Список вопросов
Как зайти в Даркнет?!
25th January, 01:11
5
0
Как в tkinter из поля ввода Entry получить значение в одну переменную и обновить строку кнопкой, затем получить ещё одно введённое значение и затем сложить их. Ниже пример кода
21st July, 19:00
893
0
Программа, которая создает фейковые сервера в поиске игровых серверов CS 1.6 Steam
21st March, 17:43
948
0
Очень долго работает Update запрос Oracle
27th January, 09:58
912
0
не могу запустить сервер на tomcat HTTP Status 404 – Not Found
21st January, 18:02
905
0
Где можно найти фрилансера для выполнения поступающих задач, на постоянной основе?
2nd December, 09:48
938
0
Разработка мобильной кроссплатформенной военной игры
16th July, 17:57
1724
0
период по дням
25th October, 10:44
3955
0
Пишу скрипты для BAS только на запросах
16th September, 02:42
3720
0
Некорректный скрипт для закрытия блока
14th April, 18:33
4613
0
прокидывать exception в блоках try-catch JAVA
11th March, 21:11
4380
0
Помогите пожалуйста решить задачи
24th November, 23:53
6084
0
Не понимаю почему не открывается детальное описание продукта
11th November, 11:51
4350
0
Нужно решить задачу по программированию на массивы
27th October, 18:01
4395
0
Метода Крамера С++
23rd October, 11:55
4309
0
помогите решить задачу на C++
22nd October, 17:31
4002
0
Помогите решить задачу на python с codeforces
22nd October, 11:11
4492
0
Python с нуля: полное руководство для начинающих
18th June, 13:58
2599
0
Каким алгоритмом/библиотекой конвертировать слово, введённое в неправильной раскладке?
Просмотров: 438
 
Ответов: 11
По сути, сделать то, что делают Punto Switcher. Нужно постоянно конвертировать подобные ошибки, сделанные в разных языках, не использующих латиницу. Желательно — на Python, можно на PHP.
Вот набросок того что я предлагал:
<?php
$layouts['en'] = preg_split('!!u', 'qwertyuiop[]asdfghjkl;\'\zxcvbnm,./', null, PREG_SPLIT_NO_EMPTY);
$layouts['ru'] = preg_split('!!u', 'йцукенгшщзхъфывапролджэ\ячсмитьбю.', null, PREG_SPLIT_NO_EMPTY);
$phrase = "тестовая cnhjrf с неверной раскладкой\n";
echo $phrase;
$phrase_chunks = explode(' ', $phrase);
$ch = array();
foreach ($phrase_chunks as $phrase_chunk) $curl_handles[] = curl_init();
foreach ($curl_handles as $index => $curl_handle) {
curl_setopt($curl_handle, CURLOPT_URL, "http://ajax.googleapis.com/ajax/services/language/detect?v=1.0&q=".urlencode($phrase_chunks[$index]));
curl_setopt($curl_handle, CURLOPT_HEADER, false);
curl_setopt($curl_handle, CURLOPT_RETURNTRANSFER, true);
}
$mh = curl_multi_init();
foreach ($curl_handles as $index => $curl_handle) {
curl_multi_add_handle($mh, $curl_handle);
}
$active = null;
do {
$mrc = curl_multi_exec($mh, $active);
} while ($mrc == CURLM_CALL_MULTI_PERFORM);
while ($active && $mrc == CURLM_OK) {
if (curl_multi_select($mh) != -1) {
do {
$mrc = curl_multi_exec($mh, $active);
} while ($mrc == CURLM_CALL_MULTI_PERFORM);
}
}
foreach ($curl_handles as $index => $curl_handle) {
$responses[] = json_decode(curl_multi_getcontent($curl_handle));
}
foreach ($curl_handles as $index => $curl_handle) {
curl_multi_remove_handle($mh, $curl_handle);
}
curl_multi_close($mh);
foreach ($responses as $index => $response) {
if ($response->responseData->confidence <= 0.005 && $response->responseData->language != 'ru') {
$phrase_chunks[$index] = str_replace($layouts['en'], $layouts['ru'], $phrase_chunks[$index]);
}
}
echo implode(' ', $phrase_chunks)."\n";
?>
<?php
$layouts['en'] = preg_split('!!u', 'qwertyuiop[]asdfghjkl;\'\zxcvbnm,./', null, PREG_SPLIT_NO_EMPTY);
$layouts['ru'] = preg_split('!!u', 'йцукенгшщзхъфывапролджэ\ячсмитьбю.', null, PREG_SPLIT_NO_EMPTY);
$phrase = "тестовая cnhjrf с неверной раскладкой\n";
echo $phrase;
$phrase_chunks = explode(' ', $phrase);
$ch = array();
foreach ($phrase_chunks as $phrase_chunk) $curl_handles[] = curl_init();
foreach ($curl_handles as $index => $curl_handle) {
curl_setopt($curl_handle, CURLOPT_URL, "http://ajax.googleapis.com/ajax/services/language/detect?v=1.0&q=".urlencode($phrase_chunks[$index]));
curl_setopt($curl_handle, CURLOPT_HEADER, false);
curl_setopt($curl_handle, CURLOPT_RETURNTRANSFER, true);
}
$mh = curl_multi_init();
foreach ($curl_handles as $index => $curl_handle) {
curl_multi_add_handle($mh, $curl_handle);
}
$active = null;
do {
$mrc = curl_multi_exec($mh, $active);
} while ($mrc == CURLM_CALL_MULTI_PERFORM);
while ($active && $mrc == CURLM_OK) {
if (curl_multi_select($mh) != -1) {
do {
$mrc = curl_multi_exec($mh, $active);
} while ($mrc == CURLM_CALL_MULTI_PERFORM);
}
}
foreach ($curl_handles as $index => $curl_handle) {
$responses[] = json_decode(curl_multi_getcontent($curl_handle));
}
foreach ($curl_handles as $index => $curl_handle) {
curl_multi_remove_handle($mh, $curl_handle);
}
curl_multi_close($mh);
foreach ($responses as $index => $response) {
if ($response->responseData->confidence <= 0.005 && $response->responseData->language != 'ru') {
$phrase_chunks[$index] = str_replace($layouts['en'], $layouts['ru'], $phrase_chunks[$index]);
}
}
echo implode(' ', $phrase_chunks)."\n";
?>
Может, такое?$ aptitude show enca
…
Описание: эвристическое определение кодировки
Enca (Extremely Naive Charset Analyser) определяет наиболее вероятную кодировку указанных текстовых файлов. Также возможно преобразование файлов в указанную кодировку (встроенными средствами, или внешними инструментами, например: libiconv, librecode, cstocs).
На данный момент поддерживаются: белорусский, болгарский, хорватский, чешский, эстонский, венгерский, латвийский, литовский, польский, русский, словацкий, словенский, украинский, китайский языки, а также определение многобайтных кодировок независимо от языка.
Сайт: gitorious.org/enca
$ aptitude show enca…
Описание: эвристическое определение кодировки
Enca (Extremely Naive Charset Analyser) определяет наиболее вероятную кодировку указанных текстовых файлов. Также возможно преобразование файлов в указанную кодировку (встроенными средствами, или внешними инструментами, например: libiconv, librecode, cstocs).
На данный момент поддерживаются: белорусский, болгарский, хорватский, чешский, эстонский, венгерский, латвийский, литовский, польский, русский, словацкий, словенский, украинский, китайский языки, а также определение многобайтных кодировок независимо от языка.
Сайт: gitorious.org/enca
список для Windows, однако покопавшись так и не смог нормально вытянуть раскладки, впринципе часть файла понятна, но…
Чтобы ответить на вопрос вам нужно войти в систему или зарегистрироваться