Не хочу быть Ачъебиулом
АрхивПолезняшки (архив)Наверняка вам, как и многим другим пользователям, неоднократно приходилось получать письма, которые при всем желании невозможно прочитать. Вроде и буквы знакомые с детства, а что-то не получается… если нет под рукой русскоязычных программ-декодировщиков.
Весь наш мир состоит из множества противоположностей. Вот, например, две наиболее часто используемые в русском интернете кодировки: windows и koi8. Нет такого человека, которому не приходилось бы получать по электронной почте совершенно нечитабельные письма. И написаны-то они вроде бы по-русски, но вместо фразы “Добро пожаловать” вы читаете “дПВТП РПЦБМПЧБФШ”, а автор письма Васечкин оказывается “Ачъебиул-ом” или, еще хуже, “БЮЯЕВЙХМ-ом”.
В принципе, ничего удивительного в этом нет. Эти письма просто были неверно перекодированы почтовыми серверами по пути следования письма. Некоторые письма подвергаются даже неоднократному перекодированию, в результате чего подобрать кодировку или пытаться сделать обратные преобразования вручную - пустая трата времени. Можно перебрать все доступные для почтовой программы варианты кодировки русского алфавита, но так и не получить осмысленный текст.
Многие провайдеры, чтобы избавить пользователей от кодировочных мук, автоматически перекодируют почту в одну из кодировок. Но лучшее, как всем прекрасно известно, - враг хорошего. Подобная забота приводит к тому, что письма принудительно кодируются и перекодируются во время их путешествия в интернете много раз. В результате получается “письмо-мутант” - и не в windows написано, и не в koi8, а в какой-то их смеси. Прочесть такое письмо крайне сложно. Проблема в том, что для его прочтения необходимо точно восстановить порядок перекодировок, проведенных в процессе пересылки.
Изначально предполагается, что, согласно существующим стандартам, письма должны передаваться между серверами в кодировке KOI8. А при их представлении пользователю информация преобразуется в нужную ему кодовую таблицу, как правило, Windows-CP1251. Именно так устроена программа Microsoft Internet Mail. Однако порой случается, что письмо перекодируется совсем по другим правилам. Например, почтовый сервер преобразует письма в KOI8-R, считая, что они имеют кодировку Windows. Между тем, вполне возможно, что одно исходное письмо было уже преобразовано в KOI8-R системой отправки, а следующее пришло в кодировке DOS. В результате оба превратилось непонятно во что. Таких “умных” серверов на пути письма может оказаться несколько…
Поэтому для нормальной работы современного офиса просто необходимы программы, которые помогут вам прочесть русский текст, испорченный по пути неправильными (и даже неоднократными) перекодировками.
Начну я с самой известной и уже давно занявшей достойное место в компьютерном мире программы MailReader. Эту интеллектуальную, в полном смысле этого слова, программу (использующую знания о русской лексике и грамматике) разработала фирма “Агама”. С помощью лингвистических технологий MailReader автоматически определяет, в какой исходной кодировке было написано письмо и каким преобразованиям оно подверглось на своем пути, при необходимости восстанавливает потерянный восьмой бит и даже преобразует написанный латиницей текст в русский.
Скачать демонстрационную (на 30 запусков) версию MailReader можно на сайте “Агамы”. Последняя версия программы (1.53) занимает порядка 2.5 Мбайт. Стоит сейчас MailReader 10 долларов в расчете на один компьютер (надо признать, что цена программы существенно снизилась, например, раньше она составляла 34$). Работает под Windows 95/98 и Windows NT.
Следует отметить несколько основных достоинств программы MailReader. Во-первых, в нее включен русский словарь (это значит, что “читабельность” письма программа проверяет автоматически и точно знает, правильно оно расшифровано или нет). При этом расшифровывается даже транслит - русские слова, записанные английскими буквами. Во-вторых, MailReader умеет зашифровывать письма. Это имеет смысл в тех случаях, когда посылаешь письмо кому-то в первый раз, и, естественно, никогда не угадаешь, смогут прочесть твою кодировку или нет; в этом случае идеальным считают вариант написания письма в транслите (правда, для многих это - настоящее испытание нервов). MailReader запросто справляется с переводом письма из русского в "русско-английский".
Для раскодировки вашей “тайнописи” достаточно выбрать из командного меню команды Сервис->Определить кодировку.
Стоит отметить очень высокий процент правильного распознавания "зашифрованных" писем. К примеру, у меня (а я пользуюсь данной программой уже 4 года) не было ни одного случая, когда бы MailReader отказался выполнить свои обязанности.
Следующим в нашем списке я решила поставить программу “Реаниматор”, которая позволит вам спасти текст, прошедший до 10 неправильных перекодировок. Как правило, можно восстановить даже безнадежно испорченные письма, при пересылке которых был потерян 8-й бит, т.е. именно та информация, которая связана с кодами русских букв. Расшифровка в этом случае становится неоднозначной. На основе словаря русского языка “Реаниматор” предложит несколько вариантов для каждого из слов сообщения, из которых вы выбираете слова, складывающиеся в осмысленные фразы.
Назову основные отличительные возможности программы “Реаниматор”:
- выбор лучшего варианта расшифровки в сомнительных случаях;
- поддержка широкого набора исходных кодировок;
- транслитерация (русский текст может быть записан латинскими буквами и выполнено обратное преобразование);
- простота и удобство в использовании.
Работает под Windows 3.X, Windows 95/98 и Windows NT. Для нормальной работы требует не менее 16 Мб оперативной памяти и 0.5 Мб свободного места на жёстком диске (сравните с 2,5 Мбайтами для MailReader). Найти “Реаниматор” можно на сайте разработчика (компания “Арсеналь”). Рабочая версия стоит 435 рублей. Существуют определенные ограничения на размер декодируемого текста для демо-версии: согласно утверждениям разработчиков, длина текста не может превышать 255 символов (реально, однако, демонстрационная версия переводит строки всего до 100 символов).
При вызове программы она помещает свой значок на панели задач Windows, и поэтому может быть доступна в любой момент времени.
“Реаниматор” можно считать (с моей точки зрения) самой удобной и простой в использовании в сравнении с другими программами-декодировщиками. Для расшифровки пришедшего вам послания достаточно скопировать “странный” текст в буфер обмена и щелкнуть по значку программы на панели задач. В результате откроется окно программы с уже переведенным текстом. И никаких проблем!
EType Mail Decoder (сокращенно ECoder) – недавно вышедшая на компьютерную арену программа для восстановления "нечитабельных” писем. Программа распространяется по принципу Shareware. Демонстрационная версия традиционно действует 30 дней, и скачать ее можно здесь. На диске программа занимает порядка 270 Кбайт. Оплата за приобретение ECoder возможна в двух вариантах: через российское агенство MkrSoft и по кредитной карте через Интернет. При оплате через агенство MkrSoft стоимость программы составляет $5, а при оплате с помощью кредитной карты - $10.
ECoder поддерживает практически все используемые в Сети кодировки. Программа может перекодировать сообщения, как обычно, в двух режимах - вручную и автоматически.
При ручном перекодировании (“Правка”->“Ручное декодирование”) вы сами указываете последовательность перекодирования текста. Этот же режим потребуется вам, если необходимо, например, перекодировать текст из кодировки Windows в кодировку MS-DOS.
В автоматическом режиме программа перебирает более 160000 вариантов перекодирования. ECoder умеет восстанавливать письма, перекодированные до 4-х раз включительно (авторы утверждают, что этого вполне достаточно для восстановления сообщений – я в этом вопросе с ними немного не согласна, см. ниже).
Программа имеет ряд дополнительных возможностей, которые делают работу с ней гораздо более комфортной. В первую очередь следует отметить возможность использования пользовательских схем. Предположим, что вам от некого Ivan Petrov регулярно приходят письма, которые нуждаются в нескольких декодированиях. В этом случае вы можете первое письмо декодировать автоматически или вручную, а последовательность перекодирований сохранить как пользовательскую схему (Правка->История->кнопка “Сохранить как схему”). В дальнейшем при получении писем от данного абонента нужно выбрать ручное декодирование, а затем перекодировку “From Ivan Petrov” - и программа выполнит всю последовательность перекодирований. Меня, правда, данная возможность не вдохновила на подвиги. Мне больше нравится, когда программа сама быстренько все решает и выдает читабельный вариант. Но на вкус и цвет, как говорится...
Для раскодировки текста следует, как обычно, запомнить текст в буфере обмена, затем щелкнуть на кнопке “Вставить текст из буфера обмена” и оценить результат.
Радует, что программа позволяет переводить сообщения не по кускам, а целиком. Однако не совсем приятно, когда к правильному варианту расшифровки добавляется в несколько раз большая по длине последовательность других (нечитабельных) вариантов.
В принципе, программа неплохо работает. Правда, у меня в 30% случаев в ответ на пожелание прочитать пришедший текст (вариант “автоматическое декодирование”), она, немного подумав, видимо, о бренности нашего бытия, выдавала сообщение: “Ни один из вариантов не подошел – либо письмо слишком коротко, либо оно было перекодировано свыше 4-х раз”. Вместе с тем ручное декодирование обеспечивает нормальную расшифровку без особых проблем. Я думаю, что на эту ситуацию авторы, несомненно, обратят внимание, и в следующих версиях программы нужды в данном сообщении не будет в принципе.
Обсуждение статьи - в форуме "Обсудим "СофтТерру"