Архивы: по дате | по разделам | по авторам

Один за всех

Архив
автор : Георгий Кузнецов, Антон Гололобов   24.03.1997

Благодаря Евгению Козловскому мы в редакции узнали о программе Mail Reader, предназначенной для восстановления испорченной почты, и решили встретиться с ее разработчиком Евгением Киреевым. Не для интервью, а так - поговорить. Предлагаем вашему вниманию беседу с Евгением Киреевым, ныне генеральным директором компании "Агама". "Компьютерру" представляют Георгий Кузнецов и Антон Гололобов.

 - С электронной почтой в России давно нелады, но последние месяцы начался просто беспредел. Мы получаем письма читателей и большую часть их не можем прочесть, применяя обычные приемы подбора кодировки. Из всех известных нам перекодировщиков ваш Mail Reader - единственный адекватный инструмент.

 - Не все так думают. Я недавно говорил с Екатериной Лажинцевой, отвечающей в Microsoft АО за русификацию. По ее мнению, такие программы, как наша, никому не нужны, а надо, чтобы все поставили себе почтовые серверы, которые правильно пользуются указаниями в заголовке сообщения.

 - Ну да, Microsoft АО рассуждает, как советское министерство.

 - А пока стоит неразбериха, и неизвестно, когда все это кончится.

 - Mail Reader сообщает, что может исправить более восьми тысяч схем искажения данных. Неужели их столько?

 - Есть, кажется, шесть основных кодировок (DOS'овские, Windows, Mac, Sun, КОИ-8...), и по пути следования письма несколько (мы моделируем до четырех) серверов пытаются испортить его, каждый на свой лад. К тому же никто не знает точно, как надо. Таблицы перекодировок на разных серверах могут отличаться. Программисты обычно копируют их друг у друга, причем реально в ходу около десятка версий. Зачастую Mail Reader'у удается восстановить почти весь алфавит, за исключением нескольких букв. Существует, конечно, множество ситуаций, когда текст портится необратимо. Исключив взаимно нейтрализующие варианты, мы насчитали 8293 схемы и продолжаем находить новые.

 - А обратную связь от пользователей принимаете?

 - Конечно. Мы приглашаем присылать нам испорченные письма, которые Mail Reader не смог восстановить.

 - И по пути к вам их еще разок-другой перекодируют... Ну ладно, а как вы торгуете программой Mail Reader?

 - Если честно, мы ей почти и не торгуем. Передали по партии двум нашим дилерам, но я даже не знаю, сколько они продали. Mail Reader разработан по инициативе нашего американского партнера. Он там продает, а в России нам удалось продать главным образом несколько крупных корпоративных лицензий. Вообще, продажи единичные.

 - А с Web-сайта?

 - Мы не умеем культурно брать деньги. Люди скачивают с Web-сайта демонстрационную версию, которая работает 30 раз. Предполагается, что после этого они заплатят нам деньги (как угодно: наличными, почтовым переводом, безналичным перечислением, а по Москве мы даже высылаем курьера) и получат пароль.

 - Наш редактор Андрей Шипилов недавно обнаружил, что многие банки выдают "электронный" вариант карточки VISA. Для них такая карточка безопасна, поэтому ее можно получить прямо на сумму вклада, даже очень небольшую. Залог не требуется. Вы случайно не прорабатывали, насколько трудно было бы наладить электронную торговлю как следует?

 - Даже и не пытались. Мы делали такой опыт в Штатах и пришли к выводу, что хлопот много, а толку мало. В России народ вряд ли поверит в надежность платежей через местный Интернет - и будет прав. Хуже того, я слышал о случаях, когда покупатели требуют вернуть им деньги, снятые с их карточных счетов, говоря, что не получили товар или услугу, - и продавец не может ничего доказать.

 - Так никакого способа выручать деньги за мелкий софт и не найдено? А если сбандлить с чем-нибудь? Или, может, провайдеры возьмутся продавать? А то пустили бы Mail Reader в свободное плавание...

 - Не знаю, может быть, со временем что-то изменится. Пока мы пробовали и то, и другое, и третье, и еще кое-что, но пока не придумали, как нам на этой программе заработать. Готовы рассмотреть любые разумные предложения, но бесплатно раздавать не хотим - как из принципа, так и в силу обязательств перед американским партнером. К тому же Mail Reader мало кому нужен - только тем, кто ведет обширную переписку с разными местами.

 - Такая же ситуация, например, в ньюсгруппах. Похоже, перекодировка почты превратилась в бедствие общенациональных масштабов.

 - Вы преувеличиваете. Пользователей электронной почты в России очень мало, даже и среди ваших читателей.

 - Да, к сожалению мы получаем очень много обычных писем, а у нас в редакции и машинистки-то нет. Но, скажем, как насчет более активного продвижения? Поместили бы, например, действующий Mail Reader на свой сайт, как у вас уже стоит программа-переводчик. Можно было бы обратиться, подсунуть текст через ClipBoard, посмотреть, что из этого получиться, и тут же отправить вашим специалистам, если не получилось. Особенно когда будут выходить новые версии.

Это можно. Кстати, переводчиком народ начал просто пользоваться. Вгоняют ему по 32 Кбайт через ClipBoard и очень довольны.

 - А как работает Mail Reader? Применяет перекодировку, пропускает через проверку правописания и оценивает качество?

 - Примерно так, но там еще много всяких хитростей. Например, сначала он пытается угадать перекодировку по некоторым легко проверяемым признакам, и так далее.

 - В Mail Reader'е примерно двадцати чаще всего встречающимся перекодировкам даны всякие смешные названия. Как вы их придумывали?

 - Большая их часть очевидна. Например, "микромыло" - это, конечно, Microsoft Mail. А вот "кошмар" - это CompuServe. Они сводят слегка отличающиеся буквы национальных алфавитов в одну: например, все европейские варианты написания буквы E с дополнительными значками преобразуются в просто Е. В случае русской кодировки это приводит к тому, что в одну латинскую "сливаются" несколько совершенно разных русских букв. Мы и с этим как-то справились, правда, нужна помощь пользователя.

Пока Mail Reader - это программа, с помощью которой можно каждому решать свои собственные проблемы, что бы там ни творилось во внешнем мире. Но мы рассматривали и другие возможности. Например, подобрав правильную перекодировку, можно было бы обратить ее и закодировать ответ, но нет гарантии, что он пойдет той же дорогой. Вот если бы Mail Reader всегда стоял с обеих сторон...

 - Это, кстати, тоже известный из практики способ стимулировать распространение программы. Но лучше пусть каждый позаботится о себе, и тогда невидимая рука позаботится обо всех остальных. Например, в последнее время мы замечаем, что провайдеры стали портить даже прилагаемые к письму двоичные файлы. "Вскрывают" маймовскую (MIME) упаковку, меняют типы, пытаются перекодировать содержимое. Мы, пользователи, в порядке самозащиты могли бы начать применять универсальную сигнатуру, с помощью которой программа могла бы прямо вычислять способ восстановления. Скажем, включать в автоматическую "подпись" строку из всех букв русского алфавита.

Может, выдвинем такую инициативу прямо не сходя с места? А вы добавите поддержку сигнатуры в свой продукт? Не заработаете, так хоть прославитесь...

 - "Агама" предпочитает славе наличные, а вот это пока не получается.

 - Но ведь как знать, что будет дальше? Провайдеры ведут себя как неуправляемая толпа. Их поведение абсолютно иррационально. Информация портится все чаще и все более непредсказуемыми способами. Ситуация уже похожа на вирусную эпидемию.

 - Разве антивирусные программы что-то дают? Единой системы противодействия так ведь и не получилось.

 - Единой и не будет никогда. Но образуется нечто вроде иммунной системы сообщества пользователей. Плотность применения антивирусов достаточно велика, чтобы они радикально влияли на распространение вирусов, ограничивали масштабы и опасность инвазий.

Аналогично, вы ведь уже ведете сбор сведений о таблицах перекодировки, а могли бы трассировать пути писем, определять точки порчи, да мало ли что еще! Допустим, когда программисты провайдера начинают ковыряться в частях маймовского сообщения и обрабатывать их по отдельности, общая сигнатура уже не защитит. Надо начинать полномасштабную войну, и вы могли бы возглавить ее. Глядишь, какой-то новый орган сетевой отрастет.

Честно говоря, мы думаем, что лучше всего было бы защищать принцип неприкосновенности переписки. Пусть провайдер не лезет в письмо, не его собачье дело, что там написано, - и точка. Все упростилось бы на порядок.

 - Я тоже так думаю. Хотя как мы могли бы этого добиться организационно и какую роль Агама могла бы в этом сыграть, пока не вижу. Не говоря уж о том, что это убивает наш продукт, за который мы хотели бы деньги получать... Пока мы не оставляем попыток. Сейчас, например, делается решение для OutLook - это новая коммуникационная программа, выпущенная компанией Microsoft. Есть WLL для MS Word 7.0 и 97. Нет, правда, версии для DOS и Win3.x, другими словами, никаких платформ кроме Win32 мы не поддерживаем. Кто-то нас за это осудит, но я пока столкнулся только с одним клиентом, который хотел Mail Reader для Windows 3.11. Так что, надеюсь, мы правильно сориентировались. И продукт получился неплохой: пользователям нравится. Пока у нас две основные категории пользователей программы: те, кто доволен продуктом, и те, кто им очень доволен.

 

Философия проблемы

На своем пути к адресату электронное письмо проходит через множество компьютеров, некоторые из которых считают себя настолько умными, что позволяют себе текст письма корректировать по определенным правилам, чтобы "было лучше". Правил этих немало, "умных" компьютеров тоже хватает, причем они, как правило, ничего друг о друге не знают и действуют, мягко говоря, несогласованно. Ситуация усложняется тем, что между двумя пунктами письма могут ходить по различным путям, имея замечательную возможность "общаться" с новыми "умными" компьютерами, отдавая каждому из них частичку себя. В результате подобных похождений блудное письмо может появиться в вашем почтовом ящике в таком виде, что, посмотрев на него, вы мучительно начнете вспоминать, что же такое вы пили вчера. А когда не вспомните, попытаетесь узнать, что пил тот, кто посылал письмо. Самое забавное, что все это вам не поможет. А поможет вам... да-да, именно! Поможет вам Mail Reader. Он действительно умнее всех тех "умных" компьютеров, которые прикладывают массу усилий, чтобы изгадить предназначенное вам письмо. Он сведет всю их разрушительную работу на нет, после чего сожмет свою руку в кулак, оттопырит средний палец и медленно, со знанием дела, выставит его в зияющую дыру открытого информационного пространства (как жаль, что вы этого не увидите!). Mail Reader - это программа-боец, программа-мститель, она создана для того, чтобы побеждать. Она даст отпор всем, кто посмеет посягнуть на великий, но не очень могучий в кибернетической паутине русский язык (латинский-то текст проходит все сетевые препятствия безболезненно). У Mail Reader достаточно сил, чтобы выдержать любой натиск, поскольку он базируется на передовых лингвистических технологиях от Агамы. Как модно сейчас писать, POWERED BY... Латиняне не пройдут!.. Остается только один вопрос: почему же Mail Reader носит такое непатриотичное название? А чтобы врагам было легче запомнить то имя, которое надолго лишит их надежд носить вожделенное для них звание Главных Пауков Паутины.

(Текст без изменений взят с Web-сайта компании "Агама", kir@russia.agama.com.)

Итак, Mail Reader призван выполнять следующие функции:

  • восстанавливать искаженные фильтрами электронной почты русские тексты сообщений;
  • раскодировать сообщения из форматов типа UUCODE;
  • кодировать посылаемое сообщение так, чтобы адресат смог прочитать его стандартными средствами.
  • Наиболее сложной является, естественно, первая задача. Для ее успешного решения Mail Reader использует перебор большого числа (более восьми тысяч) комбинаций заранее известных видов искажений русских текстов системами электронной почты. Каждая гипотеза (будем называть ее "схема декодирования") проверяется на корректность при помощи модуля орфографического контроля. Схема, давшая большее число правильных русских слов, используется для окончательного декодирования. Найденная схема декодирования может быть сохранена с некоторым именем для дальнейшего использования. Это позволяет во многих случаях избежать полного перебора, что существенно ускоряет работу.

    Раскодирование сообщения из стандартных форматов - задача более простая. В настоящий момент Mail Reader поддерживает следующие форматы: UUCODE, ISO10646, транслитерированный текст (русский текст, записанный латинскими буквами, сходными по звучанию).Кодировать посылаемое сообщение Mail Reader может тремя способами:

  • переводить текст или его фрагмент в кодировку типа UUCODE;
  • транслитерировать текст или фрагмент текста в латиницу;
  • кодировать, применяя схему, обратную заданной.
  • Последний вариант предназначен для ответа тем корреспондентам, чьи письма уже были декодированы, а схема декодирования сохранена. При этом предполагается, что на обратном пути письмо проходит те же фильтры, но в обратном порядке (это иногда может не работать).
    © ООО "Компьютерра-Онлайн", 1997-2024
    При цитировании и использовании любых материалов ссылка на "Компьютерру" обязательна.