Архивы: по дате | по разделам | по авторам

Не надо транс-ля-ля

Архив
автор : Сергей Никитин   03.11.2004

Впервые я познакомился с компьютерным переводчиком в 1998 году. Он был установлен на одной из моих служебных машин и назывался Stylus (фирма PROMT).

Впервые я познакомился с компьютерным переводчиком в 1998 году. Он был установлен на одной из моих служебных машин и назывался Stylus (фирма PROMT). Копия была, естественно, пиратской (в той бюджетной конторе все компьютеры были б/у, а все программы — пиратские). Я старательно учил электронного недотепу переводить хелпы и мануалы к VBA, которым обрабатывал разнотипные офисные документы. Узость темы, позволившая добиться некоторого успеха, одновременно превратила это занятие в чисто спортивное: когда Транслятор стал выдавать относительно складные русские тексты, я в нем уже не нуждался, научившись свободно читать оригинал.

Прошло пять лет, и вот — всего за 150 рублей купил легальный диск той же фирмы PROMT, а называется переводчик X-Translator PLATINUM. Но я не собираюсь рассказывать вам о ее замечательном интерфейсе, который, увы, даже контекстных меню не имеет. И про отсутствие автопереключения направления перевода (При работе в главном окне) скажу только здесь мимоходом; ну, нельзя вообще не сказать, если за столько лет у кого-то руки не дошли до такой ерунды. И нельзя ни шрифт, ни папку по умолчанию настроить: после перезапуска все настройки будут забыты. Буду справедлив и замечу, что появились две новые (с тех давних пор) бирюльки: одна бесполезная, но прикольная — речевой вывод; другая полезная и удобная — интеграция с браузером.
Ну, и хватит о неглавном.

Все же главная работа Переводчика — переводить. А здесь-то как раз не изменилось ничего. Более того, как мы увидим ниже, ничего и не могло измениться без кардинальной смены парадигмы построения программы. Но этот шаг требует не столько материальных ресурсов (уверен, деньги можно найти всегда), сколько ресурсов идей, знаний, профессионализма. Увы, наш платиновый герой и с лингвистической, и с программистской точек зрения являет собой пример романтического дилетантизма. Для первой версии любительской программки — может и лестная характеристика, но спустя столько лет — стыдновато…

Итак, дюжина простых опытов без пробирок и микроскопа.

Имена людей

Начнем с чего-нибудь азбучного (верхняя рамка — всегда наш входной текст, в нижней — перевод программы):

1 Маша мыла раму.
   Маша washed a frame.

Ну что ж, вполне предсказуемо и корректно: чего не знаю — то не перевожу. Пример, правда, шуточный; попробуем что-нибудь более реальное:

2  Я вижу Машу.
    I see I Wave.

А вот это уже «классика жанра»! Герой наш Машет, сам себя созерцая. Сколько анекдотов на эту тему, но кто бы мог подумать, что эти байки — так близко. Кстати, не удержался, нашел диск со Stylus’ом, проверил на нем и убедился, что был не прав, подозревая, будто разработчики просто заменили название: результат получился другой — I see I wave, то есть Stylus игнорирует заглавную букву. Технология действительно поднялась на качественно новый уровень.

Внесем «Маша» в словарь (думаю, что «Mary» — адекватный перевод) и опять попросим Переводчика поработать:

3  Я вижу Машу.
    I see the Mary.

Ай-яй-яй! Артикль здесь явно неуместен. Проверяем по-другому…

4  Я вижу Марию.
    I see Maria.

Умеет, оказывается, с именами работать, но как-то странно. Хотя тенденция уже проклевывается. Клюнем-ка еще разок:

Я видел Анну, она плакала.
    I saw Anna, she (it) cried.

«Платинум» делает вид, что не понимает — о ком (she) или о чем (it) идет речь. Формально он прав, ведь в классическом английском животные не имеют почетного права на, извините, половое местоимение; а поскольку Анной может называться не только человек, но и кошка, и черепашка… Стоп-стоп! Этак можно желаемое выдать за действительное. Надо бы проверить: думали отцы-создатели о животных или это здесь случайно получилось? Схитрим немного:

6  Я видел Анну, которая плакала.
    I saw Anna who cried.

Надо же! Уже не сомневается, что Анна — человек. Неужели из контекста понял? Мол, черепашки и кошки плакать не умеют… Вот было бы здорово, кабы так!

Такое поведение Переводчика напомнило случай в Китае. Надо сказать, по-китайски я — ни бум-бум, но в больших городах это не проблема: и надписи почти все дублированы, и многим молодым китайцам очень хочется попрактиковаться в английском, поэтому они с удовольствием помогают иностранцам. Однако пару раз я попадал на очень симпатичных студенток, которые в ответ на мои «дуюспики» делали круглые глаза (китаянки тоже умеют), недоуменно пожимали плечами, мол, даже не понимаем, о чем речь. Это показалось немного странным, поэтому, наткнувшись на такое недоумение в очередной раз, я пошел чуть дальше и сказал, как бы ни к кому не обращаясь:

— Baby, you are beautiful girl…
— Oh, thank you very much! —

Девушка покрылась румянцем удовольствия, а стоявшие рядом студенты схватились за животы от смеха. А если серьезно, то вся эта последовательность опытов была, разумеется, не шуточной и не случайной. Мы обнаружили дефект перевода и через проверку цепочки гипотез (они здесь, ради интриги, не были сформулированы явно) пришли к очень важному выводу: X-Translator PLATINUM адекватно работает с именами людей только из Генерального Словаря!

Что ему мешает так же поступать с именами, введенными пользователем? Да то, что вводя новое существительное, мы почему-то не можем прямо указать — это ИМЯ. Программисты PROMT посчитали эту категорию излишней. Единственный пункт из возможных, напоминающий требуемое, — ПЕРСОНАЛИИ. Но, как показывает опыт 3, этого явно недостаточно. А пример 5 доказывает, что и со «встроенными» именами случаются детские неожиданности.

Видно, когда отечественные программисты, объединяясь с отечественными же лингвистами, вгрызаются в глубины родного языка, он сам заставляет их быть «на уровне»…
Е. Козловский, «Русский софт» («КТ» #193)

Глаголы и существительные

Перевод глаголов и смешивание их с именами существительными — еще одно родимое пятно, указывающее на общий генотип с программой Stylus. Все нелепицы того периода, словно родимые пятна, благополучно перекочевали в якобы «современную» программу. Как уже упоминалось, Stylus я испытывал на справке. Ну, а что такое Help, если попросту? Правильно — маленькое пояснение, а дальше последовательность предписаний: бери больше; кидай дальше; отдыхай, пока летит…

Казалось бы — чего проще? Но результаты следующих опытов доказывают, что X-Translator PLATINUM никогда адекватно не переведет подобные тексты.

7  Тянуть. Тяни. Снижение.
    To pull. Pull. Decrease (reduction).

М-да… Очень мягко говоря: не впечатляет! А ведь здесь все предельно однозначно: предложения, состоящие из одного глагольного сказуемого, причем глагол в повелительном наклонении. Я ждал чего-то вроде: «Тяни. Снижай. Напрягай». Выбор корней совершенно не важен, это зависит от контекста, а порой и творчества требует. Чего не скажешь о выборе части речи или члена предложения: надо быть большим фантазером, чтобы увидеть в этом тексте существительные, а тем более — инфинитивы! Особенно в английском, с его строгим порядком членов предложения, тем более — главных…

Попробуем понять логику (или причину ее отсутствия) разработчиков фирмы PROMT, сменив направление перевода.

8  Drag. Drop. Pull.
    Тянуться. Снижение (капля).
    Напряжение.

Видите: почему-то в эту сторону с глаголами наладилось… Чего не скажешь о существительном. При этом, я опять же не переживаю по поводу несовпадения обратного перевода: тоже тема для разговора, но вовсе не сегодняшнего.

Важнее, что теперь нам стала немножко очевидней причина фантазий родителей «Платинума». А причина банальнейшая — языковой дилетантизм. «Поверхностным» признаком этого недуга является неумение различать в английском тексте части речи, опираясь на структуру предложения. Более «глубоким» симптомом следует назвать непонимание роли артикля.

Однажды (совсем по другому поводу) я провел небольшое социологическое исследование, задавая всем окружающим простецкий вопрос: что такое артикль? Как ни странно, в этом опыте (не считая анекдотов) я получил всего две разновидности ответа: либо просили нецензурно не выражаться, либо многословно рассказывали — чем определенный артикль отличается от неопределенного. Видимо еще в школе, вбивая именно эту разницу, нас напрочь отучили от обдумывания куда более важной проблемы: а вообще артикль, любой, an article, он зачем нужен? Когда так уточняешь вопрос, «респонденты» обычно тушуются, а некоторые несмело предполагают: эта штука, мол, вроде хвостика у человека, атавизм, одним словом.

Уверен, что большинство читателей знали или уже догадались, что в «этом дурацком английском», где одна словоформа может выражать три-четыре части речи, артикль — один из способов обозначать существительное. Просто в русском языке эта информация почти всегда у слова «на лбу написана», а в английском лишь иногда (есть и там слова, например, nature, happiness, freedom, которые по форме однозначно являются существительными)(Если по серьезному, то все немножко сложнее. Например, в выражении «I live in The Great Britain» артикль стоит перед прилагательным «Великая», а не перед существительным «Британия», но мы не будем терять на это время, поскольку такие случаи не противоречат упрощенной идее о роли артикля, а лишь уточняют ее).

Но может все же резко я — про дилетантизм-то? Надо бы еще раз проверить. Хорошо бы, для корректности, слово взять равноценное и как глагол, и как существительное.

Lift up, baby. The lift was broken.
    Подъем (лифт), ребенок. Подъем (лифт) был сломан (нарушен).

Как видите, употребив типичное сочетание с наречием up, я даже подсказал Транслятору, что это глагол. Тщетно… Кстати, сравните с переводом совершенно аналогичной конструкции в следующем примере. Явно проклевывается очередная тенденция. Скажем ей: «Цып-цып».

10  Stand. Stand up. Sit. Sit down.
      Стенд (позиция). Встать.
      Сидеть. Сядьте.

Беда не в том, что на пять глагольных предложений получен только один корректный перевод (sit down). Беда в том, что наш герой не всегда реагирует на однозначные грамматические признаки. Хуже того: на совершенно однотипные аргументы он выдает принципиально разные результаты! Виновата, конечно, не программа, а ее авторы, которые (из наших опытов это очевидно) не догадываются, что грамматика есть способ подружить слова в предложении.

Но может быть, нам поможет подключение словарей? Не в этом ли решение проблем?

Увы, если во встроенном (Генеральном) словаре хоть иногда проскакивает повелительное наклонение глаголов, то в пользовательские словари мы не сможем его внести ни за какие коврижки: фирма PROMT, видимо, следуя «оригинальной методике проф. Белоногова», упразднила сие излишество! Пока только в рамках своего продукта.

Про артикли словари вообще ничего не знают. Бред, конечно, но «се ля ви»…

Прежде чем закончить с глаголами, небольшая цитата из постоянно пополняющейся книги «Анекдоты от Берга» (Берг — псевдоним (точнее, прозвище) известного педагога и барда Владимира Ланцберга). Очень уж в тему…

«Группа исследователей-энтузиастов составляла частотный словарь произведений Михаила Щербакова: загнала в компьютер все доступные тексты и заставила умную программу подсчитать для каждого слова, сколько раз оно в этих текстах встречается.

Программа была настолько умная, что сама определяла грамматическую принадлежность слова (существительное, глагол и пр.) и потом распознавала его во всех формах: падежах, лицах, числах и т. д. Когда работа была сделана, ее авторы, проверяя возможности своего детища, поинтересовались, в частности, какой глагол у Щербакова самый употребительный. И получили ответ: глагол «мыть»… Исследователи переглянулись: они неплохо знали тексты Щербакова, но что-то не замечали там обилия этого глагола. Тогда они спросили: какой глагол следующий по употребительности? Козырнув статистикой, программа уверенно ответила: глагол «какать»…

Только шок, пережитый авторами работы, заставил их вспомнить, что программа считает деепричастия не самостоятельными словами, а формами глаголов; однако никто не рассказал ей о такой штуке, как ударение, которым местоимение «кака,я» отличается от деепричастия «ка,кая». Выяснилась и причина лидерства глагола «мыть», у которого нашлась подходящая форма повелительного наклонения…»

Это всего лишь анекдот — поучительная история, в данном случае, из реальной жизни. И, разумеется, ударение — вовсе не единственный (а для анализатора текста — самый неподходящий) способ отличить местоимение от деепричастия. Но разве не столь же анекдотичны результаты наших опытов?

Когда-то, еще в начальной школе, каждый из нас, от усердия высовывая язык, разбирал предложения по составу. Помните: подлежащее, сказуемое, обстоятельство времени… Согласитесь, даже в русском языке это не очень сложно. В английском же — элементарно (если это не поэзия). Но в том же английском часто невозможно понять — что перед вами: существительное? глагол? прилагательное? — не определив роли этого слова в предложении. Как мы только что доказали, ни Stylus, ни X-Platinum Translator даже не пытаются анализировать ПРЕДЛОЖЕНИЕ. Такой лингвистической категории для них не существует.

Но, извините, тогда это не программа-переводчик! Это, в лучшем случае, словарь. Но наш случай, пожалуй, и не лучший…

Поэкспериментируйте. Вы будете долго смеяться. Если раньше не заплачете…

11  Мой пол, пока не устанешь.
      Мой пол определить несложно.
      Мой пол — женский…
      My floor, you will not be tired yet.
      My floor to define simply.
      My floor — female…

Благодаря системе фразеологического перевода (разработанной в ВИНИТИ коллективом под руководством проф. Белоногова) машинная трансляция с одного языка на другой поднялась на качественно новый уровень. Постепенно ляпы Stylus первых версий воспринимаются как исторические анекдоты. С каждой новой версией программ получить до смешного некорректный перевод становится все труднее. Даже специально.
{ALT}.ru-ist, студент ВМА («КТ» #450)

О других проблемах

Имеются и не столь серьезные, но все же огрехи. Эти мелкие, но повседневные блохи не выведены из программы весьма почтенного возраста. Пример, для экономии места, только один.

12  I like «The Beatles».
     Я люблю « Beatles ».

Человеку, с текстами лишь играющему, а не работающему, это может показаться придиркой. На самом деле, здесь две грубейшие ошибки (отнюдь не творческие ошибки перевода), которые при подготовке текстового документа сильно напрягут пользователя.

Во-первых, вполне законно оставив непереведенным существительное, по какому праву Транслятор убрал артикль? Если существительное будет внесено в словарь, артикль исчезнет в результате перевода или транслитерации, а если переводить не потребуется… Неужели врукопашную ликвидировать последствия «дурацкой старательности»?

Во-вторых, представляете, если в тексте десятки таких названий и в каждом пользователю придется не только вставлять артикли, но и вручную удалять два лишних пробела! Кто-то махнет рукой: пускай их, не будем удалять… И получит распечатку (страницу сайта), где строки начинаются с закрывающих кавычек или кончаются открывающими. Бр-р-р! Дилетантщина…

Вряд ли найдется Плюшкин, который побежит в PROMT требовать назад свои пять долларов, столкнувшись с указанной и не указанной здесь халтурой. И невеликие деньги, и невеликое знание английского, и здоровая скромность («наверное, чего-то я еще не умею») не дадут вскипеть эмоциям разочарования. Но можно компенсировать и этот мизерный ущерб, извлекая уроки, изучая историю программирования.

© ООО "Компьютерра-Онлайн", 1997-2024
При цитировании и использовании любых материалов ссылка на "Компьютерру" обязательна.