Не надо транс-ля-ля
АрхивВпервые я познакомился с компьютерным переводчиком в 1998 году. Он был установлен на одной из моих служебных машин и назывался Stylus (фирма PROMT).
Впервые я познакомился с компьютерным переводчиком в 1998 году. Он был установлен на одной из моих служебных машин и назывался Stylus (фирма PROMT). Копия была, естественно, пиратской (в той бюджетной конторе все компьютеры были б/у, а все программы — пиратские). Я старательно учил электронного недотепу переводить хелпы и мануалы к VBA, которым обрабатывал разнотипные офисные документы. Узость темы, позволившая добиться некоторого успеха, одновременно превратила это занятие в чисто спортивное: когда Транслятор стал выдавать относительно складные русские тексты, я в нем уже не нуждался, научившись свободно читать оригинал.
Прошло пять лет, и вот — всего за 150 рублей купил легальный диск той же фирмы PROMT, а называется переводчик X-Translator PLATINUM. Но я не собираюсь рассказывать вам о ее замечательном интерфейсе, который, увы, даже контекстных меню не имеет. И про отсутствие автопереключения направления перевода (При работе в главном окне) скажу только здесь мимоходом; ну, нельзя вообще не сказать, если за столько лет у кого-то руки не дошли до такой ерунды. И нельзя ни шрифт, ни папку по умолчанию настроить: после перезапуска все настройки будут забыты. Буду справедлив и замечу, что появились две новые (с тех давних пор) бирюльки: одна бесполезная, но прикольная — речевой вывод; другая полезная и удобная — интеграция с браузером.
Ну, и хватит о неглавном.
Все же главная работа Переводчика — переводить. А здесь-то как раз не изменилось ничего. Более того, как мы увидим ниже, ничего и не могло измениться без кардинальной смены парадигмы построения программы. Но этот шаг требует не столько материальных ресурсов (уверен, деньги можно найти всегда), сколько ресурсов идей, знаний, профессионализма. Увы, наш платиновый герой и с лингвистической, и с программистской точек зрения являет собой пример романтического дилетантизма. Для первой версии любительской программки — может и лестная характеристика, но спустя столько лет — стыдновато…
Итак, дюжина простых опытов без пробирок и микроскопа.
Имена людей
Начнем с чего-нибудь азбучного (верхняя рамка — всегда наш входной текст, в нижней — перевод программы):
1 Маша мыла раму.
Маша washed a frame.
Ну что ж, вполне предсказуемо и корректно: чего не знаю — то не перевожу. Пример, правда, шуточный; попробуем что-нибудь более реальное:
2 Я вижу Машу.
I see I Wave.
А вот это уже «классика жанра»! Герой наш Машет, сам себя созерцая. Сколько анекдотов на эту тему, но кто бы мог подумать, что эти байки — так близко. Кстати, не удержался, нашел диск со Stylus’ом, проверил на нем и убедился, что был не прав, подозревая, будто разработчики просто заменили название: результат получился другой — I see I wave, то есть Stylus игнорирует заглавную букву. Технология действительно поднялась на качественно новый уровень.
Внесем «Маша» в словарь (думаю, что «Mary» — адекватный перевод) и опять попросим Переводчика поработать:
3 Я вижу Машу.
I see the Mary.
Ай-яй-яй! Артикль здесь явно неуместен. Проверяем по-другому…
4 Я вижу Марию.
I see Maria.
Умеет, оказывается, с именами работать, но как-то странно. Хотя тенденция уже проклевывается. Клюнем-ка еще разок:
5 Я видел Анну, она плакала.
I saw Anna, she (it) cried.
«Платинум» делает вид, что не понимает — о ком (she) или о чем (it) идет речь. Формально он прав, ведь в классическом английском животные не имеют почетного права на, извините, половое местоимение; а поскольку Анной может называться не только человек, но и кошка, и черепашка… Стоп-стоп! Этак можно желаемое выдать за действительное. Надо бы проверить: думали отцы-создатели о животных или это здесь случайно получилось? Схитрим немного:
6 Я видел Анну, которая плакала.
I saw Anna who cried.
Надо же! Уже не сомневается, что Анна — человек. Неужели из контекста понял? Мол, черепашки и кошки плакать не умеют… Вот было бы здорово, кабы так!
Такое поведение Переводчика напомнило случай в Китае. Надо сказать, по-китайски я — ни бум-бум, но в больших городах это не проблема: и надписи почти все дублированы, и многим молодым китайцам очень хочется попрактиковаться в английском, поэтому они с удовольствием помогают иностранцам. Однако пару раз я попадал на очень симпатичных студенток, которые в ответ на мои «дуюспики» делали круглые глаза (китаянки тоже умеют), недоуменно пожимали плечами, мол, даже не понимаем, о чем речь. Это показалось немного странным, поэтому, наткнувшись на такое недоумение в очередной раз, я пошел чуть дальше и сказал, как бы ни к кому не обращаясь:
— Baby, you are beautiful girl…
— Oh, thank you very much! —
Девушка покрылась румянцем удовольствия, а стоявшие рядом студенты схватились за животы от смеха. А если серьезно, то вся эта последовательность опытов была, разумеется, не шуточной и не случайной. Мы обнаружили дефект перевода и через проверку цепочки гипотез (они здесь, ради интриги, не были сформулированы явно) пришли к очень важному выводу: X-Translator PLATINUM адекватно работает с именами людей только из Генерального Словаря!
Что ему мешает так же поступать с именами, введенными пользователем? Да то, что вводя новое существительное, мы почему-то не можем прямо указать — это ИМЯ. Программисты PROMT посчитали эту категорию излишней. Единственный пункт из возможных, напоминающий требуемое, — ПЕРСОНАЛИИ. Но, как показывает опыт 3, этого явно недостаточно. А пример 5 доказывает, что и со «встроенными» именами случаются детские неожиданности.
Е. Козловский, «Русский софт» («КТ» #193)
Глаголы и существительные
Перевод глаголов и смешивание их с именами существительными — еще одно родимое пятно, указывающее на общий генотип с программой Stylus. Все нелепицы того периода, словно родимые пятна, благополучно перекочевали в якобы «современную» программу. Как уже упоминалось, Stylus я испытывал на справке. Ну, а что такое Help, если попросту? Правильно — маленькое пояснение, а дальше последовательность предписаний: бери больше; кидай дальше; отдыхай, пока летит…
Казалось бы — чего проще? Но результаты следующих опытов доказывают, что X-Translator PLATINUM никогда адекватно не переведет подобные тексты.
7 Тянуть. Тяни. Снижение.
To pull. Pull. Decrease (reduction).
М-да… Очень мягко говоря: не впечатляет! А ведь здесь все предельно однозначно: предложения, состоящие из одного глагольного сказуемого, причем глагол в повелительном наклонении. Я ждал чего-то вроде: «Тяни. Снижай. Напрягай». Выбор корней совершенно не важен, это зависит от контекста, а порой и творчества требует. Чего не скажешь о выборе части речи или члена предложения: надо быть большим фантазером, чтобы увидеть в этом тексте существительные, а тем более — инфинитивы! Особенно в английском, с его строгим порядком членов предложения, тем более — главных…
Попробуем понять логику (или причину ее отсутствия) разработчиков фирмы PROMT, сменив направление перевода.
8 Drag. Drop. Pull.
Тянуться. Снижение (капля).
Напряжение.
Видите: почему-то в эту сторону с глаголами наладилось… Чего не скажешь о существительном. При этом, я опять же не переживаю по поводу несовпадения обратного перевода: тоже тема для разговора, но вовсе не сегодняшнего.
Важнее, что теперь нам стала немножко очевидней причина фантазий родителей «Платинума». А причина банальнейшая — языковой дилетантизм. «Поверхностным» признаком этого недуга является неумение различать в английском тексте части речи, опираясь на структуру предложения. Более «глубоким» симптомом следует назвать непонимание роли артикля.
Однажды (совсем по другому поводу) я провел небольшое социологическое исследование, задавая всем окружающим простецкий вопрос: что такое артикль? Как ни странно, в этом опыте (не считая анекдотов) я получил всего две разновидности ответа: либо просили нецензурно не выражаться, либо многословно рассказывали — чем определенный артикль отличается от неопределенного. Видимо еще в школе, вбивая именно эту разницу, нас напрочь отучили от обдумывания куда более важной проблемы: а вообще артикль, любой, an article, он зачем нужен? Когда так уточняешь вопрос, «респонденты» обычно тушуются, а некоторые несмело предполагают: эта штука, мол, вроде хвостика у человека, атавизм, одним словом.
Уверен, что большинство читателей знали или уже догадались, что в «этом дурацком английском», где одна словоформа может выражать три-четыре части речи, артикль — один из способов обозначать существительное. Просто в русском языке эта информация почти всегда у слова «на лбу написана», а в английском лишь иногда (есть и там слова, например, nature, happiness, freedom, которые по форме однозначно являются существительными)(Если по серьезному, то все немножко сложнее. Например, в выражении «I live in The Great Britain» артикль стоит перед прилагательным «Великая», а не перед существительным «Британия», но мы не будем терять на это время, поскольку такие случаи не противоречат упрощенной идее о роли артикля, а лишь уточняют ее).
Но может все же резко я — про дилетантизм-то? Надо бы еще раз проверить. Хорошо бы, для корректности, слово взять равноценное и как глагол, и как существительное.
9 Lift up, baby. The lift was broken.
Подъем (лифт), ребенок. Подъем (лифт) был сломан (нарушен).
Как видите, употребив типичное сочетание с наречием up, я даже подсказал Транслятору, что это глагол. Тщетно… Кстати, сравните с переводом совершенно аналогичной конструкции в следующем примере. Явно проклевывается очередная тенденция. Скажем ей: «Цып-цып».
10 Stand. Stand up. Sit. Sit down.
Стенд (позиция). Встать.
Сидеть. Сядьте.
Беда не в том, что на пять глагольных предложений получен только один корректный перевод (sit down). Беда в том, что наш герой не всегда реагирует на однозначные грамматические признаки. Хуже того: на совершенно однотипные аргументы он выдает принципиально разные результаты! Виновата, конечно, не программа, а ее авторы, которые (из наших опытов это очевидно) не догадываются, что грамматика есть способ подружить слова в предложении.
Но может быть, нам поможет подключение словарей? Не в этом ли решение проблем?
Увы, если во встроенном (Генеральном) словаре хоть иногда проскакивает повелительное наклонение глаголов, то в пользовательские словари мы не сможем его внести ни за какие коврижки: фирма PROMT, видимо, следуя «оригинальной методике проф. Белоногова», упразднила сие излишество! Пока только в рамках своего продукта.
Про артикли словари вообще ничего не знают. Бред, конечно, но «се ля ви»…
Прежде чем закончить с глаголами, небольшая цитата из постоянно пополняющейся книги «Анекдоты от Берга» (Берг — псевдоним (точнее, прозвище) известного педагога и барда Владимира Ланцберга). Очень уж в тему…
«Группа исследователей-энтузиастов составляла частотный словарь произведений Михаила Щербакова: загнала в компьютер все доступные тексты и заставила умную программу подсчитать для каждого слова, сколько раз оно в этих текстах встречается.
Программа была настолько умная, что сама определяла грамматическую принадлежность слова (существительное, глагол и пр.) и потом распознавала его во всех формах: падежах, лицах, числах и т. д. Когда работа была сделана, ее авторы, проверяя возможности своего детища, поинтересовались, в частности, какой глагол у Щербакова самый употребительный. И получили ответ: глагол «мыть»… Исследователи переглянулись: они неплохо знали тексты Щербакова, но что-то не замечали там обилия этого глагола. Тогда они спросили: какой глагол следующий по употребительности? Козырнув статистикой, программа уверенно ответила: глагол «какать»…
Только шок, пережитый авторами работы, заставил их вспомнить, что программа считает деепричастия не самостоятельными словами, а формами глаголов; однако никто не рассказал ей о такой штуке, как ударение, которым местоимение «кака,я» отличается от деепричастия «ка,кая». Выяснилась и причина лидерства глагола «мыть», у которого нашлась подходящая форма повелительного наклонения…»
Это всего лишь анекдот — поучительная история, в данном случае, из реальной жизни. И, разумеется, ударение — вовсе не единственный (а для анализатора текста — самый неподходящий) способ отличить местоимение от деепричастия. Но разве не столь же анекдотичны результаты наших опытов?
Когда-то, еще в начальной школе, каждый из нас, от усердия высовывая язык, разбирал предложения по составу. Помните: подлежащее, сказуемое, обстоятельство времени… Согласитесь, даже в русском языке это не очень сложно. В английском же — элементарно (если это не поэзия). Но в том же английском часто невозможно понять — что перед вами: существительное? глагол? прилагательное? — не определив роли этого слова в предложении. Как мы только что доказали, ни Stylus, ни X-Platinum Translator даже не пытаются анализировать ПРЕДЛОЖЕНИЕ. Такой лингвистической категории для них не существует.
Но, извините, тогда это не программа-переводчик! Это, в лучшем случае, словарь. Но наш случай, пожалуй, и не лучший…
Поэкспериментируйте. Вы будете долго смеяться. Если раньше не заплачете…
11 Мой пол, пока не устанешь.
Мой пол определить несложно.
Мой пол — женский…
My floor, you will not be tired yet.
My floor to define simply.
My floor — female…
{ALT}.ru-ist, студент ВМА («КТ» #450)
О других проблемах
Имеются и не столь серьезные, но все же огрехи. Эти мелкие, но повседневные блохи не выведены из программы весьма почтенного возраста. Пример, для экономии места, только один.
12 I like «The Beatles».
Я люблю « Beatles ».
Человеку, с текстами лишь играющему, а не работающему, это может показаться придиркой. На самом деле, здесь две грубейшие ошибки (отнюдь не творческие ошибки перевода), которые при подготовке текстового документа сильно напрягут пользователя.
Во-первых, вполне законно оставив непереведенным существительное, по какому праву Транслятор убрал артикль? Если существительное будет внесено в словарь, артикль исчезнет в результате перевода или транслитерации, а если переводить не потребуется… Неужели врукопашную ликвидировать последствия «дурацкой старательности»?
Во-вторых, представляете, если в тексте десятки таких названий и в каждом пользователю придется не только вставлять артикли, но и вручную удалять два лишних пробела! Кто-то махнет рукой: пускай их, не будем удалять… И получит распечатку (страницу сайта), где строки начинаются с закрывающих кавычек или кончаются открывающими. Бр-р-р! Дилетантщина…
Вряд ли найдется Плюшкин, который побежит в PROMT требовать назад свои пять долларов, столкнувшись с указанной и не указанной здесь халтурой. И невеликие деньги, и невеликое знание английского, и здоровая скромность («наверное, чего-то я еще не умею») не дадут вскипеть эмоциям разочарования. Но можно компенсировать и этот мизерный ущерб, извлекая уроки, изучая историю программирования.