Архивы: по дате | по разделам | по авторам

Mышь белая, говорящая

Архив
автор : Сергей Леонов   02.11.1999

Пару недель назад Игорь Гордиенко принес в редакцию красивую коробку с надписью Philips SpeechMike и попросил разобраться с неизвестным науке зверем. Зверь, судя по описанию, являлся этаким универсальным пультом управления компьютером, содержащим мышь (трекбол), микрофон и громкоговоритель.


Трекбол - самый обычный, хотя и чрезвычайно неудобный для меня, привыкшего крутить шарик указательным пальцем, а не большим. Кроме двух стандартных кнопок, аналогичных правой и левой кнопкам мыши, снизу устройства оказались еще две кнопки, рассчитанные на нажатие указательным пальцем и похожие на спусковой крючок. Одна из них выполняет ту же функцию, что и обычная левая кнопка мыши, назначение же второй понять не удалось - никаких действий она не производит. Впрочем, "нажимать на курок", удерживая одновременно большим пальцем шарик трекбола, удается не всегда, и без тренировки чаще всего промахиваешься мимо кнопки на экране, прилично отклоняясь вверх. Чуть выше трекбола расположен микрофон - обычный, подключаемый ко входу звуковой карты и связанный с мышью только общим корпусом. А с низу трекбола находится еще и динамик, назначение которого я до сих пор понимаю не очень хорошо. Можно, конечно, прикладывать мышь к уху (учитывая, что динамик относительно тихий), но проще, на мой взгляд, слушать звук через колонки или встроенный динамик ноутбука. И микрофон, и динамик имеют собственные "джеки" для подключения к звуковой карте, и при полном подключении "СпичМайка" к ноутбуку, последний оказывается буквально опутан проводами (учитывая, что COM у моего ноутбука сзади, а микрофонный вход и выход на наушники - спереди).

Но самое вкусное оказалось на приложенном к устройству диске: программа FreeSpeech 98 (версии, разумеется, английской). Я было попытался заставить "Майка" работать с русскоговорящим "Горынычем", но безуспешно. Пришлось, несмотря на явное присутствие в моем английском произношении сильного московского акцента, учить мышь английскому.

Процесс установки FreeSpeech запомнился тем, что инсталлятор заставлял меня в течение пятнадцати минут читать в микрофон куски инструкции по эксплуатации, дифирамбы компании Philips и прочую ерунду. На обещание улучшить качество и уменьшить время распознавания в обмен на еще пятнадцать минут этого мучения я не согласился и приступил к делу.

Программа поддерживает два варианта работы - ввод произносимого текста в любое приложение, где можно набирать текст, и выполнение команд приложения и системы. Я тут же открыл Word и попытался сказать "Hello, Word!" - не тут то было. Русский Word набрал текст русскими же буквами, абсолютно так же, как я набрал бы эти слова, забыв переключиться на английский. Ручное переключение перед набором текста привело к тому, что вместо букв печатались какие-то точки. Зато в Notepad'е все пошло как надо. Первым попавшимся под руку английским текстом оказалось описание системной платы MicroStar, которое я тут же и употребил. Что получилось у программы, можете судить сами (курсивом выделены ошибки, а в скобках приведен оригинальный текст):

 
This equipment has been tested and found to comply with the limits for a close to be (class B) digital devices (device), push wants (pursuant) to cut (part) 15 of Nazi cereals (the FCC rules). The sentiments (These limits) are designed to provide a reasonable protection against harmful and Air France (interference) when the equipment is operated in a commercial environment. This equipment generates, uses and can create (radiate) radio frequency and budget (energy) and, if not install and used in accordance with the instruction manual, make calls from four went to France (may cause harmful interference) to radio communications. Operation of this equipment in a residential area is likely to cause harmful and her friends (interference), in each (which) case the user will be required to character that into France but (correct the interference at) his own expense.Notice one (1)The changes or modifications not expressly approved by the parking (party) responsible for compliance could avoid (void) the users call to retain (user's authority) to capture rates (operate) the equipment.


На мой взгляд, результат и плох, и хорош одновременно. Получается быстрее, чем на клавиатуре, но это для меня, а не для профессиональной машинистки: абзаца ждешь секунд 10-15. В словаре программы явно нет слова "interference", впрочем, как и "radiate". Правда, словарь ориентирован на компьютерную и общеупотребительную тематику. Подобное количество ошибок давали программы распознавания сканированного текста несколько лет назад, а сейчас качество их работы возросло на несколько порядков. Вполне вероятно, что через пару лет технологии распознавания речи достигнут того же рубежа. Наверняка не последнюю роль сыграл мой разговорный английский, в связи с чем результат все же следует признать очень хорошим.

Ради эксперимента можно было, конечно, дать мышке послушать фильм без перевода или радио на английском, но вряд ли это принесло бы пользу: ведь программе требуется настройка на голос, а заставить диктора радио произносить написанную у меня на экране абракадабру я пока не в силах.

А вот с распознаванием команд оказалось не столь просто. Вообще-то и не стоило ожидать корректной работы программы в таком окружении, как английская версия Windows 2000 RC1 в комплекте с русской версией Word 2000. Тот же Wordpad работает с голосовыми командами лучше, хотя тоже не вполне корректно. Попытки выполнить ну хоть какой-нибудь пункт из меню завершились ничем: команда распознается нормально, отображается во всплывающем рядом с мышкой окошке, а меню приложения только подмигивает, но список не раскрывает. Но если один из пунктов меню открыть, то дальше все работает без проблем: говоришь мышке "Даун!" - курсор движется по меню вниз, говоришь "Save" или "Print" - вызывается соответствующее окно. Правда, практической пользы нет. Можно, конечно, с гордым видом, отодвинувшись от стола, сказать мышке "Save", и она поймет, но когда дело дойдет до запроса имени файла, придется забыть про гордость, придвинуться к столу и набрать имя руками. Кроме того, команда распознается на моем компьютере (Pentium 266 MMX) секунды за три-четыре, а это все же очень медленно. Лучше всего выполняется то, что относится к системе: "Close", "Maximize", "Minimize" и "Cancel". Причем последняя работает независимо от русификации в тех случаях, когда программа предоставляет на выбор только русские "Да", "Нет" и "Отмена". А вот распознать простейшее "No" программа не смогла ни разу.

При обычной работе распознавание команд спокойнее все же отключить, иначе тот же Word так и норовит сделать что-нибудь совершенно непредсказуемое типа переноса строки посередине набранного слова или выделения и последующего удаления фрагмента текста. Это не шутка, и кажущаяся чрезвычайно малой вероятность таких событий на самом деле не столь мала: я помню случай, когда моя кошка, прогуливаясь по клавиатуре, ухитрилась наступить последовательно на "+", Enter, F8, Enter, а дело было, если кто еще не понял, в Norton Commander.

А жаль все же, что мышь не понимает по-русски, так иногда хочется, вставая из-за стола, сказать компьютеру: "Эй, а ну кончай трещать диском, знаешь, сколько времени?"



© ООО "Компьютерра-Онлайн", 1997-2024
При цитировании и использовании любых материалов ссылка на "Компьютерру" обязательна.