Mышь белая, говорящая
АрхивПару недель назад Игорь Гордиенко принес в редакцию красивую коробку с надписью Philips SpeechMike и попросил разобраться с неизвестным науке зверем. Зверь, судя по описанию, являлся этаким универсальным пультом управления компьютером, содержащим мышь (трекбол), микрофон и громкоговоритель.
Трекбол - самый обычный, хотя и чрезвычайно неудобный для меня, привыкшего крутить шарик указательным пальцем, а не большим. Кроме двух стандартных кнопок, аналогичных правой и левой кнопкам мыши, снизу устройства оказались еще две кнопки, рассчитанные на нажатие указательным пальцем и похожие на спусковой крючок. Одна из них выполняет ту же функцию, что и обычная левая кнопка мыши, назначение же второй понять не удалось - никаких действий она не производит. Впрочем, "нажимать на курок", удерживая одновременно большим пальцем шарик трекбола, удается не всегда, и без тренировки чаще всего промахиваешься мимо кнопки на экране, прилично отклоняясь вверх. Чуть выше трекбола расположен микрофон - обычный, подключаемый ко входу звуковой карты и связанный с мышью только общим корпусом. А с низу трекбола находится еще и динамик, назначение которого я до сих пор понимаю не очень хорошо. Можно, конечно, прикладывать мышь к уху (учитывая, что динамик относительно тихий), но проще, на мой взгляд, слушать звук через колонки или встроенный динамик ноутбука. И микрофон, и динамик имеют собственные "джеки" для подключения к звуковой карте, и при полном подключении "СпичМайка" к ноутбуку, последний оказывается буквально опутан проводами (учитывая, что COM у моего ноутбука сзади, а микрофонный вход и выход на наушники - спереди).
Но самое вкусное оказалось на приложенном к устройству диске: программа FreeSpeech 98 (версии, разумеется, английской). Я было попытался заставить "Майка" работать с русскоговорящим "Горынычем", но безуспешно. Пришлось, несмотря на явное присутствие в моем английском произношении сильного московского акцента, учить мышь английскому.
Процесс установки FreeSpeech запомнился тем, что инсталлятор заставлял меня в течение пятнадцати минут читать в микрофон куски инструкции по эксплуатации, дифирамбы компании Philips и прочую ерунду. На обещание улучшить качество и уменьшить время распознавания в обмен на еще пятнадцать минут этого мучения я не согласился и приступил к делу.
Программа поддерживает два варианта работы - ввод произносимого текста в любое приложение, где можно набирать текст, и выполнение команд приложения и системы. Я тут же открыл Word и попытался сказать "Hello, Word!" - не тут то было. Русский Word набрал текст русскими же буквами, абсолютно так же, как я набрал бы эти слова, забыв переключиться на английский. Ручное переключение перед набором текста привело к тому, что вместо букв печатались какие-то точки. Зато в Notepad'е все пошло как надо. Первым попавшимся под руку английским текстом оказалось описание системной платы MicroStar, которое я тут же и употребил. Что получилось у программы, можете судить сами (курсивом выделены ошибки, а в скобках приведен оригинальный текст):
|
На мой взгляд, результат и плох, и хорош одновременно. Получается быстрее, чем на клавиатуре, но это для меня, а не для профессиональной машинистки: абзаца ждешь секунд 10-15. В словаре программы явно нет слова "interference", впрочем, как и "radiate". Правда, словарь ориентирован на компьютерную и общеупотребительную тематику. Подобное количество ошибок давали программы распознавания сканированного текста несколько лет назад, а сейчас качество их работы возросло на несколько порядков. Вполне вероятно, что через пару лет технологии распознавания речи достигнут того же рубежа. Наверняка не последнюю роль сыграл мой разговорный английский, в связи с чем результат все же следует признать очень хорошим.
Ради эксперимента можно было, конечно, дать мышке послушать фильм без перевода или радио на английском, но вряд ли это принесло бы пользу: ведь программе требуется настройка на голос, а заставить диктора радио произносить написанную у меня на экране абракадабру я пока не в силах.
А вот с распознаванием команд оказалось не столь просто. Вообще-то и не стоило ожидать корректной работы программы в таком окружении, как английская версия Windows 2000 RC1 в комплекте с русской версией Word 2000. Тот же Wordpad работает с голосовыми командами лучше, хотя тоже не вполне корректно. Попытки выполнить ну хоть какой-нибудь пункт из меню завершились ничем: команда распознается нормально, отображается во всплывающем рядом с мышкой окошке, а меню приложения только подмигивает, но список не раскрывает. Но если один из пунктов меню открыть, то дальше все работает без проблем: говоришь мышке "Даун!" - курсор движется по меню вниз, говоришь "Save" или "Print" - вызывается соответствующее окно. Правда, практической пользы нет. Можно, конечно, с гордым видом, отодвинувшись от стола, сказать мышке "Save", и она поймет, но когда дело дойдет до запроса имени файла, придется забыть про гордость, придвинуться к столу и набрать имя руками. Кроме того, команда распознается на моем компьютере (Pentium 266 MMX) секунды за три-четыре, а это все же очень медленно. Лучше всего выполняется то, что относится к системе: "Close", "Maximize", "Minimize" и "Cancel". Причем последняя работает независимо от русификации в тех случаях, когда программа предоставляет на выбор только русские "Да", "Нет" и "Отмена". А вот распознать простейшее "No" программа не смогла ни разу.
При обычной работе распознавание команд спокойнее все же отключить, иначе тот же Word так и норовит сделать что-нибудь совершенно непредсказуемое типа переноса строки посередине набранного слова или выделения и последующего удаления фрагмента текста. Это не шутка, и кажущаяся чрезвычайно малой вероятность таких событий на самом деле не столь мала: я помню случай, когда моя кошка, прогуливаясь по клавиатуре, ухитрилась наступить последовательно на "+", Enter, F8, Enter, а дело было, если кто еще не понял, в Norton Commander.
А жаль все же, что мышь не понимает по-русски, так иногда хочется, вставая из-за стола, сказать компьютеру: "Эй, а ну кончай трещать диском, знаешь, сколько времени?"