Архивы: по дате | по разделам | по авторам

Умные телефоны заговорили

АрхивТехнологии
автор : Андрей Кочетков   03.05.2005

Производители мобильных телефонов давно хотят научить свои устройства человеческой речи. Делается это с разными целями, но важнейшая из них - дать возможность пользоваться сотовым телефоном людям с ограничениями по зрению.

Последние несколько лет производители мобильных телефонов стремятся научить свои устройства человеческой речи. Делается это с разными целями, но важнейшая из них - дать возможность пользоваться сотовым телефоном людям с ограничениями по зрению.

Новый этап развития мобильного софта начался с появлением операционной системы Symbian. Платформа позволяла создавать приложения, которые резко расширяли возможности обработки экранной информации. Вскоре на рынке появились программы экранного доступа для смартфонов, преобразующие текст в речь.

Первой из них стала Talks, ныне принадлежащая компании ScanSoft. Она успешно продавалась, обрастала новыми функциями. Стало очевидным, что это направление имеет хорошие перспективы и будет пользоваться немалым спросом. В 2004 году у Talks появляется достойный конкурент - Mobile Speak от испанской компании Code Factory (www.codefactory.com). Оба продукта используют синтезаторы речи для большинства основных европейских языков. К сожалению, среди них не нашлось места для русского. Впрочем, законы рынка, диктующие необходимость постоянного роста, заставили производителей обратить взгляд и на Россию.

Главным препятствием при выводе Talks и Mobile Speak на российский рынок оказалось отсутствие русского речевого синтезатора для платформы Symbian. Но "свято место - пусто не бывает", спрос рождает предложение, и усилиями минской компании "Сакрамент" в середине 2004 года синтезатор был создан. А в конце ноября 2004 года компания Code Factory объявила о выходе русской версии своего программного продукта для смартфонов на платформе Symbian. Сегодня уже можно подвести некоторые итоги и поделиться впечатлениями о работе с этой программой. Итак, что же такое Mobile Speak и чем она интересна для пользователей с ограничениями зрения?

Mobile Speak - это программа речевого доступа к экрану мобильного телефона, которая позволяет использовать большинство его функций. При работе она озвучивает экранный текст на пятнадцати языках, включая русский. Этой же функцией снабжены входящие в пакет поставки файл-менеджер, калькулятор, MP3-плейер (готовится к выпуску веб-браузер). Имеется два аудиопрофиля, один из которых улучшает качество звука при использовании наушника.

Mobile Speak работает в операционной среде Symbian и не зависит от сотовой сети. Сегодня программа поддерживает смартфоны Nokia 3650, 3660, 6260, 6600, 6620, 6630, 6670, 7610, N Gage, N Gage QD и Siemens SX1, этот список постоянно пополняется.

Mobile Speak в деле

Поработать с программой удалось на смартфоне Nokia 6600. Процесс загрузки достаточно прост. Все файлы поставки загружаются через Bluetooth-соединение. Сначала устанавливается синтезатор голоса "Ирина" компании "Сакрамент", затем основной пакет Mobile Speak. Если продукт не начал работать сразу после установки, то активировать его можно через меню телефона. Перемещение по меню, ввод информации, чтение сообщений сопровождаются произнесением букв, слов или строк по вашему желанию. Вся информация на дисплее, включая состояние батареи и мощность сигнала, может быть озвучена. При входящем звонке телефон сообщает имя и номер абонента (после нажатия горячей клавиши). Легко составляются MMS- или SMS-сообщения, редактируется телефонная книжка, управляется календарь, органайзер и многое другое. Вы можете забыть об экране и полагаться только на речевой вывод информации. Кроме того, многим придется по душе возможность чтения на смартфоне электронных книг или публикаций.

Демонстрационные версии программы с поддержкой разных языков можно скачать с сайта компании www.mobile speak.com. Есть возможность бесплатно пользоваться и полнофункциональным продуктом в течение месяца, если вы сделаете запрос на получение пробного серийного номера.

Нежелательное многословие

После знакомства с Mobile Speak возникает вполне резонный вопрос: чем она отличается от упомянутой выше Talks?

Параллельное использование обоих пакетов в течение двух недель показало, что они сносно работают со стандартными меню и программами смартфонов Nokia. Однако у Mobile Speak иногда возникают проблемы с чтением текстовых окон. В окне просмотра коротких сообщений Mobile Speak далеко не идеально справляется с прочтением. Когда происходит перемещение по буквам, Mobile Speak зачастую произносит целое слово, а не букву. Talks не делает подобных ошибок, прекрасно работая в текстовых окнах даже с такими приложениями, как Quick Word и Yedit. Между тем в окне Quick Word Mobile Speak вообще ничего не видит.

В Talks отлично реализована функция прочтения всего текста от курсора и до конца документа, Mobile Speak не имеет такой возможности. Установка множества различных приложений показала, что в большинстве случаев и Mobile Speak, и Talks успешно читают в них текст, меню и прочую информацию. Это позволяет расширить возможности смартфона за счет программного обеспечения третьих фирм, то есть вовсе не обязательно ограничиваться стандартным набором приложений, поставляемых с вашим смартфоном.

Одним из серьезных недостатков Talks является его "словоохотливость". Если в Mobile Speak можно установить степень многословности, то в Talks такая возможность отсутствует. Часто Talks начинает читать информацию с экрана, когда этого совсем не требуется. В руководстве для пользователей говорится, что голос может быть остановлен длительным нажатием на кнопку "talks". Однако после этого все последующие нажатия воспринимаются как начало команды talks. Да и само чтение частенько возобновляется после небольшой паузы, а курсор убегает неизвестно куда. Кроме того, Talks порой сокращает длинные пункты меню и пункты списков. Mobile Speak всегда читает эти элементы полностью. В целом Mobile Speak дает больше возможностей для тонкой подстройки приложения под конкретного пользователя. Она лучше управляема и менее требовательна к производительности телефона.

В каждой программе есть недоработки и ошибки, но производители по-разному реагируют на их появление. Стиль этой реакции вполне может стать решающей причиной выбора покупателем той или иной программы. Talks была приобретена компанией ScanSoft, но, видимо, оказалась для нее далеко не приоритетным продуктом. С момента выхода последней версии прошло уже полгода, а о новых релизах пока ничего не слышно. ScanSoft не предоставляет серьезной поддержки пользователям, так что, если у вас возникнут проблемы, бороться с ними придется самостоятельно.

Напротив, Mobile Speak - основной продукт для Code Factory, обновления выпускаются раз в месяц, а у пользователей есть возможность сделать запрос о дополнении функций. Поэтому, если что-то не работает сегодня, через месяц или раньше это будет исправлено.

Разумеется, самым большим недостатком Talks следует считать отсутствие поддержки русского языка. В этом смысле Mobile Speak пока находится в гордом одиночестве на российском рынке. Оба продукта неидеальны, но радует сам факт, что подобное ПО добралось и до наших палестин, расширяя возможности пользователей смартфонов.

Программы экранного доступа для PC

В конце 80-х - начале 90-х годов появляются аппаратные синтезаторы и простейшие программы экранного доступа для DOS, среди которых наилучшей функциональностью и стабильностью отличается Vocal-Eyes от компании GWMicro.
В 1994 году вышли две программы, позволяющие работать в ОС Windows 3.1: Windows Bridge и Jaws for Windows от Henter Joice. Устанавливается паритет, но Windows Bridge выигрывает в стабильности и работе с большим числом экранных элементов.

С выходом OS Windows 95 временно наступает затишье, но в 1996 году на рынке появляются Windows Bridge 2.xx, Jaws for Windows 3.x и Window-eyes 3.0. Продукты весьма нестабильны, но уже позволяют нормально работать с основными офисными приложениями, а также используют немногочисленные программные синтезаторы речи. Русского языка еще нет.
В 1999 году с появлением Windows 98 совершенствуются программы экранного доступа. Windows Bridge сходит с арены, а оставшиеся делят 90 процентов мирового рынка. Появляются первые синтезаторы речи для русского языка.

Сегодня Jaws 6.1 и Window-eyes 5.0 - мощные пакеты, которые обеспечивают работу с широчайшим кругом приложений и даже с некоторыми функциями графических редакторов. Они прекрасно озвучивают содержимое интернет-сайтов, позволяя работать и с удаленными серверами. Есть несколько русских синтезаторов речи: Digalo, SayItPro, L&H и Sakrament. Последний, в частности, работает в системах экранного доступа, в телефонных серверах, в словарях и т. д.

Linux тоже не обойдена вниманием. Уже несколько лет существует среда EmacSpeak с синтезатором речи MBrola, который говорит по-русски. Для незрячих пользователей Linux остается специфической ОС, хотя и весьма привлекательной благодаря своей надежности и растущей сфере приложений (последнее особенно важно для будущих профессионалов ИТ). Однако можно не сомневаться - рано или поздно Linux начнет говорить и в своих графических оболочках. 

- Из журнала "Компьютерра"

© ООО "Компьютерра-Онлайн", 1997-2024
При цитировании и использовании любых материалов ссылка на "Компьютерру" обязательна.