Архивы: по дате | по разделам | по авторам

Видеть

Архив
автор : Андрей Кочетков   02.11.2000

Некоторые материалы темы «Без ограничений» («КТ» #335 от 22 февраля 2000 года), посвященной компьютерным технологиям для инвалидов, стимулировали весьма позитивные процессы. Так, автор одной из статей темы, слепоглухонемой доктор психологических наук Александр Суворов теперь имеет выход в Интернет благодаря поддержке, которую ему оказал «Проект гармония» («Project Harmony») и отчасти РООИ «Содействие социальной защищенности инвалидов» (rooisszi@online.ru). Мы получили также ряд интересных писем. Сегодня я предлагаю вниманию читателей небольшую статью Андрея Кочеткова об использовании голосовых технологий для «компьютеризации» незрячих. - Л.Л.-М.

В далекие времена, когда крутой системой была DOS 5.5 и начинали свой путь Windows 3.0, а капитан Пауэр сражался с железными роботами лорда Дрэда, почему-то все решили, что голоса у этих разрушительных машин должны быть похожи на скрип жестяных динамиков, без капли человеческого. Но на фоне всеобщей боязни порабощения компьютерами нашлись люди и компании, пожелавшие вдохнуть в скрежет безжизненных аппаратов чуточку людского: если не искру сознания, то хотя бы иллюзию живого голоса. Для людей же с нарушением зрения синтезированный голос открывал компьютерный мир.

Уже в начале 90-х годов в компании IBM был разработан пакет Screen Reader, который вместе с синтезатором речи позволял довольно комфортно работать в программах с текстовым интерфейсом. Пользователь управлял читающей программой через небольшую клавиатуру, похожую на калькулятор. Screen Reader стал первым сервисным приложением, помогающим профессиональной реабилитации людей с ограничениями зрения. Вскоре в США появились незрячие программисты, операторы баз данных, сотрудники по работе с клиентами.

По сей день незрячие всего мира с большой охотой используют в своей работе сервисные DOS-программы. Но прогресс не мог стоять на месте. Появились операционные системы с графическим интерфейсом, что стало огромной проблемой для разработчиков сервисных программ экранного доступа.

Лишь через год после выхода OS/2 и Windows 3.1 компаниями Synthavoice и Henter Joice были выпущены первые пакеты экранного доступа для Windows 3.1. IBM тоже не осталась в стороне, выпустив версию Screen Reader, которая озвучивала OS/2. Эти программы давали незрячим лишь минимальный доступ к работе с различными приложениями. Но среди этих приложений были программы распознавания текста. А значит, стало возможно читать любые печатные издания без помощи глаз!

В те же годы произошло другое событие, определившее дальнейшее развитие голосовых технологий и технологий экранного доступа. Всем владельцам звуковых карт от фирмы Creative Labs известен пакет под названием Text Assist, который стал первым примером программного синтеза речи. Позднее те же Synthavoice и Henter Joice использовали программный синтез речи в своих продуктах Windows Bridge и Jaws for Windows. Появились и другие программные синтезаторы, говорящие разными голосами на нескольких языках. Flextalk, Dectalk, Microsoft Speech Engine, Eloquence, Elan Informatique speech engine - этот ряд можно продолжить.

Сегодня в мире есть несколько сотен тысяч пользователей с ограничениями зрения. Пакеты Jaws for Windows и Windows Bridge позволяют им выполнять 90% операций, не связанных непосредственно с графикой. Почти все действия мыши дублируются командами клавиатуры, при помощи комбинаций клавиш пользователь получает информацию о размере, цвете и стиле шрифтов, о формате документа. В сервис входит чтение диалоговых окон и табличных списков, не говоря уж о чтении текущей строки, слова или буквы.

Безусловно, больше всего вопросов вызывает работа без глаз в Интернете. Однако Virtual Cursor, последняя разработка компании Henter Joice, революционизировала доступ к Интернету для людей с ограничениями зрения. При помощи этой технологии html-документ виртуально преобразуется в текстовый документ в окне Internet Explorer. Пользователь перемещает курсор по строке, а сервисная программа читает текст вместе с информацией о таблицах, картинках и т. д. Произносятся и ссылки, и можно пойти на другую страничку, нажав в нужном месте клавишу Enter.

По сути дела, современные пакеты экранного доступа сделали работу с компьютером для человека без зрения почти неотличимой от работы обычного пользователя. Используя речевой синтезатор, наушники и компьютер с программой экранного доступа, незрячие служат, например, брокерами или аналитиками рынка в ряде крупнейших компаний.

Увы, вышесказанное в девяносто случаях из ста касается стран Запада. В России же развитие голосовых технологий значительно отстает от тамошнего уровня. Широко известный пакет «Говорящая мышь» не отвечает мировым стандартам. По сей день в DOS-приложениях экранного доступа используется речевой драйвер СДРВ, созданный в начале 90-х в Минске. В этом году появился еще один российский синтезатор речи - Digalo, основой которого является Speech Engine от компании «Элан Информатик». Однако эта система может устойчиво работать только на компьютерах с мощным процессором (не слабее PIII 450). К счастью, за создание «русского голоса» взялась Microsoft, и бета-версия программы уже работает.

Сейчас в России всего несколько сотен активных пользователей персональных компьютеров из числа людей с ограничениями зрения, а общее количество ПК, оборудованных для работы без визуального контроля, не превышает 500-600. Поэтому выпуск такого сложного продукта, как синтезатор речи, не может принести быструю прибыль. Вспомним, однако, опыт западных стран, где голосовые технологии стали служить не только людям с ограничениями зрения, но и обычным пользователям персональных компьютеров.

В нашем обществе мало кто осознает, что физические ограничения не являются приговором для человека. Необходимы только дополнительные технические средства и справедливое отношение к людям: ведь человек, лишенный зрения, иногда может быть гораздо более производительным, чем человек с больной печенью или сердцем.

Остается только поблагодарить журнал «Компьютерра» за обращение к этой теме. Если проблема названа, если завязался общественный диалог, это уже первый шаг к ее решению.

© ООО "Компьютерра-Онлайн", 1997-2024
При цитировании и использовании любых материалов ссылка на "Компьютерру" обязательна.