Архивы: по дате | по разделам | по авторам

1. Нужен ли компьютеру речевой интерфейс? Насколько это актуально?<BR>2. Позволяет ли современная технология реализовать речевой интерфейс?

Архив
08.12.1997

Андрей Быстрицкий,
аспирант Института биологии гена РАН

1. Разумное применение речевого управления могло бы несколько облегчить жизнь, однако сегодня, на мой взгляд, нужнее средства диктовки, а не управления. В то же время качество программ распознавания речи пока обеспечивает не комфорт, а скорее, постоянное напряжение. По крайней мере, мне так и не удалось научить Dragon NaturallySpeaking понимать мой английский. И, конечно же, вопрос локализации для "речеписов" становятся на порядок острее.

2. Мне кажется, нынешние так называемые домашние компьютеры (даже на Pentium II) пока на это неспособны. Об офисных же машинах и речи нет. Так что видит око…

Александр Глотов,
переводчик

1. В отдельных областях и профессиях такая необходимость, на мой взгляд, существует, но речевой ввод никогда не заменит клавиатуру (или другие устройства ввода) полностью. Трудно представить офис, в котором несколько сотрудников сидят и разговаривают со своими компьютерами.

2. Да. Я имею в виду уже предлагаемые коммерческие продукты, в частности IBM VoiceType, интегрированный в OS/2 Warp 4 Merlin. К сожалению, в русской версии OS/2 он отсутствует, и поработать с ним мне не довелось. Однако в Сети и в компьютерной периодике я встречал неплохие отклики об этом продукте. Кроме того, существуют и другие аналогичные продукты, такие как Digital Dictate и Dragon Dictate.

Что касается работы переводчика, то здесь, пожалуй, речевой ввод не помешал бы, но опять-таки при условии, что я работаю один (наверное, моя беда в том, что меня иногда и так раздражает постоянный треп коллег в офисе).

Можно привести в пример довольно много профессий, где речевой интерфейс оказался бы как нельзя кстати. Причем в некоторых случаях можно говорить о речевом вводе, позволяющем отказаться от надиктовывания на магнитофон и последующего набора текста, а в некоторых - о речевом выводе, предоставляющем важную информацию, не отвлекая человека от основной работы (или, наоборот, при необходимости привлекая его внимание). Речевой ввод удобен, например, при проведении всевозможных лабораторных исследований и анализов, когда человек занят своей непосредственной работой и не может пользоваться клавиатурой. Кроме того, трудно переоценить значение средств речевого ввода и управления для инвалидов, о которых у нас почти никто не помнит.

Сергей Гладков,
директор Клуба голосовых технологий

1. Думаю, что нужен. Однако речевой интерфейс в том состоянии, в котором он находится сегодня, предназначен в первую очередь для людей с хорошей дикцией, способных разговаривать четко. Я не уверен в способности большинства людей справится с этой задачей. Создание же системы распознавания речи, которая бы могла воспринимать непрерывную, нечеткую речь, пока нереально. Возможно, лет через пять в Соединенных Штатах такая система и появится, так как там на разработку подобных систем ежегодно тратится несколько сот миллионов долларов. В России же рынок систем распознавания речи пока отсутствует, и появиться он может лишь при наличии платежеспособного спроса.

2. В принципе, речевой интерфейс уже существует. Например, наш продукт "Голосовая мышь" и есть реализация речевого интерфейса. Однако на данном этапе пользоваться речевым интерфейсом должны люди образованные. Пока что эти продукты не для массового пользователя.

Евгений Киреев,
генеральный директор компании "Агама"

1. Да. Одним из применений речевого интерфейса для пользователя персонального компьютера, по моему мнению, является обыкновенная диктовка текста. Возможно, для людей, способных печатать быстрее, чем говорить, речевой интерфейс и не принесет особых преимуществ. Но большинство же пользователей, пожалуй, предпочтут диктовать тексты, а не набирать их на клавиатуре.

2. Разработки в области речевого интерфейса, конечно, есть. Однако программы, реализующие речевой интерфейс, пока способны распознавать лишь отдельные команды, непрерывная же речь им не по силам. Главная проблема, на мой взгляд, состоит в том, что существующие программы распознают речь на уровне букв и слов, в то время как человек воспринимает речь на более высоком уровне - фразами. Человек способен уловить смысл текста, чего не способны делать современные программы распознавания речи.

Сергей Алпатов,
менеджер по маркетингу Windows/Office компании Microsoft

1. Думаю, что необходимость в применении речевого интерфейса с компьютером есть. Дело в том, что у многих людей есть проблемы со слухом, зрением, и для них речевой интерфейс существенно упростил бы работу с компьютером. У компании Microsoft пока что подобного рода разработок нет, но есть некоторые возможности, встроенные, в частности, в Windows 95, упрощающие работу людей со слабым зрением и слухом.

2. Основная работа в разработке технологий распознавания речи лежит на программистах и системотехниках. Возможность улавливать звуки и речь при помощи аппаратуры уже существует. Распознавание же речи представляет большую проблему. Необходимы алгоритмы, способные успешно расшифровывать человеческую речь. Насколько мне известно, алгоритмов распознавания речи, которые бы действовали со стопроцентной точностью, пока нет. Существуют программы, способные распознавать отдельные слова, однако для работы с ними пользователю необходимо провести некоторое время для адаптации программы к его голосу и речи. Но даже после этого, она далеко не всегда точно распознает речь.

Компания Microsoft пока не включала в свои продукты подобных функций. В частности, потому, что если что-то делать, то делать надо хорошо. Не могу сказать, что Microsoft не работает над созданием программ для распознавания речи, но пока мы не готовы предложить такого продукта, который, с нашей точки зрения, устроил бы потребителя.

Эмиль Якупов,
начальник отдела разработки шрифтов компании "ПараГраф"

1. Я считаю, что необходимость в нем есть. Нужно отметить, что в данном случае речь идет о наиболее естественном для человека интерфейсе. Те же цели преследуются и при создании трехмерных интерфейсов. Однако при нынешнем уровне развития речевых технологий реализация полноценного речевого интерфейса, естественного и удобного для пользователя, невозможна.

2. Да. Например, речевой интерфейс отчасти реализован в OS/2 Merlin IBM. Есть и другие программы, реализующие речевой интерфейс. Однако они еще не столь совершенны, допускают ошибки и поэтому не имеют широкого применения.

Ответы собирал Юрий Сакун

© ООО "Компьютерра-Онлайн", 1997-2024
При цитировании и использовании любых материалов ссылка на "Компьютерру" обязательна.