Архивы: по дате | по разделам | по авторам

Разговорный язык Java

Архив
автор : Михаил Брауде-Золотарев   17.11.1998

Компания Sun Microsystems объявила о выпуске платформно-независимого интерфейса разработки прикладных программ в области обработки речи Java Speech API.

Речь, наиболее естественный для человека способ обмена информацией, пока еще не вошла в повседневную практику взаимодействия с компьютерами. Среди возможных и неизбежных в будущем применений речевых технологий (а это распознавание, синтез и сжатие речевого сигнала) присутствуют речевой ввод и управление компьютерами, Интернет-телефония, всевозможные автоматические справочные системы, электронная почта, чат и многое другое.

Java Speech API обеспечит программистов, не являющихся специалистами в области речевых технологий, необходимыми для создания коммерческих приложений средствами.

В разработке Java Speech API, помимо Sun, принимали участие также AT&T, Dragon Systems, IBM, Novell, Philips Speech Processing, Texas Instruments и еще двенадцать компаний, так что появившийся продукт следует рассматривать как открытый стандарт, основанный на Java-технологии.

По мнению специалистов, к настоящему моменту сложилась интересная ситуация: научные достижения в области обработки речи сильно опережают прикладные разработки, и, чтобы снять ограничения для неспециалистов, требуется появление какого-то универсального общепризнанного инструмента, позволяющего "собирать" конечные приложения из заложенных в API стандартных библиотек.

Смежная разработка Sun в области обработки речи, так называемый JSML (Java Speech Markup Language), или язык "разметки" речи, названный так по аналогии с HTML, действует на втором фронте. JSML решает задачу создания речевого Web-интерфейса - голосового заполнения анкет, зачитывания содержания Интернет-страничек и т. п. Первая версия языка появилась еще 1997 году, но с тех пор не обновлялась. Кстати, здесь конкурентом Sun оказалась Motorola, продвигающая свою аналогичную разработку - Vox Markup Language (см. КТ #268). В любом случае, кто бы ни победил на рынке, область применения речевых технологий в Интернете воистину огромна, особенно при использовании портативных систем. Речевые технологии крайне важны и для людей с различными физическими недостатками, например, с ослабленным зрением.

То же самое можно сказать и о бурно растущем рынке компьютерно-телефонных систем, включающих в себя автоматические операторские центры, виртуальный банкинг, вообще все те области жизнедеятельности, где доступ к компьютеру осуществляется через телефонную сеть.

За подробностями можно обратиться непосредственно к сайту Sun, где по адресу http://java.Sun.com/products/java-media/speech лежат спецификации, руководство программиста, описание JSML.

Собственную реализацию речевого API для платформы Windows 9x/NT предлагает IBM. Ее в настоящее время можно бесплатно скачать с сайта компании, там же имеются и подробные описания других разработок IBM в этой области. Среди представивших собственные разработки на основе Java Speech API, помимо IBM, фигурируют Lernout & Hauspie (продукт True Voice), Lotus Development (Lotus Suite) и другие. В свою очередь, представитель Microsoft, хотя и не назвал конкретных сроков, подтвердил, что в будущем операционные системы от Microsoft будут полностью поддерживать речевое управление. Вместе с тем он подчеркнул, что полного отказа от столь привычных для нас мыши и клавиатуры ожидать не следует.

Заметим вскользь, что ценность речевых API будет прежде всего определяться тем, станет ли пополняться набор заложенных в библиотеку API алгоритмов и насколько оперативно это пополнение будет происходить, так как новые прикладные результаты в данной области появляются чуть ли не ежемесячно. - М.Б.

© ООО "Компьютерра-Онлайн", 1997-2022
При цитировании и использовании любых материалов ссылка на "Компьютерру" обязательна.