Архивы: по дате | по разделам | по авторам

Поговорим с телевизором?

АрхивВидео
автор : Вячеслав Ландау   05.04.2005

Новейшие технологии распознавания речи дают возможность не только переключать программы голосом, но и выбирать нужный фильм или телепрограмму и даже заказывать рекламируемые товары.

Представьте себе, что вы приходите с работы домой, заходите в гостиную и обращаетесь к телевизору: "включись!" На экране появляется нелюбимый вами балет и вы говорите: "найди футбол". Через пару секунд телевизор переключается на трансляцию кубка УЕФА. Вы с удобством устраиваетесь в любимом кресле, начинаете смотреть матч, и тут вам начинает хотеться пива и пиццы. Вы произносите: "заказать пиццу и пару банок пива", после чего на экране видите изображения разных сортов пиццы и пива. Говорите "заказать пиццу мексиканскую и две банки Staropramen", а через полчаса в вашу дверь звонит курьер.

Подобная сценка уже перестает быть фантастикой благодаря усилиям двух американских компаний - Agile TV и OneVideo Technology. Эти фирмы разработали специальные системы распознавания речи, предназначенные для использования в телевизионных кабельных сетях и ТВ-приставках. Тестирование технологий Agile TV и OneVideo Technology уже осуществляют многие кабельные телесети США, включая крупнейшего кабельного провайдера страны, компанию Comcast.

Идея голосового управления различными бытовыми приборами и компьютерными программами далеко не нова, достаточно вспомнить голосовой набор в мобильных телефонах или возможность управления через меню и надиктовки текста в последних версиях офисного пакета Microsoft Office. До самого последнего времени использование систем распознавания голоса было ограниченным. Во многом это вызвано либо невысоким качеством распознавания, либо высокой стоимостью таких систем. К примеру, программные продукты распознавания речи для индивидуального пользования надо было "обучить", прочитав в микрофон довольно много текстов. И даже после этого "обучения" программа могла понимать голос лишь одного человека, да и то не всегда. В мобильных телефонах и легковых автомобилях используются специальные версии этих программ. Корпоративные продукты распознают голоса большего числа людей, однако они имеют ограниченный словарный запас, а их внедрение стоит больших денег. Как правило, такие пакеты используются в системах бронирования авиабилетов, автоматизированных call-центрах и прочих случаях, имеющих ограниченную функциональность. Главный минус этих систем - их чрезвычайная дороговизна, что препятствует их применению в бытовых приборах и домашних развлекательных центрах.

Принципиальное отличие новых систем заключается в том, что они позволяют владельцам телевизоров без утомительного путешествия по экранному меню или без звонков по телефону заказывать различные товары, включая видеопрограммы (на кабельных каналах категории "видео-на-заказ ", пиццу или любые рекламируемые на экране продукты. Такая перспектива, несомненно, привлечет своим удобством потребителей. Не в накладе останутся и рекламодатели, ведь не секрет, что нередко потенциальные покупатели не успевают записать мелькнувший на экране телефон, либо им просто неохота звонить и заказывать понравившийся товар.

При всем функциональном сходстве технологий Agile TV и OneVideo они имеют целый ряд принципиальных отличий в способе их реализации. В настоящее время обе технологии демонстрируются на ежегодном торговом шоу кабельной индустрии, проходящем в Сан-Франциско. Система Agile TV, носящая название Promptu, состоит из микрофона, расположенного в пульте дистанционного управления или подключенного к телевизионной приставке, и специализированного аппаратно-программного комплекса, расположенного на территории кабельного оператора. Система Promptu позволяет переключать программы, осуществлять поиск по характеру передачи (например, "новости", "спорт", "фильмы"), поиск ("сканирование")по нескольким каналам, демонстрирующим программы одного типа (к примеру, вы хотите посмотреть фильм, но пока не знаете, на каком остановиться), поиск по ключевым словам (допустим, вам нужен конкретный фильм, либо матч между известными вам командами, либо аналитическая передача интересующего вас ведущего). Кроме того, вы можете сразу выбрать голосом интересующий вас раздел программы телепередач, отметить передачи, которые вы хотели бы посмотреть, а также заказать передачу в рамках сервиса.


Сканирование телепрограмм

Система Agile TV Promtu способна распознавать порядка 15 вариантов произношения американского варианта английского языка и отфильтровывать паразитные шумы. Опытную эксплуатацию Promtu компания Comcast пока осуществляет лишь в Филадельфии и ее окрестностях, где проживают пятьдесят добровольцев, а кабельные операторы других регионов США ведут испытания этой или конкурирующей систем распознавания. Основной недостаток Promtu заключается в том, что его "мозг" расположен у кабельного провайдера, а это означает, что у подписчиков телеканала должна быть двусторонняя связь с оператором, которая нередко отсутствует у кабельных и спутниковых операторов. Хотя, если такая связь существует, установка пользовательского терминала не представляет собой ничего сложного: в состав комплекта входит пульт с микрофоном и приемник сигналов; приемник нужно подключить к кабельной ТВ-приставке, а в пульт - вставить батарейки. После этого система полностью готова к работе.


Поиск программ по ключевому слову

В отличие от продукта Agile TV, в аналогичной системе от OneVideo, которая носит название OneListener, используется микрофон, установленный на ТВ-приставке, а не встроенный в пульт дистанционного управления. При этом никакое программное обеспечение на серверы провайдера не устанавливается, что позволяет предлагать услуги системы спутниковым операторам и телефонным компаниям. По своей функциональности OneListener практически ничем не отличается от Promtu.

Представители OneVideo поясняют, что их технология состоит из подключаемых к кабельным сетям устройств и сетевой операторской службы распознавания речи (Voice Recognizing Network Services (VRNSs). Как утверждают разработчики системы, она обходится гораздо дешевле прочих продуктов голосового распознавания благодаря тому, что специальное устройство с цифровым сигнальным процессором и микрофоном устанавливается дома у клиентов. Само устройство производители сравнивают с домашним телефоном, который всегда включен. При этом заявляется поддержка распознавания речи большого числа пользователей и большой список распознаваемых слов. Кроме того, появляется возможность управлять голосом любыми устройствами (DVD-проигрывателями, видеомагнитофонами, ресиверами), подключенными к телеприставке.

Помимо повышенного удобства новые системы "общения" с телевизором должны упростить жизнь людям с ослабленным зрениям. По оценкам специалистов, клиенты кабельных сетей будут, прежде всего, пользоваться функцией переключения программ, в то время как возможность голосового заказа товаров будет менее востребована, хотя действенность телерекламы, несомненно, повысится. Более того, появляется возможность демонстрации телезрителям точечной рекламы в зависимости от характера программ, которые они чаще всего просматривают.

Системы голосового управления телевизором - это конечно, прекрасно, однако для того, чтобы это стало реальностью, нужна поддержка этих технологий кабельными операторами. К сожалению, в нашей стране пока не проводится даже широкомасштабных тестирований подобных систем, так что остается лишь дожидаться, когда наши телекомпании заинтересуются новыми возможностями привлечения зрителя.

© ООО "Компьютерра-Онлайн", 1997-2019
При цитировании и использовании любых материалов ссылка на "Компьютерру" обязательна.