Ты меня понимаешь?..
АрхивОгород КозловскогоЛет сто назад Дмитрий Иванович Менделеев предрек, что в 1950 году приблизительно 95 процентов населения Российской Империи займется обслуживанием лошадей. Ученый был прав: он сделал вывод о повышении роли транспорта, и единственное, что не пришло ему в голову, - что буквально завтра изобретут автомобиль!
Я рассказал этот анекдот, чтобы не рассуждать о технологических пределах развития компьютерной техники: давайте считать, что любое технологическое ограничение со временем будет преодолено и мощный компьютер можно будет надеть на руку, как сегодня - часы; а если понадобится, чтобы ваш автомобиль, телевизор, фотоаппарат или что угодно еще имели компьютер встроенный, специализированный или общий, - то и тут no problem. Не должно остаться проблем и с подключением к мировым коммуникационным каналам, и любая информация из того колоссального объема, что накоплен человеческой цивилизацией, окажется перед вами в считанные минуты. Все это мелочи, которые непременно будут решены. Останется задача: научить компьютер понимать.
Вы едете по забитой машинами улице и, увидев, что зеленый сигнал светофора сменился красным, автоматически нажимаете на тормоз. А теперь попытайтесь взглянуть на окружение компьютерным глазом: мешанина разноцветных точек и поверхностей - кузова, клочки неба, островки асфальта, огоньки стоп-сигналов и поворотов, реклама... Как понять, что именно вот тот красный кружок (и только он!) и должен определить поведение вашего автомобиля? Тем более что светофоры бывают разных размеров и конструкций, что на светодиодном может вылететь в самом замысловатом порядке треть элементов, что может сгореть красная лампа и вам (компьютеру) придется вычислять ееположение относительно зеленой.
Оптическое распознавание текстов (OCR), командование голосом, диктовка, перевод, грамматический анализ, - вот, на мой взгляд, ростки будущего компьютерного мира.
Отечественные OCR способны практически безошибочно прочитать качественный книжный или журнальный текст, что меня до сих пор потрясает. Но перед плохоньким московским факсом или нацарапанной на клочке бумаги запиской OCR спасует, а вам как человеку даже не придет в голову, что тут могут быть проблемы, - в худшем случае о смысле двух-трех особенно неразборчивых слов можно догадаться!
Я люблю потрясать гостей, далеких от компьютерных сфер, демонстрацией того, как компьютер слушается моих голосовых команд. Я говорю: Нортон! - и две синие панельки тут же выскакивают на экран; я говорю: П'шел вон! - и они исчезают. В новой версии OS/2 уже есть реальная (увы, не русскоязычная!) диктовка. Но лишь тогда, когда компьютер начнет не просто записывать, а понимать, и не набор условных команд, а живую человеческую речь, - можно будет считать, что проблема решена. Сколько на это понадобится времени? Даже мой оптимизм в растерянности покачивает головой.
Приблизительно то же можно сказать и о переводе, и о грамматическом анализе и коррекции, хотя, когда я запускаю спеллинг и программа вместо ошибочного слова подсовывает мне единственно верное (примерно один раз на полсотни случаев), я совершенно по-детски радуюсь-умиляюсь и не перестаю радоваться, когда при добавлении в словарь не знакомого спел-чекеру слова, тот в девяти случаях из десяти предлагает корректный его анализ. Я понимаю, что фразу "Хотя плоть немощна, дух крепок" электронный переводчик переведет сегодня скорее всего как "Хотя мясо протухло, запах сильный", - но когда ему удается идеально перевести фразу "Я получил ваше письмо", я готов пролить слезу. И зря мне пеняют на неумеренное восхищение спел-чекерами, переводчиками, распознавалками текста и голоса: я не хуже пеняющих вижу несовершенство нынешних программ. Но в отличие от пеняющих вижу и то, что эти программы - первые неуклюжие гости из будущего.
Если перенестись на сотню лет назад и, остановясь на пыльной улице с разинутым ртом, проводить восхищенным взглядом рычащий, извергающий клубы дыма, дергающийся автомобиль из первых, - наверняка нашелся бы сосед, попытавшийся охладить пыл справедливой критикою в адрес ужасающего монстра. И не до всякого из таких критиков удалось бы донести образ нынешнего "Мерседеса" или "Феррари" - это еще в том случае, если бы достало фантазии самому их вообразить...
Проблема компьютерного понимания, на мой взгляд, вовсе не ограничивается проблемой интерфейса, то есть сведения общения между человеком и компьютером к привычному человеку стилю (движение от абракадабры DOS'овской командной строки к кнопкам Windows 95 - движение именно в этом направлении), - остается еще проблема стиля мышления компьютеров.
Каких-то десять лет назад авторы популярных шахматных книжек относились к достижениям шахматных компьютерных программ с не скрываемой снисходительностью: "О, да! Перворазрядника хорошая программа обыграть может, но до гроссмейстера ей - как Воробьевым горам до Гималаев". Сегодня гениальный Каспаров уже предрек, что он, возможно, окажется последним шахматным чемпионом из гуманоидов.
Но шахматы - игра конечная. Основная шахматная задача (при начальной расстановке фигур) выглядит так: "Белые начинают и обязательно выигрывают". Можно плюнуть на тонкости умных программ и построить глупую, которая после каждого хода будет перебирать все варианты до конца партии и обязательно выиграет: здесь проблема только в быстродействии, но это, как мы с вами условились на берегу, - вовсе и не проблема.
Вопрос в том, удастся ли все многообразие окружающего мира, все богатство культурного наследия человечества свести к сколь угодно большому (но все же не бесконечному) набору элементов, перебор и анализ которых сводится лишь к затратам машинного времени, или появятся-таки компьютеры, способные понимать смысл происходящего?
Я - идеалист, и потому полагаю, что разложить мир на элементы не удастся в принципе. Значит, у алгоритмов понимания не остается иного выхода как появиться...
Адрес для переписки: ekozlovsky@cterra.com.