Microsoft Natal как светлое будущее игровой индустрии
АрхивСтатьиНаш старый знакомый, немецкий разработчик чипов Антон Клотц, снова высказался для "КТ-Онлайн" на актуальную тему, на этот раз - лежащую немного в стороне от его основной специальности - о революционной игровой системе Natal от Microsoft.
На прошедшем в Лос-Анджелесе игровом шоу E3 Microsoft представила проект "Наталь", суть которого заключается в совершенно новых формах взаимодействия пользователя с компьютером или игровой приставкой. В данной статье я бы хотел проанализировать технологии, нашедшие применение в этом проекте, а также поразмышлять, что бы хотелось в дальнейшем получить в подарок от игроделов.
Для начала давайте посмотрим на железную составляющую Natal. Помимо собственно консоли Xbox 360 наиболее интересной частью является камера, способная воспринимать людей и объекты трехмерно. Технология сильно напоминает мне проект ZCam, разработанный израильским стартапом 3DV. Эта компания была выкуплена Microsoft несколько месяцев назад, но MS отрицает, что технология в их камере - от 3DV, называя в качестве причины покупки компании обладание нужными патентами. Но в любом случае технологии должны быть достаточно похожими. ZCam от 3DV использует ИК-лучи для измерения расстояния до объекта, представляя собой подобие радара с разрешением порядка 1-2 сантиметров, чего должно хватать для большинства нужд. В камеру также встроен микрофон для распознавания речи.
И всё же самая интересная часть - софт. Исследовательский центр MS свел воедино столько всяких "интересностей", дополняющих друг друга, что очень сложно рассматривать их по раздельности.
Начнём с распознавания мимики. Софт, очевидно, не только узнает пользователя, но и исправно распознает его мимику, а также делает предположения о его настроении. Это требует очень продвинутой системы распознавания моделей. Число пользователей домашней консоли наверняка невелико, так что "опознание" не должно представлять проблемы. Но вычисление эмоций человека по выражению лица для компьютера представляет весьма непростую задачу. Интересно, нужна ли ПО некоторая калибровка перед использованием. Как можно понять из видеоролика, мимика используется в игровом процессе (показателен момент с огненными шарами, вылетающими из пасти монстра), передовой искусственный интеллект может существенно изменить характер игры, и диалоги станут более персонифицированными. При этом вне игр, например, при выборе пользователем видео или музыки для покупки, предложение может формироваться с учетом настроения пользователя.
Другое важное новшество - сканирование объектов, которые в дальнейшем могут быть задействованы в игровом процессе. В демонстрации новой экспериментальной игры (см. видео ниже), использующей возможности Natal, Питер Мулине показал, как сосканированный с помощью камеры рисунок на бумаге был в задействован в дальнейшем развитии сюжета. Для таких фокусов также нужно достаточно продвинутое распознавание образов. Я полагаю, что первые игры с зачатками подобной функциональности будут просто снимать образы с камеры, не занимаясь их распознаванием, причем функциональность не пойдет дальше кастомизации каких-то объектов вроде одежды или скейтбордов. Естественно, эти возможности могут быть использованы для того, что было обещано нам ещё в Second Life, но так и не реализовано - для приведения своего игрового персонажа в практически полное соответствие со своей внешностью. Это, кстати, является практически мечтой для всех продавцов и производителей одежды, чтобы клиент мог примерить все свои потенциальные покупки, виртуальным образом комбинируя их с уже имеющимися, перед тем, как их приобретать. Возможно, разрешения пока не хватит на кройку одежды по модели, но со временем характеристики улучшатся, и систему можно будет применять для заказа индивидуального пошива одежды через Интернет.
Распознавание голоса - способ управления, который до настоящего времени использовался крайне ограниченно, ведь такое управление достаточно медленно само по себе, да и обилие выражений делает реализацию такого управления технически сложной - слишком большая нагрузка ложится на ИИ. Но есть один тип игр, как будто нарочно созданный для голосового управления - разнообразные викторины. Компьютеру необходимо всего лишь распознать верный ответ, что гораздо легче интерпретации свободной речи. Однако демонстрация Milo показала, что Milo вроде бы способна управляться с пониманием речи. Ответы немного напоминают древний проект ELIZA, но и это уже огромное достижение.
Ещё стоит вспомнить такой аспект, как распознавание движений. Sony EyeToy может распознавать движения, но без возможности работы в трёх измерениях, да к тому же с не самой высокой точностью. Теперь же Microsoft обещает нам, что отслеживаться будет всё тело, причём в достаточно высоком разрешении, и таким образом нужда в каком-либо отдельном органе управления отпадет. Питер Мулине абсолютно прав, когда говорит, что контроллеры со всё увеличивающимся количеством кнопок препятствуют естественному взаимодействию с консолью, и пример успеха Nintendo Wii это только подтверждает. А теперь отпадает необходимость даже в "Нунчаках", что должно положительно сказаться на росте числа потребителей игровой продукции - барьер для участия в развлечении становится как никогда низок. Просто встаньте перед ТВ и начинайте играть. Противники подобного подхода могут заметить, к примеру, что управлять автомобилем, крутя руками в воздухе, как-то неестественно, но ничто не мешает использовать любой подручный объект в качестве виртуального руля, если нужно обязательно иметь что-то в руках.
Итак, чего же теперь не хватает для идеального взаимодействия с игровой приставкой? Перспективы ввода вроде бы просматриваются, но подсистеме вывода многого не хватает, чтобы стать идеальной. Массовое внедрение HD-панелей, конечно, улучшило ситуацию, но сам формат экрана идеальным назвать язык не поворачивается. Конечно, система вроде VR-cave была бы идеальной, но она до сих пор дорога и громоздка, а потому непрактична. Шлемы виртуальной реальности себя не оправдали, и к тому же они ограничивают возможности взаимодействия с другими игроками в помещении. Решением мог бы стать экран высотой в человеческий рост. Реализм драки значительно повышается, если противник становится ростом с игрока, и это относится ко многим другим играм спортивного толка. Для игр, в которых необходим широкий угол обзора, например, авиасимуляторов, экран можно сделать поворотным.
Системы типа VR-Cave могут быть достаточно громоздкими
3D-кинотеатры могли бы пережить ренессанс с приходом новых цифровых систем, и эта технология могла бы со временем стать более доступной. На смену системам со стереоочками могли бы прийти специальные мониторы, где применение таких очков не требуется. Конечно, мощность консоли придётся повысить для возможности удвоения скорости генерации кадров, однако я не думаю, что в перспективе это представляет собой проблему.
Самая большая проблема - обратная связь. К примеру, бокс без неё как-то не страдает реализмом [может, оно и к лучшему? - прим. ред.]. Пока что отдача реализуется в виде соответствующих джойстиков и специальных кресел, однако если дать геймеру возможность свободно двигаться по комнате, проблема встает в полный рост. Вот это и есть направление дальнейшего приложения усилий разработчиков.
В заключение могу сказать, что проект Natal для игровой индустрии революционен, он объединяет несколько технологий в одно решение, которое конечному пользователю наверняка покажется очень естественным и интуитивным. Интересно будет пронаблюдать за практической реализацией этой технологии в будущих играх и процессом создания этих игр. MS пообещала вывести камеру на рынок к 2010 году, и сбудутся ли на практике все обещания разработчиков, остается неясным. Но путь к более реалистичным играм открыт.
ОБ АВТОРЕ: Автор - ведущий инженер-разработчик филиала компании Cadence Design Systems в Мюнхене, Германия. Cadence - крупнейший производитель ПО для автоматизированного проектирования электронных микросхем. Также предоставляет услуги по разработке самих схем на заказ. Компания основана в Сан-Хосе, Калифорния, в 1988 году. В настоящее время насчитывает 5200 сотрудников в штате. Оборот за 2007 год составил 1,62 млрд. долларов США.