Кивино гнездо: Фильмы нашего разума
АрхивКивино гнездоИз научных лабораторий приходят известия о результатах, словно взятых из фантастики. Успехи впечатляют: учёным удалось считать образы из мозга.
В золотые годы советского кинематографа (точнее, в середине 1960-х годов, когда хрущёвская оттепель уже закончилась, едва начавшись, однако всерьёз это ощутили лишь первые диссиденты) появился совершенно чудесный мультфильм "Шпионские страсти". Где доблестную советскую контрразведку и её борьбу с кознями империализма впервые в истории СССР изобразили без пафоса и патетики. Более того, с иронией и юмором, присущими жанру кинопародии.
В одном из кульминационных эпизодов с разоблачением арестованной шпионки на сцене появляется генерал Сидорцев. Приблизившись к сидящей на стуле вражине, он чуть наклоняется и пристальным взором вглядывается в шпионскую голову. И тут же перед ним, словно на экране, всплывает вся картина преступной операции. Более того, достав внушительную лупу, генерал прочитывает на картине даже мелкие подробности в планах иностранных диверсантов.
Столь заманчивая для спецслужб идея - порыться в чужом сознании и воочию посмотреть, что там за мыслишки у людей в голове, - ещё не раз обыгрывалась во множестве зарубежных фантастических фильмов. Но как-то само собой всегда подразумевалось, что всё это чистые фантазии или нереально далёкое будущее. Но сейчас эти идеи обретают уже совершенно реальные очертания.
Сведя воедино несколько продвинутых инфотехнологий, включая томографическое сканирование мозга и мощный компьютерный видеосимулятор, учёные калифорнийского университета Беркли продемонстрировали, что по активности нейронов коры уже становится возможным в общих чертах восстанавливать вид визуальных картин в голове человека. Пока что, правда, речь идёт о весьма конкретных условиях специфического опыта. Однако для первых шагов даже этот результат выглядит чрезвычайно впечатляюще.
Учёные использовали известные возможности технологии функциональной магнитно-резонансной томографии (ФМРТ), а также вычислительные модели собственной разработки, благодаря которым им удалось добиться успеха в "декодировании и реконструкции динамического визуального опыта людей". Если перевести этот словесный оборот на общечеловеческий язык, то учёные демонстрировали испытуемому небольшой фрагмент произвольного голливудского кинофильма, а затем по снимкам сканирования мозга восстанавливали на экране компьютера тот клип, который смотрел человек. Точнее, не сам клип, а то, что они смогли в коре мозга углядеть и восстановить.
Чтобы огромная техническая сложность решаемой задачи стала понятнее, надо дать некоторые пояснения. Сама идея о том, что по результатам декодирования сканов ФМРТ в области зрительной коры можно воссоздавать визуальные картины, обрабатываемые мозгом, выдвинута и исследуется учёными довольно давно. Более того, с середины двухтысячных годов из разных лабораторий стали поступать результаты, свидетельствующие, что действительно возможно восстанавливать по сканам томографа те картинки, что разглядывает при сканировании человек. Но надо подчеркнуть, что это исключительно статичные картинки - символы, цифры, естественные чёрно-белые фотографии и так далее.
Восстанавливать динамичные картины принципиально сложнее - метод ФМРТ физически регистрирует активность мозга по сигналам, зависящим от уровня кислорода в крови. То есть динамика снимаемой картины непосредственно связана со скоростью тока крови через мозг, а эта скорость несравнимо медленнее скорости нейросигналов, кодирующих динамическую информацию в зрительной коре. Иначе говоря, учёные полагают, что переход от декодирования статичных картин к адекватному декодированию динамики - это тот самый критически важный шаг, что должен помочь в получении реконструкций таких внутренних состояний сознания, как воображение, сны и тому подобные процессы.
Именно в этом направлении и удалось ныне заметно продвинуться исследователям лаборатории университета Беркли, возглавляемой Джеком Гэлантом.
В своих предыдущих исследованиях Гэлант и его коллеги уже построили достаточно мощную вычислительную модель для декодирования статичных фотографий. Этот алгоритм позволял им по ФМРТ-сканам мозга с высокой точностью воссоздавать статические изображения. Для декодирования сигналов мозга при наблюдении движущихся картинок была разработана новая, двухэтапная вычислительная модель. Суть её сводится к раздельному моделированию лежащих в основе процессов: работы нейропопуляций и гемодинамики, то есть сигналов тока крови (коль скоро они функционируют с существенно различными скоростями).
В компьютере, обрабатывающем изображения-сканы томографа, мозг поделён на крошечные трёхмерные кубики, именуемые объёмными пикселями, или, кратко, "вокселями". Конкретно в данном эксперименте один воксель соответствует объёму ткани мозга размером 2х2х2,5 мм. Физически каждый такой воксель представляет собой совокупную активность сотен тысяч нейронов. И для каждого вокселя исследователи построили модель, которая описывает, каким образом информация о формах и движениях в просматриваемом человеком фильме отображается в активности мозга.
Эта модель описывает быструю визуальную информацию и медленную гемодинамику с помощью раздельных компонентов. Сначала записывались сигналы тока крови в зрительной коре испытуемых, которые смотрели обычные кинофильмы, а затем шло подстраивание алгоритма раздельно к индивидуальным вокселям. Чтобы наглядно продемонстрировать эффективность избранного подхода, исследователи сконструировали на его основе "байесовский декодер", скомбинировав модели оценочного кодирования с образцами предварительно просмотренных человеком кинофильмов.
Поясняя, почему для анализа был выбран именно просмотр кинофильмов, Синдзи Нисимото (ведущий автор исследования в лаборатории Гэланта) говорит следующее: "Наш естественный визуальный опыт напоминает просмотр кинофильма. Для того чтобы разрабатываемая технология нашла широкое применение, мы должны понять, каким образом наш мозг обрабатывает такого рода динамический визуальный опыт".
Сам Нисимото и ещё двое других исследователей команды служили в качестве испытуемых в продолжительной серии экспериментов. Главным образом это было сделано потому, что процедура сканирования каждый раз требует от добровольцев тихо и неподвижно лежать внутри магнита ФМРТ на протяжении нескольких часов. А процедур таких требовалось довольно много, потому что для формирования большой библиотеки образов, необходимой для обучения программы, было просмотрено в общей сложности восемнадцать миллионов секунд скачанных с Youtube видеотрейлеров к голливудским кинофильмам.
Образцы мозговой активности снимались один раз в секунду. Набранные таким способом данные легли в основу для разработки вычислительных моделей, которые способны предсказывать паттерны мозговой активности, порождаемые при просмотре уже совершенно произвольных фильмов (то есть не входивших в начальный набор клипов, использованных для построения модели).
Следом ФМРТ использовали для измерения мозговой активности, порождаемой другим набором клипов - тоже трейлеров, но уже других фильмов.
Слева на картинке - кадр из фильма, который человек смотрел, находясь внутри магнита. Справа - реконструкция этого фрагмента по мозговой активности, зарегистрированной с помощью ФМРТ. Как и в первой фазе экспериментов, образцы мозговой активности снимались раз в секунду; каждая секундная секция просматриваемого фильма восстанавливалась по отдельности. Восстановление производилось путём смешивания и усреднения примерно ста наиболее вероятных фрагментов из общих накоплений в библиотеке реконструкции.
В целом результаты декодирования показали, что восстановленное динамическое изображение оказывается весьма цельным. Качество картинки оказалось заметно зависимым от конкретного вида мозговой активности каждого из тестируемых людей. Но как бы там ни было, работа исследователей в Беркли стала первой наглядной демонстрацией того, что динамический визуальный опыт человека в принципе может быть восстановлен даже на основе той очень медленной мозговой активности, что регистрируется с помощью ФМРТ.
Первые же вопросы к исследователям, представившим столь любопытные результаты, естественно, касаются возможностей заглянуть во внутренние образы сознания - вроде декодирования сновидений, воспоминаний и прочих визуальных картин воображения.
Учёные высказываются об этом довольно осторожно. В целом современной наукой предполагается, что все ментальные процессы имеют конкретный нейробиологический базис. Если появятся хорошие средства для измерения мозговой активности и хорошие вычислительные модели мозга, то в принципе должно стать возможным декодирование внутренних ментальных процессов вроде снов, памяти и так далее.
Однако надо подчеркнуть, что вплоть до настоящего времени науке не известно, реализуются ли процессы вроде сновидений и воображения в мозге тем же образом, что и восприятие внешнего мира. Если это так, то тогда должна существовать и возможность для использования разработанных ныне технологий в задачах декодирования различной мозговой активности.
Ещё осторожнее учёные отвечают на вопросы, непосредственно связанные с применением их открытия в работе спецслужб, правоохранительных органов и в судебных разбирательствах.
По мнению исследователей, потенциальное использование разработанной технологии в следственной и юридической системе представляется им весьма сомнительным. Многие психологические исследования ныне продемонстрировали, что показания очевидцев на редкость ненадёжны. Свидетели часто обладают плохой памятью, но обычно не знают об этом. При этом память людей имеет тенденцию быть смещённой - из-за новых обстоятельств и событий, непреднамеренных подсказок либо подстраивания памяти под уже известные вещи (предыдущие воспоминания). Кроме того, свидетели часто дополняют свои истории, чтобы сделать логически связными те события, детали которых они плохо помнят.
По этим причинам, считают учёные, любое устройство "чтения мозга", нацеленное на декодирование памяти, неизбежно будет ограничено не только самой технологией, но также и качеством хранимой в сознании информации. В конечном же счёте аккуратное и точное считывание ложной памяти способно предоставлять всего лишь ошибочную информацию. Так что любое будущее приложение этой технологии в правовой системе, полагают исследователи, должно быть встречено особенно настороженно.
Дополнительные подробности об этой работе можно найти на сайте Джека Гэланта, а также в публикации журнала "Современная биология".