Архивы: по дате | по разделам | по авторам

Межгалактический зверинец

Архив
автор : Александр Бумагин   16.08.2007

Интернет дает возможность привлекать к решению сложных задач огромное количество компьютерных ресурсов, но иногда обработку данных могут сделать только люди, вручную.

Интернет дает возможность привлекать к решению сложных задач огромное количество компьютерных ресурсов, но иногда обработку данных могут сделать только люди, вручную. И если технологии распознавания изображений работают пока через пару раз на третий, почему бы не попросить пользователей Интернета сделать то, что компьютерным программам не по силам?

Одними из первых обратились за помощью к добровольцам сетевые проекты, призванные раскрывать тайны космоса. Модная идея решать сложные задачи экстенсивным путем нашла воплощение в проекте Galaxy Zoo. Началось с того, что всем уставшим от поиска внеземных цивилизаций посредством SETI@home NASA предложило искать "звездную" пыль, привезенную зондом StarDust. В SETI@home вклад участника был пассивным: добровольцам, по сути, делать ничего не приходилось, разве что чуть больше платить за электроэнергию. Изображения участков пылеуловителя StarDust, напротив, требовали внимания и концентрации, так как организованные поиски сродни известной процедуре в стоге сена. Что поделаешь, с одной стороны, программа Stardust@home объединяет множество людей, занимает их досуг, экономит деньги и успешно решает поставленную задачу, а с другой - неумолимо свидетельствует о кризисе в создании автоматизированных интеллектуальных систем.

Именно высокая эффективность черновой работы участников Stardust@home вдохновила астрономов трех американских университетов, решивших поставить на поток обработку фотографий совсем иного рода. Под пристальное внимание ученых попали снимки галактик, полученные в ходе крупнейшего картографического эксперимента Sloan Digital Sky Survey (SDSS), по итогам которого будет составлена подробная карта четверти небосвода. Снимки поставляет 2,5-метровый широкоугольный телескоп обсерватории в Нью-Мексико, оснащенный специальным регистратором - уникальным комплексом из тридцати четырехмегапиксельных матриц, образующих одну огромную матрицу из более чем ста двадцати миллионов ячеек. Производительность такой системы - 200 Гбайт сырых данных за ночь.

Организаторы проекта www.galaxyzoo.org задались целью собрать небывалую по выборке статистику о типах галактик: из базы SDSS взяты изображения миллиона объектов. Как известно, во Вселенной существует два основных типа галактик - спиральные и эллиптические. Дело усложняет то, что спиральные галактики могут вращаться в разные стороны с точки зрения наблюдателя и находиться под разными углами к нему. Вдобавок есть звездные системы неправильные по форме, а кроме того, галактики всех типов иногда сталкиваются друг с другом в разных сочетаниях. Программными средствами удается лишь выделить на изображениях туманное пятнышко - предположительно, галактику, но вот научить компьютер определять тип звездной системы по трудно формализуемым признакам удастся, видимо, еще не скоро. Один из основателей Galaxy Zoo Кевин Шавински (Kevin Schawinski) уже попробовал самостоятельно в течение недели классифицировать около 50 тысяч галактик и пришел к выводу, что в одиночку с такой горой данных не справиться, слишком уж скучным оказалось это занятие. Однако в гомеопатических дозах разбор галактик безопасен для психики и даже может оказаться увлекательным занятием, а потому всем желающим надлежит немедленно примкнуть к сообществу на www.galaxyzoo.org.

Заметим, что организаторы связались с астрономическими (во всех смыслах) числами не ради Книги рекордов Гиннеса. Главная задача состоит в уточнении соотношения по численности между спиральными и эллиптическими галактиками. Кроме того, решено проверить, действительно ли равновероятно направление закручивания спиральных галактик (если окажется, что галактики относительно нас предпочитают вращаться в какую-то одну сторону, этому придется искать объяснение). Наконец, будет собрана статистика по количеству звездных систем, столкнувшихся друг с другом.

Участие в Galaxy Zoo начинается с регистрации. После этой немудреной процедуры вам будет предложено пройти обязательное обучение. И в самом деле: далеко не всякий сетянин знаком с астрономией. Чрезмерно загружать желающих поделиться свободным временем на сайте не станут, во всяком случае насильно. На сайте, конечно, есть раздел, проливающий свет на научные идеи проекта, но заучивать его необязательно. Зато к необходимым умениям относят навык выявления типа галактики, предложенной к рассмотрению, а потому сразу к базе данных вас не пустят. Сперва вам дадут пятнадцать тестовых изображений и проверят, научились ли вы различать спиральные галактики, закрученные в разные стороны и лежащие на боку, эллиптические галактики, сталкивающие галактики, и не путаете ли вы галактики со звездами, следами, оставленными спутниками и другими артефактами снимков. Только в том случае, если вы сможете правильно распознать хотя бы восемь изображений из пятнадцати, вам будут открыты виды на галактики из базы данных. Как видите, проходной бал невысок, а потому каждую фотографию увидят перед собой до двадцати участников проекта.

Итак, главное - процесс. Автор этих строк быстро освежил свои знания о галактиках, доблестно разгадал все пятнадцать тестовых загадок и приступил к основному действию. После нескольких десятков "опознаний" понимаешь, что дело это и впрямь рутинное. Усидчивости хватило минут на сорок. Обработать столько изображений, что их перестанут предлагать за неимением оных, вряд ли возможно. Реально лишь выделить себе определенное время или "копать от забора до вечера". Виртуальной похвалы за усердие пока не ждите. Раздел в личном профиле, предназначенный для созерцания собственных достижений, содержит лишь перечень нескольких последних из ваших галактик. Скудость информации объясняется незавершенностью работы над сайтом, о чем предупредительно уведомляют.

Раз десять в течение нескольких визитов на Galaxy Zoo встречались объекты причудливой и труднообъяснимой формы, о чем, согласно инструкциям, я сообщал на специальный электронный адрес. Позабавило, что ответ от робота с благодарностями пришел лишь на первое письмо, все прочие и организаторами, и автоответчиком были проигнорированы. Послав письмо с другого адреса, можно рассчитывать еще на один (точно такой же) ответ.

Важнее, однако, то, что с основной функциональностью сайта все в порядке. Изображения на сайте одинаковы по размерам, хотя и соответствуют участкам неба разной площади. Идентифицируемый объект всегда расположен в центре [Для разбора сложных ситуаций на сайте открыт раздел FAQ, косвенно свидетельствующий о том, что Galaxy Zoo в Сети не потерялся. По официальным данным, к началу августа зарегистрировано почти 90 тысяч участников]; он имеет свой идентификатор, нажав на который, вы при желании попадете на страницу с техническими данными, собранными в процессе фотографирования. На этой странице можно узнать, есть ли изучаемый вами объект в каких-нибудь каталогах и в каких именно. После двух десятков попыток наткнуться на галактику, которая не упомянута в каталогах, бесперспективное дело первооткрывателя было решено оставить.

Что же еще есть на Galaxy Zoo? Примерно через две недели существования проект обзавелся форумом. По его публичной статистике можно косвенно судить о том, что на каждую женщину, участвующую в проекте, приходится четверо мужчин. В первую неделю работы форума на нем регистрировалось примерно по 150 человек в день. Участники уже предложили множество путей усовершенствования Galaxy Zoo, особенно расстраивает людей не слишком хорошая обратная связь. Пока доступен лишь рейтинг самых активных охотников за галактиками (к 1 августа лидер преодолел рубеж в 50 тысяч распознаваний). Однако каждому хочется знать, сколько и каких именно галактик он распознал и сколько галактик распознано общими усилиями. Искушенные в астрономии участники не хотят довольствоваться простейшей классификацией и требуют усложнения задачи для себя (не вникая порой в цели организаторов). Администраторы форума обещают все меж собою обсудить и многое сделать. К примеру, в первый же день работы форума была создана специальная тема для любителей прекрасного, в которой любой может поделиться изображениями самых необычных из своих галактик, причем каждые сутки выбирается прима дня.

Если будет сделано все, что обещано, то скучный научный процесс станет весьма занятным, если только… не завершится естественным путем. Дело в том, что по сведениям, которые нам любезно сообщил один из сотрудников проекта [Сами себя они прозвали zookeepers] Крис, уже к концу июля было произведено более 10 млн. распознаваний (в среднем около сотни на каждого участника). Иными словами, каждую галактику, опять же в среднем, увидело десять человек. За три недели было сделано буквально полдела. Что будет дальше, пока неизвестно. Возможно, база будет пополнена, а может быть, появятся новые научные задачи, и участники получат еще один шанс себя проявить.

Пока еще есть время, желающие дать выход своему азарту могут попробовать отыскать-таки среди бездны снимков новую галактику или хотя бы повыше взобраться в рейтинге. Вполне можно ожидать, что Galaxy Zoo оттянет на себя значительную часть нынешних посетителей Stardust@home: все же рассматривать галактики гораздо интереснее, чем ломать глаза в поисках космических крупинок.

© ООО "Компьютерра-Онлайн", 1997-2024
При цитировании и использовании любых материалов ссылка на "Компьютерру" обязательна.