По полочкам
АрхивКолонка ЗолотоваБольшое будущее предрекают эксперты никому пока неизвестной поисковой системе Clusty. У этого малыша нет даже собственной поисковой машины, зато он умеет сортировать результаты поиска по темам. Завидуй, Google!
Поисковая машина Google.com, принимающая ежедневно сотни миллионов запросов со всех уголков планеты, став единственной и неповторимой для восьми из каждых десяти сетян, кажется несокрушимым гигантом. Но ахиллесова пята есть и у неё. Говорят, в течение многих лет основатели Google боялись, что однажды кто-то повторит их успех, придумав ещё более удобный механизм поиска в Сети. Правда это или нет, но у них есть все основания опасаться такого исхода, ведь и сама Google получила путёвку в жизнь именно как родоначальник одного из таких усовершенствованных механизмов. Пионеры поиска во главе с Yahoo! сделали первый шаг, сконструировав простейшие поисковые системы в середине 90-ых гг. Основатели Google сделали шаг второй, внедрив механизм ранжирования документов. Страничка, на которую чаще ссылаются, будет показываться в результатах поиска выше. Это логично и удобно, но идеально ли? Увы, Google сделала поиск эффективнее, но засилье доступной в Вебе информации требует изобретения ещё более хитрого инструментария.
Третьим шагом к совершенству специалистам видится так называемый кластерный поиск - тема в последние дни более чем модная: алгоритмы кластеризации частично задействованы в новом поисковике A9 от Amazon.com, на этих же алгоритмах полностью основана и уникальная поисковая система Clusty, представленная на днях. Говорить о закате Google рано, но та же Clusty расценивается комментаторами как серьёзное покушение на позиции поискового монополиста. Принимая во внимание, что у новорожденной нет даже собственной поисковой машины (она использует результаты работы Overture, принадлежащей сегодня Yahoo!), заявление кажется, как минимум, смелым, но давайте разберёмся, не торопясь.
Clusty принадлежит компании Vivisimo, основанной тремя выходцами из Университета Карнеги-Меллона, специализировавшимися, в частности, на искусственном интеллекте. Родилась Clusty не вчера: получив миллионный грант от фонда молодых учёных, ребята из Vivisimo работают над своей системой уже четыре года, успев за это время добиться несомненных успехов. Их поисковик используется корпоративными клиентами и уже приносит прибыль, сейчас же бета-версия Clusty доступна и рядовым сетянам. Изюминка её заключается в умении сортировать результаты поиска по темам - это и называют кластеризацией: вместо обычного длинного списка результатов, в который скиданы документы, содержащие нужные вам слова (или, в общем случае, удовлетворяющие некоему условию поиска), Clusty предлагает пользователю несколько списков, в каждом из которых содержатся результаты, сходные по смыслу и источнику, из которого они получены (поиск ведётся как по обыкновенным веб-страницам, так и в блогах, изображениях, торговых каталогах и пр.). Компьютеры ещё не научились понимать человека, и спросив у Google, к примеру, про "гвоздь программы" вы получите россыпь ссылок на документы не только нужной вам театральной тематики, но и касающиеся программирования, а также столярного дела. Clusty понимает вас ничуть не лучше Google, но она умеет сортировать результаты, поэтому документы по театрам будут отделены от прочих. Общий уровень интеллекта по-прежнему на уровне пылесоса, но - удобнее, согласны?
Предрекать смерть Google, конечно, поспешно: поисковый гигант сам замечательно экспериментирует с кластерным поиском, убедиться в чём можно заглянув на Google News с автоматической тематической подборкой новостей. Надо полагать, совсем скоро мы услышим и о добавлении функции кластеризации результатов в основной поисковик Google. Появление Clusty (а также близкой по духу, но более ограниченной A9) важно по другой причине: третий шаг в совершенствовании поисковых механизмов наметился и будет сделан в ближайшее время. А это значит, что грядёт ещё одна, пусть небольшая, но революция в Вебе. Давно ли Yahoo! была коллекцией ссылок?