Семь дней с Google Desktop Search
АрхивТехнологииМы изучили, как работает вышедшая неделю назад бета-версия персонального поисковика Google, выяснили его достоинства и недостатки и поняли, почему в Google его считают одним из самых важных проектов.
Ровно неделю назад Google выпустил бета-версию поисковой системы для персональных компьютеров (если вы пропустили эту новость, подробности ищите тут). Программу можно скачать по адресу http://desktop.google.com. Она работает под Windows.
Неожиданностью появление персонального поисковика не стало. Хотя в Google культивируют секретность, утечки всё же порой случаются. В мае о существовании секретного проекта сообщила газета "Нью-Йорк Таймс" ("Компьютерра-Онлайн" писала об этом так). Правда, как мы теперь знаем, ошибок в раздобытой журналистом "Нью-Йорк Таймс" информации хватало. В частности, кодовое имя проекта оказалось вовсе не Puffin, а значит и наша теория, будто персональный поисковик создаётся на базе приложения Google Deskbar, оказалась ложной.
Размер установочного файла - 400 килобайт. Google Desktop Search скачивается в мгновение ока даже при небыстром телефонном соединении. Это первое оружие в арсенале Google. Размеры установочных файлов конкурирующих программ будут сдерживать их распространение. Тут перещеголять Google под силу только Microsoft: если соответствующая программа входит в состав Windows или Office, то скачивать не нужно ничего.
Наполеоновские планы. По неофициальной информации, в Google были разочарованы количеством установок Google Toolbar, специальной поисковой панели для Internet Explorer. Скорее всего, любая другая компания может только мечтать о такой популярности своего продукта, но в Google желают большего. Google Desktop Search должен распространиться повсеместно. По замыслу создателей, он должен быть установлен на миллионах и миллионах компьютеров. Зачем?
Инсталляция. При установке программа просит закрыть все браузеры, в том числе и Firefox. Однако дополнительные компоненты оказываются установлены только в Internet Explorer. Похоже, поддержка Firefox планировалась, но так и не была реализована. Возможно, слухи, будто в Google решили выпустить недоделанную бета-версию Google Desktop Search раньше времени, когда узнали, насколько далеко зашла разработка аналогичного проекта в Microsoft, не лишены оснований.
Индекс. Наверное, когда-нибудь на накопителях обычных домашних компьютеров хватит места, чтобы уместить индекс всего современного интернета. Чтобы осознать его масштабы, стоило поставить Google Desktop Search. Индекс не интернета, а всего лишь моего жесткого диска потребовал не одной сотни мегабайт. Инсталлятор отказывается продолжать работу, если на диске нет свободного гигабайта, а размер индекса может достигать двух гигабайтов. Кажется, это очень много. Наверное, дело в том, что я ещё помню винчестеры размером сорок мегабайт.
Интерфейс. У Google Desktop Search нет собственных окон, только маленькая иконка на системной панели задач. Пока она видна рядом с часами, в памяти компьютера работает крохотный веб-сервер. Если дважды щёлкнуть по ней, откроется стандартный браузер (это может быть Internet Explorer, Firefox или Opera - неважно) со страницей до боли знакомого вида. От настоящего Google её отличает лишь чуть иной логотип и количество документов в индексе. У Google их 4 миллиарда, а у меня - только 40 тысяч.
Арахнология. О том, что документов у меня 40 тысяч, я узнал не сразу. Создание индекса требует времени. Этим занимается другой невидимый пользователю процесс-паук, который включается только тогда, когда компьютер ничем не занят. Зато тогда он работает так энергично, что хочется пожалеть отчаянно жужжащий жёсткий диск. За считанные минуты программа перебирает сотни файлов. Программисты Google не зря едят свой хлеб.
Типы файлов. Google Desktop Search позволяет вести полнотекстовый поиск в найденных на диске текстовых файлах и документах в форматах HTML, MS Word, MS Excel, MS Powerpoint. Кроме того, в индекс попадает электронная переписка, хранящаяся в почтовых программах Outlook или Outlook Express, а также архивы переговоров в интернет-пейджере AIM.
Внешняя память. Осталась неупомянутой ещё одна возможность. Её нет ни в одной другой стандартной для Windows программе, и она превращает Google Desktop Search в нечто большее, чем просто программа для поиска в файлах. С помощью Google Desktop Search можно вести поиск на интернетовских страницах, которые хоть раз открывались в браузере.
Сырость. Когда-то увиденные в интернете страницы попадут в индекс Google Desktop Search только в том случае, если они были открыты в браузере Internet Explorer. Другие браузеры не поддерживаются (просьба инсталлятора выключить Firefox даёт надежду, что поддержка этого браузера вскоре будет добавлена, пока же можно пользоваться обходным путём: специальным расширением Slogger). Google Desktop Search не знает ничего, кроме Outlook (не работает даже Gmail!), и никогда не слышал про существование ICQ. Для Google Desktop Search файлы в форматах PDF, метаинформация в звуковых и графических файлах - загадка за семью печатями. Поддержка русского языка в персональном поисковике есть не везде: в индекс текстовые файлы попадают уже без надписей на кириллице. В довершение всего, Google Desktop Search пока не поддерживает работу с несколькими пользователями на компьютере.
Если гора не идёт к Магомету... Есть шансы, что в Google Desktop Search когда-нибудь появится поддержка ICQ или Firefox. Однако можно ли всерьёз рассчитывать на то, что в Google будут тратить ресурсы на заботу о немногочисленных в масштабах интернета пользователях интернет-пейджера Miranda или почтового клиента The Bat? Вряд ли. Если Google не позволит сторонним разработчикам писать плагины для поддержки новых файловых форматов, создателям популярного софта придётся задуматься: не перейти ли на использование файловых форматов своих более популярных соперников?
Глас народа. Google позволил пользователям голосовать за введение новых функций. В списке: индексация кэша Firefox, почты в Thunderbird и переговоров в других интернет-пейджерах, поиск в PDF, музыкальных файлах и именах папок, поиск по неполным запросам, специальная кнопка для Google Desktop Search на Google Toolbar и показ более десяти результатов одновременно. Голосуйте.
Поисковый запрос. Запросы к Google Desktop Search формулируются так же, как и к "большому" Google. Это большой плюс. Несмотря на все недоработки, совершенный язык запросов позволяет программе выглядеть не столь бледно на фоне предшественников, которые поддерживают все существующие и несуществующие форматы файлов.
Скорость поиска. Ответ на любой запрос следует мгновенно. Без всякого преувеличения.
Результаты. Знакомый вид - почти Google.com. Добавилась маленькая иконка - указание на тип найденного документа. Четыре ссылки под строкой поиска позволяют отфильтровать результаты, чтобы посмотреть только файлы, только найденные письма, только найденные переговоры в интернет-пейджере или только веб-страницы, когда-то загружавшиеся в браузер. Любопытно, что для веб-страниц иногда показываются крохотные скриншоты. "Большой" Google такого не делает.
Без пейджранка. Google.com был выстроен на технологии PageRank. Она - его фундамент. Именно PageRank когда-то выделил этот поисковик из других. Оказалось, что учёт ссылок, соединяющих веб-страницы в интернете, позволяет сортировать результаты более точно. Жёсткий диск персонального компьютера - не интернет, и ссылки там встречаются редко. Это значит, что PageRank использовать нельзя, и Google лишён своего главного козыря. Первый же взгляд на результаты поиска обнаруживает, что сортировка по релевантности стыдливо отключена, а результаты рассортированы по дате изменения. Значит ли это, что в Google настолько не верят в собственный алгоритм сортировки?
Архив изменений - одна из тех возможностей, которые замечаешь не сразу. У Google Desktop Search, как и у его старшего брата, есть "кэш", в котором можно просмотреть, как выглядела найденная страница в момент индексации. Больше того, оказывается, Google Desktop Search сохраняет не одну, а несколько версий документа, так что потом можно проследить за историей его изменений.
Интеграция с "большим" Google. После установки Google Desktop Search на сайте Google.com появляется ссылка "Desktop", ведущая на локальную страницу персонального поисковика. Если же поискать при помощи Google в интернете, перед ссылками на удовлетворяющими запросу ресурсами появится информация о количестве найденных на локальных компьютере документов. Однако сведения о содержимом компьютера не отправляются в интернет, и угрозы конфиденциальности нет. Эту информацию в страницы Google добавляет работающий тут же Google Desktop Search (судя по всему, он действует как UDP-прокси, пропуская через себя приходящий с Google.com код).
"Вирусный маркетинг". Добавление персональной информации в страницы "большого" Google - великолепный рекламный ход. На пользователей видоизмененные страницы поисковика производят неизгладимое впечатление, а значит можно рассчитывать на хождение молвы о Google Desktop Search из уст в уста. Вирусный маркетинг никогда не подводил Google - им он и заработал свою популярность. Не подведёт и на этот раз.
Конфиденциальность. Google Desktop Search не передаёт никакой информации в "большой" Google. Результаты, которые отображаются в браузере, не покидают локального компьютера. Однако убедить в этом несведущих пользователей будет нелегко, а как показала недавняя история с другим детищем Google, почтовой системой Gmail, уровень паранойи достаточно высок, чтобы раздуть слона из самой маленькой мухи. Уже на следующий день после релиза Google Desktop Search некие аналитики объявили программу невиданной угрозой конфиденциальности: оказывается, если за одним компьютером работают несколько человек, и они не позаботились о том, чтобы защитить свои папки паролем, то персональный поисковик проиндексирует всё. Улавливаете логику?
Рекламы не будет. Кстати, из-за всё той же параноидальной борьбе за конфиденциальность Google Desktop Search лишен коммерческих перспектив. Показывать рекламу на его страницах нельзя, а основной источник доходов Google - это именно реклама. Чтобы получать с сервера контекстную рекламу, туда придётся отправлять какую-то информацию о содержимом компьютера. Это покажется бесцеремонным вторжением в частную жизнь слишком многим.
Несовместимость. Есть приложения, сосуществовать с которыми Google Desktop Search наотрез отказывается. В первую очередь, он не любит программы, которые пытаются фильтровать интернет тем же способом, которым это делает он сам. В их число входят некоторые антивирусы, персональные брандмауэры и средства для вырезания баннеров. Оправдание у Google Desktop Search простое: что вы хотите от первой бета-версии?
Пауки на галерах. Что будет, если связать все Google Desktop Search воедино? Получится гигантская пиринговая сеть. В воздухе давно витает идея пирингового поисковика, роль роботов-пауков в котором исполняют люди, установившие на свои компьютеры специальное программное обеспечение. Однако попытки её реализации попадают в замкнутый круг, из которого нет выхода: чтобы создать индекс подходящих размеров, сеть должна достигнуть определенной популярности, но пока индекса нет, популярности у неё не будет. Использование программы наподобие Google Desktop Search для того, чтобы вырваться из замкнутого круга, было бы остроумным решением, но нужно ли это Google?
Тень "Напстера". Есть и другое применения для гигантской пиринговой сети. Если скрестить Google Desktop Search с социальной сетью Orkut, которая тоже принадлежит Google, то появится прекрасный способ делиться файлами с друзьями - сравнительно легальный даже по строгим западным меркам.
Персонализация. Впрочем, у Google Desktop Search есть и ещё один путь развития. Программа уже сейчас модифицирует содержимое принимаемой из интернета страницы, когда встраивает результаты поиска в страницу с Google.com. Можно пойти дальше и позволить ей вносить изменения в состав и порядок результатов поиска в интернете в зависимости от информации о пользователе, которую она собрала. А если распространить эту тактику на другие сайты? Раньше эту идею пробовали применить компании Microsoft и Gator, каждая по-разному, но обе - безуспешно. Что выйдет у Google?
Где зарыта собака. Реакция на появление Google Desktop Search кажется слишком бурной. Все разговоры только о нём. Каждая крупная компания, считающая, что она чего-то стоит в интернете, сочла своим долгом протрубить о разработке собственного персонального поисковика. Microsoft, Apple, Yahoo, AOL - всех и не перечислить.
Зачем? Что их привлекло на этом рынке? (Да и рынок ли это? Есть ли в персональном поиске деньги?) Ведь ясно, что потребность в собственном поисковике испытывает лишь горстка продвинутых пользователей, а 99% прекрасно обходятся и без него.
Ответ на этот вопрос прост. На кону в грядущей битве - не поиск, а нечто совсем иное.