Архивы: по дате | по разделам | по авторам

Google Goggles – универсальный путеводитель

АрхивСофтерра
автор : Николай Маслухин   23.07.2010

Поиск в интернете может быть не только текстовым - Goggles позволяет искать информацию об объектах, лишь наведя на них камеру мобильного телефона.

Почему поиск в интернете должен быть обязательно текстовым? Похоже, этим вопросом и задались в Google Labs, в результате чего изобрели Google Goggles. Эта программка позволяет искать информацию об объектах, лишь наведя на них камеру. Googles попытается определить называние объекта и затем использовать его для поиска. Получается, по сути, универсальный помощник путешественника.

Google Goggles может определить по внешнему виду достопримечательности её название и выдать ссылку на "Википедию"; позволяет распознавать тексты афиш, надписей или меню и сразу выдать перевод текста (с недавних пор доступен перевод и на русский язык); узнавать картины, скульптуры и прочие произведения искусства и давать ссылки на подходящие описания; по обложке книги или диска определять автора и название, выдавая ссылки на рецензии; распознавать марки вин, автомобилей и логотипы компаний.

Звучит фантастично? Ровно до тех пор, пока не видишь, что программа действительно работает. Правда, лучшие результаты она показывает, только когда показываешь ей картинки из интернета (они и понятно - сравнение идёт с иллюстрациями, уже присутствующими в базе Google). А вот при фотографировании с натуры возникают трудности, связанные с подбором подходящего ракурса. К тому же, результаты выдачи сильно зависят от условий и места съёмки.

Так, к примеру, если фотографировать памятник Салавату Юлаеву (визитная карточка города Уфы), при снимке с монитора выдаются ссылки исключительно про сам город. А вот если тот же снимок сделать в непосредственной близости от постамента, к анализу картинки подключаются данные от приемника GPS, и программа выдает точное название памятника.


Распознавание объектов по снимку с монитора


Распознавание визиток. Не совсем верно расшифрована фамилия, зато контактные данные считаны верно. Информацию можно сразу же добавить в контакты (или перевести, если речь идёт о текстовом блоке)


Распознавание логотипов. Логотип определен правильно, причём в выдаче указан уже совместный с компанией Renault логотип

Чтобы проверить качество распознавания в условиях плохой освещенности, мы специально сфотографировали известный плакат "We Can Do It!". Несмотря на посредственное качество снимка, программе не только удалось опознать произведение и автора, но и в первых же позициях выдачи дать ссылку на статью в "Википедии".


Работа с нечеткими снимками

К сожалению, при всех достоинствах программы (включая полную бесплатность) есть у неё и большой недостаток - поиск осуществляется исключительно на английском языке. И если текстовый блок можно перевести прямо из программы, то названия логотипов, достопримечательностей, а также ссылки на ресурсы, выдаются на языке Шекспира.

© ООО "Компьютерра-Онлайн", 1997-2019
При цитировании и использовании любых материалов ссылка на "Компьютерру" обязательна.