Google в поиске фактов и знаний

Компания Google 3 июня объявила о запуске сервиса поиска фактов и знаний - Google Squared (www.google.com/squared). В отличие от обычной поисковой системы, данная служба подвергает результаты поиска аналитической обработке с целью логически сгруппировать разрозненные данные, значительно облегчив тем самым восприятие найденного материала человеком. Пользователь в результате получает таблицу фактов и знаний, а не просто список ссылок, причём переходить по ссылкам уже не требуется - то, что вы искали, уже отображается в браузере.


Тестирование Google Squared

Анализировать работу приложений Google всегда приятно, т.к. видно, что усилий было приложено немало. Давайте посмотрим на возможности новой службы (www.narthex-daemon.net/google-microsoft-fact-search.daemon90). Например, если ввести в поле поиска Google Squared слово "Metallica", то система построит таблицу, в первом столбце которой будут перечислены названия песен, во второй - фрагменты лирики, в третьей - обложка альбома и т.д. Можно добавить и свои колонки, например, год выпуска или название альбома, и система быстро перестроит таблицу, используя технологию Ajax. Поиск по ключевым словам может быть сохранён при входе в учётную запись Google. Такая запись предоставляется каждому пользователю при регистрации в Gmail или любом другом сервисе компании, например, Feed Burner или Google Analytics.

Отмечу, что работа сервиса впечатляет, однако подборка фактов бывает неточной, т.е. в какой-то ячейке таблицы может появиться информация, логически не относящаяся к предметной области запроса.


Есть ли конкуренты у Google?

Компания Microsoft позиционирует свою новую поисковую систему Bing (www.bing.com) в качестве интеллектуальной службы поиска, и на словах выходит, что это конкурент Google Squared. Однако система производителя Windows, скорее, напоминает обычный поисковик с выдачей ссылок, картинок и связанных поисковых запросов, удовлетворяющих введённым ключевым словам. Ничего особенного, по сравнению с системой Google, поэтому совершенно непонятно, почему руководство Microsoft представляет Bing в качестве системы поиска по фактам и знаниям. Хотя, возможно, данный сервис и станет таким через некоторое время, глотая пыль и глядя на сверкающие пятки Google.

Более состоятельным конкурентом Google Squared выглядит запущенная 15 мая 2009 года система поиска по знаниям компании Wolfram Research - Wolfram Alpha (www.wolframalpha.com). Данная веб-служба представляет структурированную информацию по запросам, которые могут вводиться естественным языком. Продукт основан на 20-летних разработках компании Wolfram и написан средствами платформы Mathematica, широко используемой в научных кругах. Принцип работы системы такой же, как у классической экспертной системы - имеется огромная база фактов и математические алгоритмы, которые как раз и занимаются выводом конкретных знаний на основе этих сведений (www.narthex-daemon.net/knowledge-services.daemon128). Создание экспертной системы всегда похвально, т.к. это чрезвычайно трудоёмкий и длительный процесс. В данный момент Wolfram Alpha не сможет найти ответы на многие вопросы, однако разработка онлайн-службы продолжается бурным ходом. В качестве примера скажу, что я легко получил данные по валовому внутреннему продукту Беларуси, но найти ответы на вопросы "Кто создал Linux" и "Какой первый круг ада в Божественной комедии Данте" так и не удалось. Как будет рассказано в следующем разделе, Google Squared использует более простую технологию, однако её эффективность, на мой взгляд, всё же больше.


Немного аналитики и технических подробностей

Если проанализировать работу системы Google Squared любым HTTP сниффером, то можно заметить, что запрос к серверу и ответ представлены в полностью табличной форме. Если вы добавляете новую колонку, то в запрос попадает схема всей таблицы вместе с новой колонкой. Результат приходит не для всех колонок, а только для добавленной. Судя по всему, пришедшие результаты нигде не кэшируются - если вы удаляете колонку, а потом добавляете новую с тем же именем, то запрос посылается снова.

Основной технологией, используемой в Google Squared, является семантический поиск, основанный не на содержании документа, расположенном в глобальной сети, а на его метаданных, для описания которых используются такие языки, как RDF и OWL. Именно метаданные определяют родственные отношения между теми или иными структурами данных (сайтов, их страниц, публикаций и т.д.). Идеи семантической паутины, которая бы служила пользователям наподобие Google Squared, в настоящий момент активно продвигаются Консорциумом WWW (W3C).


Заключение

Сервис Google Squared очень интересен в плане реализации семантического поиска и предоставляет полезные и логически сгруппированные данные конечному пользователю, что, несомненно, может сэкономить время на поиск и анализ материала. Отдельно стоит упомянуть большое будущее для такого инструмента в финансовой и информационной среде благодаря наглядности представляемых результатов. Если сравнить два обсуждаемых в этой статье подхода к разработке систем поиска по знаниям, семантического поиска и экспертных систем, то первый выглядит куда менее затратным и более глобальным, поскольку семантическая сеть идеологически децентрализована и распределена по всему миру.

Narthex,
www.narthex-daemon.net

Версия для печатиВерсия для печати

Номер: 

24 за 2009 год

Рубрика: 

Internet
Заметили ошибку? Выделите ее мышкой и нажмите Ctrl+Enter!