Поисковые механизмы: "Яндекс"

Yandex - (англ. Языковый Индекс, Yet Another Index)

Одна из наиболее крепко вошедших в историю развития русскоязычного Интернета поисковая система Яndex (www.yandex.ru) была разработна компанией "КомпТек" сравнительно недавно (дата официального открытия - 23 сентября 1997 года), став как родителем популярнейшего поискового портала, так и одним из первых путеводителей целого сегмента "Мировой Паутины". С течением времени "Яндекс" превратился в полноценный поисковый механизм Интернет-ресурсов, позволяющий создавать личные поисковые службы и предоставляющий множество полезных и незаменимых услуг как профессиональному Web-мастеру, так и коммерческому агенту, тесно связанным с работой в области информационных.

Важнейшее и, пожалуй, основное преимущество поискового механизма Яndex - возможность производить поиск с учетом разнообразных особенностей русской морфологии - Яndex (как, впрочем, и "Апорт!" (www.aport.ru)) понимает слово во всех его грамматических формах. При этом, если "Апорт" жестко привязан к базовому словарю, поэтому на запросы, включающие слова "будда" и "будде", он выдаст различные результаты, то Яndex, встретив неизвестное системе слово, при необходимости автоматически построит гипотезу, опираясь на знание правил русского языка, и, таким образом, ответы на запросы "будда" и "будде" в итоге окажутся одинаковыми. Еще одним достоинством Яndex является способность находить заданные слова независимо от формы, в которой они употребляются в документах. Интересно, что система может образовывать словоформы даже для тех слов, которых нет в словаре.

Другим важнейшим плюсом Yandex.Ru является уникальная (по сравнению с другими поисковыми системами) база проиндексированных документов - 146,10 Гб, содержащая информацию о 15 млн web-сайтов, расположенных на 80 тысячах серверов (информация на 4 марта 2000 года).


Как искать?

Как и основные более-менее серьезные поисковые порталы, Яndex поддерживает логические операции И, ИЛИ и НЕ и логические группы, причем действие операторов И и НЕ может распространяться как на один абзац, так и на весь документ в целом.

Простой поиск, доступный с главной страницы, позволяет формулировать запрос на естественном языке (примеры запросов приведены под полем ввода), не утруждая пользователя необходимостью ломать голову над построением запроса. При этом результаты такого поиска имеют высокую релевантность, что не характерно для современных поисковых механизмов Сети. Однако, если вы ищете конкретную информацию по определенной тематике, вы можете выучить язык поисковых запросов, и тогда конечный результат ваших трудов с лихвой оправдает затраченное время.

Прежде всего необходимо заметить, что при введении запроса прописными буквами поисковым механизмом будут найдены только слова, начинающиеся с прописной буквы, в противном случае будут найдены как слова с большой буквы, так и со строчной. Так, например, с помощью запроса "заяц" вы сможете найти информацию как о братьях наших меньших, так и о людях, фамилии которых соответствуют данному запросу. Если вы хотите работать не с конкретным сайтом, а со всеми, начинающимися с заданной последовательности символов, используйте "*".

Если же вам точно известна словоформа необходимой информации, вы можете поставить перед ней восклицательный знак "!". Тогда по запросу "!Беларуси" Яndex предоставит вам документы, содержащие заданную словоформу "Беларуси", а по запросу "Беларусь ~~!Беларуси" - документы, в которых упоминается слово "Беларусь", кроме тех, которые были найдены по первичному запросу.

Как и в любом другом поисковом механизме, Яndex включает возможность использования естественно-языкового синтаксиса. Так, если вы хотите, чтобы в найденных поисковой системой документах обязательно содержалась заданная в запросе фраза, поставьте перед каждым словом знак "+". Если же вы хотите исключить какие-либо слова, поставьте перед каждым из них "-".

Кроме этого, несколько набранных в запросе слов, разделенных пробелами, означают, что все они должны входить в одно предложение искомого документа. Тот же самый эффект произведет употребление символа "&". Например, при запросе "векторная графика" или "векторная & графика" результатом поиска будет список документов, в которых в одном предложении одновременно содержатся слова "векторная" и "графика".

При поиске же документов, содержащих любое из выбранных вами слов, между словами удобно поставить знак "|": запрос вида "дизайн | интернет | html | Ява" задаст поиск документов, содержащих хотя бы одно из перечисленных в запросе слов, а запрос "Microsoft ~ "Internet Explorer"" позволит найти документы, содержащие слово "Microsoft", рядом с которым (в пределах предложения) не обнаружится фраза "Internet Explorer".

Чтобы подняться на ступень выше, от уровня предложения до уровня документа, просто удвойте соответствующий знак, учитывая при этом, что одинарный оператор (&, ~) совершает поиск в пределах одного абзаца, двойной (&&, ~~) - в пределах целого документа. Например, по запросу "рецепты && (плавленый сыр)" Яndex найдет документы, в которых встречается и слово "рецепты", и словосочетание "(плавленый сыр)", причем '(плавленый сыр)' обязательно будет находиться в одном предложении.

Отличительной способностью Яndex является многообразие поиска в отдельно взятых элементах Интернета. Так, например, вы можете ограничить поиск информации списком серверов или, наоборот, исключить определенные серверы из поиска (по запросу 'Компьютерные Вести ~~ #url="www.kv.minsk.by*"' Яndex будет искать упоминания газеты 'Компьютерные Вести' на всех сайтах, исключая ее собственный (www.kv.minsk.by). Однако необходимо отметить, что данный вид поиска крайне редко выдает точные и полезные результаты, так как большинство Интернет-ресурсов, как в РуНете, так и в БайНете, имеют сразу несколько синонимов web-адресов своих проектов. Так, Яndex при вышеназванном запросе, кроме искомой информации, выдаст также документы с адресами "http://kv.minsk.by". Также существует возможность поиска документов, содержащих необходимую вам фразу в заголовке html-документов ($title (Беларусь)), тексте гиперссылок ($anchor (Минск | Витебск)), ключевых словах (#keywords=(поисковая система)), аннотациях в мета-тегах (#abstract=(Альтависта | поиск)), подписях к изображениям (#hint=(Купала | Пушкин)), названиях самих изображений (#image="Rembrandt*"), страницах, содержащих ссылки на определенные web-сайты (#link="kv.minsk.by*").

Уже сегодня поисковая система Яndex является одной из наиболее популярных и информативных поисковых ресурсов русскоязычного Интернета. Кроме того, неизменно высок ежедневный темп роста объема проиндексированной системой информации, что позволяет говорить о масштабных и целенаправленных планах создателей "Яндекса" на ближайшее будущее.

Остается лишь пожелать начинающим любителям Интернета удачи в поиске в информационном киберпространстве Сети, ведь поисковые запросы, кажущиеся на первый взгляд сложными и бессмысленными, почти всегда основаны лишь на умелом использовании естественного синтаксиса поискового механизма.

Виталий ФРИДМАН,
Vit_Friedman@softhome.net,
www.kv.minsk.by/belhome

Версия для печатиВерсия для печати

Номер: 

13 за 2000 год

Рубрика: 

Internet
Заметили ошибку? Выделите ее мышкой и нажмите Ctrl+Enter!