Найди то, не знаю что...

- А как в интернете работать?

- Сначала нужно узнать, что вам нужно.

Существует множество точек зрения на то, что такое есть интернет. Например, это средство всемирного обмена информацией. Или глобальная "сеть сетей"... Или всемирная свалка (ну или склад, кому как нравится) информации. Пожалуй, мне ближе всего последний вариант. Действительно, при желании в интернете можно найти практически любую информацию. Конечно, все зависит от тематики, и хорошую библиотеку нынешний интернет не заменит. С другой стороны, любая библиотека заменить его тоже не сможет. В общем, налицо быстрый и доступный источник информации, так что надо учиться с ним эффективно работать. Вот и попробуем этим заняться.

Итак, задача - найти некую информацию в интернете. Для этого существует два основных способа. Если вы ищете некий конкретный предмет (например, зная название товара, хотите найти его описание, фотографию, характеристики и т.д.), тогда имеет смысл воспользоваться поисковой машиной (search engine). Если же надо найти сайты по определенной тематике (скажем, ресурсы, посвященные физике), тогда прямая дорога в каталоги. Что это такое и чем они отличаются?

Поисковая машина старается индексировать все веб-ресурсы, до которых может дотянуться. То есть, грубо говоря, специальная программа (робот, паук, агент) методично перебирает ссылки на web-страницах и перекачивает сами страницы в поисковую машину. Машина выделяет с этих страниц ключевые слова и заносит их в базу данных (здесь в соответствие каждому ключевому слову ставятся адреса страниц, на которых оно встречается). В результате индексации на сервере поисковой машины создается база данных, в которой словам соответствуют ссылки на web-страницы. Если вы вводите в поисковую машину слово или набор слов, она выдает ссылки, которые этим словам соответствуют. Метод, по которому определяется степень соответствия страницы запросу для разных машин разный. Значит, и порядок выдачи результатов по одинаковым запросам для них будет разный. Но это уже детали. Главное - в том, что при поиске на поисковой машине вы получаете кучу ссылок непосредственно на страницы, которые более-менее отвечают вашему запросу (так, как его поняла машина, а не так, как вы думаете). Соответственно, если того, что вы искали, нет в первой паре десятков ссылок, значит, либо этого нет вообще, либо запрос сформулирован неверно (о том, как это сделать правильно, как-нибудь в следующий раз). Но даже с правильным запросом придется потратить некоторое время на перебор этой "пары десятков", чтобы найти нужное.

Каталоги. Думаю, каждый знает, что такое каталог. Так вот, интернет-каталог - это абсолютно то же самое. То есть набор тематически отсортированной информации. Каталоги очень удобны, если вам надо найти информацию по, скажем так, некоторой отрасли знаний. Плюс каталогов в том, что все в них упорядочено, и в результате путешествия по категориям и подкатегориям вы, скорее всего, найдете что-то подходящее. Второй плюс - ресурсы для каталога обычно подбираются живыми людьми (редакторами), которые плохого не посоветуют. В смысле, внесут в каталог действительно лучшие ресурсы по каждой теме. Минус каталогов - меньший охват ресурсов. Еще один минус - логика создателя каталога в отношении разделов может не совпадать с вашей (то есть, то, что вы ищете в одном разделе, на самом деле лежит совсем в другом). Правда, каталоги включают в себя внутрений поиск, так что последний недостаток можно легко обойти.

Итак, это была теория, теперь перейдем к практике. То бишь, к ссылкам на ресурсы. Основные поисковые машины:

Google (www.google.com) - индексировано более 1,3 миллиарда страниц, правда, из них полнотекстовая индексация сделана только для порядка 700 миллионов. Есть русский интерфейс и уже неплохо индексирована русскоязычная часть интернета. AltaVista (www.altavista.com) - индексировано порядка 500 миллионов страниц. Ищет в рунете, но хуже, чем Google. Самый мощный русский поисковик - это, пожалуй, Yandex (www.yandex.ru или www.ya.ru - без примочек) - проиндексировано 38 миллионов страниц.

Что касается каталогов, то исторически самым популярным остается Yahoo (www.yahoo.com). Он содержит порядка 2 миллионов ссылок. Второй большой каталог - Open Directory Project (www.dmoz.org). 2.5 миллиона ссылок в 372 тысячах категорий и больше 37 тысяч редакторов. Из русских каталогов можно посоветовать, скажем, Rambler (www.rambler.ru) - 48 тысяч ссылок. Да и на том же Yandex'е тоже имеется каталог.

А вообще о том, по каким параметрам выбрать подходящую поисковую машину и какие у них есть сильные и слабые стороны, в следующий раз.

Константин АФАНАСЬЕВ

Версия для печатиВерсия для печати

Номер: 

21 за 2001 год

Рубрика: 

Internet
Заметили ошибку? Выделите ее мышкой и нажмите Ctrl+Enter!