Где искать? Рано или поздно, такой вопрос возникает у любого белорусского пользователя Интернета. Ответ очевиден - искать надо с помощью поисковых систем. А это специально созданные узлы WWW, основная функция которых состоит в поиске информации среди различных информационных ресурсов Интернета (серверы WWW, FTP, Gopher, телеконференции, UseNet, списки адресов E-mail). Бывают они разные и классифицируются по методам поиска информации. Существует три основных типа таких систем: поисковые каталоги, поисковые индексы и гибридные системы поиска.
В поисковый каталог информация заносится по инициативе человека. Добавляемая страница должна быть жестко привязана к принятым в каталоге категориям. Результатом является постоянно обновляющийся иерархический (древовидный) каталог, на верхнем уровне которого собраны самые общие категории, такие как "бизнес", "наука", "искусство" и т.п., а элементы самого нижнего уровня представляют собой ссылки на отдельные web-страницы и серверы вместе с кратким описанием их содержимого. Предметные каталоги предоставляют также возможность автоматического поиска по ключевым словам. Только поиск происходит не в содержимом самих web-серверов, а в их кратких описаниях, хранящихся в каталоге. Поисковые каталоги обеспечивают высокое качество поиска и по уровню сортировки документов намного превосходят поисковые индексы, проигрывая им по количеству просмотренных документов.
Поисковые или автоматические индексы (spiders, crawlers) постоянно исследуют Интернет с целью пополнения своих баз данных. Обычно это не требует никаких усилий со стороны человека. Программа, в которую загрузили несколько тысяч общеизвестных URL-адресов, будучи запущена на компьютере с доступом к WWW, начинает автоматически скачивать из сети документы по этим URL. Причем из каждого нового документа она извлекает все содержащиеся в нем ссылки и добавляет их в свою базу адресов. Преимуществами этих систем являются большие базы данных и высокая скорость обработки запросов. К недостаткам можно отнести очень большое количество ссылок на выходе, причем большая часть этих документов имеет весьма отдаленное отношение к нужной теме.
Гибридные системы поиска сочетают в себе поисковые каталоги и индексы. Существуют ещё и метапоисковые системы (поисковые службы), которые рассылают запросы пользователя одновременно нескольким поисковым серверам и обращаются к некоторым другим источникам информации. Затем они объединяют полученные результаты и представляют их пользователю в виде HTML-страницы с активизируемыми URL-ссылками.
Какие же есть белорусские поисковые системы и как их можно найти? Конечно, существуют такие поисковики, которые известны практически всем. Ну что там у нас на слуху? All.by, poisk.com, br.by. Также можно спросить у своих знакомых и друзей. И, наконец, просто поискать в уже известных нам поисковиках. Так и поступим, а заодно и проверим их, устроив своеобразное тестирование. Для этого везде будем вводить одинаковый текст запроса, например, "каталог ресурсов", и посмотрим, где и сколько будет соответствий. Попутно обратим внимание на количество ресурсов, заявленных в этих каталогах и на их рубрикатор. Кстати, под ресурсом понимается сайт в целом, а под документом - информация, находящаяся на какой-либо страничке сайта. Итак, поехали. А результаты приведём в таблице 1.
Таблица 1: Белорусские поисковики и каталоги с функцией поиска | ||||
Название поисковой службы | Кол-во ресурсов | Кол-во категорий | Выдано ресурсов после запроса | Соответствие запросу |
"XXI век" vek.virtualave.net | ? | - | 39 | 7 |
"Белорусские ресурсы" BelResource.com.by | 6781 | 9 | 12 | 6 |
Poisk.com | 1103 | 8 | 1 | 0 |
"Белорусский рейтинг" Br.by | 996 | 14 | 9 | 5 |
All.by | 1827 | 8 | 22 | 14 |
Agapov.com | 304 | 14 | 25 | 6 |
"*.BY" search.promedia.minsk.by | ? | - | 18 817 документов | 11 |
"Зубр" Zubr.com | 487 | 12 | 38 | 18 |
Как видно из таблицы, по соответствию запросу, бесспорным лидером этого эксперимента оказался Zubr.com. И количество выданных ссылок реально просмотреть, и соответствий достаточно. Обидно только, что количество ресурсов пришлось считать самому, как говорится, вручную. На втором месте поисковый индекс и каталог All.by. Здесь, кстати, представляется информация не только о количестве ресурсов, содержащихся в базе, но и о количестве документов - 60 070, что, кстати, представляет отдельный интерес. Выдаваемая информация делится на две части: ссылки на ресурсы и ссылки на документы. Очень удобно. Кстати, кто ещё не знает, all.by - это новое имя и лицо старого-доброго 09.open.by.
На третьем месте - поисковая служба *.by. Как вы заметили, только *.by выдаёт в результате ссылки на документы, а не на сайты. Не знаю, у кого хватит сил и нервов просмотреть всю эту кучу документов. Лично меня хватило на 60 ссылок, в которых я и нашёл 11 соответствий. Вполне возможно, что если просмотреть всё, то можно найти и больше, но это уже не для меня. Есть на этом сайте и приятные вещи, а именно: дополнительные параметры запросов, с помощью которых можно повысить точность выдаваемых ссылок, а также снизить их количество.
Интересно получилось с poisk.com. При поиске по каталогу он выдал только одну ссылку на российский каталог list.ru. Причём, если посмотреть в рубрикаторе, то имеется 13 ссылок на каталоги ресурсов. Почему же они не были выданы при поиске? У poisk.com имеется ещё возможность поиска в Yandex-Беларусь. Вот он-то и вывалил ссылки на 479 документов, а это не менее 76 серверов. Просмотрев первые 20 ссылок, я нашел 9 соответствий, а дальше, честно говоря, было просто лень смотреть. Кстати, у poisk.com имеется неплохой расширенный поиск, в котором указывается страна, город, язык, зона, рубрика и др. параметры, что тоже может облегчить поиск. Ну а остальные поисковики выдали по 5-7 соответствий.
Что же мы нашли в результате поиска? Приведем ещё одну таблицу (2) уже с результатами поиска по белорусским каталогам ресурсов. Здесь оцениваемыми параметрами будут количество ресурсов и категорий первого уровня, то есть те категории, которые находятся на заглавной странице каталога.
Таблица 2: Белорусские каталоги без функции поиска | ||
Название | Количество ресурсов | Количество категорий |
"Акавiта" akavita.kryvia.net | 734 | 54 |
"Винт" bsm.unibel.by/vint | 140 | 24 |
"Новый век" highwebs.com/vek | 436 | A…Я и A…W |
"Белорусские домашние страницы" www.kv.by/belhome | 69 | 6 |
"Интересные www-сайты в и о Беларуси" аc.by/country | ~4000 | 16 |
"Minsk in Person" mips.virtualave.net | 31 | - |
"БИФ" bif.by | 311 | 12 |
"Весь Белорусский Интернет" danila.w3.to | ~400 | 39 |
Теперь для анализа будем использовать данные обеих таблиц. Итак, все каталоги можно разделить по количеству ресурсов на два типа. К примеру, на каталоги, содержащие до 1 000 ресурсов и, соответственно, более 1 000. Как видно из таблиц, к первому типу относится большинство каталогов - 10. Ко второму относится только 5 каталогов. Но заметьте, что у каталогов первого типа рубрикатор, в основном, больше. Взять, к примеру "Акавiту", "Весь белорусский Интернет" или "Винт". Здесь "Акавiта" вообще лидер, по количеству рубрик дальше всех ушла. С одной стороны, это удобно - всё перед вами, и не надо лазить по всему дереву каталога, чтобы найти интересующую категорию. Но, с другой стороны, глаза просто разбегаются, когда смотришь на эти 54 рубрики.
Второй тип каталогов берёт своё количеством ресурсов. Взять, к примеру, BelResource.com.by. Пускай у него всего только 9 категорий первого уровня, но зато более 6 700 ресурсов. Прежде всего это каталог белорусских ресурсов, но здесь регистрируются не только белорусские сайты. К этому же типу относится еще один привлекательный каталог - "Интересные www-сайты в и о Беларуси". Дело в том, что этот каталог дает ссылки на многоязычные информационные ресурсы, посвящённые нашей стране. Хотите узнать, что пишут и думают о нас в других странах, тогда вперёд. Причём каталог постоянно находится в стадии развития и пополняется почти ежедневно. Там есть что посмотреть и почитать, если, конечно, вы знаете ещё какой-нибудь язык, кроме русского. Например, здесь можно почитать о Минске на французском или итальянском языках.
Итак, какие же всё-таки будут итоги? Просмотрев каталоги, я пришёл к выводу, что:
- информацию о компьютерах и Интернете лучше всего искать на belresource.com. by, all.by, br.by, poisk.com;
- о науке и образовании - belresource.com.by, all.by, br.by, zubr.com, аc.by/country;
- о политике - all.by, br.by, poisk.com, аc.by/country, belresource.com.by, аkavita.kryvia.net;
- о культуре и искусстве - belresource.com.by, аc.by/country, all.by, аkavita.kryvia.net, poisk.com;
- о бизнесе - belresource.com.by, all.by, аkavita.kryvia. net, poisk.com, zubr.com;
- о здоровье и медицине - belresource.com.by, all.by, br.by, аkavita.kryvia.net;
- о новостях и СМИ - all.by, br.by, poisk.com, аc.by/country, belresource.com.by, zubr.com;
- об отдыхе и развлечениях - belresource.com.by, all.by, poisk.com, br.by, аkavita.kryvia.net.
А что касается результатов по запросам, то они, конечно, относительны. Ведь если взять другой текст, то и результат может получиться совершенно отличным от данного. Не берусь утверждать, какой поисковик или каталог лучше. Об этом можно спорить очень и очень долго. Лучший вариант - если вы сами попробуете поработать с той или иной поисковой службой и впоследствии выберете именно то, что вам нравится и подходит. Я сделал именно так, и теперь вряд ли перестану дружить с All.by.
Игорь ЯКОВЛЕВ,
инф. агентство "Веспол",
vespol@tut.by
Горячие темы