Пособие для начинающего "крота"

Каждый исследователь, который когда-либо занимался первоначальным накоплением информации по интересующей его теме, знаком с длительной процедурой поиска необходимых источников. Обнаружив, часто случайно, какой-либо источник интересной информации, исследователь, подобно трудолюбивому кроту, начинает постепенно "разрывать" другие источники, процитированные в уже найденном. Некоторые из них оказываются полезными, другие имеют весьма косвенное отношение к искомой теме. Процесс может быть бесконечным - ученый "крот" получает все больше и больше дополнительной информации по теме, уводящей все далее назад по времени к возможным истокам проблемы или целого класса родственных проблем. Нередко такой поиск можно оборвать на какой-либо фундаментальной классической работе, суммировавшей в себе большой пласт предшествующих исследований. Но гораздо чаще такая цепочка приводит к чахлым струйкам информации, к множеству мелких источников, при анализе которых можно прийти к неким обобщающим выводам по определенной проблеме. В любом случае классический поиск информации, известный многим поколениям ученых, направлен вспять во времени и, как правило, добавляет новые источники информации по одному или небольшими группами.

Появление интернета радикально изменило многие аспекты исследовательской работы. Ведь, как правило, в Сети можно обнаружить ресурсы по любой теме и родственным ей проблемам. И хотя интернет не влияет на скорость восприятия и обработки информации человеком, он значительно упрощает поиск и аккумуляцию необходимых данных. Теперь, чтобы стать специалистом в каком-либо узком вопросе, не нужно тратить годы на создание собственной информационной базы - нужно лишь обнаружить необходимые данные, уже выставленные в Сети.

Однако работа в этой гигантской библиотеке затрудняется отсутствием "консультантов". Мощные поисковые машины на такую роль не годятся - как правило, поиск в них ведется по заданным пользователем ключевым словам в отсутствие какой-либо привязки к контексту. С одной стороны, такой бесконтекстный поиск приносит массу бесполезных, нерелевантных документов. С другой, начиная исследование по какой-либо новой теме, вы нередко не владеете самим запасом ключевых слов этой темы. Поэтому существует значительный риск потерять некоторые важнейшие документы.

Создание полномасштабных интеллектуальных контекстных поисковых машин и каталогов - дело относительно ближайшего будущего. В принципе, первопроходцами в этом нелегком деле должны бы стать крупнейшие мировые библиотеки, которые на своих сайтах могли бы предоставлять сервисы контекстного поиска информации на основе имеющихся у них фондов и баз данных. Возможно, образцом для таких автоматизированных библиотечных услуг могут послужить соответствующие сервисы ряда периодических изданий или новостные разделы крупнейших интернет-каталогов.

Современные сервисные службы многих крупных газет позволяют осуществлять контекстный поиск информации одновременно в двух направлениях по времени, выдавая новые источники, как правило, по группам. При обнаружении статьи по конкретной теме в каком-то давнем номере газеты в разделе "related articles" будут указаны не только предшествующие, но и более поздние публикации по данной теме, вплоть до последнего выпуска газеты (правда, такая подборка ограничена только публикациями из данного издания). Впрочем, учитывая, что соответствующий ссылочный аппарат обеспечивает технический персонал газеты, нельзя быть стопроцентно уверенным в исчерпывающем характере списка "related articles".

Газеты также частенько предлагают опцию "related sources", которая содержит указание на источники информации за пределами данного сайта - на ресурсы, с помощью которых можно получить дополнительные сведения по искомой теме (прямо скажем, в большинстве периодических изданий Рунета и Байнета таких сервисов нет, ссылки преимущественно внутренние и не слишком полные).

Нередко первоначальным источником информации по теме могут стать обычные новостные сообщения информационных агентств. Предположим, что 15 апреля 2003 года на новостном разделе "Yahoo! News" (dailynews.yahoo.com) в сообщениях агентства Associated Press меня заинтересовала информация о претензиях администрации Буша к Сирии. На сайте, кроме статьи Барри Суэйда, дипломатического обозревателя AP, посвященной этим событиям, находилась ссылка "Full Coverage", кликнув по которой, я попал на страницу, полностью посвященную теме. Здесь размещалась группа линков на публикации того же дня, посвященных сирийской проблеме (информации агентств Reuters, Associated Press, статьи в газетах Washington Post, Los Angeles Times и др.). Кроме этих текущих источников, под рубрикой "Opinion & Editorials" приводились ссылки на редакционные статьи и мнения, опубликованные в различных авторитетных периодических изданиях, как американских, так и англоязычных арабских с несколько большей глубиной временного погружения - примерно на неделю назад. Здесь же содержались ссылки на журнальные статьи, в той или иной мере посвященные обсуждению данного вопроса, охватывающие более глубокий отрезок времени примерно в 3,5 года. Кроме того, в разделе "Full Coverage" содержались ссылки на мультимедийные источники информации - аудиоматериалы нескольких радиостанций и видеоинформация, преимущественно от BBC и CNN, - с глубиной временного охвата примерно в три года; ссылки на постоянно функционирующие веб-сайты с информацией по Сирии; ссылки на другие родственные колонки "Full Coverage", содержащие информацию по родственным тематикам (Ближний Восток, Ирак, Ливан); ссылки на категории каталога Yahoo и на сайты новостных служб некоторых других каталогов.

Таким образом, достаточно случайно заинтересовавшись текущими событиями, можно получить довольно полное представление о Сирии вообще, ее экономике, политике и истории. Основная часть полученной информации представлена, естественно, на английском языке, однако при желании не трудно выйти и на арабские информационные ресурсы.

Очевидно, что аккумуляция материалов такого объема в доинтернетовскую эпоху потребовала бы недель, месяцев, а может, и лет целенаправленной работы, посвященной специальному изучению сирийской проблематики, с доступом в крупнейшие библиотеки и архивы мира. Ныне же такую информацию при желании и определенном умении каждый может собрать за пару часов.

Опция "Full Coverage", которая сопровождает на сайте "Yahoo! News" практически все новости, встречается и в других ресурсах, скажем, на сайтах многих периодических изданий. Правда, в данном случае она сопровождает далеко не каждую публикацию, а лишь статьи, освещающие значительные события. Некоторые сайты ведущих мировых журналов и газет, не предлагая явно опцию "Full Coverage" по той или иной тематике, позволяют пользователям аккумулировать базовую информацию, проясняющую опубликованные материалы иным способом. Например, известный журнал The Economist (www.economist.com) сопровождает многие статьи опцией "Get article background", кликнув по которой, можно изучить историю вопроса, поднятого в статье.

Существующее сегодня упрощение аккумуляции информации и резкое повышение производительности данного процесса существенно смещают акценты в профессиях исследователя, аналитика и журналиста. Более весомой становится работа по генерации первоначальной информации - по превращению событий реального мира в факты информационного пространства. Исключительный характер приобретает работа аналитика, способного сделать выводы из огромных массивов неупорядоченной информации. В принципе, такое смещение акцентов должно найти отображение в процессах современного, прежде всего, высшего образования. Все менее существенным для очень многих специальностей становится длительное индивидуальное накопление базовых данных. Все более существенным становится обучение технологиям поиска и обработки информации, существующей во Всемирной сети. Разумеется, есть такие сферы человеческого знания, в которых без длительного накопления данных не обойтись, - скажем, при изучении иностранного языка, - когда знание технологии поиска и обработки интернет-информации поможет вам как рыбке зонтик :).

К сожалению, с падением дохода от сетевой рекламы и резким ослаблением притока инвестиционных средств сотни веб-сайтов вынуждены вводить платную подписку за доступ к своему содержанию или платному представлению некоторой части своих услуг. Разумеется, "бесплатный", поддерживаемый рекламой, интернет-контент не исчезает полностью, однако он во все большей степени сосуществует с платными интернет-сервисами (политика, скажем, еще сравнительно недавно бесплатных контент-проектов вроде Британской энциклопедии или медийной корпорации Financial Times - тому пример). При этом, при переходе на платный вариант западные контент-проекты, как показывает практика, теряют до 40% своего трафика.

Крупнейшие новостные сайты пока еще, в основном, полагаются на доходы от рекламы, но доминирующей тенденцией является введение ограниченного платного контента (premium content). Например, premium content газеты The New York Times, включает в себя уже готовые тематические подборки статей и электронные кроссворды. А несколько тысяч оригиналов вносят дополнительную плату за возможность получить электронное издание, являющееся полной визуальной копией "бумажной" версии газеты.

Большинство крупнейших порталов, таких, как AOL, MSN, Yahoo и другие, добавили платные сервисы к уже имеющимся бесплатным, чтобы пополнить доходы от рекламы и провайдерских услуг. В частности, они предлагают платные музыкальные подписки MusicNet и PressPlay. Все больше увеличивается стремление только за плату представлять в интернете видеоинформацию. Даже CNN (www.cnn.com), бывшее лидирующим поставщиком бесплатных видео-новостей, постепенно перевело получение большей части своих видеоматериалов на коммерческую основу (месячная подписка стоит ок. $10).

Увы, но данная тенденция жестоко разочаровывает тех, кто верил, что суть интернета состоит в бесплатном распространении информации. Так что исследователям не следует забывать свои "кротовые" навыки - глядишь, пригодятся....

Майлз Vornet,
vornet@tut.by