Как не потерять уже найденное?

Проблема эффективного поиска информации во Всемирной сети привлекает внимание многих исследователей. И определенный прогресс в ее решении, безусловно, имеет место. Значительно менее разработана тема, как организовать найденную информацию так, чтобы ее можно было в любой момент опять найти и использовать. А без специальных исследований в этой области трудно ожидать появления эффективных инструментов, которые помогали бы пользователям не утонуть в информационном океане.

Подобный анализ в настоящее время проводят многие исследовательские группы, например, группа У. Джонса, Г. Брюса и С. Дюмэ, работающая в рамках проекта Keeping Found Things Found (KFTF) Школы информации университета Вашингтона и финансируемая Национальным фондом науки США (kftf.ischool.washington.edu/index.asp), группа К. Альварадо, Дж. Тевана, М. Акермана и Д. Каргера из Лаборатории искусственного интеллекта Массачусетского технологического института, группа Р. Капра и М. Перез-Квиньонеса из Технологического института штата Вирджинии и некоторые другие.

Эксперименты позволили выявить определенные закономерности в стратегиях повторного поиска некогда найденной информации. Так, группа Альварадо показала, что при повторном поиске информации используются, в основном, два подхода, которые они назвали ориентирование (orienteering) и телепортирование (teleporting). В первом случае контекстуальная информация используется для пошагового сужения круга поиска источника информации. Это навигация, зависящая от ситуации (situated navigation). Во втором случае делается попытка сразу попасть на искомый источник. Этот тип авторы исследования назвали спланированной навигацией (plan-based navigation). Кроме того, они сделали важное наблюдение, что "люди сохраняют огромное количество контекстуальной информации о той специфической информации, которую они ищут".

Группа Джонса (KFTF) показала практическую малую эффективность использования закладок для повторного поиска нужной информации. По словам Джонса, списки "избранного" очень быстро становятся "информационной свалкой", где в беспорядке соседствуют нужные ссылки и ссылки на сайты, к которым больше никогда не возвращаются. Только для очень организованных пользователей, которые регулярно сортируют ссылки по папкам, удаляют мертвые ссылки и проверяют релевантность забытых ссылок, эти списки имеют действительную ценность. Эксперименты выявили большое разнообразие подходов пользователей к организации найденной информации, и коллекционирование закладок оказалось не самым популярным. Многие пользователи предпочитают посылать самим себе e-mail'ы с ссылками и пометками, почему эти ссылки могут быть полезными в дальнейшем. Некоторые распечатывают страницы, сохраняют их на диске, добавляют линки на персональных веб-страницах или используют стикеры или просто бумажки. Но, в основном, люди полностью полагаются на свою способность найти нужную страницу вновь с помощью поисковых машин. Исследование также показало огромную роль, которую контекст играет для повторного нахождения информации. Если испытуемые в эксперименте могли описать содержание сайта своими словами и составить его аннотацию, то они легко находили его и спустя шесть месяцев после этого. А вот средства накопления закладок в современных браузерах делать аннотации к ссылкам не позволяют.

Можно, конечно, переориентировать себя на использование специальных программ, таких, как веб-органайзеры типа Ariadne или накопители ссылок типа URL Album. Однако средства эти не универсальные и не для всех пользователей пригодные. Тем более, что в случае с Ariadne приходится иметь дело с бесконечными "бетами", а значит - мириться с периодическими появлениями сообщения о том, что "программа выполнила недопустимую операцию". Во всяком случае, после очередного испытания мне каждый раз приходилось с разочарованием деинсталировать Ariadne.

Для решения этой проблемы группа KFTF создала специальное расширение для "Favorites" Internet Explorer'а - "Add to Favorites 2". В особом окошке пользователи могут добавлять описание сайтов, на которые они собираются сделать закладки. В настоящее время "Add to Favorites 2" тестируется небольшой группой пользователей в университете Вашингтона.

Еще одно средство повторного поиска разрабатывается совместно группой KFTF и Сьюзен Дюмэ (research.microsoft.com/~sdumais), старшим научным сотрудником Microsoft Research. Это программа Stuff I've Seen, которая должна помочь отыскать электронное сообщение или посещенный некогда веб-сайт на основе единого поискового интерфейса. В настоящее время программу тестируют 1500 сотрудников Microsoft. Stuff I've Seen, по-видимому, не будет продаваться как самостоятельный продукт, но наработки используют в новой операционной системе под кодовым названием Longhorn. Подробное описание системы Stuff I've Seen можно прочитать в статье: research.micro-soft.com/~sdumais/SISCore-SIGIR2003-Final.pdf.

Однако и С. Дюмэ, и Б. Бедерсон (директор лаборатории взаимодействия человека и компьютера университета Мэриленда) полагают, что хорошие поисковые системы устранят необходимость не только в накопителях закладок, но даже и в использовании иерархии папок в файловых системах и самих файлов. Сам Бедерсон уже разработал программу NoteLens, которая позволяет быстро найти свои старые записи по ключевым словам без необходимости открывать папки. По его словам, программа легко может быть адаптирована для припоминания посещенных веб-страниц. NoteLens доступна для скачивания по адресу windsorinterfaces.com.

Недостатком описанных экспериментов является то, что они не учитывали динамический характер как поиска, так и повторного поиска информации, в частности, их диалогичность. Для того, чтобы несколько прояснить ситуацию, исследователи из Технологического института штата Вирджинии Р. Капра и М. Перез-Квиньонес провели специальный эксперимент (его описание и результаты см.: xxx.lanl.gov/pdf/cs.HC/0310011). В нем принимали участие пары "мобильных" пользователей, в которых один из участников выступал в качестве "собирателя" информации и консультировал своего партнера по телефону. "Мобильные" пользователи были выбраны потому, что именно они часто пользуются таким удаленным консультированием для получения доступа к необходимой информации вне дома или офиса. Важной в данном случае является диалоговая форма общения между удаленными пользователями, те приемы и словарь, которые при этом используются, т.е. некий общий контекст общения.

Информационный контекст задавался путем создания аннотаций веб-страниц, на которых была найдена необходимая информация. При таком аннотировании главную роль играют различные артифакты и тезаурус ключевых слов, по которым могут распознаваться посещенные веб-страницы. В лабораторном эксперименте важно было выяснить, что люди припоминают прежде всего, когда пытаются отыскать информацию, уже некогда найденную в интернете и, возможно, хранящуюся на другом удаленном компьютере, и в каком контексте.

Эксперимент показал, что в большинстве случаев повторный поиск представляет собой итеративный процесс использования контекстуальной информации. Было также показано, что при выполнении повторного поиска большое значение имеют два типа артифактов: промежуточные пункты (waypoints) и аннотации. Очень часто пользователю легче восстановить путь к некоторой промежуточной странице, которая ведет к искомой, чем непосредственно сразу к искомой. Причем, если пользователь предварительно создавал категоризованные (классифицированные по тематическим категориям) аннотации, то процесс поиска значительно ускорялся.

Однако понятно, что аннотирование требует дополнительных усилий со стороны пользователей, и не факт, что они готовы тратить на это время ради выгоды возможного в будущем быстрого повторного доступа к информации.

В общем, проблема еще очень далека от разрешения. Я, как и большинство, использую комбинированные способы в зависимости от характера находимой информации: и закладки, и пометки на бумажках или в электронных блокнотиках, и сохранение страниц или целых сайтов на диске. Иметь нужную информацию под рукой (на диске компьютера) всегда удобно, но, во-первых, часто хотелось бы не терять и адреса ее оригинального размещения в Сети, а во-вторых, сохраненную на диске информацию бывает труднее отыскать среди тысяч других сохраненных файлов, чем повторно найти ее с помощью хорошо спланированного поиска в интернете. В первом случае помогают такие утилиты, как Inject URL (lodz.pdi.net/~eristic/free/index.html), которая позволяет вставить в сохраненную страницу ее оригинальный веб-адрес. Во многих случаях для сохранения страниц, сайтов или избранных разделов сайтов оправдано использование Adobe Acrobat, так как при этом на каждой странице прописывается путь к ее оригинальному размещению, а итоговый pdf-файл компактен и удобен для дальнейшей работы. В частности, средства Adobe Acrobat позволяют делать в документе пометки, закладки, подсвечивать фрагменты текста и т.д., т.е. все, что необходимо для работы с добытой информацией. Ну а как разгребать файловые завалы на своем винчестере, каждый пользователь решает сам.

Сергей САНЬКО

Версия для печатиВерсия для печати

Номер: 

06 за 2004 год

Рубрика: 

Internet
Заметили ошибку? Выделите ее мышкой и нажмите Ctrl+Enter!