С неимоверным увеличением потока электронных писем расширяются и самые разнообразные исследования этого своеобразного феномена современности. Недавно (№12) "КВ" рассказывала об успехе ученых из HP Labs, которые, анализируя потоки электронной корреспонденции, научились выделять формальные и неформальные группы в рамках большой организации, а также неформальных лидеров таких групп.
Теперь о своих результатах сообщили исследователи из университета Южной Калифорнии. Они разработали специальные средства организации и визуализации огромных массивов электронных писем. В таких инструментах давно заинтересованы юристы, историки, архивисты и многие другие, кому приходится работать с большими электронными архивами. Система, которую разработчики назвали "eArchivarius", будет продемонстрирована 30 июля на конференции в Торонто.
"eArchivarius" использует изощренное поисковое программное обеспечение типа того, что применяется в поисковых машинах в интернете. Оно позволяет определять наиболее важные взаимосвязи между сообщениями и их авторами. Затем система автоматически генерирует интуитивно понятный интерфейс, где сгруппированные в пространстве шарики как раз и отражают выявленные связи. Причем информационную нагрузку несет не только пространственное положение шариков, но и их цвет, а также его интенсивность.
Например, при одной конфигурации системы шарики представляют какого-нибудь автора, а расстояния между ними - количество сообщений, отправленных и полученных автором в течение определенного периода времени. Шарики могут также визуализировать и по другим параметрам, по содержанию сообщений. Тогда полученная конфигурация будет отражать сообщества людей, занятых одной темой, и взаимосвязи между такими сообществами. Затем полученная информация может быть преобразована в гипертекстовый документ с линками на людей, которые отправляли или получали конкретное письмо, и линками на письма аналогичного содержания. "eArchivarius" имеет и другие весьма продвинутые возможности.
Ученые продемонстрировали эти возможности, проанализировав массив из нескольких сотен электронных писем, но уже готовы анализировать и тысячи писем, полученных индивидом в течение 18 лет. Следующий шаг - анализ миллионов сообщений, которыми обменялись тысячи людей. Похоже, инструмент получился и гибким, и весьма полезным.
Пресс-релиз находится по адресу: www.usc.edu/isinews/stories/91.html. Подробности на сайте: www.isi.edu/~leuski/earchivarius.
Сергей САНЬКО
Горячие темы