Простая и несложная в реализации схема для фильтрации спама придумана американскими учеными. Новая технология предусматривает составление карты социальных связей по полям отправителя и адресата в почтовых сообщениях.
Согласно научной работе "Персональные сети электронной почты: эффективный инструмент фильтрации спама" (www.arxiv.org/abs/cond-mat/0402143), опубликованной в тематической категории "Беспорядочные системы и нейросети" электронного архива научных работ arXiv.org, данный метод работает примерно на половине всех почтовых сообщений, но если уж система срабатывает, то она срабатывает на 100%.
П. Оскар Бойкин (P. Oscar Boykin) и Ввани Ройчоудхьюри (Vwani Roychowdhury) из Университета Калифорнии, разработавшие новую технику фильтрации, говорят, что их методика должна проявить себя с максимальной эффективностью, если использовать ее совместно с более изощренными методами фильтрации.
Калифорнийские ученые оттолкнулись от того факта, что большинство электронных писем пересылаются в рамках небольших социальных сетей, которые объединяются в кластеры, где каждый знает каждого посредством, максимум, одного человека. Выражаясь языком научных абстракций, если Алиса знает Боба и Виктора, то письмо от Боба к Виктору никак не может быть спамом. Этот известный феномен социальных сетей впервые реализован в системах фильтрации спама. Его реализация чрезвычайно проста, потому что спамерские сообщения никогда и никоим образом не вписываются в структуру социальных сетей, если только не подделывается обратный адрес, но это уже другая проблема, которую можно решить известными способами авторизации на почтовых серверах.
Автоматизированная система, разработанная американскими учеными, устанавливается на почтовом сервере и сканирует поля "from", "to" и "cc" во всех почтовых сообщениях, составляя карту социальных сетей по известным нейросетевым алгоритмам. Таким образом, автоматически составляется черный список спамеров и "белый" список добропорядочных пользователей.
После кластеризации почтового трафика автоматическая система способна уничтожить примерно 54% спама при такой настройке, когда обеспечивается абсолютная точность фильтрации. При подобной настройке система точно идентифицирует в качестве "спама" или "нормального письма" примерно половину всего почтового трафика, в то время как вторая половина остается неидентифицированной - именно эту, оставшуюся, половину нужно фильтровать более сложными фильтрами с применением лингвистического анализа, самообучающихся шаблонов и т.д. Новаторская техника фильтрации по социальным сетям выгодно отличается простотой и быстродействием (сканируются только заголовки писем), а также абсолютной надежностью. Благодаря этим преимуществам ее можно использовать для предварительной фильтрации трафика во всех существующих антиспам-фильтрах.
Анатолий АЛИЗАР