В рубрике FAQ, давно уже ставшей традиционной, мы говорили о множестве различных терминов, связанных как с Интернетом, так и с защитой информации. Тем не менее, нерассмотренных терминов осталось ещё очень даже немало, а потому мы познакомимся сегодня с одним из них - очень распространённым, но при этом не всегда верно понимаемым широкой аудиторией.
Итак, что же принято в наши дни называть контентной фильтрацией? Контентная фильтрация - фильтрация данных, передаваемых по каким-либо каналам, по их содержанию (от англ. content - содержание, сущность). Главным критерием, по которому системой принимается решение о блокировании той или иной информации, является как раз содержимое этой информации. При этом для определения содержимого могут использоваться как формальные признаки (формат данных, которые нужно блокировать, или расширения файлов), так и достаточно сложные алгоритмы семантического анализа текста или распознавания изображений. В качестве примеров контентной фильтрации можно привести спам-фильтры, используемые сегодня повсеместно на почтовых серверах и пользовательских рабочих станциях, или противопорнографические фильтры, устанавливаемые на школьные компьютеры во многих странах. В настоящее время контентная фильтрация также активно применяется в корпоративных системах безопасности - например, в получающих всё большее распространение системах защиты от утечек данных.
Стоит отметить, что сегодня под контентной фильтрацией понимают совокупность различных методов, предназначенных для блокировки данных по признаку содержащейся в них информации, а не какую-то одну технологию. Хотя многие производители программного обеспечения, включающего в себя средства контентной фильтрации, взращивают в пользователях уверенность, что контентная фильтрация ограничивается только фильтрацией по формальным признакам. В действительности же контентная фильтрация использует большое количество различных техник, включая уже упомянутые семантический поиск, распознавание изображений, эвристический анализ, анализ информации с использованием регулярных выражений, вероятностные методы; фильтрацию, основанную на источнике данных... При этом большинство систем контентной фильтрации не ограничивается применением какого-то одного метода, а использует их комбинации.
Вадим СТАНКЕВИЧ,
[email protected]
Горячие темы