Момент истины

Управление данными

Становится уже вполне очевидным, что пути и методы дальнейшего развития компьютерных технологий, основанные на все возрастающем усложнении системного ПО и непрерывного увеличения разнообразия его компонентов, практически полностью себя исчерпали. Взять, к примеру, хотя бы тот факт, что не успели еще отзвучать фанфары, оповещающие появление самой выдающейся операционной системы всех времен и народов Microsoft Windows XP, как почти сразу же вслед за этим появляется Service Pack 1 с обновлениями к этой самой системе. Видимо, по мнению разработчиков, потребитель должен быть несказанно обрадован, увидев перечень из полсотни продуктов, которые, оказывается, без этой примочки в Windows XP не работают! К подобным штучкам все уже настолько привыкли, что воспринимают их как вполне нормальное явление. Но все же, в основном, не эти фиговые листки бросают тень на могущественные корпорации, а, прежде всего, их полное бессилие и неспособность защитить не то чтобы пользователя, но и самих себя от компьютерного террора1.

Разумеется, такая ситуация не может длиться бесконечно долго, и об этом свидетельствуют хотя бы изрядно опустевшие от малоэффективных и разорительных нововведений кошельки не только потребителей, но и самих производителей.2 Ясно, что таким путем из порочного круга не выбраться, однако последовательное продвижение вперед оказывается вполне возможным, но поначалу не в сфере производства компьютерных технологий, а в науке, позволяющей не только существенно прояснить возникшую ситуацию, но и назвать определяющие ее причины, связанные с дефицитом ресурсов управления на уровне данных ("КВ" №46).

С другой стороны, как только проясняется, что это за ресурсы, то это оказывается вновь напрямую связанным с проблемой определения общего понятия "информация". Чтобы убедиться в этом, достаточно выделить из аморфной массы терминов повседневной практики компьютерщиков все то, что касается вопросов управления данными. Тогда в результате обобщений появляется на удивление простая и вполне понятная система, компоненты которой всегда имеют место в информационных объектах с достаточно большими объемами:

Управление данными

  1. Функции
    1. Доступность
    2. Целостность
    3. Актуальность
  2. Ссылки
    1. Прямая
    2. Словарная
    3. Тематическая

Глядя на эту систему, совсем не трудно себе представить, каким образом обеспечивается взаимосвязь между основными элементами любой информации - данными. Очевидно, что доступность данных регулируется через специально создаваемые препятствия и ограничения для различных категорий пользователей в части управления и потребления информационных ресурсов. Такое "неравноправие" в системах с разделением труда не только вполне естественно, но и совершенно необходимо для их надежной работы. В то же время поддерживать целостность данных (зависимость одних данных от других - "КВ" №23) с такими искусственными препонами вряд ли возможно, если требуемое разделение труда не регулируется соответствующими параметрами настройки системы. Что же касается актуальности данных, то это особая тема для исследований ("КВ"№48/2000), до сих пор остающаяся белым пятном в традиционных КТ, несмотря на очевидную ее значимость.

Другая разновидность средств управления данными - это ссылки, которые осуществляются тремя способами. На первый взгляд, самая простая - это прямая ссылка, реализуемая через адрес. Однако в динамически изменяемых источниках информации структуры и способы адресации являются сложнейшими задачами, доставляющими немало головной боли разработчикам КТ. Словарная ссылка - это тоже адреса, но не сохраняемые постоянно, а получаемые в результате поиска по ключевым словам или их комбинациям.

Вследствие простоты технической реализации и удобства пользователей прямая и словарная ссылки получили широкое распространение в традиционных КТ, однако при очень больших объемах информации это все же недостаточно эффективный способ взаимосвязи данных, т.к. списки адресов становятся слишком длинными даже для простого обозрения. Этот недостаток вполне устраним с помощью тематической ссылки, которая может быть реализована в виде списков конкретных тем, освещаемых в данном источнике информации, с адресами и приоритетами. Но пока еще такие ссылки - слишком большая редкость, чтобы стать de facto в действительности.

И дело тут даже не в том, что подготовка такого рода ссылок требует больших затрат ресурсов, хотя это существенное препятствие (например, даже в электронных изданиях Библии их пока нет). Куда более трудной является проблема поддержки систем управления в источниках, содержащих тематические ссылки. Например, в таком гиганте, как MSDN ("КВ" №№43, 44), на поддержку только тематических ссылок потребовалось бы больше ресурсов, чем до сих пор затрачивалось на всю систему.

Однако трудности эти обусловлены не сложностью реализации тематических ссылок, а недостаточной структурированностью источников информации в рамках существующих форматов данных. Если все источники информации привести к единой структуре ("КВ" №№6, 8), т.е. уменьшить ничем неоправданную избыточность форматов данных, то вся проблема сведется лишь к последовательному составлению полного списка тем в данном источнике и указанию позиций источника, относящихся к данной теме. Поддержка всех компонентов системы управления данными, в т.ч. и тематических ссылок, могла бы стать составной частью таких источников. В этом случае неконтролируемый процесс разбухания объема источника теряет свою основу, т.к. избыточные данные могут выявляться уже на стадии их ввода.

Таким образом, грядущий прогресс в развитии КТ упирается в существующие структуры источников информации, возникшие как результат становления и накопления опыта в этой отрасли производства. По мере того, как кризисные явления будут становиться все более влиятельным аргументом при наставлении ее на путь истинный, волей неволей придется перестраиваться, и это уже вопрос не далекого будущего, а ближайшей перспективы.

И все же остается еще один вопрос, ставящий под сомнение обоснованность таких выводов: каким образом компоненты представленной системы могут быть выведены из самого понятия "информация"? Ведь они явно должны иметь отношение к исходному определению ("КВ" №№43, 44/2000). Очередной момент истины возникает как неожиданный и крутой поворот. Однако, поскольку компоненты системы отражают свойства источников информации как формы ее существования, то ответ может показаться настолько же невероятным, насколько и обескураживающе простым: все эти компоненты, как разновидности ресурсов управления, не могут быть одновременно и свойствами какой-либо информации вообще!

Юрий КРАСКОВ,
[email protected]

Все права на публикацию принадлежат автору


1 В.Демидов. "Вирусы..." - "КВ" №
39, "Анатомия DDoS" -"КВ" №44

2 "Нововведения Microsoft..." - "КВ" №39

Версия для печатиВерсия для печати

Номер: 

49 за 2001 год

Рубрика: 

Новые технологии
Заметили ошибку? Выделите ее мышкой и нажмите Ctrl+Enter!