Управление данными
Становится уже вполне очевидным, что пути и методы дальнейшего развития компьютерных технологий, основанные на все возрастающем усложнении системного ПО и непрерывного увеличения разнообразия его компонентов, практически полностью себя исчерпали. Взять, к примеру, хотя бы тот факт, что не успели еще отзвучать фанфары, оповещающие появление самой выдающейся операционной системы всех времен и народов Microsoft Windows XP, как почти сразу же вслед за этим появляется Service Pack 1 с обновлениями к этой самой системе. Видимо, по мнению разработчиков, потребитель должен быть несказанно обрадован, увидев перечень из полсотни продуктов, которые, оказывается, без этой примочки в Windows XP не работают! К подобным штучкам все уже настолько привыкли, что воспринимают их как вполне нормальное явление. Но все же, в основном, не эти фиговые листки бросают тень на могущественные корпорации, а, прежде всего, их полное бессилие и неспособность защитить не то чтобы пользователя, но и самих себя от компьютерного террора1.
Разумеется, такая ситуация не может длиться бесконечно долго, и об этом свидетельствуют хотя бы изрядно опустевшие от малоэффективных и разорительных нововведений кошельки не только потребителей, но и самих производителей.2 Ясно, что таким путем из порочного круга не выбраться, однако последовательное продвижение вперед оказывается вполне возможным, но поначалу не в сфере производства компьютерных технологий, а в науке, позволяющей не только существенно прояснить возникшую ситуацию, но и назвать определяющие ее причины, связанные с дефицитом ресурсов управления на уровне данных ("КВ" №46).
С другой стороны, как только проясняется, что это за ресурсы, то это оказывается вновь напрямую связанным с проблемой определения общего понятия "информация". Чтобы убедиться в этом, достаточно выделить из аморфной массы терминов повседневной практики компьютерщиков все то, что касается вопросов управления данными. Тогда в результате обобщений появляется на удивление простая и вполне понятная система, компоненты которой всегда имеют место в информационных объектах с достаточно большими объемами:
Управление данными
- Функции
- Доступность
- Целостность
- Актуальность
- Ссылки
- Прямая
- Словарная
- Тематическая
Глядя на эту систему, совсем не трудно себе представить, каким образом обеспечивается взаимосвязь между основными элементами любой информации - данными. Очевидно, что доступность данных регулируется через специально создаваемые препятствия и ограничения для различных категорий пользователей в части управления и потребления информационных ресурсов. Такое "неравноправие" в системах с разделением труда не только вполне естественно, но и совершенно необходимо для их надежной работы. В то же время поддерживать целостность данных (зависимость одних данных от других - "КВ" №23) с такими искусственными препонами вряд ли возможно, если требуемое разделение труда не регулируется соответствующими параметрами настройки системы. Что же касается актуальности данных, то это особая тема для исследований ("КВ"№48/2000), до сих пор остающаяся белым пятном в традиционных КТ, несмотря на очевидную ее значимость.
Другая разновидность средств управления данными - это ссылки, которые осуществляются тремя способами. На первый взгляд, самая простая - это прямая ссылка, реализуемая через адрес. Однако в динамически изменяемых источниках информации структуры и способы адресации являются сложнейшими задачами, доставляющими немало головной боли разработчикам КТ. Словарная ссылка - это тоже адреса, но не сохраняемые постоянно, а получаемые в результате поиска по ключевым словам или их комбинациям.
Вследствие простоты технической реализации и удобства пользователей прямая и словарная ссылки получили широкое распространение в традиционных КТ, однако при очень больших объемах информации это все же недостаточно эффективный способ взаимосвязи данных, т.к. списки адресов становятся слишком длинными даже для простого обозрения. Этот недостаток вполне устраним с помощью тематической ссылки, которая может быть реализована в виде списков конкретных тем, освещаемых в данном источнике информации, с адресами и приоритетами. Но пока еще такие ссылки - слишком большая редкость, чтобы стать de facto в действительности.
И дело тут даже не в том, что подготовка такого рода ссылок требует больших затрат ресурсов, хотя это существенное препятствие (например, даже в электронных изданиях Библии их пока нет). Куда более трудной является проблема поддержки систем управления в источниках, содержащих тематические ссылки. Например, в таком гиганте, как MSDN ("КВ" №№43, 44), на поддержку только тематических ссылок потребовалось бы больше ресурсов, чем до сих пор затрачивалось на всю систему.
Однако трудности эти обусловлены не сложностью реализации тематических ссылок, а недостаточной структурированностью источников информации в рамках существующих форматов данных. Если все источники информации привести к единой структуре ("КВ" №№6, 8), т.е. уменьшить ничем неоправданную избыточность форматов данных, то вся проблема сведется лишь к последовательному составлению полного списка тем в данном источнике и указанию позиций источника, относящихся к данной теме. Поддержка всех компонентов системы управления данными, в т.ч. и тематических ссылок, могла бы стать составной частью таких источников. В этом случае неконтролируемый процесс разбухания объема источника теряет свою основу, т.к. избыточные данные могут выявляться уже на стадии их ввода.
Таким образом, грядущий прогресс в развитии КТ упирается в существующие структуры источников информации, возникшие как результат становления и накопления опыта в этой отрасли производства. По мере того, как кризисные явления будут становиться все более влиятельным аргументом при наставлении ее на путь истинный, волей неволей придется перестраиваться, и это уже вопрос не далекого будущего, а ближайшей перспективы.
И все же остается еще один вопрос, ставящий под сомнение обоснованность таких выводов: каким образом компоненты представленной системы могут быть выведены из самого понятия "информация"? Ведь они явно должны иметь отношение к исходному определению ("КВ" №№43, 44/2000). Очередной момент истины возникает как неожиданный и крутой поворот. Однако, поскольку компоненты системы отражают свойства источников информации как формы ее существования, то ответ может показаться настолько же невероятным, насколько и обескураживающе простым: все эти компоненты, как разновидности ресурсов управления, не могут быть одновременно и свойствами какой-либо информации вообще!
Юрий КРАСКОВ,
[email protected]
Все права на публикацию принадлежат автору
1 В.Демидов. "Вирусы..." -
"КВ" №39, "Анатомия
DDoS" -"КВ" №44
2 "Нововведения Microsoft..." - "КВ" №39
Горячие темы