Что такое формат данных?
Мы вас тоже не
слышим... Первая фраза, переданная по телефону |
Прежде всего нужно, конечно, поздравить корпорацию Corel с юбилейным, десятым по счету, изменением формата данных для своего детища CorelDraw. Но вместе с этими поздравлениями тихонько добавим: прости их, Господи, ибо не ведают они, что творят. А не ведают они об этом лишь потому, что не своим делом занимаются, изобретая все новые форматы данных, вместо того, чтобы поставить задачу перед наукой о создании единого формата для всех компьютерных источников информации. Наивная вера в то, что пользователи будут оплачивать все фантазии разработчиков Corel, не может иметь реальной почвы, и мощная волна потрясений, прокатившаяся по корпорации, - лучшее тому подтверждение ("КВ" №37, 2000 г.).
Стихийный процесс, в котором многочисленные форматы данных ведут борьбу за место под солнцем, совершенно абсурден для интеллектуальных разработок, т.к. приводит не только к взаимному уничтожению плодов творческих усилий, но и быстрорастущему кладбищу устаревшего инструментария для обработки данных. Куда более естественным было бы сложение этих усилий (как раз в соответствии с законами развития общества), но для этого нужно, чтобы они были однонаправлены, т.е. нацелены на развитие единого и общедоступного формата данных.
Очевидной загвоздкой на этом пути являются "зачинщики смуты" - данные, обладающие огромной силой, способной безжалостно перемалывать ценные ресурсы общества вследствие непонимания ее происхождения. Последствия от разработки форматов данных методом научного тыка вполне предсказуемы и сопоставимы, например, с теми, которые инициировал известный детский персонаж Незнайка, превращая человека в осла и наоборот.
Очевидная тенденция в развитии КТ - запутывать все как можно больше и круче, чтобы только компьютер мог в этом разобраться - для обычного рассудка вряд ли постижима. За примерами далеко ходить не надо, вот пожалуйста:
"ДАННЫЕ (data) - информация, представленная в виде, пригодном для обработки"1
Ну как? Понятно, что такое данные? Похоже, не очень. Да и в термине "обработка информации" не так все просто ("КВ" №11). А ведь суть может стать совершенно очевидной, если обратить внимание на то, что данные сами по себе (т.е. изолированно друг от друга) вообще не могут существовать, поэтому и необходимо вначале создать место для их размещения, которое называется источник информации. Но в действительности это место пока может называться как угодно, например, так:
"БАЗА ДАННЫХ (database) - совокупность данных, расположенных в файле, используемом программами, которые могут копировать или изменять данные, но при этом пользователи не изменяют метод, при помощи которого эти данные записаны"
Если кто-то подумает, что это не умный человек формулировал (не указано главное в БД - единообразная структура файлов), то зря. Вот так незатейливо, но надежно скрывается факт полного фиаско попыток создать универсальную среду для хранения и обработки данных. Однако упоминание о файле здесь вполне уместно, т.к. английское слово file - это обыкновенная папка-скоросшиватель, порядок в которой всецело зависит от ее хозяина. Образные сравнения всегда облегчают понимание, особенно если речь идет о форматах данных, символизирующих последний крик моды. Вот, пожалуйста еще пример:
"ГИПЕРТЕКСТ (hypertext) - документ или ряд документов, которые могут быть прочитаны мышью с использованием "спрятанных клавиш"
Правда ведь, сразу стало понятно, что такое гипертекст? Не уступает ему в "наглядности" и название другого популярного формата данных spreadsheet - электронные таблицы, ассоциированные с… постелью (spread - расстеленная, sheet - простыня). В этом смысле поистине трогательной заботой о пользователе были проникнуты разработчики OS Windows, когда назвали экран компьютера "рабочим столом", а для каждой "иконки" (богобоязливые, однако) автоматически добавили надпись "Ярлык для…". Вот так и угождают привычкам клиентов наклеивать ярлыки на все, что ни попадя.
Когда нужно (например, в рекламных целях) хорошенько заморочить клиенту голову, то важен как раз образ, а не суть. Именно так и появились "цифровые" технологии (от английского слова digital), но изюминка здесь в том, что digit означает также палец (десять пальцев - десять цифр). Следовательно, если вы увидите нечто, где бегают циферки, и пальчиками нужно нажимать на кнопки, то это и есть цифровые технологии! Вот как все просто, доступно и, главное, понятно! А для тех, кому нужны трудности, можно добавить, что цифра по-английски может быть также figure, а десятичные цифры к форматам данных если и имеют, то лишь весьма отдаленное отношение.
Вот так, фигурально говоря, приходится выносить сор из избы с красивым фасадом. Однако делать это когда-то все равно придется, т.к. иного пути к новым знаниям просто нет. Без новых знаний огульная критика непродуктивна, но когда они появляются, то рано или поздно проложат себе дорогу. Если исходить из задачи создания источников информации универсального типа, то все разнообразие существующих форматов данных может уместиться в структуре единообразной иерархической позиции такого источника, поскольку в нем ничего другого просто нет ("КВ" №6). Весь позитивный опыт разработчиков КТ может найти там свое применение, но при этом их усилия будут складываться в рамках развития единого формата, а не распыляться, как сейчас, в необъятном множестве форматов.
Бытующее мнение о том, что знания о сути феномена информации не увеличат производительность компьютеров, конечно, верно, но лишь формально и в прямом (таком твердолобом) смысле. В то время как фактическая польза от той же самой производительности с учетом новых знаний может возрасти настолько, что многократно перекроет весь выигрыш от предыдущего роста производительности процессоров. Обращаясь к урокам истории, можно представить себе, сколько подобных мнений выслушивали в свое время апостолы Кирилл и Мефодий и каково было им в те времена закладывать основы сегодняшней информатики. Тем не менее, их потомки навсегда останутся им благодарны за то, что они свое дело все же сделали и многократно расширили тем самым доступ людей к знаниям.
Юрий КРАСКОВ,
c_city2000@mail.ru
Все права на публикацию принадлежат автору
Postscriptum к 1 апреля:
- Почему ты дал мне неправильный пароль?
- Как? Разве ты не помнишь, сколько дней в году?
- Да, я так и набирал - 368.
- ???
- Нет, это вначале, а затем я набирал правильно - 369.
1 Здесь и далее - Айен
Синклер "Большой толковый
словарь компьютерных терминов
COLLINS" М. "ВЕЧЕ·АСТ", 1999.