Числовое сжатие информации
Обычные способы сжатия (архивации, упаковки) информации основаны на изначальной избыточности кода, в котором она представляется, причем эта избыточность (в разумных пределах) не только неизбежна, но и совершенно необходима для того, чтобы информация была наиболее доступна и удобна для потребления (чтения, изменения, преобразования). С другой стороны, фактическая избыточность кода, как правило, позволяет уменьшить объем информации лишь в несколько раз, а не, скажем, в десятки или сотни. Отсюда возникает вопрос, возможна ли (хотя бы теоретически) большая степень сжатия информации, чем это позволяет избыточность кода?
Если исходить из того, что информация - это интуитивное понятие, не имеющее строгого научного определения, из которого выводятся все известные ее свойства, то очевидно, что нет никаких оснований даже для постановки этого вопроса, т.к. остается неизвестным сам предмет исследования. Однако, если допустить, что информация - это особый тип разнообразия ("КВ" №№43-44, 2000 г.), то появляются не только возможность такой вопрос поставить, но и основания предполагать утвердительный (!!!) ответ. При этом можно в очередной раз убедиться, сколь значительно вопрос о сущности информации затрагивает сами основы науки.
Если на пути к определению понятия "информация" пришлось пройти через базисные определения фактически не существующей еще науки о системах ("КВ" №№25-31, 2000г.) и нерешенный пока центральный вопрос экономической науки об источнике богатства ("КВ" №33-38, 2000 г.), то теперь, когда сущность информации все более проясняется, центр тяжести начинает перемещаться в область основного вопроса... математики!
Видимо, только очень наивные люди могут полагать, что такая развитая наука, как математика, давно уже знает, что такое число. Если бы кому-то и пришло в голову поискать ответ на этот "детский" вопрос, то даже в самых толстенных математических справочниках ничего, кроме банального "основное понятие математики", или необъятного моря конкретики, например, из 19971-й (!!!) статьи в энциклопедии Britannica, или обыденного толкования, вряд ли удастся найти. Вот пример одной из таких попыток:
Number, word or symbol used to designate quantities or entities that behave like quantities.1
Число, слово или символ, применяемый для обозначения количества или сущностей как количества.
Если бы сущность числа сводилась только к количеству, то и речи быть не могло о возможностях сжатия информации. Но поскольку число проявляет себя в то же время и как способ отражения любого разнообразия, и, следовательно, как форма представления информации, то это дает самый простой ключ к пониманию феномена сжатия ("КВ" №15)2.
Существование этой обратной стороны числа обнаруживается сразу, если обратить особое внимание на форму его существования, а именно: любое отдельно взятое число в случае невозможности существования других чисел превращается в бессмыслицу. Но, с другой стороны, это свойство присуще не только числу, но и вообще любым абстракциям, и, возможно, как раз это обстоятельство придает особую значимость точному определению понятия "информация" для всей науки в целом, которой потребовались тысячелетия, чтобы, наконец, обнаружить эту простую и очевидную истину.
В этом смысле явной поддержки заслуживает все более отчетливое понимание этого научного аспекта представителями математической науки, которые не без оснований полагают, что сложное по сути понятие "число" должно представляться как элемент множества, т.е. выводиться из более простого понятия3. В этом направлении предстоит еще очень много чего сделать, однако даже первый шаг - это уже полдела.
На такой основе вопрос сжатия информации за пределы избыточности кода переходит в плоскость выявления возможностей более компактного представления очень больших чисел. Однако прежде всего нужно выяснить, почему такая возможность вообще существует. Ведь здесь в качестве незыблемой теоретической основы должно действовать положение, не допускающее абсолютно никакой возможности получать из данной информации большее содержание, чем в ней фактически имеется.
Но так вопрос и не стоит. Целью является не преобразование самой информации, а замена ее другой, более компактной, позволяющей полностью восстановить данную информацию в ее конечном виде. На первый взгляд, это выглядит как утопия, однако в пользу такой возможности можно назвать следующие факторы:
- Не любое число может отражать в себе реальную информацию (как символьную, так и аналоговую), следовательно, диапазон возможных решений не может представляться непрерывными функциями.
- Можно считать, что код исходной информации не является избыточным (этот вопрос уже практически решен).
- Ресурсы для приведения фактических чисел в более компактную форму могут быть меньше получаемого от этого конечного выигрыша в ресурсах.
Возможно, в какой-то мере этот подход иллюстрирует следующий пример:
906335128301201858212694431153506 = 1528+2124
Очевидно, что более компактная правая часть уравнения - уже не есть само исходное число, а только способ его получения. Разумеется, что данный пример еще не проясняет фактической реализации такого рода технологий. Но когда Клод Шеннон разрабатывал теорию сжатия информации, он тоже еще ничего не знал о возможностях сегодняшних компьютерных архиваторов.
С другой стороны, появляются сомнения в эффективности такого рода преобразований, поскольку числа в степени избыточны в самой своей сути. Однако не так-то все просто в этом мире - стоит только добавить к этому "избыточному" числу, скажем, единичку (или другое совсем небольшое число), и оно может измениться настолько, что станет и вовсе простым, т.е. не имеющим целых нетривиальных делителей.
Вот уж и впрямь, час от часу не легче! Раскрытие сущности информации и возможностей для разработки эффективных методов ее представления и обработки раз за разом и непременно выходит на самые сокровенные тайны науки и в данном случае даже на "философский камень" науки наук - математики! Ведь речь теперь уже идет о (многовековых!) поисках формулы вычисления простых чисел, т.е. об одной из самых "нерешаемых" задач в науке. Предлагаемые пока наукой алгоритмы определения простоты числа пока еще не отличаются особой эффективностью4. Тем не менее, можно уже заметить и более существенный прогресс - поистине волшебные свойства чисел, позволяющие, в принципе, радикально уменьшить объемы ресурсов для хранения и передачи информации, находятся главным образом не в будущих технологических разработках, а всего лишь в особой разновидности самой информации!
Юрий КРАСКОВ,
c_city2000@mail.ru
Все права на публикацию принадлежат автору
1 Microsoft® Encarta® Encyclopedia 2001. © 1993-2000 Microsoft Corporation. All rights reserved.
2 Аветисян Р.Д., Аветисян Д.О. Теоретические основы информатики.
3 Реверанс в сторону преподавателей математики БГУ
4 А.Китаев, А.Шень, М.Вялый. Классические и квантовые вычисления - М.: МЦНМО: ЧеРО, 1999
Комментарии
Банальное деление числа N (выбираемого из последовательности 6*k+-1)на все простые числа до корня из N известно давно и не интересно.