Хватит шифроваться!

Этот обзор я решил сделать тематическим, то есть он будет посвящен конкретной проблеме - перекодировке текста. Не важно, откуда он будет взят, факт остается фактом - мы имеем нечитаемый текст и хотим в нем увидеть знакомые слова. У меня скопилось несколько новых похожих программ, из-за которых, собственно, и родилась такая идея. А попутно я буду еще напоминать про уже рассказанные в прошлых обзорах программы, которые заслужили уважение и надолго запомнились своими возможностями.


Доктор твоего мыла

Трудная жизнь у писем. Трудная и непредсказуемая. Ведь на пути от отправителя до адресата русские буквы сообщения могут быть преобразованы в нечто непонятное. А посему его содержимое искажается до такой степени, что невозможно прочитать. Это происходит, в основном, из-за того, что существует несколько различных кодировок для представления символов кириллицы.

Программ для возврата послания к исходному читаемому виду, то есть для перекодировки и распознавания искаженных писем, сегодня существует довольно много. Вот одна из них - MailDoctor - сразу понравилась мне тем, что автоматически встраивается в почтовые программы (Outlook Express и TheBat). А далее, при открытии любого письма, "Доктор" перебирает всевозможные кодировки (KOI8-R, WIN, ISO, DOS) до тех пор, пока процент русских слов в сообщении не станет достаточно большим. Результат работы программы отображается в небольшом окне, где в дальнейшем вручную можно представить текст в различных кодировках. Так, например, пожелав отправить весточку за границу в транслите, необходимо лишь выбрать представление "Латиница" в пункте меню "Действия". Как видите, достаточно приложить минимум усилий, чтобы письмо стало вновь читаемым не только у вас на компьютере, но и "там".

Как я уже сказал, это далеко не первая и, хочется надеяться, не последняя программа для перекодировки. Еще одно новое творение - RusCoder&Repair. Данная программа позволяет исправить неправильно перекодированные сообщения, которые максимум 7 раз подвергались насилию и дискриминации со стороны почтовых серверов. RusCoder&Repair работает как с буфером обмена, так и с файлами. При этом происходит автоматический запуск анализа кодировки исходного текста, который проходит, следует заметить, достаточно быстро. Разбирается программа в таких "колбасных обрезках", как WIN, KOI8, ISO5, ALT (DOS), MAC, а также с транслитерацией.

Еще один маленький плюсик - RusCoder&Repair не требует инсталляции.

Ветеран данного жанра - программа "Штирлиц". Про нее много поговорили в свое время (www.kv.by/index2001051102.htm), а сейчас лишь скажу, что это одна из самых "продвинутых" и любимых программ для перекодировки. Если кратко, то это просто и скромно: "умная мощность".


Быстро по клавишам стуча...

Следующая программа обзора поможет многострадальным обладателям клавиатуры с русской и английской раскладкой. Впрочем, у каждого из нас на компьютере установлено не менее двух раскладок: если при наборе текста вполне можно обойтись кириллицей, то при серфинге в интернете без латиницы ничего не сделаешь.

Так вот, здесь сразу возникает знакомое всем и вся неудобство: иногда просто забываешь переключиться с одного языка на другой, или кажется, что переключил, а печатаешь, не глядя на экран (вместо слова, скажем, "Привет", что-то типа "Ghbdtn"). Особенно часто это бывает в чатах или при быстром наборе текста. Посему представляю программу "Кодер", помогающую сделать из беспорядочной последовательности английских символов полноценные русские слова. Чтобы ею воспользоваться, необходимо вставить в окно программы "неправильный" скопированный текст и запустить программу.

Ну а если "Кодер" по каким-то причинам не понравится вам, то вспомните про программу "Очепятка" (www.kv.by/index2000461104.htm). Она также борется с опечатками, а чтобы увидеть результаты ее работы, достаточно выделить неправильный текст и нажать единственную кнопку Scroll Lock.

И еще одна программа, относящаяся к данному классу - FF12 (www.kv.by/index2001251103.htm). Она может исправлять раскладку как последнего слова, так и всего набранного текста. Кроме этого, ликвидируются последствия ошибочного нажатия CapsLock. Хотя Word не попал в число программ, с которыми работает программа, зато она замечательно сотрудничает с адресными строками браузеров и MS Outlook, а также с ICQ.


Устранение 404 ошибки

Похожая неприятная ситуация с "шифровкой" может возникнуть при вводе url в адресную строку браузера. Вместо того, что хочется увидеть, получается как всегда - лишь набор русских букв. Мне нравится программа "Перекодировщик URL", про которую уже писалось ранее (см. www.kv.by/index2000501103.htm). Напомню, что она успешно справляется с задачей преобразования адреса к понятному виду как для пользователя, так и для самого браузера. Например, "цццюлмюин" после недолгих раздумий станет самой обыкновенной ссылкой на "Компьютерные Вести": www.kv.by.

Павел БАДЯЛИК,
[email protected],
softarticle.cjb.net


Программы, попавшие в обзор, находятся вот где:

MailDoctor [75 Kb], free, www.nevru.com/soft/maildoc3.zip

RusCoder&Repair [420 Kb], free, www.pnp.ru/rus/programs/RusCoder.zip

"Кодер" [228 Kb], free, esoft.bos.ru/decoder.zip

"Опечатка" [70 Kb], free, www.ipom.ru/golomin/soft/Snoop2.rar

FF12 [218 Kb], free, ff-12.chat.ru/ff12.zip

"Перекодировщик URL" [57 Kb], free, www.ahsoftgroup.com/exe/urlhook.exe


Способы представления кириллицы

KOI8-R ("Код для Обмена Информацией") - наследница КОИ-7 и КОИ-8, полученная во времена начального развития русской электронной почты путем "слияния" КОИ-8 с псевдографикой DOS и принятая как стандарт русской кодировки для UNIX-систем. Зарегистрирована в IANA как KOI8-R.

Русская кодировка для MS DOS (она же CP866, то есть CodePage и "альтернативная кодировка ВЦ Академии Наук СССР"). Эта таблица также предназначена только для русского, английского языков и охватывает лишь русские кириллические знаки. Расположение прописных букв русского алфавита организовано по принципу основной кодовой таблицы ASCII (за единственным исключением буквы "Ё"), тогда как последовательность строчных букв прерывается символами псевдографики. Существует несколько модификаций этой кодировки, отличающихся друг от друга символами в последних 14 позициях.

Международный стандарт ISO 8859-5 - наследница предыдущей кодировки, получившая статус стандарта ISO. Данный стандарт позволяет кодировать не только русский и английский языки, но и белорусский, болгарский, македонский, сербский и украинский. При этом порядок расположения букв русского алфавита организован в соответствии с принципом построения основной таблицы ASCII, когда все подряд идущие прописные буквы (как всегда, за исключением буквы "ё") кодируются последовательными номерами, а коды строчных букв отличаются от кодов прописных букв на 32. Зарегистрирована в IANA как ISO-8859-5.

Windows (или CP1251). Помимо русских букв, содержит буквы большинства современных славянских языков и ряд стандартных для Windows символов. Построена в соответствии с принципами, применяемыми в международном стандарте ISO-8859-5, но от него отличается перемещением русских букв со столбцов B0-E0 в столбцы C0-F0 и несколько ином размещении остальных символов.

Кириллица Macintosh (или CP10007). Эта таблица близка по своим принципам построения к таблицам СР-ISO-8859-5 и CP-1251. Хотя она не зарегистрирована в IANA, но часто обозначается как x-mac-cyrillic.

Unicode - универсальная двухбайтовая (в отличие от вышеописанных) кодировка. Содержит не только сам символ, но и инструкцию, как его надо воспроизводить, то есть каждый символ - два байта. Включает многие и стремится охватить все распространенные алфавиты мира. Unicode использует 16-битный код вместо 7-битного кода ASCII, что обеспечивает коды для более чем 65 тысяч знаков.

Транслитерация (латиница) - 7-битная русская кодировка. Позволяет передавать русские буквы похожими по звучанию английскими.

Павел БАДЯЛИК

Версия для печатиВерсия для печати

Номер: 

36 за 2001 год

Рубрика: 

Software
Заметили ошибку? Выделите ее мышкой и нажмите Ctrl+Enter!