Все, что нужно для работы с PDF

Часть 2

Продолжим рассматривать тему работы с PDF-файлами. В прошлый раз мы узнали, что же представляет собой данный формат, как преобразовывать в него файлы и, наоборот, конвертировать PDF в обычный HTML.


PDF в HTML: слово за Adobe

Сама Adobe также не смогла остаться в стороне и предложила свое средство для преобразования PDF-документов в текстовый формат. Реализовано оно в виде бесплатного плагина для известной программы Acrobat Reader. После установки Acrobat Access в меню "File" Reader'а добавляются два новых пункта ("Export Document to HTML" и "Export Document to TXT"), позволяющие конвертировать текст из формата PDF в формат HTML или TXT. Таким образом, Acrobat Reader перестает быть просто "читалкой" и позволяет не только просматривать содержимое документов.

Но это все теория. А на практике дела обстоят несколько иначе. Преобразовать в текст мне удалось, к сожалению, не все имеющиеся на компьютере PDF-файлы - в некоторых случаях (даже трудно сказать, в каких именно) два заветных пункта оставались недоступными... Но даже и с теми файлами, которые удалось обработать, тоже не все гладко - текст в них теряет начальное форматирование (отступы, шрифты, начертания и др.), а рисунки и вовсе пропадают. Впрочем, чему удивляться? Все это - стандартный результат работы подобных утилит. Спасибо на том, что хоть удалось текст "выцарапать"... Кстати, плагин Acrobat Access позволяет выделить текст по-другому - достаточно нажать комбинацию Ctrl+4, чтобы просмотреть "исходник" текущего PDF-документа (при этом, помимо основного текста, видны теги, обозначающие ссылки и изображения - точно так же, как и при просмотре кода web-странички).


Зашифровка PDF

Предположим, вы решили распространять через интернет какой-либо документ в PDF-формате (книгу, например), но не хотите, чтобы просматривающий пользователь смог его распечатать. Такое PDF запросто позволяет сделать. Как уже выяснилось, рассмотренная ранее утилита FinePrint pdfFactory Pro умеет устанавливать на создаваемый файл пароль, не зная который, нельзя открыть защищенный документ, распечатать его или скопировать со страницы текст и графику. А вот как поступить, если уже имеется готовый PDF-файл, и его лишь требуется снабдить защитой?

Тогда можно воспользоваться утилитой EncryptPDF. Она позволяет сменить пароли (или вообще их убрать), указать степень шифрования (40 или 128 бит), добавить (или убрать) запрет на печать документа или копирования его отдельных элементов.

Интересно вот что: в программе используется не один, как обычно, а два пароля: owner и user. Они нужны для того, чтобы отличить автора документа от пользователя, и, соответственно, в первом случае беспрепятственно предоставить доступ ко всем возможностям (печати, копированию и т.д.), а во втором - только к разрешенным автором документа.

Дополнительно с помощью EncryptPDF можно указать, кто является автором файла, ввести название документа, выбрать ключевые слова. Программа имеет поистине приятный интерфейс, возможность пакетной обработки файлов, отличается высокой скоростью обработки, поддержкой Windows 98-XP.


Восстановление паролей

Вполне может случиться и так, что пароль, который должен храниться как зеница ока, вы потеряли и не можете получить полноценный доступ к своему же PDF-файлу. Упросить или уговорить не получится - упрямому Reader'у нужен пароль.

Приходится обращаться к специальному софту, который сможет восстановить потерю. Компания Elcomsoft уже давно занимается подобными вопросами и известна своими решениями для восстановления паролей к программам, входящим в MS Office, архивам и прочим приложениям. Есть среди их разработок и программы для "борьбы" с PDF.

Первая из них - Advanced PDF Password Recovery (или сокращенно - APDFP) - позволяет убрать любую защиту с документа. Правда, чтобы APDFP запустилась, необходимо знать один из паролей - owner или user. Программа работает очень быстро, так как в ней не используется перебор всевозможных паролей. В результате получается "чистенький" PDF, не имеющий никаких ограничений. При необходимости его можно вновь снабдить защитой (хотя бы с помощью рассмотренной выше EncryptPDF) и паролем.

Второе решение от Elcomsoft - это профессиональная редакция первой программы. Называется оно Advanced PDF Password Recovery Pro (или сокращенно - APDFPRP). Программа, в отличие от своей младшей версии, не требует никаких паролей и сама пытается восстановить их. При этом используются стандартные средства: взлом методом "грубой силы" (перебор всех паролей), атака по словарю, по маске или поиск ключей. Интерфейс APDFPRP не сложен, абсолютно идентичен другим производимым компанией продуктам. Так что разобраться с настройками проблем не составит, тем более, что среди поддерживаемых языков присутствует великий и могучий.

Павел БАДЯЛИК,
fpmi@tut.by


Программы, упомянутые в обзоре, можно скачать вот откуда:

Acrobat Access [1.19 Mb], shareware, download.adobe.com/pub/adobe/acrobatreader/ win/4.x/plugins/accs405.exe

EncryptPDF [759 Kb], shareware, www.toppdf.com/encryptpdf/encryptpdf.exe

APDFP [837 Kb], shareware, download.elcomsoft.com/apdfpr.zip

APDFPRP [720 Kb], shareware, www.elcomsoft.com/APDFPR/apdfprp.zip

Версия для печатиВерсия для печати

Номер: 

34 за 2003 год

Рубрика: 

Software
Заметили ошибку? Выделите ее мышкой и нажмите Ctrl+Enter!