Усовершенствованные методики извлечения содержания из PDF
Как наверняка известно читателям, продукт под названием Adobe Acrobat имеет широкое применение в качестве инструмента для работы с PDF-файлами. Однако данная программа обладает также множеством полезных функций, которые могут оказаться актуальными и в повседневной офисной деятельности. Новая версия Adobe Acrobat Х ориентирована как раз таки на эффективное решение большого количества текущих офисных задач.
Рассмотрим одну из новых функций, усовершенствованную в последней версии Acrobat - экспорт содержимого в офисные приложения из PDF в целях их последующего редактирования. Полученные файлы при этом полностью дублируют исходные, которые применялись для создания PDF. Чем это может оказаться полезным конечному пользователю? В первую очередь, конечно, тем, что в большинстве случаев при конвертировании документов подобного формата получить исходные материалы попросту невозможно. И если бы не наличие данной функции, пришлось бы копировать текст по частям из PDF, работать с бумажным документом либо же его отсканированной версией. Безусловно, обновленная версия продукта позволяет значительно облегчить труд большого количества офисных работников: ведь каждый из них неминуемо сталкивается с необходимостью преобразования файлов, с которыми ему приходится работать. Таким образом, нововведение компании Adobe во многом на руку для тех, кто привык экономить собственное время в целях более продуктивной и целенаправленной профессиональной деятельности.
В целом же, Adobe Acrobat Х упрощает труд работников офиса сразу в двух направлениях.
Во-первых, новая версия представляет значительно улучшенную работу со сканируемыми документами. Прежде всего, был усовершенствован алгоритм автоматического распознавания текста, а также возможность контролировать распознанный текст и исправлять возможные ошибки. Это красноречиво свидетельствует о том, что общий "уровень грамотности" обрабатываемых документов заметно повысится. К слову, можно отметить и функцию, знакомую всем нам по ставшему уже классическим Word: Acrobat Х выделяет слова, насчет распознавания которых у него возникли сомнения, и позволяет вводить собственные варианты. Во многом это хорошо для тех, кому по долгу службы приходится работать со специализированной лексикой: как известно, профлексикон содержит большое количество слов, написание которых может быть поставлено под сомнение. И в этом случае, чтобы не утруждать себя последующим поиском ошибок, лучше всего сразу обратиться к усовершенствованной версии программного продукта Adobe. Возможность вмешательства в автоматическое распознавание текста в данной версии программы является одной из ключевых. И хотя наш век ознаменован бурным развитием современных технологий, наилучшая система распознавания представляет собой процесс, в котором участвуют человеческие руки и мозг. Если задуматься над этим как следует, становится совершенно очевидно, что оптимальной технологией является распознавание текста, контролируемое человеком. Однако это актуально только "на входе" - то есть, во время чтения текста. Ведь человеку свойственно уставать, и когда дело доходит до копирования видимой информации в компьютер, данный способ становится неточным и весьма медленным. К примеру, секретарь-делопроизводитель, которому по долгу службы приходится обрабатывать большие объемы информации, путем исключительно собственного "орфографического контроля" может допустить немало ошибок. И если в рамках одного документа это просто банальная описка, то на уровне компании, ошибка, вкравшаяся невзначай в серьезный документ, может послужить причиной срыва крупного контракта.
И здесь приходит на помощь новый Acrobat Х, который выполняет самостоятельно большую часть работы и оставляет пользователям только контроль и внесение правок.
Во-вторых, новая версия программного продукта представляет значительно улучшенный режим форматирования и редактирования текста. Теперь отсутствует необходимость создавать новые пустые документы, что вносить в них исправления отдельных графических либо же текстовых компонентов. Acrobat выполняет большинство работы за нас при экспорте как из отсканированных документов, так и рядовых PDF-файлов, созданных в различных приложениях. После тщательного анализа исходного PDF, он создаст идентично выглядящий документ для Word. К великой радости для тех, кто привык работать в стандартных текстовых редакторах, править документы в Acrobat Х теперь можно аналогичным образом. И это еще один немаловажный плюс современного программного продукта, значительно облегчающего работу с PDF.
В целом же, следует отметить, что усовершенствованный конвертер файлов, представленный компанией Adobe, являет собой замечательный образец современного продукта для работы с PDF-файлами, сочетающий в себе функции графического и текстового редактора. Воспользоваться им, несомненно, стоит - и это будет только на руку работникам, которым ежедневно приходится сталкиваться с потоком как входящей, так и исходящей информации.
Елена ХАРЛАМОВА
Комментарии
Вставлю свои пару слов, т.к. по опыту прошлого знаю, что этот автор не читатель, а писатель, и на связь с читателями не выходит.
----------------------------------------------------------------------
Adobe Acrobat X вышел в двух версиях: Adobe Acrobat X Standard и Adobe Acrobat X Professional. Стандартная версия обладает следующим функционалом:
Экспорт и редактирование файлов PDF
Пользователь может редактировать документы PDF и экспортировать их в формат Word и Excel.
Преобразование файлов PDF в формат Word с улучшенным сохранением форматирования и компоновки. При преобразовании сохраняется относительное расположение таблиц, изображений и столбцов текста, а также параметры страниц, абзацев и шрифтов.
Редактирование файлов PDF без необходимости обращения к исходным файлам оригинала.
Предпечатная подготовка, корректировка и подготовка файлов PDF к высококачественной печати и цифровой публикации.
Объединение файлов из нескольких приложений
Создание портфолио PDF: объединение различных типов файлов , включая аудиофайлы, видеофайлы и другие мультимедиа материалы.
Создание пользовательских портфолио PDF.
Использование макетов, тем визуального оформления и цветовых палитр для создания собственных портфолио PDF. Пользователь может вносить в документы информацию о бренде, добавляя логотипы и корпоративные цвета компании.
Создание файлов PDF с использованием аудиоконтента, видеоконтента, совместимого с Flash Player, и интерактивного медиаконтента с возможностью просмотра документов в Adobe Reader X и Reader 9.
Вложение файлов в исходном формате.
Оптимизированное рецензирование документов в режиме онлайн
Инструменты комментирования позволяют вносить пометки в файлы PDF.
Рецензирование документов через Интернет.
Расширение функциональности Reader дает возможность участвовать в совместном рецензировании, заполнять и сохранять формы, а также использовать цифровые подписи и утверждать документы PDF вне зависимости от используемой платформы или операционной системы.
Сбор данных при помощи заполняемых форм PDF
Мастер форм позволяет создавать динамичные заполняемые формы PDF на основе бумажных документов или электронных файлов.
Поддержка Adobe Reader.
Анализ данных и генерация отчетов в виде электронных таблиц.
Защита файлов PDF и документов
Использование Цифровых подписей на основе сертификатов для проверки подлинности и целостности документов.
Возможность использования подписи при работе в Adobe Reader X и Reader 9.
Использование паролей для упрощения управления доступом к документам PDF.
Удаление информации без возможности восстановления.
Версия Adobe Acrobat X Professional включает в себя дополнительно:
Улучшенная продуктивность и согласованность работы
Мастер операций позволяет автоматизировать решение стандартных многоэтапных задач.
Быстрый доступ к часто используемым инструментам, включая инструменты редактирования, комментирования и внесения пометок.
Сравнение версий и устранение различий в файлах.
Интеграция с Microsoft Sharepoint.
Соответствие стандартам PDF и поддержка возможностей расширенного доступа
Соблюдение требований стандартов ISO при создании и проверке документов PDF, включая PDF/A для архивации, PDF/E для обмена техническими данными и PDF/X для печати.
Выполнение работы с соблюдением стандартов цифровых подписей для документов PDF, включая части 2, 3 и 4 стандарта ETSI PAdES (расширенные электронные подписи PDF).
Чтение файлов PDF, поиск по ним и совместное использование файлов
Оптимизированный режим просмотра позволяет увеличить свободное пространство на экране для чтения и презентации файлов PDF.
Обмен файлами через Интернет.
При желании можно указать примерную стоимость продукта: $385 и $580 за Standard и Professional соответственно.
Учитывая, что на родном сайте http://www.adobe.com/ru/products/acrobat.html уже объявлено о выходе Acrobat XI аналогичных версий Standard и Professional, можно считать, что автор не справился со своей задачей, т.к. явно на заходил на сайт первоисточника. Двойка.
За эти деньги разумнее купить бук и поставить "либру". И, думается, при написании статей не стОит забывать о не слишком больших доходах читателей "Вестей", составляющих основной контингент.