FineReader 4.0

Делопроизводство в нашей стране в последние три-четыре года все активнее компьютеризуется. И связано это отнюдь не с тем, что компьютер - это модно или современно, а, скорее, с тем, что работники различных организаций и предприятий наконец-то осознали, насколько незаменимым в работе может оказаться персональный компьютер. Однако до сих пор при компьютеризации различных предприятий (особенно государственных, активно ведущих бумажное делопроизводство уже много лет) возникает один существенный барьер - как перевести (желательно быстро и без ошибок) ту огромную груду бумаг, "наработанных" за много лет, в электронную форму. Можно, конечно, пойти по тому же пути, который обычно выбирают большинство организаций - старые бумаги подшить в папки, а новые оперативно вводить в компьютер. Однако здесь есть два существенных нюанса: во-первых, практически невозможно сделать это быстро, без ошибок, дешево (ведь при большом объеме делопроизводства один-два человека с эти не справятся), без существенного "отрыва от производства"; во-вторых, после года такой кропотливой работы возникает путаница - какие бумаги внесены в компьютер, а какие - нет.

Итак, как же можно вводить тысячи, десятки и сотни тысяч документов в компьютер? Ответ здесь напрашивается только один - использовать систему оптического распознавания текстов (OCR - Optical Character Recognition). Конечно же, OCR давно уже не новинка. Более того, если у пользователя есть сканер, то у него почти всегда есть и какая-нибудь OCR - FineReader, Cunei Form и т.д. Однако пальма первенства в этом списке принадлежит конечно же FineReader`у. Вот о нем, а точнее, о его новой версии - FineReader 4.0, и поговорим.

Система распознавания символов FineReader, разработанная компанией ABBYY (бывшая BIT Software), сегодня вошла в тройку сильнейших OCR-систем мира и получила четыре "Editor's Choice" (Выбор редакции) от именитых западных журналов. По сравнению с предыдущей версией (3.0), точность распознавания возросла в 1,5-2 раза. Улучшено распознавание документов с плохой печатью (распечатка с матричных принтеров, пишущих машинок, ксерокопий и факсов). Эти возможности были достигнуты с помощью применения технологии целостного целенаправленного адаптивного (т.е. самообучающегося) восприятия. При помощи FineReader 4.0 сложный документ с таблицами, цветными картинками в любой ориентации (боком, "вверх ногами" или нормально) будет распознан автоматически по нажатию на кнопку Scan& Read. Теперь даже новичок сможет быстро ввести сложный документ в компьютер и получить превосходный результат, например, в MS Word. Есть возможность сохранять оформление документа, состоящего из многоколоночных текстов с картинками и таблицами. FineReader отличается высоким качеством работы с таблицами - автоматическая сегментация корректно разделит таблицу на ячейки, включая объединенные по горизонтали и вертикали. Специальный инструментарий позволит легко и быстро добавить или убрать новые строки и столбцы в случае необходимости. Встроенный редактор отобразит распознанную таблицу для возможного последующего редактирования, не теряя связи с исходным изображением. Кроме того, FineReader 4.0 позволяет теперь распознавать тексты на 40 (!) языках - от русского до суахили, а также многоязычные документы, содержащие текст на нескольких языках. В комплекте с системой поставляется также и полнофункциональная система коррекции орфографии Lingvo Corrector для 11 языков, которая уменьшает время на поиск и исправление ошибок. Кроме того, при нажатии всего одной кнопки можно экспортировать "переведенный" текст в MS Word 97/95/6.0, MS Excel 97/95, Word Pro 97, Word Perfect 8.0/7.0, Promt 98. Добавлена функция работы с цветными изображениями. Теперь FineReader сканирует, открывает и распознает цветные изображения (форматы TIF, PCX, BMP). FineReader 4.0 распознает также различные формы (бланки, анкеты, бюллетени, декларации и т.д.), сохраняя результаты в формате DBF или экспортируя напрямую в базу данных через ODBC 32. С FineReader поставляется мощный, простой в освоении и работе дизайнер шаблонов форм, который позволяет самостоятельно настраивать FineReader на "специфические" бланки.

Режим фонового распознавания в системе FineReader 4.0, при котором распознавание и редактирование происходит одновременно, максимально эффективно использует ресурсы процессора. Кроме того, система FineReader 4.0 поддерживает многопроцессорную платформу Intel. При переходе с однопроцессорной платформы на двухпроцессорную увеличение затрат на 30% повышает производительность на 100%.

В настоящее время существуют следующие модификации FineReader: FineReader Light, FineReader 4.0 Standard, FineReader 4.0 Professional, FineReader Рукопись, FineReader Банк, каждая из которых обладает дополнительными специфическими возможностями. Вы можете приобрести как весь комплект целиком, так и по частям.

Система FineReader продается в США и Канаде под торговой маркой Presto! OCR Pro. Впрочем, более подробную информацию о системе FineReader 4.0 и о других продуктах компании ABBYY вы можете узнать по Internet-адресу www.abbyy.ru или по электронной почте: office@abbyy.ru.

Функциональные возможности Standard Professional Рукопись
Типы распознаваемых текстов Печатные Печатные Печатные, рукописные (англ., рус., нем., украин.)
Точность распознавания 1-2 ошибки на стр.
Распознавание документов с плохой печатью + + +
Распознавание штрих-кода - + +
Возможность обучения новым символам + + +
Распознавание многоколоночного текста с картинками и таблицами и сохранение документа в формате RTF + + +
Internet-сохранение документа в формате HTML + + +
Распознавание многоязычных документов + + +
Создание новых языков - + +
Распознавание форм и сохранение их в формате DBF - + +
Дизайнер шаблонов форм - + +
Экспорт в базы данных через ODBC 32 - - +
Автоматический подбор шаблона формы - - +
Экспорт графического изображения элементов форм в БД - - +

Павел БЫЛЬ,
beltiz@user.unibel.by

Версия для печатиВерсия для печати

Номер: 

32 за 1998 год

Рубрика: 

На заметку
Заметили ошибку? Выделите ее мышкой и нажмите Ctrl+Enter!