Делопроизводство в нашей стране в последние три-четыре года все активнее компьютеризуется. И связано это отнюдь не с тем, что компьютер - это модно или современно, а, скорее, с тем, что работники различных организаций и предприятий наконец-то осознали, насколько незаменимым в работе может оказаться персональный компьютер. Однако до сих пор при компьютеризации различных предприятий (особенно государственных, активно ведущих бумажное делопроизводство уже много лет) возникает один существенный барьер - как перевести (желательно быстро и без ошибок) ту огромную груду бумаг, "наработанных" за много лет, в электронную форму. Можно, конечно, пойти по тому же пути, который обычно выбирают большинство организаций - старые бумаги подшить в папки, а новые оперативно вводить в компьютер. Однако здесь есть два существенных нюанса: во-первых, практически невозможно сделать это быстро, без ошибок, дешево (ведь при большом объеме делопроизводства один-два человека с эти не справятся), без существенного "отрыва от производства"; во-вторых, после года такой кропотливой работы возникает путаница - какие бумаги внесены в компьютер, а какие - нет.
Итак, как же можно вводить тысячи, десятки и сотни тысяч документов в компьютер? Ответ здесь напрашивается только один - использовать систему оптического распознавания текстов (OCR - Optical Character Recognition). Конечно же, OCR давно уже не новинка. Более того, если у пользователя есть сканер, то у него почти всегда есть и какая-нибудь OCR - FineReader, Cunei Form и т.д. Однако пальма первенства в этом списке принадлежит конечно же FineReader`у. Вот о нем, а точнее, о его новой версии - FineReader 4.0, и поговорим.
Система распознавания символов FineReader, разработанная компанией ABBYY (бывшая BIT Software), сегодня вошла в тройку сильнейших OCR-систем мира и получила четыре "Editor's Choice" (Выбор редакции) от именитых западных журналов. По сравнению с предыдущей версией (3.0), точность распознавания возросла в 1,5-2 раза. Улучшено распознавание документов с плохой печатью (распечатка с матричных принтеров, пишущих машинок, ксерокопий и факсов). Эти возможности были достигнуты с помощью применения технологии целостного целенаправленного адаптивного (т.е. самообучающегося) восприятия. При помощи FineReader 4.0 сложный документ с таблицами, цветными картинками в любой ориентации (боком, "вверх ногами" или нормально) будет распознан автоматически по нажатию на кнопку Scan& Read. Теперь даже новичок сможет быстро ввести сложный документ в компьютер и получить превосходный результат, например, в MS Word. Есть возможность сохранять оформление документа, состоящего из многоколоночных текстов с картинками и таблицами. FineReader отличается высоким качеством работы с таблицами - автоматическая сегментация корректно разделит таблицу на ячейки, включая объединенные по горизонтали и вертикали. Специальный инструментарий позволит легко и быстро добавить или убрать новые строки и столбцы в случае необходимости. Встроенный редактор отобразит распознанную таблицу для возможного последующего редактирования, не теряя связи с исходным изображением. Кроме того, FineReader 4.0 позволяет теперь распознавать тексты на 40 (!) языках - от русского до суахили, а также многоязычные документы, содержащие текст на нескольких языках. В комплекте с системой поставляется также и полнофункциональная система коррекции орфографии Lingvo Corrector для 11 языков, которая уменьшает время на поиск и исправление ошибок. Кроме того, при нажатии всего одной кнопки можно экспортировать "переведенный" текст в MS Word 97/95/6.0, MS Excel 97/95, Word Pro 97, Word Perfect 8.0/7.0, Promt 98. Добавлена функция работы с цветными изображениями. Теперь FineReader сканирует, открывает и распознает цветные изображения (форматы TIF, PCX, BMP). FineReader 4.0 распознает также различные формы (бланки, анкеты, бюллетени, декларации и т.д.), сохраняя результаты в формате DBF или экспортируя напрямую в базу данных через ODBC 32. С FineReader поставляется мощный, простой в освоении и работе дизайнер шаблонов форм, который позволяет самостоятельно настраивать FineReader на "специфические" бланки.
Режим фонового распознавания в системе FineReader 4.0, при котором распознавание и редактирование происходит одновременно, максимально эффективно использует ресурсы процессора. Кроме того, система FineReader 4.0 поддерживает многопроцессорную платформу Intel. При переходе с однопроцессорной платформы на двухпроцессорную увеличение затрат на 30% повышает производительность на 100%.
В настоящее время существуют следующие модификации FineReader: FineReader Light, FineReader 4.0 Standard, FineReader 4.0 Professional, FineReader Рукопись, FineReader Банк, каждая из которых обладает дополнительными специфическими возможностями. Вы можете приобрести как весь комплект целиком, так и по частям.
Система FineReader продается в США и Канаде под торговой маркой Presto! OCR Pro. Впрочем, более подробную информацию о системе FineReader 4.0 и о других продуктах компании ABBYY вы можете узнать по Internet-адресу www.abbyy.ru или по электронной почте: [email protected].
Функциональные возможности | Standard | Professional | Рукопись |
Типы распознаваемых текстов | Печатные | Печатные | Печатные, рукописные (англ., рус., нем., украин.) |
Точность распознавания | 1-2 ошибки на стр. | ||
Распознавание документов с плохой печатью | + | + | + |
Распознавание штрих-кода | - | + | + |
Возможность обучения новым символам | + | + | + |
Распознавание многоколоночного текста с картинками и таблицами и сохранение документа в формате RTF | + | + | + |
Internet-сохранение документа в формате HTML | + | + | + |
Распознавание многоязычных документов | + | + | + |
Создание новых языков | - | + | + |
Распознавание форм и сохранение их в формате DBF | - | + | + |
Дизайнер шаблонов форм | - | + | + |
Экспорт в базы данных через ODBC 32 | - | - | + |
Автоматический подбор шаблона формы | - | - | + |
Экспорт графического изображения элементов форм в БД | - | - | + |
Павел БЫЛЬ,
[email protected]
Горячие темы