Визитная карточка
|
В 1995 г. в Израиле была образована компания WizCom Technologies Ltd. с довольно узкой специализацией - разработка и производство ручных портативных сканеров, обеспечивающих высокое качество отсканированного изображения и его дальнейшую обработку, в частности, распознавание и перевод иностранного текста. Первым ее продуктом стал Quicktionary - ручной сканер, внешне напоминающий обычный маркер. Этот прибор впервые был представлен в марте 1997 г. на международной выставке в Ганновере CeBIT '97 и получил приз журнала BYTE "Best of CeBIT '97". Не смотря на небольшие размеры (16 см в длину) и вес (90 г без аккумуляторов), Quicktionary заключает в себе все компоненты, входящие в состав традиционной системы для автоматизированного ввода документов в ПК и их перевода, только с приставкой мини. Полностью автономным устройством Quicktionary делают: миниатюрный сканирующий блок фирмы Lipman Engineering, установленный на "кончике пера", сверхминиатюрная система OCR (Optical Character Recognition) - оптического распознавания символов и такой же аккуратно упакованный словарик почти на 500000 слов.
Перевод, являющийся для обычного человека скучноватым и трудоемким процессом, когда необходимо откладывать в сторону книгу или газету и рыться в одном или нескольких громоздких словарях, а владельцам электронных словарей - нажимать маленькие кнопки, превратился в несложную для освоения манипуляцию прибором, не лишенную при этом элемента развлечения. Все, что нужно сделать для понимания незнакомого слова - это "закрасить" его, прокатив носик сканера по центру строки. Quicktionary полноценно реализует принцип Scan-and-See. "Scan" - это сканирование слова длиной 5 см или 32 символа со скоростью 4 см/сек и разрешением 300 dpi. А "See" - отображение через 2-5 с отсканированного слова с вариантами перевода на графическом экране (122х32 пикселов, 3 строчки по 20 символов), размещенном на корпусе прибора. Трех щелочных аккумуляторов AAA, сберегаемых настраиваемой на время от 15 до 240 с системой автоотключения, хватает примерно на 3000 сеансов сканирования. Сканировать можно как целые, так и разделенные при переносе слова размером 8-14 пунктов, напечатанные различными шрифтами в нормальном, жирном, курсивном и подчеркнутом начертаниях. Допустимая цветовая гамма источника включает комбинацию черных, синих или серых букв на белом, желтом или красном фоне, и наоборот, белых, желтых или красных символов на черном, синем или сером фоне. Встроенная функция оптической "склейки" OptiCard, представляющая собой модуль распознавания штрих-кодов, позволяет переводить слова, которые напечатаны большими буквами (как на различных объявлениях) или которые просто неудобно отсканировать стандартным путем. Для ввода такой информации служит специальная карточка с алфавитом соответствующего языка, напротив каждой буквы которого нанесен ее штрих-код. Кроме букв туда включены символы пробела и ввода. Для активно изучающих язык будут полезны "откатка" на 75 переводов назад и возможность ведения настраиваемых пользовательских словарей.
Первая версия Quicktionary, представленная год назад, осуществляла двусторонний перевод только трех языковых пар, включающих английский, немецкий и французский, и содержала, соответственно, три отдельных двусторонних словаря общим объемом более 430000 слов, в том числе более 15000 идиом и слэнговых оборотов. Таким образом, перевод слова представлял собой довольно информативную словарную статью, включающую не только основное и дополнительные значения слова, но и связанные устойчивые выражения и фразы. В марте этого года на очередной выставке CeBIT было объявлено о преодолении миллионного барьера в словарном запасе Quicktionary и начале выхода в мае версий переводчика, нагруженных сверх обязательной англо-франко-немецкой связки, несколькими другими языковыми сочетаниями, среди которых двусторонние пары английского с голландским, испанским, итальянским и португальским языками. Односторонние версии продукта поддерживают перевод с английского на русский, иврит, корейский, японский, китайский, греческий, шведский, датский, польский, чешский, тайский и некоторые другие языки.
Кроме утяжеленного Quicktionary, на CeBIT'98 израильтяне привезли Quicktionary-Mono - прибор, расширяющий концепцию ручного сканера, попутно заменяющего собой толстенный бумажный словарь. В отличие от переводчика, или Quicktionary-Multi, моно-версия этого продукта включает электронную версию толкового словаря American Heritage College dictionary. После уже привычного сканирования и распознавания на экране появляется развернутое толкование значения отсканированного слова вместе с транскрипцией, вариантами произношения, грамматическим анализом, а также примерами использования данного слова в составе обычного предложения или идиоматического выражения. Quicktionary-Mono может растолковать таким образом более 80000 слов. Первые версии этого прибора будут распространяться в США с июня этого года по каналам Seiko Instruments. Последующие версии Quicktionary-Mono будут заменять другие толковые словари.
В дальнейшие планы компании входит наделение Quicktionary способностью распознавать речь, разработка интерфейса с ПК или электронным секретарем (PDA - Personal Digital Assistant), а также использование сканера с Internet-словарями и включение его в состав специальных средств обучения для инвалидов.
Отдельно хочется остановиться на программной начинке Quicktionary. Началом истории видимо надо считать 1989 г., когда была образована израильская компания Ligature Ltd. В настоящее время Ligature является, наряду с Caere, Xerox и Recognita, крупным поставщиком решений OCR. Компания известна на западном рынке ПО благодаря своему основному продукту CharacterEyes, ядро которого вместе с Ligature SDK интегрированы в 40% ПО для факсов, а также находятся в составе других пакетов (например, Procomm Plus от Quarterdeck) и специализированной аппаратуры. К марту 1997 г. Ligature завершила разработку абсолютно новой компрессионной технологии OCR - OCR-on-a-Chip, вошедшей в состав прототипа Quicktionary. Главной целью при разработке данного решения являлось обеспечение высококачественного распознавания текста без потери скорости устройствами, имеющими ограничения в цене, размерах и мощности. OCR-on-a-Chip предназначена как для обработки полноформатных текстовых страниц на ПК, так и для считывания коротких заголовков или блоков текста с помощью ручного "карандашного" сканера или цифровой камеры. Уникальность OCR-on-a-Chip состоит в том, что уровень интеллектуальности, сравнимый с возможностями полноценной рабочей станции, достигается с использованием экономичного, недорогого и легко цепляемого на любое оборудование (роботы, цифровые камеры, промышленные установки) чипа. Аппаратные требования к системе выглядят поистине невероятными, в сравнении с запросами традиционных пакетов OCR в виде 8-16 Mб RAM и 4-25 Mб на винчестере. Для функционирования OCR-on-a-Chip необходим микропроцессор, 500-1100 кб ПЗУ и 64 кб ОЗУ. В марте 1998 г. произошло слияние WizCom со своим более именитым соотечественником, после которого все основные компоненты Quicktionary оказались под одной крышей. По замыслу руководства компании, это должно способствовать более эффективной разработке новых версий сканера. Наличие же в команде такого игрока, как Ligature, позволит WizCom оставаться одним из лидеров и в области OCR-технологий.
Владимир РОЗИН
Горячие темы