ABBYY: не только системы распознавания

Компания ABBYY знакома очень многим пользователям прежде всего благодаря своей OCR-системе FineReader. Рассказать о компании и о тенденциях развития систем распознавания любезно согласился Сергей АНДРЕЕВ, генеральный директор ABBYY.


- Сергей, многим было бы интересно узнать, что представляет собой компания ABBYY на сегодняшний день.

- Наша компания была основана в 1989 году студентом 4 курса Давидом Яном (ныне - председатель совета директоров ABBYY Software House). Тогда она называлась BIT Software.

На сегодняшний день ABBYY - один из ведущих мировых разработчиков в области искусственного интеллекта. Основное направление деятельности - это технологии распознавания и обработки естественного языка. Флагманскими продуктами компании стали система оптического распознавания (OCR-система) ABBYY FineReader и электронный словарь Lingvo. Кроме этого, компания также занимается разработкой ICR-технологий, то есть технологий распознавания так называемого рукопечатного текста. Эти технологии реализованы в нашем продукте FormReader, который позволяет вводить в компьютер данные из форм, заполненных от руки.

ABBYY представляет собой группу компаний, общая численность персонала которых составляет около 350 человек. Головной офис группы находится в Москве - здесь занято свыше 200 человек. При этом более 60% сотрудников московского офиса работают в отделе исследований и разработок: это лингвисты, математики и программисты. Другие компании группы ABBYY расположены в США, Германии, Великобритании и на Украине. Дилеры и партнеры ABBYY работают в 80 странах мира.

- В чем причина успеха ABBYY?

- Мы ставим перед собой только далекие, но достижимые цели. Например, принимая решение выпускать FineReader, мы хотели создать программу, которая станет международным стандартом в своей отрасли. И, как вы знаете, это получилось.

Далее, мы всегда делаем ставку на наукоемкие технологии. Понятно, что создание наукоемких программных продуктов невозможно без проведения серьезных исследований, которые, в свою очередь, требуют привлечения наиболее квалифицированных, талантливых специалистов и, конечно, серьезного финансирования. Именно поэтому более 50% дохода ABBYY тратит на научные исследования. Постоянно ведутся разработки в сферах искусственного интеллекта и лингвистики, а наши ученые участвуют в многочисленных международных конференциях.

Есть и еще один секрет. Работа в столь сложной области не может быть успешной без заботы о коллективе. Коллектив ABBYY - это не просто люди, приходящие поработать в одно помещение. Мы создаем и поддерживаем в компании командный дух.

- В прошлом году ABBYY Software House получила премию российского правительства за научные работы. Расскажите, пожалуйста, подробнее об этих исследованиях.

- Да, авторский коллектив системы FineReader действительно получил в 2002 году Премию правительства России в области науки и техники. Нам особенно приятно, что ABBYY стала одной из первых коммерческих компаний и первой IT-компанией, получившей столь высокую правительственную награду. Эта премия - вторая по значимости после Государственной, и присуждается она не только и не столько за научные исследования, сколько за их полезность для экономики страны. Поэтому в данном случае мы гордимся тем, что был высоко оценен не только наш научный потенциал, но и реальный экономический эффект от использования наших продуктов.

Если говорить о реальных внедрениях, то вот один хороший пример.

В июле сего года Министерство образования РФ подвело итоги очередного Единого Государственного Экзамена (ЕГЭ). Впервые автоматизированное тестирование выпускников проводилось столь масштабно: количество участников экзамена, проводившегося в 47 регионах страны, составило 655 тысяч человек. При этом организаторы ЕГЭ вынуждены были искать решение, позволяющее уложиться в весьма жесткие временные рамки, ведь на проведение всех экзаменов отводился неполный месяц. В итоге, за 18 дней средствами поставленного ABBYY программного комплекса было обработано 3.350 тысяч бланков. Подобных результатов в рамках проектов государственного значения никому в мире до сих пор достичь не удавалось.

- Что Вы можете сказать о конкурентах? Как выглядят FineReader и Lingvo на их фоне?

- Конечно, у нас есть конкуренты, но ситуация очень разнится в зависимости от конкретного рынка. Возьмем, к примеру, мировой рынок OCR-программ. Наш единственный серьезный конкурент здесь - американская компания ScanSoft. Ее программа занимает на сегодня основную долю рынка. ABBYY FineReader на втором месте по объему продаж. Естественно, мы работаем над расширением количества наших пользователей, и более чем успешно: разрыв достаточно быстро сокращается. Так, например, в Германии мы уже занимаем более 50% розничного рынка систем распознавания.

Но в точности распознавания ABBYY FineReader не знает себе равных, являясь признанным технологическим лидером на рынке. Продукт у нас выигрывает почти во всех тестах и сравнениях.

На российском рынке, можно сказать, у нас конкурентов практически нет. Точнее, нет опасных для нас конкурентов. Мы прочно заняли нишу систем распознавания уже несколько лет назад и не видим здесь серьезных соперников. Более того, в России слово "FineReader" уже во многом стало нарицательным, часто обозначая весь класс систем распознавания в целом.

Если говорить о российском рынке электронных словарей, то здесь ситуация похожая. Хотя конкурентов тут больше, чем в области распознавания, мы их уверенно опережаем как по качеству технологий, так и по объемам продаж. По нашим оценкам, мы сейчас занимаем порядка 80% данного рынка. Конкуренты нас беспокоят, но мы не стоим на месте, и будем предлагать своим клиентам улучшенные решения.

- Сергей, каким видится будущее OCR-продуктов? Какое место в нем отводится вашему флагманскому пакету FineReader?

- Я полагаю, что будущее принадлежит системам обработки естественного языка. Иными словами, через несколько лет многие формальные различия между программами распознавания, перевода, электронными словарями будут стерты. Вместо этих узкоспециализированных продуктов будут, полагаю, существовать универсальные программные комплексы, позволяющие решать любые задачи из этой области. Определенные тенденции к трансформации и расширению функций можно отметить уже сейчас. Например, версия FineReader для Macintosh позволяет озвучить распознанный текст - то есть компьютер прочитает вам, что получилось при распознавании. В данном случае это возможно благодаря технологиям Macintosh.

А если к системе распознавания подключить электронный переводчик и словарь, то получится универсальная система "от страницы на одном языке до страницы на другом". Идея такой универсальной системы появилась еще когда мы только создавали электронный словарь Lingvo - наш первый продукт. В свое время FineReader стал фактически одним из шагов к созданию такой системы, превратившись затем в самодостаточный продукт. Тем не менее, мне кажется, что будущее именно за универсальными системами, которые свяжут воедино сразу несколько глобальных функций. Ведь основное предназначение любого программного продукта - облегчить человеку жизнь, сделать так, чтоб ему пришлось потратить минимум времени на решение той или иной задачи. Универсальные системы здесь как нельзя более кстати.

- Как Вы считаете, сильно ли сказывается пиратство на развитии рынка коробочного ПО и, в частности, на продвижении продуктов ABBYY?

- Если Вы говорите о российском рынке, то утверждать, что пиратство "мешает", на мой взгляд, не совсем верно. Это, например, в Японии или в Германии оно мешает. А у нас это один из неотъемлемых факторов рынка, данность, бороться с которой крайне сложно и которую обязательно приходится учитывать при разработке как самого продукта, так и планов его продвижения. Пиратство в нашей стране - нечто, сходное с гравитацией. Тем более, сражаться с пиратством силами одной отдельно взятой компании невозможно. У нас это слишком мощная сила, победить которую можно лишь постепенно и сообща.

Пока же приходится приспосабливаться к существующему положению и стараться обратить пиратство себе на пользу. Как это ни парадоксально, но такое возможно. Простой пример - в последнее время многие пираты начали продавать лицензионную версию нашего словаря Lingvo. Заметьте, по доброй воле начали продавать. Во-первых, цена лицензионной версии сопоставима со стоимостью пиратской копии, а во-вторых, наши продукты хорошо защищены, поэтому отыскать на "развале" действительно хорошо взломанную версию Lingvo сложно. Проще купить легальный словарь, чем все время переустанавливать "падающую" нелицензионку.

- При распространении продуктов наверняка происходили курьезные случаи. Какие из них запомнились больше всего?

- Курьезы случаются. Занятный случай, который до сих пор вспоминают у нас на фирме (этакий фирменный анекдот), был связан с выпуском одной из версий электронного словаря Lingvo. Обложка диска, прежде чем уйти в печать, само собой, проверяется по несколько раз всеми ответственными людьми, включая генерального директора. В тот раз макет обложки был также проверен всеми. Отдали в тираж. Напечатали. И только когда обложка диска пришла из типографии, заметили, что на самом видном месте, в перечислении достоинств нашего словаря - опечатка: "самая соверменная лексика". Ведь через десяток людей прошел макет, все честно проверяли, и никто не заметил такой кричащей ошибки! Пришлось в срочном порядке перепечатывать весь тираж. С тех пор "соверменная лексика" вошла у нас на фирме в поговорку.

Часто радуют вопросами пользователи. От одного человека пришло как-то письмо: "Подскажите, как я могу приобрести полную версию ABBYY Software House?". Мы долго веселились, представляя, как он удивится, если мы ему назовем цену:).

Беседовал Павел БАДЯЛИК

Версия для печатиВерсия для печати

Номер: 

49 за 2003 год

Рубрика: 

Эксклюзивное интервью
Заметили ошибку? Выделите ее мышкой и нажмите Ctrl+Enter!