"Белазар" - першы перакладчык на беларускую мову

Беларуская мова мае вельмі старадаўнюю гісторыю. Пісьменнасць на старабеларускай мове пачала фарміравацца ў часы старажытнага Полацкага княства, а праз некалькі стагоддзяў старабеларуская мова стала дзяржаўнай мовай Вялікага княства Літоўскага, Рускага і Жамойцкага. На гэтай мове не толькі напісаны больш за 500 тамоў метрыкі ВКЛ, але яна таксама аказала вялізарны ўплыў на мовы іншых дзяржаў падобна таму, як сучасная руская мова ўплывае на мовы народаў СНД. Шмат інфармацыі аб развіцці нашай мовы знаходзіцца ў Сетцы, напрыклад, тут: litvin.org.

Сёння я вяду гутарку са стваральнікам першага руска-беларуска-рускага перекладчыка "Белазар" Алегам АЗАРОЎСКІМ. Дарэчы, знайсці "Белазар" можна ў інтэрнэце на сайце belazar.belinter.net, а аб самой праграме расказвалася ў аглядзе "Синхронные переводчики" (гл. "КВ" №23/2004).

Алег АЗАРОЎСКІ, 30 год, матэматык-сістэмны праграміст. Пасля заканчэння Факультэта прыкладной матэматыкі і інфарматыкі (ФПМІ) БДУ ў 1995 годзе працаваў праграмістам і сістэмным адміністратарам. Зараз працуе па спецыяльнасці ў прыватнай кампаніі. Жанаты, жыве ў беларускім горадзе Ліда.

- Алег, як наогул расшыфроўваецца назва праграмы "Белазар"?

- Насамрэч, "расшыфраваць" гэтае слова не так і складана, звярнуўшы ўвагу на маё імя:-).

- Паведайце, калі ласка, гісторыю стварэння "Белазара".

- У 2000 годзе мяне зацікавіла тэма перакладу інтэрфейсаў прыкладных праграм для Windows на беларускую мову. У той час пачалі з'яўляцца "інтэрнацыяналізаваныя" праграмы, якія прапаноўвалі простыя спосабы стварэння інтэрфейсаў да іх на розных мовах. Досыць было перавесці некаторую колькасць радкоў тэкставага файла - і праграма станавілася беларускамоўнай.

У той час не існавала руска-беларускіх перакладчыкаў, якія маглі б дапамагчы мне ў гэтай справе. Электронныя слоўнікі пад увагу не бярэм, бо слоўнік і перакладчык - гэта розныя рэчы. Але ж я праграміст!

Спачатку была створана праграма, якая дазваляла маніпуляваць моўнымі файламі розных фарматаў, а затым быў распрацаваны і сам руска-беларускі перакладчык "Белазар", першая версія якога была апублікавана 1 лістапада 2002 года.

- Ці вядомыя Вам іншыя спробы стварэння перакладчыкаў з/на беларускую мову?

- Праблемай беларуска-рускага перакладу цікавяцца многія людзі, у тым ліку і спецыялісты ў вобласці кампутарнага праграмавання. Я ведаю некалькі праектаў, якія прапануюць слоўнікі ўласнай распрацоўкі. Напрыклад, са студзеня 2002 года існуе праект Biaroza (biaroza.netfirms.com) - электронны беларуска-англійска-беларускі слоўнік пад ліцэнзіяй GPL. А параўнальна нядаўна быў створаны сайт slounik.org з on-line слоўнікамі.

Ніводная з вядомых мне праграм-перакладчыкаў не ўтрымоўвае беларускага моўнага модуля, у тым ліку і вядомы "ПРОМТ". Праўда, у газеце "Наша Ніва" ў артыкуле "Электронны перакладчык" (№14/2004) было згадванне аб перакладчыку, праца над якім вядзецца на ФПМІ БДУ, але ў Сетцы больш дэталёвай інфармацыі аб ім я не знайшоў. Заўважце, гэты і іншыя праекты прапануюць толькі слоўнікі, а "Белазар" - гэта перакладчык, які дазваляе атрымаць пераклад не асобных слоў, а цэлых сказаў і тэксту.

Ёсць праграмы, якія выконваюць асобныя функцыі, не звязаныя непасрэдна з атрыманнем перакладу: напрыклад, арфаграфічны аналіз тэкстаў або пераўтварэнне беларускіх тэкстаў з кірыліцы ў лацінку і наадварот. У якасці прыкладу арфаграфічных аналізатараў можна прывесці праграмы ArfaBel (arfabel.belinter.net) і "Правапiс" (pravapis.tut.by).

- Як раз было б цікавым параўнаць праграму "Правапiс" з блокам арфаграфічнага аналізу "Белазара"...

- Як заяўляюць аўтары, "Правапiс" утрымоўвае вялізарны спіс слоў - каля 2 млн. словаформаў (для параўнання, у беларускай частцы слоўніка "Белазара" на сёння "ўсяго толькі" 574,447 розных словаформаў). Несумненнымі плюсамі "Правапiсу" з'яўляюцца таксама інтэграванасць у рэдактар Microsoft Word і ўбудаваны перакладчык тэкстаў з сучаснага напісання ("наркамаўка") у класічнае ("тарашкевіца"). Пры праверцы арфаграфіі гэтая праграма шукае набранае слова ў сваёй вялізнай базе і падкрэслівае яго чырвонай рыскай у выпадку, калі такога там не знойдецца.

Аднак блок арфааналізу "Белазара" працуе крыху па-іншаму: ён не толькі робіць пошук слоў па базе, але і аналізуе дапушчальнасць ужывання спалучэнняў літараў у тых або іншых пазіцыях у слове. Акрамя таго, "Белазар" не проста паведамляе карыстальніку, ці правільна напісана тое або іншае слова, але і прапаноўвае варыянты аўтазамены для выпраўлення. Алгарытм "навучаны" выпраўляць памылкі ў людзей, якія часцей пішуць на рускай мове, чым на беларускай.

- Ці адбываліся ў карыстальнікаў "Белазара" цікавыя выпадкі пры рабоце з праграмай?

- Для атрымання поўнага слоўніка карыстальнікі павінны дасылаць свае дапаўненні. Аднак многія па розных прычынах не могуць або не жадаюць гэтага рабіць і прадстаўляюцца вядомымі людзьмі...

А аднойчы я атрымаў ліст з Екацярынбурга. Яго аўтар паведаміў, што, дзякаючы "Белазару", ён аднойчы вельмі ўразіў сваю дзяўчыну, якая жыве ў Мінску, калі прыслаў ёй ліст на беларускай мове...

- Дарэчы, наколькі актыўна дапамагаюць карыстальнікі ў папаўненні слоўніка?

- Карыстальнікі "Белазара" прымаюць самы актыўны ўдзел у напаўненні слоўніка. Мяркуйце самі: на пачатак 2004 года поўны слоўнік праграмы ўтрымоўваў 30,000 артыкулаў, а ўжо напрыканцы ліпеня я планую апублікаваць абнаўленне, у якім будзе больш за 51,000 слоў кожнай мовы! Прычым, калі яшчэ год назад карыстальнікі дадавалі не больш за 30% новых перакладаў, то зараз гэты паказчык дасягае 70%. Але, нягледзячы на гэта, перад далучэннем новых перакладаў да слоўніка я імкнуся ўсе іх правяраць на правільнасць.

- Цікава, у якіх краінах карыстаюцца "Белазарам"?

- Паводле звестак інтэрнэт-рэйтынгу "@Mail.ru" за чэрвень, большасць карыстальнікаў на сайт "Белазара" прыходзілі з Беларусі (41%), ЗША (33%), Расіі (10%), а таксама Нарвегіі, Украіны і іншых краін Еўропы, СНД і Прыбалтыкі.

- Над чым зараз працуеце? Чаго чакаць ад Вас у будучыні?

- На бліжэйшы месяц-два я планую зрабіць перапынак у працы над "Белазарам" (поўны слоўнік, тым не менш, будзе абнаўляцца рэгулярна). А на восень у мяне мноства планаў. Па-першае, планую ўбудаваць у "Белазар" блок перакладу з класічнага правапісу ў сучасны. А, па-другое, у мяне шмат ідэй па ўдасканальванні алгарытмаў перакладу: вылучыць з усіх назоўнікаў уласныя імёны, увесці паняцці "альтэрнатыўныя формы слоў" (напрыклад, "секторы" - "сектора", "дорогой" - "дорогою"), а таксама працягнуць удасканаленне перакладу рускіх дзеепрыслоўяў у беларускія словазлучэнні.

- Поспехаў Вам, Алег, у развіцці "Белазара"! Спадзяюся, што ў будучыні сітуцыя вакол беларускай мовы зменіцца да лепшага.

Гутарку веў Павел БАДЗЯЛІК

Версия для печатиВерсия для печати

Номер: 

29 за 2004 год

Рубрика: 

Эксклюзивное интервью
Заметили ошибку? Выделите ее мышкой и нажмите Ctrl+Enter!