Система распознавания речи делает всего 5,9% ошибок по методике WER (Word Error Rate), столько же ошибок делает естественный распознаватель речи – человек. В прошлом месяце этот показатель равнялся 6,3%. Об этом сообщает компания Microsoft в корпоративном блоге.
«Мы достигли уровня человека. Это историческое достижение», - заявил главный ученый команды из подразделения Microsoft по работе с искусственным интеллектом Сюэдунь Хуань. По признанию исполнительного вице-президента подразделения Гарри Шума, еще пять лет назад сотрудники Microsoft полагали, что такое невозможно, пишет CNews.
Исторический момент наступил после десятилетий исследований в этой сфере, начиная еще с 1970-х годов, работы совместно с Агентством по перспективным оборонным научно-исследовательским разработкам США (DARPA), перед которым была поставлена задача технологических прорывов в сфере национальной безопасности.
Комментарии
Страницы
Покамест имхо фигня. Чел прекрасно распознаёт зашумленную речь. Компу ещё долго пукать до уровня чела. Хотя дело к этому идёт. :)
(Фишка в корреляционной обработке семантических паттернов речи мозгом. Но журналистам можно втирать, что всё решено -- схАвают! -- журналисты от пипл мало чем отличаются.)
Все-таки как хорошо, что у нас есть mike, который компетентен абсолютно во всех вопросах, от нейрофизиологии до педагогики! И как ловко, всего одной фразой, он ставит на место этих жалких врунишек из M$, которые работают по своей тематике всего какой-то десяток-другой лет!
И само собой, хуже них могут быть только ничтожные журнализды, которые в силу своей тупости перепечатывают откровенное вранье, и которых наш mike неустанно за это возит мордой по столу.
Ну, Майк прав. Методика WER подразумевает чистый звук, без шумов. А очистка звука/голоса от шума - отдельный разговор, хотя и там есть неплохие результаты.
Кстати, еще и язык влияет. Небось, цифирь-то для английского, а он простой в этом плане.
Вот когда какого-нибудь вьетнамца на базаре распознают - будет круто! ;)
Парни из МС про это в курсе, поэтому и "собираются убедиться, что распознавание так же хорошо работает в стандартных бытовых ситуациях: шумных ресторанах, громких улицах и при сильном ветре" (цитата с другого сайта).
Простой? Лично я американский английский воспринимаю с трудом, в отличие от английского английского или, тем более, какого-нибудь немецкого английского или турецкого английского.
А вообще, я где-то читал, что в этом плане весьма хорош немецкий. И немцы хорошо воюют в том числе и потому, что приказы на немецком воспринимаются гораздо лучше в условиях боя, чем на других языках :)
Логика забанили, так он принялся за меня. :)
К сожалению, Логик(тм) вернется к людям уже завтра :(
Что касается тебя, то я могу понять твое желание до##аться до местных "журнализдов". Но в последнее время минимум в половине случаев ты до##ываешься совершенно без повода (как в данном случае). Извини, но это унылое однообразие лично меня уже изрядно утомило.
Твои проблемы. :)
Впрочем, буду разнообразнее. :))
> Но в последнее время минимум в половине случаев ты до##ываешься совершенно без повода (как в данном случае)
Журналистов как личностей хочется видеть. Полет мысли типа... А не тупой перепост (слава Богу, без ошибок). Думаешь, я что-то знал четко(!) по теме до поста Майка? Неа. И поэтому ему спасибо - я погуглил и узнал больше (методика WER, проблемы с конкретными языками).
Заняло минут 15. Но если бы это сделал автор и вставил в текст типа как "а вот есть еще такое мнение" - было бы отлично.
Компьютеру до распознавания речи - как раком до Луны. Можете опровергать но это смешно будет.
О, еще один эксперт!
А до чего еще? Вот, например, до управления автомобилем - как до Луны или все-таки чуток поближе?
Страницы