Whisper — это система автоматического распознавания речи (ASR), обученная на 680 000 часов многоязычных и многозадачных контролируемых данных, собранных из интернета. Об этом сообщается на сайте компании.
По словам представителей OpenAI, использование такого большого и разнообразного набора данных приводит к повышению устойчивости к акцентам, фоновому шуму и техническому языку. Компания предлагает разработку с открытым исходным кодом, которая может служить основой для создания полезных приложений и дальнейших исследований в области обработки речи.
«Мы открыли исходный код нейронной сети под названием Whisper, которая приближается по надежности и точности к человеческому уровню распознавания», - сообщается в релизе компании.
Исходный код уже размещен на GitHub.
Горячие темы