Компания Cerebras Systems анонсировала решение для разработчиков на основе искусственного интеллекта, которое может подорвать доминирующее положение Nvidia в области работы с ИИ.
Графические процессоры Nvidia хорошо подходят для работы с крупными моделями ИИ, такими как ChatGPT. Однако эти модели требуют совместной работы большого количества процессоров, что делает их слишком дорогими и неэффективными, особенно для небольших компаний.
Cerebras предлагает альтернативное решение: выпустить одну из лучших моделей ИИ – LLaMA 3.1 с открытым исходным кодом на своем чипе Wafer Scale Engine. Этот чип представляет собой большую кремниевую пластине с 44 Гб SRAM с пропускной способностью 21 Пбит/с. Он способен генерировать более 1800 токенов в секунду при запуске Llama 3.1 8B с 16-битной точностью.
Преимущества такого решения:
- больше нет необходимости в использовании множества графических процессоров;
- обеспечивается значительно более высокая производительность: до 20 раз по сравнению с предложениями Nvidia;
- дешевизна: Cerebras предлагает эту услугу всего за 10 центов за 1 млн обработанных токенов.
По прогнозам большинства экспертов, сегмент рынка ИИ-решений будет быстро расти, и Cerebras стремится завоевать заметную его долю, предлагая экономичную и высокопроизводительную альтернативу существующим решениям на основе графических процессоров.
Горячие темы