Компания представила Samsung Gauss2, второе поколение своей собственной модели ИИ. Была отмечена улучшенная производительность, эффективность и различные возможности применения.
Samsung Gauss2 — это усовершенствованная модель генеративного ИИ, представленная компанией в прошлом году. Она отличается повышенной производительностью и эффективностью при одновременной обработке различных типов данных, поскольку представляет собой мультимодальную модель, объединяющую язык, код и изображения. Она доступна в трех различных моделях, предназначенных для разных целей: Compact, Balanced и Supreme.
Модель Compact — это компактная модель, специально разработанная для эффективной работы даже в ограниченных условиях вычислительной среды. Она обеспечивает оптимизированную производительность при работе с устройством, максимально используя его вычислительные ресурсы. Модель Balanced нацелена на достижение баланса между производительностью, скоростью и эффективностью, обеспечивая стабильную работу при выполнении различных задач. Наконец, модель Supreme нацелена на достижение высокой производительности за счет использования технологии Mixture of Experts в модели Balanced, что позволяет значительно сократить вычислительные затраты в процессе обучения и формирования выводов и сохранить при этом высокий уровень производительности и эффективности.
Samsung Gauss2 поддерживает от 9 до 14 языков, а также различные языки программирования, в зависимости от модели. Samsung разработала и внедрила собственные методы обработки больших языковых моделей (LLM) и создала собственный токенизатор, чтобы обеспечить максимальную эффективность для поддерживаемых языков.
Модели Balanced и Supreme обладают равной или превосходящей производительностью по таким ключевым параметрам, как генерация ответов на различных языках, включая английский и корейский, и возможности кодирования в сравнении с ведущими моделями генеративного ИИ с открытым исходным кодом, доступными в настоящее время. Кроме того, скорость обработки данных в час в 1,5-3 раза выше. Это позволяет быстрее генерировать ответы ИИ, сократить время ожидания пользователей и повысить эффективность обработки задач.