Meta выпустила последнюю модель в своей серии открытых генеративных моделей искусственного интеллекта Llama 3. Или, точнее, компания дебютировала с двумя моделями в своем новом семействе Llama 3, а остальные появятся в ближайшем будущем.
Meta описывает новые модели — Llama 3 8B, которая содержит 8 миллиардов параметров, и Llama 3 70B, которая содержит 70 миллиардов параметров. Это большой скачок по сравнению с моделями Llama предыдущего поколения (Llama 2 8B и Llama 2 70B) с точки зрения производительности.
Мета говорит, что Llama 3 8B и Llama 3 70B, обученные на двух специально созданных кластерах по 24 000 графических процессоров, являются одними из самых эффективных моделей генеративного ИИ, доступных сегодня.
Компания указывает на оценки моделей Llama 3 в популярных тестах искусственного интеллекта, таких как MMLU (который пытается измерить знания), ARC (который пытается измерить приобретение навыков) и DROP (который проверяет рассуждения модели на фрагментах текста).
Meta также разработала собственный набор тестов, охватывающий различные варианты использования: от кода и творческого письма до рассуждений и обобщения.
Горячие темы