OpenAI представила новую языковую модель o1, которая демонстрирует беспрецедентные способности к рассуждению и решению задач. В отличие от своих предшественников, o1 может имитировать человеческий процесс мышления, разбивая сложные проблемы на более простые шаги, анализируя различные подходы и даже исправляя свои ошибки.
Большая языковая модель (LLM) o1 показала выдающиеся результаты в тестах и соревнованиях, сравнимые с результатами специалистов-людей. По программированию o1 заняла 49-е место на Международной олимпиаде по информатике (IOI) 2024 года и превзошла 89 % людей на платформе Codeforces. По математике o1 вошла в число 500 лучших студентов США на квалификационном этапе Американской математической олимпиады (AIME), продемонстрировав способность решать задачи, предназначенные для самых одарённых школьников.
Модель o1 продемонстрировала значительный прогресс в сравнении с предшественниками, превзойдя их в разнообразных тестах на интеллект и решение задач, включая MMMU и MMLU. Согласно OpenAI, o1 демонстрирует существенное превосходство над GPT-4o в большинстве задач, требующих логического мышления.
Компания отмечает, что улучшение результатов модели o1 напрямую связано с увеличением объема обучения с подкреплением и времени, отведенного на размышление. В частности, в тестах AIME модель o1 решила в среднем 83% задач, в то время как GPT-4o справился лишь с 13%.
Стоимость использования o1-preview составляет $15 за 1 миллион входных токенов и $60 за 1 миллион выходных токенов. В сравнении, GPT-4o предлагает более доступную цену в $5 за 1 миллион входных токенов и $15 за 1 миллион выходных токенов.
Горячие темы