
Alibaba Group Holding выпустила открытую нейросетевую модель QwQ-32B. Эта модель демонстрирует улучшенные возможности рассуждения и, по заявлениям разработчиков, превосходит DeepSeek R1 по производительности при меньшем потреблении ресурсов. Анонс стал причиной 7,5%-ного взлета акций Alibaba на Гонконгской бирже — самого значительного внутридневного роста за последние две недели.
Несмотря на значительно меньшее количество параметров (32 млрд против 671 млрд у DeepSeek R1 и 100 млрд у OpenAI o1-mini), новая ИИ-модель Alibaba, QwQ-32B, демонстрирует превосходство в математических вычислениях, программировании и ответе на общие вопросы. Это достигнуто благодаря применению обучения с подкреплением, технологии, аналогичной использованной в DeepSeek R1. Уменьшенное количество параметров обеспечивает более эффективное использование вычислительных ресурсов, что способствует более широкому распространению модели. Модель QwQ-32B теперь доступна на Hugging Face.
Alibaba анонсировала беспрецедентные инвестиции в размере более 380 млрд юаней (52 млрд долларов США) в развитие облачных технологий и инфраструктуры искусственного интеллекта в течение ближайших трёх лет. Это крупнейшее в истории Китая частное вложение в сферу ИИ.

Горячие темы