Команда разработчиков проекта сообщила, что востребованные модели для генерации действуют медленно и недостаточно хорошо улавливают свои задачи. Это одна из причин, по которой их до сих пор не применяют широко в рамках реальных проектов. Tencent решила эту проблему, разбив процесс создания 3D-моделей на несколько этапов.
-
-
Модели нового поколения способны рассуждать (поддерживать функцию chain-of-thought). Прежде чем ответить на сложный вопрос, они разбивают задачу на более простые и решают их пошагово, выстраивая цепочку рассуждений.
24 октября, 2024 - 17:308620 -
Нейронная сеть способна создавать 10-секундные видеоролики с разрешением 768p и частотой кадров 24 FPS.
14 октября, 2024 - 11:167380 -
Компании Alibaba представила мультимодальную модель машинного обучения mPLUG-Owl3, предназначенную для анализа текста, изображений и видео.
23 августа, 2024 - 22:2710160 -
Нейросеть поможет врачам обнаружить при УЗИ-исследовании беременных женщин симптомы spina bifida — тяжелого врожденного заболевания центральной нервной системы у детей.
19 августа, 2024 - 11:198570 -
Это может быть полезно кинокомпаниям, музеям, историкам и другим специалистам для улучшения качества значимых видео и работы с историческим наследием.
2 августа, 2024 - 11:307120 -
Dream Machine обучалась непосредственно на видео, что позволяет ей генерировать физически точные, последовательные и насыщенные действиями сцены.
14 июня, 2024 - 13:2211290 -
ChatGPT Edu, основанный на GPT-4o, может анализировать текст и изображения, а также использовать расширенные инструменты, такие как анализ данных.
31 мая, 2024 - 13:3010260 -
Модель умеет генерировать 6-секундный видеоряд с частотой 8 и 32 кадра в секунду.
29 мая, 2024 - 15:209060 -
YandexART 1.3. перешла на новую технологию для генерации изображений — латентную диффузию.
24 апреля, 2024 - 17:3010600