Alibaba представила «рассуждающую» модель Marco-o1

11:48 Блог сайта «Хайтек+»

Модель OpenAI o1 хорошо решала задачи со стандартными ответами в математике, физике и программировании. Этого удалось достичь благодаря применению техники «масштабирования во время вывода». Суть метода заключается в том, что модели предоставляется дополнительное «время на подумать» за счет увеличения количества вычислительных циклов во время генерации. Это позволяет ей выдавать более развернутые и обоснованные ответы, тщательно проверяя каждый шаг рассуждения. Однако многие реальные проблемы не имеют однозначных решений и требуют более гибкого подхода. Исследователи Alibaba стремились преодолеть эти ограничения и расширить возможности больших языковых моделей для решения сложных, нестандартных задач.

Marco-o1 — это усовершенствованная модель искусственного интеллекта на базе Alibaba Qwen2-7B-Instruct. В нее интегрированы современные методы машинного обучения — обучение с цепочкой рассуждений (CoT), поиск по дереву Монте-Карло (MCTS) и специальные алгоритмы для улучшения логического мышления. Модель тренировалась на специально разработанных наборах данных для задач, требующих глубокого анализа и рассуждений.

Marco-o1 применяет алгоритм поиска MCTS для генерации ответов, рассматривая множество потенциальных вариантов. Оценивая вероятность каждого исхода, модель строит «дерево» решений, изучая различные ветви. Это позволяет ей принимать более взвешенный и нюансированный выбор, особенно в неопределенных ситуациях.

Исследователи также разработали гибкую стратегию, которая позволяет им регулировать гранулярность шагов MCTS — определять количество токенов, генерируемых в каждом узле дерева. Это оптимизирует баланс между точностью и вычислительными затратами.

Marco-o1 оснащена механизмом самопроверки. В процессе рассуждения модель периодически останавливается и задает себе вопрос: «А правильно ли я мыслю? Не допустил ли я ошибку?». Это позволяет ИИ пересмотреть свои логические цепочки, выявить возможные недочеты и скорректировать ход мыслей. Как отмечают исследователи, такой подход делает модель похожей на внутреннего критика, который постоянно проверяет правильность своих рассуждений.

Для оценки Marco-o1 исследователи провели ряд экспериментов, в том числе на бенчмарке MGSM — наборе задач по математике начальной школы на нескольких языках. ИИ превзошел базовую модель Qwen2-7B, особенно при настройке компонента MCTS на точность одного токена. Однако основной целью создания ИИ-инструмента было решение задач, требующих глубокого осмысления в условиях неопределенности.

Для проверки этих возможностей Marco-o1 протестировали на переводе разговорных выражений и сленга, что требует понимания тонких нюансов языка, культуры и контекста. Модель справилась лучше традиционных систем перевода в этой области.

Например, она перевела китайское идиоматическое выражение на английский язык. В процессе рассуждений она оценивала различные варианты перевода и выбрала наиболее подходящий.

Команда Alibaba выпустила Marco-o1 на Hugging Face вместе с частичным набором данных, который исследователи могут использовать для тренировки собственных моделей рассуждений. После https://hightech.plus/2024/09/13/openai-predstavila-novuyu-m... o1 ИИ-компании соревнуются за создание «рассуждающих» моделей. Ранее китайская DeepSeek https://hightech.plus/2024/11/21/predstavlen-kitaiskii-analo... R1-Lite-Preview — аналог o1. Выпуск этих инструментов происходит на фоне неопределенности относительно перспектив масштабирования ИИ. Некоторые исследования показывают, что эффективность обучения моделей с увеличением их размера начинает снижаться и может достичь предела.

Alibaba в новостях

Alibaba представила «думающий» ИИ

Alibaba представила открытую ИИ-модель, которая лучше OpenAI

Alibaba выпускает «открытого» конкурента o1 OpenAI

«Я часто пересекалась с Юрой за кулисами»: Савичева рассказала, как спела песню Шатунова

Your League of Legends rank will reset less in 2025, and creepy XP-boosting flowers will now grow around your corpse thanks to the new theme coming in season 1

В Подмосковье росгвардейцы пришли на помощь пострадавшим в результате ДТП

Best Black Friday office chair and desk deals: November 28

Bloody - участник и технический партнер Red Expo-2024

В Москве научат бесплатно писать пером

Маск заявил о превосходстве книг Достоевского над литературой по психологии

Тихонов заявил, что предателем надо называть Чубайса, а не Исинбаеву

LG STYLER В ЦЕНТРЕ ВНИМАНИЯ НА ТАЙБЭЙСКОЙ НЕДЕЛЕ МОДЫ

Рэпер Джиган запустил производство своего безалкогольного пива

Николь Кидман с мужем намерены вернуться домой в Австралию после «худшего года жизни»

Тренера клуба МХЛ «Сибирские Снайперы» обвиняют в сексуальных домогательствах до игроков

Лучший теннисист России в четвёртом квартале 2024 — Карен Хачанов! Рейтинг «Чемпионата»

Шеф Пентагона Остин поговорил с главой МО Израиля Кацем

Как Горбачёв и его сторонники убирали Григория Романова

«Африканская инициатива»: вице-премьер России Новак посетит Мали

NASA отправляет зонд Europa Clipper для изучения ледяного океана Европы

Метро, развязки и трамваи: как транспортные мегапроекты изменят Петербург

Работники филиала «Северный» ООО «ЛокоТех-Сервис» стали победителями Первенства по теннису среди работников Сольвычегодского железнодорожного узла.

Новости тенниса

Теннисисты из Италии второй раз подряд выиграли Кубок Дэвиса

Концерт в честь 15-летия городского казачьего общества прошел в Мытищах

В Москве представят российский вездеход "Макс"

«Грузовичкоф» на передовой новых коллабораций с блогерами: выступление Наталии Поникаровской на конференции The Trends

Адвокат Сальникова: Блиновской до нового года приговор не вынесут

«Спартак» обратился в ЭСК РФС по двум эпизодам матча против «Ростова»

И.о. вице-премьера Башкирии Алан Марзаев не признал вину по делу о взятке

SHOT: в Москве задержали троих юношей, напавших на посольство Швеции

Осень провожаем, зиму встречаем! Афиша мероприятий на выходные в Москве

Рустэм Султанов представляет альбом «На осколках декабря»: smooth jazz в преддверии зимы

«Предчувствие Рождества»: органный вечер с Татьяной Андриановой в сердце Москвы

В Москве пройдет международная премия «The Women's Business Awards»

Даниил Медведев открыл собственный теннисный корт во Франции

Синнер: Защита титула — одно из лучших чувств

Теннисисты из Италии второй раз подряд выиграли Кубок Дэвиса

Зарина Дияс узнала хорошую новость от WTA

Суд обязал Водоканал Нижнего Тагила заплатить за нанесенный двум рекам ущерб

Гастрольный форс-мажор: Театр Дениса Матросова едва не остался без сценических костюмов

В Азербайджане стартует третий этап проекта «Русский язык: читаем, слушаем, смотрим в странах СНГ»

Неудачный обгон: на орловской трассе «BMW» сбил пешехода

Концертный Директор для Певцов, Музыкантов и Артистов.

Автор и исполнитель песен Павел КОЗЫРЕВ с душевными песнями на Радио Русский Шансон.

Концерт музыки ABBA и The Beatles в исполнении симфонического оркестра

Цискаридзе признался в своей слабости

Приметы и поверья на День апостола Матфея 29 ноября 2024 года

Москва сохранила лидерство среди городов России по качеству жизни

Активистка из Ленинского округа победила в проекте «Лидеры Подмосковья»

Глава СК России поручил доложить по обстоятельствам нападения мужчины на людей в столице

Победы "Динамо" и "Белогорья": главные события чемпионата России по волейболу