ВСЕ новости СЕГОДНЯ
RSS.+ — история VIP в новостях News24 с календарным архивом. Все самые быстрые 24/7 новости в ежеминутном тематическом обновлении Life24 — на русском, и не только + Today24, а также тексты с озвучкой — в авторском разделе #123ru.net
Ria.city

Alibaba представила «рассуждающую» модель Marco-o1

Модель OpenAI o1 хорошо решала задачи со стандартными ответами в математике, физике и программировании. Этого удалось достичь благодаря применению техники «масштабирования во время вывода». Суть метода заключается в том, что модели предоставляется дополнительное «время на подумать» за счет увеличения количества вычислительных циклов во время генерации. Это позволяет ей выдавать более развернутые и обоснованные ответы, тщательно проверяя каждый шаг рассуждения. Однако многие реальные проблемы не имеют однозначных решений и требуют более гибкого подхода. Исследователи Alibaba стремились преодолеть эти ограничения и расширить возможности больших языковых моделей для решения сложных, нестандартных задач.

Marco-o1 — это усовершенствованная модель искусственного интеллекта на базе Alibaba Qwen2-7B-Instruct. В нее интегрированы современные методы машинного обучения — обучение с цепочкой рассуждений (CoT), поиск по дереву Монте-Карло (MCTS) и специальные алгоритмы для улучшения логического мышления. Модель тренировалась на специально разработанных наборах данных для задач, требующих глубокого анализа и рассуждений.

Marco-o1 применяет алгоритм поиска MCTS для генерации ответов, рассматривая множество потенциальных вариантов. Оценивая вероятность каждого исхода, модель строит «дерево» решений, изучая различные ветви. Это позволяет ей принимать более взвешенный и нюансированный выбор, особенно в неопределенных ситуациях.

Исследователи также разработали гибкую стратегию, которая позволяет им регулировать гранулярность шагов MCTS — определять количество токенов, генерируемых в каждом узле дерева. Это оптимизирует баланс между точностью и вычислительными затратами.

Marco-o1 оснащена механизмом самопроверки. В процессе рассуждения модель периодически останавливается и задает себе вопрос: «А правильно ли я мыслю? Не допустил ли я ошибку?». Это позволяет ИИ пересмотреть свои логические цепочки, выявить возможные недочеты и скорректировать ход мыслей. Как отмечают исследователи, такой подход делает модель похожей на внутреннего критика, который постоянно проверяет правильность своих рассуждений.

Для оценки Marco-o1 исследователи провели ряд экспериментов, в том числе на бенчмарке MGSM — наборе задач по математике начальной школы на нескольких языках. ИИ превзошел базовую модель Qwen2-7B, особенно при настройке компонента MCTS на точность одного токена. Однако основной целью создания ИИ-инструмента было решение задач, требующих глубокого осмысления в условиях неопределенности.

Для проверки этих возможностей Marco-o1 протестировали на переводе разговорных выражений и сленга, что требует понимания тонких нюансов языка, культуры и контекста. Модель справилась лучше традиционных систем перевода в этой области.

Например, она перевела китайское идиоматическое выражение на английский язык. В процессе рассуждений она оценивала различные варианты перевода и выбрала наиболее подходящий.

Команда Alibaba выпустила Marco-o1 на Hugging Face вместе с частичным набором данных, который исследователи могут использовать для тренировки собственных моделей рассуждений. После https://hightech.plus/2024/09/13/openai-predstavila-novuyu-m... o1 ИИ-компании соревнуются за создание «рассуждающих» моделей. Ранее китайская DeepSeek https://hightech.plus/2024/11/21/predstavlen-kitaiskii-analo... R1-Lite-Preview — аналог o1. Выпуск этих инструментов происходит на фоне неопределенности относительно перспектив масштабирования ИИ. Некоторые исследования показывают, что эффективность обучения моделей с увеличением их размера начинает снижаться и может достичь предела.



Все новости по теме на сегодня

Alibaba в новостях



Музыкальные новости
Юлия Савичева

«Я часто пересекалась с Юрой за кулисами»: Савичева рассказала, как спела песню Шатунова



Все новости 24/7

Game News

Your League of Legends rank will reset less in 2025, and creepy XP-boosting flowers will now grow around your corpse thanks to the new theme coming in season 1


Новости 24 часа

В Подмосковье росгвардейцы пришли на помощь пострадавшим в результате ДТП


News Every Day

Best Black Friday office chair and desk deals: November 28



Интернет

Bloody - участник и технический партнер Red Expo-2024


Мир

В Москве научат бесплатно писать пером

Бизнес

Весь бизнес

Культура

Спорт

Политика

Общество

Авторы

Новости тенниса

Кубок Дэвиса

Теннисисты из Италии второй раз подряд выиграли Кубок Дэвиса



Rss.Plus — реально независимые новости по темам (энциклопедический систематизированный навигатор "Википедия новостей 24/7" c ежеминутным тематическим мониторингом интернет-пространства) в форме аполитичного просветительского интернет-журнала на русском языке, без цензуры, на многоязычной международной веб-платформе 103news.com в содружестве с более чем 20 000 источников информации во всём мире, сайтом News-Life.pro, глобальными гео-проектами Ria.City и Moscow.Media под патронажем Russia24.pro с уникальным персонифицированным новостным разделом "Региональная власть РФ" без купюр и модерации, а также "VIP-скандалы" в двух цветовых вариантах "День - Ночь" (кнопка справа вверху). Эти новости увидят Ваши внуки (наша система обеспечивает вечное хранение опубликованной информации 24/7). Будьте честными сегодня, чтобы было не стыдно завтра.

Опубликовать свою новость в любом городе и регионе, а также на любом языке мира можно мгновенно — здесь


Ria.city

Концерт в честь 15-летия городского казачьего общества прошел в Мытищах

В Москве представят российский вездеход "Макс"

«Грузовичкоф» на передовой новых коллабораций с блогерами: выступление Наталии Поникаровской на конференции The Trends

Филиал № 4 ОСФР по Москве и Московской области информирует: Отделение СФР по Москве и Московской области оплатило свыше 243 тысяч дополнительных выходных дней по уходу за детьми с инвалидностью

Новости России

Адвокат Сальникова: Блиновской до нового года приговор не вынесут

«Спартак» обратился в ЭСК РФС по двум эпизодам матча против «Ростова»

И.о. вице-премьера Башкирии Алан Марзаев не признал вину по делу о взятке

SHOT: в Москве задержали троих юношей, напавших на посольство Швеции

Экология в России и мире

Осень провожаем, зиму встречаем! Афиша мероприятий на выходные в Москве

Рустэм Султанов представляет альбом «На осколках декабря»: smooth jazz в преддверии зимы

«Предчувствие Рождества»: органный вечер с Татьяной Андриановой в сердце Москвы

В Москве пройдет международная премия «The Women's Business Awards»

Спорт в России и мире

Даниил Медведев открыл собственный теннисный корт во Франции

Синнер: Защита титула — одно из лучших чувств

Теннисисты из Италии второй раз подряд выиграли Кубок Дэвиса

Зарина Дияс узнала хорошую новость от WTA

Moscow.media

Суд обязал Водоканал Нижнего Тагила заплатить за нанесенный двум рекам ущерб

Гастрольный форс-мажор: Театр Дениса Матросова едва не остался без сценических костюмов

В Азербайджане стартует третий этап проекта «Русский язык: читаем, слушаем, смотрим в странах СНГ»

Неудачный обгон: на орловской трассе «BMW» сбил пешехода

Новости Крыма на Sevpoisk.ru

Концертный Директор для Певцов, Музыкантов и Артистов.

Автор и исполнитель песен Павел КОЗЫРЕВ с душевными песнями на Радио Русский Шансон.

Концерт музыки ABBA и The Beatles в исполнении симфонического оркестра

Цискаридзе признался в своей слабости

Губернаторы России

Приметы и поверья на День апостола Матфея 29 ноября 2024 года

Москва сохранила лидерство среди городов России по качеству жизни

Активистка из Ленинского округа победила в проекте «Лидеры Подмосковья»

Глава СК России поручил доложить по обстоятельствам нападения мужчины на людей в столице


Все города России от А до Я

Персональные новости
Динамо

Победы "Динамо" и "Белогорья": главные события чемпионата России по волейболу


BigPot.News — быстрые и самые свежие тематические новости об известных личностях в России, в Украине, в Беларусии, в Казахстане и за их пределами в календарном формате 24/7 на основе авторской технологичной информационно-поисковой системы Smi24.net с элементами искусственного интеллекта, гео-отбора и возможностью мгновенной публикации авторского контента в категориях News и Life в режиме Free Public



Больше новостей СЕГОДНЯ


RSS.plus — СРОЧНЫЕ новости. Неоспоримое преимущество RSS.plus — максимальная скорость публикаций 24/7. Быстрее нас, СЕЙЧАС, лишь только — ВЕТЕР Сайт создан под патронажем Россия24.pro — непрерывные новости из регионов 24/7 на русском + новости Москвы от Moscow.Media и мировые новости от Smi24.net и партнёров в календарном формате (вчера, сегодня и сейчас) совместно с 123ru.net и платформой СМИ24.net по технологии 103 NEWS

Опубликовать свою новость в любом городе и регионе, а также на любом языке мира можно мгновенно — здесь







Rss.plus