Добавить новость
ВСЕ новости СЕГОДНЯ
RSS.+ — история VIP в новостях News24 с календарным архивом. Все самые быстрые 24/7 новости в ежеминутном тематическом обновлении Life24 — на русском, и не только + Today24, а также тексты с озвучкой — в авторском разделе #123ru.net
Ria.city

Новые релизы Google: ИИ-модели для озвучки текста, роботов и Gemini на macOS

ForkLog
7

Корпорация Google выпустила Gemini 3.1 Flash TTS — обновленную модель синтеза речи на базе поколения Gemini 3. Она отличается улучшенным качеством звука, выразительностью и более точным управлением, а также поддерживает более 70 языков.

Нейросеть позволяет разработчикам, компаниям и рядовым пользователям создавать приложения с голосовым ИИ-интерфейсом.

 Gemini 3.1 Flash TTS уже доступна:

  • для разработчиков — в режиме предварительного доступа через Gemini API и Google AI Studio;
  • для предприятий — в Vertex AI;
  • для пользователей Workspace — через сервис Google Vids.

Улучшенное качество речи и управляемость

Модель набрала 1211 баллов в рейтинге Artificial Analysis TTS. Этот показатель сформирован на основе предпочтений тысяч респондентов, принимавших участие в слепом тестировании качества аудио.

Источник: Google.

Компания Artificial Analysis отнесла модель к группе наиболее привлекательных решений благодаря сочетанию высококачественного синтеза речи и низкой стоимости.

LLM выделяется способностью генерировать естественные диалоги с участием нескольких спикеров.

Новые аудио-теги

В версии 3.1 Flash TTS появились аудио-теги — инструмент для управления стилем, темпом и манерой речи.

«Первые разработчики и корпоративные тестировщики уже видят результаты работы 3.1 Flash TTS, отмечая ее впечатляющую управляемость и выразительность. Они рассказали нам, как аудио-теги обеспечивают новый уровень творческой точности, превращая простой текст в высококачественное голосовое исполнение», — говорится в блоге компании.

ИИ-модель для робототехники

Параллельно с Gemini 3.1 Flash TTS корпорация представила Gemini Robotics-ER 1.6. Эта ИИ-модель призвана обеспечить роботов возможностью выполнять сложные задачи в реальных условиях за счет улучшенных когнитивных функций и «воплощенного» мышления.

Нейросеть специализируется на пространственном восприятии, планировании действий и оценке их успешности. Она демонстрирует заметные улучшения по сравнению со своей предшественницей и Gemini 3.0 Flash при выполнении заданий, связанных с пространственным и физическим мышлением.

Gemini Robotics-ER 1.6 может интерпретировать данные со сложных измерительных приборов и наблюдать показатели через смотровые стекла. Эту возможность специалисты Google DeepMind разработали совместно с Boston Dynamics для нужд промышленного сектора.

«Такие возможности позволяют автономно видеть, понимать и реагировать на реальные вызовы», — прокомментировал вице-президент проекта Spot в Boston Dynamics Марко да Сильва.

В тестах на выявление угроз безопасности новинка превзошла Gemini 3.0 Flash на 6% в текстовых сценариях и на 10% при анализе видео.

Интеграция LLM в реальные рабочие процессы уже началось: Boston Dynamics интегрировала Gemini и Gemini Robotics-ER 1.6 в собственную платформу Orbit AIVI-Learning.

Gemini на macOS

Кроме того, Google выпустила нативное приложение Gemini для macOS. Оно доступно по нажатию Option + Пробел. Среди функционала — возможность поделиться окном для мгновенной передачи контекста.

Приложение поддерживает генерацию изображений с помощью Nano Banana, создание видео с Veo и другие привычные инструменты.

Напомним, в апреле Google представила Gemma 4 — новое семейство открытых ИИ-моделей для продвинутых рассуждений и агентных рабочих процессов.



Все новости по теме на сегодня

Google в новостях



Музыкальные новости


Все новости 24/7






Бизнес

Весь бизнес

Культура

Спорт

Политика

Общество

Авторы

Новости тенниса



Rss.Plus — реально независимые новости по темам (энциклопедический систематизированный навигатор "Википедия новостей 24/7" c ежеминутным тематическим мониторингом интернет-пространства) в форме аполитичного просветительского интернет-журнала на русском языке, без цензуры, на многоязычной международной веб-платформе 103news.com в содружестве с более чем 20 000 источников информации во всём мире, сайтом News-Life.pro, глобальными гео-проектами Ria.City и Moscow.Media под патронажем Russia24.pro с уникальным персонифицированным новостным разделом "Региональная власть РФ" без купюр и модерации, а также "VIP-скандалы" в двух цветовых вариантах "День - Ночь" (кнопка справа вверху). Эти новости увидят Ваши внуки (наша система обеспечивает вечное хранение опубликованной информации 24/7). Будьте честными сегодня, чтобы было не стыдно завтра.

Опубликовать свою новость в любом городе и регионе, а также на любом языке мира можно мгновенно — здесь


Ria.city
Новости России
Экология в России и мире
Спорт в России и мире
Moscow.media
Новости Крыма на Sevpoisk.ru
Губернаторы России

Все города России от А до Я

Персональные новости

BigPot.News — быстрые и самые свежие тематические новости об известных личностях в России, в Украине, в Беларусии, в Казахстане и за их пределами в календарном формате 24/7 на основе авторской технологичной информационно-поисковой системы Smi24.net с элементами искусственного интеллекта, гео-отбора и возможностью мгновенной публикации авторского контента в категориях News и Life в режиме Free Public



Больше новостей СЕГОДНЯ


RSS.plus — СРОЧНЫЕ новости. Неоспоримое преимущество RSS.plus — максимальная скорость публикаций 24/7. Быстрее нас, СЕЙЧАС, лишь только — ВЕТЕР Сайт создан под патронажем Россия24.pro — непрерывные новости из регионов 24/7 на русском + новости Москвы от Moscow.Media и мировые новости от Smi24.net и партнёров в календарном формате (вчера, сегодня и сейчас) совместно с 123ru.net и платформой СМИ24.net по технологии 103 NEWS

Опубликовать свою новость в любом городе и регионе, а также на любом языке мира можно мгновенно — здесь







Rss.plus