Добавить новость
ВСЕ новости СЕГОДНЯ
RSS.+ — история VIP в новостях News24 с календарным архивом. Все самые быстрые 24/7 новости в ежеминутном тематическом обновлении Life24 — на русском, и не только + Today24, а также тексты с озвучкой — в авторском разделе #123ru.net
Ria.city

Alibaba открыла Qwen3-TTS: клонирование голоса за 3 секунды и синтез речи в реальном времени

В открытый релиз вошли три ветки: Base (базовая модель для качественного TTS и быстрого клонирования), CustomVoice (управляемая озвучка со «стилевыми» профилями) и VoiceDesign — самый показательный компонент линейки, позволяющий задавать параметры будущего голоса естественным языком: от тембра и манеры речи до эмоционального рисунка и просодики. В практическом смысле это попытка увести настройку синтеза из мира акустических «ручек» и тонкой инженерной подгонки — в привычные промпты, понятные продюсерам, редакторам и разработчикам.

Технически Qwen3-TTS опирается на подходы нового поколения, которые в последние два года активно вытесняют «классические» TTS-конвейеры. В техническом отчёте команда описывает «двухтрековую» архитектуру, рассчитанную на разные сценарии — от максимального качества до реального времени, — и сразу два семейства токенизаторов речи.

В публичный набор, судя по репозиторию и моделям на Hugging Face, вынесен прежде всего 12 Hz-токенизатор (в обозначениях релиза — Tokenizer-12Hz): он сжимает речь до крайне низкого битрейта и позволяет системе отдавать «первый пакет» звука практически мгновенно, что и даёт заявленную задержку в десятки миллисекунд.

Наиболее чувствительная для рынка функция — клонирование голоса за считанные секунды. В отчёте говорится о «3-секундном voice cloning», а независимые разработчики уже демонстрируют работу механизма через публичное демо на Hugging Face: пользователь записывает короткий референс и получает озвучку другого текста «в своём» тембре. Это та самая грань, за которой технология перестаёт быть экзотикой студий и превращается в повседневный инструмент — достаточно видеокарты с несколькими гигабайтами видеопамяти или даже браузера, если вычисления берёт на себя внешний сервис.

Отдельный практический маркер зрелости — лицензирование. Alibaba публикует модели и токенизаторы под Apache-2.0, то есть одной из наиболее «дружественных» для коммерческого применения лицензий: её выбирают, когда хотят стимулировать внедрение в продукты и экосистемы партнёров. На стороне распространения видна ставка на привычную инфраструктуру open-source: GitHub-репозиторий и коллекция моделей на Hugging Face, где доступны варианты 0,6B и 1,7B, а также отдельные артефакты токенизатора.

Контекст для релиза — более широкая стратегия Alibaba, которая последние два года наращивает присутствие в ИИ как в корпоративных сервисах, так и в потребительских продуктах. Reuters фиксировал, что компания последовательно расширяет линейку Qwen и продвигает её как инфраструктурную платформу, а в январе 2026-го сообщал об обновлении приложения Qwen с упором на «прикладные» сценарии — от планирования до транзакций в экосистеме Alibaba.

Вывод TTS-семейства в открытый доступ здесь выглядит логичным: голос становится интерфейсом, а «собственная» речь — таким же активом, как текст и изображение.

Показательно, что параллельно компания сохраняет и коммерческий контур: в документации Alibaba Cloud Model Studio рекомендован сервис Qwen3-TTS-Flash с заявленными 49 голосами, поддержкой нескольких языков (включая русский) и тарификацией $0,10 за 10 000 символов при лимите ввода 600 символов за запрос в международном режиме. Это типичная для крупных вендоров двойная стратегия: открытые «веса» подталкивают сообщество к интеграциям и форкам, а облачный продукт остаётся удобным вариантом «под ключ» — с готовыми голосами, SLA и биллингом.

Но у демократизации есть обратная сторона. Массовое клонирование голоса усиливает и без того острые риски «аудио-дипфейков»: от мошеннических звонков «родственникам» до подделки публичных выступлений и компрометации брендов. Разница лишь в том, что теперь порог входа ещё ниже: если раньше требовались закрытые сервисы или сложная сборка исследовательских моделей, то теперь достаточно скачать несколько гигабайт и следовать README. И именно поэтому нынешний релиз можно считать не просто очередным обновлением «опенсорса», а сменой масштаба: голосовая генерация выходит из лабораторий в бытовую норму — наравне с текстом и картинками.



Все новости по теме на сегодня

Alibaba в новостях



Музыкальные новости


Все новости 24/7






Бизнес

Весь бизнес

Культура

Спорт

Политика

Общество

Авторы

Новости тенниса



Rss.Plus — реально независимые новости по темам (энциклопедический систематизированный навигатор "Википедия новостей 24/7" c ежеминутным тематическим мониторингом интернет-пространства) в форме аполитичного просветительского интернет-журнала на русском языке, без цензуры, на многоязычной международной веб-платформе 103news.com в содружестве с более чем 20 000 источников информации во всём мире, сайтом News-Life.pro, глобальными гео-проектами Ria.City и Moscow.Media под патронажем Russia24.pro с уникальным персонифицированным новостным разделом "Региональная власть РФ" без купюр и модерации, а также "VIP-скандалы" в двух цветовых вариантах "День - Ночь" (кнопка справа вверху). Эти новости увидят Ваши внуки (наша система обеспечивает вечное хранение опубликованной информации 24/7). Будьте честными сегодня, чтобы было не стыдно завтра.

Опубликовать свою новость в любом городе и регионе, а также на любом языке мира можно мгновенно — здесь


Ria.city
Новости России
Экология в России и мире
Спорт в России и мире
Moscow.media
Новости Крыма на Sevpoisk.ru
Губернаторы России

Все города России от А до Я

Персональные новости

BigPot.News — быстрые и самые свежие тематические новости об известных личностях в России, в Украине, в Беларусии, в Казахстане и за их пределами в календарном формате 24/7 на основе авторской технологичной информационно-поисковой системы Smi24.net с элементами искусственного интеллекта, гео-отбора и возможностью мгновенной публикации авторского контента в категориях News и Life в режиме Free Public



Больше новостей СЕГОДНЯ


RSS.plus — СРОЧНЫЕ новости. Неоспоримое преимущество RSS.plus — максимальная скорость публикаций 24/7. Быстрее нас, СЕЙЧАС, лишь только — ВЕТЕР Сайт создан под патронажем Россия24.pro — непрерывные новости из регионов 24/7 на русском + новости Москвы от Moscow.Media и мировые новости от Smi24.net и партнёров в календарном формате (вчера, сегодня и сейчас) совместно с 123ru.net и платформой СМИ24.net по технологии 103 NEWS

Опубликовать свою новость в любом городе и регионе, а также на любом языке мира можно мгновенно — здесь







Rss.plus