Alibaba выпустила ИИ-генератор видео HappyHorse
HappyHorse-1.0 представляет собой модель на 40-слойном трансформере с 15 миллиардами параметров. В ней данные генерируются диффузионным методом и обрабатываются единым потоком, который включает текст, изображения, видео и звук. Для генерации 5-секундного клипа в разрешении 256p достаточно около 2 секунд на ускорителях Nvidia H100; 5-секундный ролик в 1080p — примерно 38 секунд.