
Китайская компания ByteDance, владелец социальной сети TikTok, представила свою модель искусственного интеллекта (ИИ) под названием OmniHuman-1. Эта модель способна создавать видео с изображением людей на основе фотографий и аудиофайлов, как сообщают исследователи, работавшие над проектом.
«Мы предлагаем интегрированную платформу для генерации видео с участием людей, называемую OmniHuman. Она может создавать видео, используя одно изображение и различные сигналы движения (например, только аудио, только видео или их комбинацию)», - говорится в заявлении разработчиков ByteDance, опубликованном на платформе GitHub.
Уточняется, что данная модель ИИ способна генерировать крайне реалистичные видео с изображением людей, опираясь на минимальные входные данные. Она поддерживает различные визуальные и звуковые стили, может создавать видео с любыми пропорциями и соотношениями сторон, а также улучшает отображение жестов, что было проблемой для других аналогичных ИИ.
Разработчики также продемонстрировали примеры сгенерированных видео, в одном из которых «оживший» Эйнштейн в течение 23 секунд делится своими мыслями о науке.
На данный момент ByteDance официально не выпустила эту модель.
Ранее газета Financial Times, ссылаясь на источники, сообщила, что ByteDance планирует инвестировать более 12 миллиардов долларов в развитие инфраструктуры, связанной с ИИ, включая закупку ИИ-чипов.
В декабре 2024 года в отчете Китайского интернет-информационного центра (CNNIC) было указано, что число пользователей продуктов генеративного искусственного интеллекта в Китае достигло 230 миллионов человек.
Источник и фото - ria.ru