
Google представила новую нейросеть для создания видео — Gemini Omni. Модель умеет генерировать ролики по тексту, картинкам, рисункам и даже уже готовым видео. Kursiv LifeStyle рассказывает, почему Omni называют одним из самых амбициозных ИИ-проектов Google.
Пока пользователям доступна первая, облегченная версия под названием Gemini Omni Flash.
Главная фишка Gemini Omni — возможность редактировать видео обычными фразами. Пользователю не нужно разбираться в сложных программах для монтажа. Достаточно написать запрос вроде «добавь дождь», «измени фон» или «пусть герой побежит». Нейросеть сама внесет изменения и сохранит сцену цельной.
Как утверждают в компании, нейросеть знает, как работает гравитация, вода и движение объектов. Поэтому видео выглядят реалистично, а не как странный цифровой сон.
Еще одна особенность — модель «помнит» предыдущие изменения. Если пользователь несколько раз редактирует ролик, персонажи и объекты не будут случайно меняться или исчезать.
Модель Gemini Omni Flash уже начинает появляться в приложении Gemini, сервисе Google Flow и у авторов контента в YouTube Shorts.
В Google говорят, что в будущем Omni сможет работать не только с видео, но и с изображениями и аудио.
Ранее Kursiv LifeStyle писал о том, что Google представила новую линейку ноутбуков Googlebook. Компания называет их следующим этапом после Chromebook и делает ставку на глубокую интеграцию искусственного интеллекта Gemini.