«Сбер» научил свою нейросеть Kandinsky генерировать анимационные видео по текстовому описанию. О новых возможностях технологии рассказали в пресс-службе технологической компании.
«Сбер» научил нейросеть Kandinsky создавать анимацию по текстовому описанию
Пользователи Kandinsky 2.2 смогут получить анимационный ролик длительностью четыре секунды по текстовому описанию. Разрешение видео — 640×640 пикселей, частота кадров — 24 в секунду. Одна секунда видео генерируется в среднем 20 секунд.
Технически процесс устроен следующим образом: пользователь описывает словами то, что хочет увидеть в ролике, после чего бот предлагает на выбор 16 вариантов анимации сцены. Также доступна генерация составных сцен. То есть можно задать до трех текстовых описаний и указать разные механики анимации для каждого ролика. В этом случае бот сгенерирует «мини-фильм».
На начальном этапе функция будет доступна самым активным пользователям Kandinsky 2.2, они получат соответствующие приглашения и смогу протестировать новые возможности. Подать заявку на ознакомление с новым функционалом можно в Telegram-боте.
Ранее в «Сбере» заявили, что разработчики нейросети не должны нести ответственности за изображения, которые генерирует Kandinsky. Этому предшествовала претензия депутата о том, что изображения Kandinsky создают «негативный образ России».
Подписывайтесь на наш Telegram-канал, чтобы быть в курсе последних новостей и событий!