Яндекс показал прототип собственной нейросети для генерации картинок по текстовым запросам пользователей. Увидеть, какие изображения она создает на основе описаний, можно в бета-версии 0.1.4 приложения Шедеврум на Android и iOS.
Шедеврум понимает русский и английский языки и очень любит конкретику. Чем подробнее описание, тем точнее результат. Нейросеть учитывает особые пожелания (например, «фотореализм» или «высокая детализация»), способна подражать известным живописцам и работать в заданных художественных стилях.
Кот с рюкзаком на спине идет по заброшенному городу
Нейросеть Шедеврума формирует изображения по методу каскадной диффузии: сначала создает картинки в соответствии с запросом, а затем поэтапно увеличивает их разрешение, насыщая деталями. Первую версию генеративной модели для бета-теста разработчики обучили на 240 миллионах примеров картинок с текстовыми описаниями. Обучение продолжается на наборе данных из 500 миллионов примеров — в следующих обновлениях качество будет поэтапно улучшаться.
Алексей Гусаков, руководитель управления машинного интеллекта и исследований Яндекса:
«Мы пока в самом начале пути. В основе Шедеврума прототип нейросети, которой предстоит многому научиться. К моменту финального релиза она сможет генерировать баннеры, иллюстрации, создавать изображения для интернет-витрин и не только. Бета-тест приложения для пользователей — это новый опыт и немного хорошего настроения, для нас — возможность чуть лучше понять, в каком направлении развивать нейросеть дальше».
Для просмотра готовых изображений достаточно скачать Шедеврум. Понравившиеся изображения можно лайкать в общей ленте. Самые популярные из них попадают в топ лучших на отдельной вкладке. Чтобы генерировать картинки по собственным запросам, нужно оставить заявку и дождаться ее подтверждения. В будущем такую возможность получат все зарегистрированные пользователи.