«Яндекс» опубликовал нейросеть YaLM 100B — она генерирует и обрабатывает тексты на русском и английском языках. В компании уверяют, что это самая большая GPT-подобная модель, выложенная в свободном доступе.
YaLM 100В содержит 100 млрд параметров.
«Яндекс» выложил в открытый доступ нейросеть для генерации текстов на русском и английском
Языковые модели семейства YaLM определяют принцип построения текста и генерируют новые, основываясь на законах лингвистики и своих знания о мире. Они способны придумывать идеи для рекламных кампаний, описать товары и видео, генерировать стихи, ответы, поздравления и другое, а также классифицировать их.
«Выкладывая YaLM 100B в открытый доступ, мы рассчитываем, что это даст толчок развитию генеративных нейросетей», — сообщил гендиректор «Яндекс.Технологий» Петр Попов, слова которого приводятся в сообщении компании.
Модель была обучена на суперкомпьютерах «Яндекса», в процессе YaLM 100B обработала около 2 ТБ текстов из открытых датасетов и интернета на английском и русском языках.
Модель предоставляется по открытой лицензии Apache 2.0, доступна на GitHub.
Фото на обложке: Unsplash
Подписывайтесь на наш Telegram-канал, чтобы быть в курсе последних новостей и событий!