Нейросеть ЯЛМ 100Б от Яндекса выложена в открытый доступ. Сейчас это самая большая модель нейросети GPT на сегодняшний день, которая доступна абсолютно каждому. Он предназначен для генерации и обработки текстов на русском и английском языках. Об этом ресурсу Хабр рассказали представители компании, которые считают, что такая инициатива даст толчок развитию генеративных нейронных сетей.
YaLM 100B содержит 100 миллиардов параметров. Это больше, чем у любой другой существующей GPT-нейросети для обработки русского языка, что позволяет выполнять практически любые задачи. Например, она может сочинить стихи, придумать рекламный слоган или описание товара для интернет-магазина и так далее. В то же время данная модель способна классифицировать тексты по стилю речи. Яндекс использует свою нейросеть более чем в 20 проектах. YaLM 100B используется в поисковой системе и голосовом помощнике Алиса, а также для формирования рекламы и быстрых ответов на странице поиска. Кроме того, нейросеть помогает сотрудникам Яндекса реагировать на запросы клиентов.
ЯЛМ 100Б обучался на суперкомпьютерах Яндекс. Обработала 2 ТБ текстов из интернета и открытых наборов данных на русском и английском языках. Проект можно найти на GitHub.