Сбер публикует крупнейший набор открытых ИИ-моделей от российской компании
Сбер делает публично доступными веса и исходный код нескольких крупных моделей — чтобы организации и разработчики могли использовать и дообучать их для своих задач. Релиз охватывает языковые, речевые, визуальные и ускоряющие компоненты. Что открыли:
GigaChat Ultra Preview — модель для решения русскоязычных задач: бизнес-приложения, аналитика, разработка и дообучение на собственных данных. MoE-архитектура, 702 миллиарда параметров всего и 36 миллиардов активных.
GitHub и HuggingFace
GigaChat Lightning — лёгкая и быстрая модель, оптимизированная для задач с ограниченными ресурсами. Тоже MoE: 10 всего и 1,8 миллиарда активных. Контекст — 256к токенов
GitHub и Hugging Face
GigaAM-v3 — набор из пяти моделей распознавания речи с поддержкой пунктуации, работы с акцентами и спонтанной речи. Подходит для голосовых ассистентов, контакт-центров и аналитики звонков.
GitHub и Hugging Face
Kandinsky 5.0 — генерация изображений и коротких видео по тексту. Image Lite (HD-изображения, поддержка русского языка), Video Pro (HD-видео до 10 секунд), Video Lite (версия для домашних видеокарт от 12 ГБ).
GitHub и Hugging Face, техрепорт
K-VAE 1.0 — модель для сжатия представлений, чтобы ускорить работу с изображениями.
GitHub и Hugging Face
Код и веса опубликованы под лицензией MIT, а значит, их можно использовать везде, включая коммерческие проекты.
























