GFusion: как мы обучали диффузионную LLM в GigaChat
Салют, Хабр!
Хочу поделиться проектом, которым я занимался во время стажировки в команде GigaChat Pretrain. В течение нескольких месяцев мы исследовали диффузионные языковые модели (dLLM) — относительно новое направление в LLM, в котором многие идеи только начинают проверяться на практике.
Главной целью было не тратить огромное количество ресурсов на обучение с нуля, а взять базовую авторегрессионную модель GigaChat3-10B-A1.8B-base и перевести её в диффузионный режим. Так появились наши экспериментальные GFusion-10B-A1.8B-base и GFusion-10B-A1.8B!
Читать далее
Источник: habr.com
❌ Нет похожих статей с такими тегами
Оцените материал:
Поделиться
Понравилась статья? Расскажите другим
Архив рубрики ~Полезное~
Собрали ультимативный архив бесплатных GitHub-проектов — сразу 100 репозиториев под…
Архив рубрики ~Полезное~
Китайцы представили GLM 5.2 — новую ИИ-модель, которую уже сравнивают…
Архив рубрики ~Полезное~
Разбил экран на телефоне — теперь можно не переживать и…
Архив рубрики ~Коротко из Telegram~
Metacritic назвал 10 лучших игр первой половины 2026 года —…
Архив рубрики ~Коротко из Telegram~
ИИ-браузеры легко могут слить все ваши данные. Исследователи нашли атаку…
Архив рубрики ~Полезное~
🔥 Google раздаёт 1️⃣ МИЛЛИОН токенов для Gemini бесплатно —…
Архив рубрики ~Коротко из Telegram~
Opus 4.8 превращают в Fable 5 одним промптом — вайбкодеры…
Архив рубрики ~Коротко из Telegram~
Компании начали намеренно заставлять свои инструменты искусственного интеллекта общаться в…
Архив рубрики ~Обо всем~
Большой адронный коллайдер остановили на четыре года для модернизации. Ученые планируют поднять светимость в десять раз
Архив рубрики ~Коротко из Telegram~
🔥 API для генерации речи раздают бесплатно — Fish Audio…
Архив рубрики ~Коротко из Telegram~
✨ В 2015 году OpenAI была всего лишь небольшим проектом,…
Архив рубрики ~Коротко из Telegram~
📁 Пока все обсуждают, насколько хорошо ИИ пишет код, разработчики…
Архив рубрики ~Коротко из Telegram~
‼️ Пока большинство моделей просто генерируют текст, Alibaba делает ставку…
Архив рубрики ~Коротко из Telegram~
Автоконцерн Nissan сообщил об утечке данных нынешних и бывших сотрудников…
Архив рубрики ~Полезное~
Собрали ультимативный архив бесплатных GitHub-проектов — сразу 100 репозиториев под…
Архив рубрики ~Полезное~
Китайцы представили GLM 5.2 — новую ИИ-модель, которую уже сравнивают…
Архив рубрики ~Полезное~
Разбил экран на телефоне — теперь можно не переживать и…
Архив рубрики ~Коротко из Telegram~
Metacritic назвал 10 лучших игр первой половины 2026 года —…
Архив рубрики ~Коротко из Telegram~
ИИ-браузеры легко могут слить все ваши данные. Исследователи нашли атаку…
Архив рубрики ~Полезное~
🔥 Google раздаёт 1️⃣ МИЛЛИОН токенов для Gemini бесплатно —…
Архив рубрики ~Коротко из Telegram~
Opus 4.8 превращают в Fable 5 одним промптом — вайбкодеры…
Архив рубрики ~Коротко из Telegram~
Компании начали намеренно заставлять свои инструменты искусственного интеллекта общаться в…
Архив рубрики ~Обо всем~
Большой адронный коллайдер остановили на четыре года для модернизации. Ученые планируют поднять светимость в десять раз
Архив рубрики ~Коротко из Telegram~
🔥 API для генерации речи раздают бесплатно — Fish Audio…
Архив рубрики ~Коротко из Telegram~
✨ В 2015 году OpenAI была всего лишь небольшим проектом,…
Архив рубрики ~Коротко из Telegram~
📁 Пока все обсуждают, насколько хорошо ИИ пишет код, разработчики…
Архив рубрики ~Коротко из Telegram~
‼️ Пока большинство моделей просто генерируют текст, Alibaba делает ставку…
Архив рубрики ~Коротко из Telegram~
Автоконцерн Nissan сообщил об утечке данных нынешних и бывших сотрудников…
Похожие записи
Архив рубрики ~Лента новостей~
Бывший менеджер по продуктам Tesla хочет сделать подделку предметов роскоши невозможной, начиная с микросхемы.
11.02.2026
Архив рубрики ~Лента новостей~
Учёные создали ИИ, способный распознавать болезни задолго до симптомов
10.10.2025
Архив рубрики ~Лента новостей~
Зарядка от Steam Controller и металлический ремешок от Pixel Watch 3 чуть не устроили пожар
24.05.2026Присоединяйтесь и подпишитесь на рассылку самых свежих новостей по Email
Получайте свежие новости и идеи на почту. Без спама — только самое интересное.
Нажимая «Подписаться», вы соглашаетесь с политикой конфиденциальности.
