Архив рубрики ~Лента новостей~

Чипы Nvidia и AMD больше не обязательны: для обучения DeepSeek V4 использовались чипы Huawei Ascend

Чипы Nvidia и AMD больше не обязательны: для обучения DeepSeek V4 использовались чипы Huawei Ascend

В DeepSeek V4 для выполнения задач искусственного интеллекта используются чипы Huawei, но в последнем исследовании компания применила процессоры Ascend для завершения постобучения модели V4 Pro. Это еще один прорыв в китайской индустрии чипсетов для ИИ.

Китайские производители микросхем успешно поддерживают вывод данных с помощью ИИ, но они сталкиваются с трудностями в обучении моделей ИИ, что является гораздо более сложной задачей. Исследовательская группа использовала чипы Huawei для постобучения модели искусственного интеллекта DeepSeek V4 Pro. В реализации этого проекта совместно участвовали Huawei и такие институты, как Shenzhen Loop Area, Shenzhen Campus of Harbin Institute of Technology и Shenzhen Institute of Big Data.

Группа исследователей использовала вычислительный кластер, работающий на базе около 1000 чипов Huawei Ascend 910C, для проведения постобучения модели DeepSeek V4 Pro. Это было полнопараметрическое обучение, в ходе которого модель была полностью обновлена без каких-либо изменений в структуре.

Изображение Grok

Вывод результатов и постобучение — это два разных сегмента LLM в области искусственного интеллекта. Первый представляет собой простой метод запуска «уже готовой» модели для ответа на запросы пользователя, а второй посвящен тому, как заставить модель ИИ работать с командами человека. Предварительное обучение — это процесс обучения модели ИИ речи путем обработки огромных объемов данных. В то время как последующее обучение относится к работе модели ИИ с инструкциями человека, правилами безопасности и другими операциями. Последние шаги в этом направлении помогут повысить самодостаточность китайской индустрии искусственного интеллекта.

До Huawei обучение по программе AI LLM проводилось на чипсетах Nvidia или Advanced Micro Devices (AMD). Например, обучение DeepSeek V3 проходило на вычислительном кластере, состоящем из 2048 чипов Nvidia H800 (в настоящее время доступ к нему ограничен).

Ранее сообщалось, что китайский ИИ-стартап DeepSeek готовится к крупному раунду финансирования, в рамках которого планирует привлечь около 50 млрд юаней (примерно 7,4 млрд долларов). DeepSeek — это китайская компания и семейство мощных больших языковых моделей (LLM) с открытым исходным кодом, специализирующаяся на искусственном интеллекте (ИИ), выступающая конкурентом ChatGPT и других популярных моделей, при этом отличаясь меньшими затратами на обучение. Она генерирует текст, пишет код, решает логические задачи, а также способна генерировать изображения.

Телеграм: t.me/ainewsline

Источник: www.ixbt.com

Источник: ai-news.ru

Оцените материал:

Читайте также
Архив рубрики ~Обо всем~ Я годами тестировал солнечную энергию у себя дома — 12 мифов, в которые не стоит верить в 2026 году Архив рубрики ~Обо всем~ Я позволяю Siri видеть мою жизнь на Vision Pro, и это предзнаменование грядущих событий. Архив рубрики ~Обо всем~ Новая электронная книга Boox Go 6 поддерживает использование стилуса для ведения заметок. Новости робототехники Вера в немецких роботов вышла за пределы ЕС Архив рубрики ~Коротко из Telegram~ Математики объявили войну ИИ-хайпу Более 150 ведущих мировых математиков опубликовали… Архив рубрики ~Коротко из Telegram~ Siri переезжает в Spotlight и получает доступ к файлам Apple… Архив рубрики ~Коротко из Telegram~ Скилл, который отучает ИИ делать одинаковые сайты Для агентного фронтенда… Архив рубрики ~Коротко из Telegram~ Собираем себе ИИ-офис из агентов Появился Agent Teams — инструмент,… Архив рубрики ~Коротко из Telegram~ Siri стала Siri AI — теперь это не просто ассистент,… Архив рубрики ~Коротко из Telegram~ ХАЛЯВА ОТ NVIDIA: они раздают доступ к 95 бесплатным API… Архив рубрики ~Коротко из Telegram~ Запускаем 500 ИИ-агентов бесплатно — платформа Stack AI раздала щедрый… Архив рубрики ~Коротко из Telegram~ Генерим фотки и видео БЕСПЛАТНО — умельцы выкатили полностью халявный… Архив рубрики ~Обо всем~ Конфиденциальная подача проекта формы S-1 в Комиссию по ценным бумагам и биржам США | OpenAI Архив рубрики ~Коротко из Telegram~ Компания Google представила Gemini 3.5 Live Translate — модель для… Архив рубрики ~Обо всем~ Я годами тестировал солнечную энергию у себя дома — 12 мифов, в которые не стоит верить в 2026 году Архив рубрики ~Обо всем~ Я позволяю Siri видеть мою жизнь на Vision Pro, и это предзнаменование грядущих событий. Архив рубрики ~Обо всем~ Новая электронная книга Boox Go 6 поддерживает использование стилуса для ведения заметок. Новости робототехники Вера в немецких роботов вышла за пределы ЕС Архив рубрики ~Коротко из Telegram~ Математики объявили войну ИИ-хайпу Более 150 ведущих мировых математиков опубликовали… Архив рубрики ~Коротко из Telegram~ Siri переезжает в Spotlight и получает доступ к файлам Apple… Архив рубрики ~Коротко из Telegram~ Скилл, который отучает ИИ делать одинаковые сайты Для агентного фронтенда… Архив рубрики ~Коротко из Telegram~ Собираем себе ИИ-офис из агентов Появился Agent Teams — инструмент,… Архив рубрики ~Коротко из Telegram~ Siri стала Siri AI — теперь это не просто ассистент,… Архив рубрики ~Коротко из Telegram~ ХАЛЯВА ОТ NVIDIA: они раздают доступ к 95 бесплатным API… Архив рубрики ~Коротко из Telegram~ Запускаем 500 ИИ-агентов бесплатно — платформа Stack AI раздала щедрый… Архив рубрики ~Коротко из Telegram~ Генерим фотки и видео БЕСПЛАТНО — умельцы выкатили полностью халявный… Архив рубрики ~Обо всем~ Конфиденциальная подача проекта формы S-1 в Комиссию по ценным бумагам и биржам США | OpenAI Архив рубрики ~Коротко из Telegram~ Компания Google представила Gemini 3.5 Live Translate — модель для…

Оставить комментарий