Закажи экспресс-аудит своего дела онлайн всего за 199 ₽
и получи рекомендации по улучшению - Жми сюда !

[Перевод] Масштабирование LLM: от одного чипа до ЦОДа. Глава 3. Сколько ресурсов нужно для LLM?

b34a3f3a9b917f5eddd00211251fa174

Это продолжение цикла статей о масштабировании тренировки и инференса LLM.

Предыдущая статья

А теперь перейдем к чему-то более практическому, а именно к тому, сколько нужно FLOPs и байт для работы трансформера. Подразумевается, что у вас уже есть представление о том, что такое архитектура трансформера, как работает механизм внимания и т.д.

Давайте начнем с векторов x, y и матриц A, B, имеющих вот такие размеры, допустим один элемент занимает при этом один байт.

Читать далее

Источник: habr.com

✅ Найденные теги: LLM, Масштабирование, новости, Одного, Перевод, Чипа

Добавить комментарий

Новости других рубрик

Архив рубрики ~Лента новостей~: Обучение ИИ чтению карты Архив рубрики ~Лента новостей~: Как подсадить разработку на ИИ Архив рубрики ~Лента новостей~: НБА планирует внедрить систему искусственного интеллекта для автоматического определения выхода мяча за пределы площадки. Архив рубрики ~Лента новостей~: Анализ показывает, что политика Шотландии в отношении «зеленых центров обработки данных» игнорирует влияние искусственного интеллекта на выбросы парниковых газов. Архив рубрики ~Лента новостей~: Не пики, а бассейны: почему эволюция — это блуждание по графу жизни Архив рубрики ~Лента новостей~: Люди делают пластическую хирургию, чтобы выглядеть более искусственно созданными искусственным интеллектом Архив рубрики ~Лента новостей~: Маск приравнял Neuralink к чудесам Иисуса: «технология на уровне Христа» Архив рубрики ~Лента новостей~: Укрепление нашей системы обеспечения безопасности на границе