Вот как MIT Technology Review пробирался через хаос данных и скрытых переменных, чтобы рассчитать индивидуальный и коллективный спрос на энергию со стороны ИИ.

Когда мы приступили к написанию статьи о наиболее достоверных оценках энергопотребления и выбросов ИИ, мы знали, что эти цифры будут содержать оговорки и неопределённости. Но, как мы быстро обнаружили, эти оговорки — тоже история.
Эта статья является частью серии статей MIT Technology Review «Энергоемкие: ИИ и наше энергетическое будущее», посвященной энергетическим потребностям и стоимости выбросов углерода в результате революции искусственного интеллекта.
Измерение энергии, потребляемой моделью искусственного интеллекта, не похоже на оценку расхода топлива автомобиля или энергоэффективности бытовой техники. Не существует общепринятого метода или общедоступной базы данных значений. Нет регулирующих органов, обеспечивающих соблюдение стандартов, и у потребителей нет возможности сравнить одну модель с другой.
Несмотря на то, что миллиарды долларов вкладываются в перестройку энергетической инфраструктуры с учётом потребностей ИИ, никто не нашёл способа количественно оценить энергопотребление ИИ. Хуже того, компании, как правило, не желают раскрывать свою часть головоломки. Оценка выбросов, связанных с этим спросом на энергию, также ограничена, поскольку энергосистема использует сложный, постоянно меняющийся набор источников энергии.
По сути, это полный бардак. Итак, вот множество переменных, предположений и оговорок, которые мы использовали для расчёта последствий запроса ИИ. (Полные результаты нашего исследования можно увидеть здесь.)
Измерение энергии, потребляемой моделью
Такие компании, как OpenAI, работающие с моделями с «закрытым исходным кодом», обычно предоставляют доступ к своим системам через интерфейс, где вы вводите вопрос и получаете ответ. Что происходит между этим — какой дата-центр в мире обрабатывает ваш запрос, сколько энергии на это тратится и насколько углеродоёмки используемые источники энергии — остаётся секретом, известным только самим компаниям. У них мало стимулов публиковать эту информацию, и пока большинство из них этого не сделали.
Именно поэтому для нашего анализа мы обратились к моделям с открытым исходным кодом. Они служат весьма несовершенным, но лучшим из имеющихся у нас вариантов. (OpenAI, Microsoft и Google отказались предоставить подробную информацию о том, сколько энергии потребляют их модели с закрытым исходным кодом.)
Лучшими ресурсами для измерения энергопотребления моделей ИИ с открытым исходным кодом являются AI Energy Score, ML.Energy и MLPerf Power. Команда ML.Energy помогла нам с расчётами моделей текста и изображений, а команда AI Energy Score — с расчётами моделей видео.
Текстовые модели
Модели ИИ расходуют энергию в два этапа: во время первоначального обучения на огромных объёмах данных (это называется обучением), и во время ответа на запросы (это называется выводом). Когда несколько лет назад был запущен ChatGPT, обучение было основным направлением, поскольку технологические компании стремились не отставать и создавать всё более масштабные модели. Но теперь больше всего энергии потребляется на вывод.
Самый точный способ понять, сколько энергии потребляет модель ИИ на этапе вывода, — это напрямую измерить количество электроэнергии, потребляемой сервером, обрабатывающим запрос. Серверы содержат множество различных компонентов: мощные чипы, называемые графическими процессорами (GPU), которые выполняют основную часть вычислений, другие чипы, называемые центральными процессорами (CPU), вентиляторы для охлаждения и многое другое. Исследователи обычно измеряют мощность, потребляемую графическим процессором, и оценивают остальное (подробнее об этом ниже).
Для этого мы обратились к аспиранту Чжэ-Вон Чунгу и доценту Мошарафу Чоудхури из Мичиганского университета, которые возглавляют проект ML.Energy. Получив от их команды данные об энергопотреблении графических процессоров разных моделей, нам нужно было оценить, сколько энергии тратится на другие процессы, например, охлаждение. Мы изучили исследовательскую литературу, в том числе статью Microsoft за 2024 год, чтобы понять, какую часть общего энергопотребления сервера обеспечивают графические процессоры. Оказалось, что она составляет примерно половину. Поэтому мы взяли оценку энергопотребления графических процессоров, полученную командой, и удвоили её, чтобы получить представление об общем энергопотреблении.
Команда ML.Energy использует пакет из 500 подсказок из более обширного набора данных для тестирования моделей. Аппаратное обеспечение остаётся неизменным; графический процессор — популярный чип Nvidia H100. Мы решили сосредоточиться на моделях трёх размеров из семейства Meta Llama: малых (8 миллиардов параметров), средних (70 миллиардов) и больших (405 миллиардов). Мы также определили несколько подсказок для тестирования. Мы сравнили их со средними значениями для всего пакета из 500 подсказок.
Модели изображений
Stable Diffusion 3 от Stability AI — одна из самых распространённых моделей генерации изображений с открытым исходным кодом, поэтому мы сосредоточились на ней. Хотя мы протестировали несколько размеров текстовой модели Meta Llama, мы остановились на одном из самых популярных размеров Stable Diffusion 3 — с 2 миллиардами параметров.
Команда использует набор данных с примерами подсказок для проверки энергетических потребностей модели. Хотя энергия, потребляемая большими языковыми моделями, частично определяется подсказкой, для диффузионных моделей это не так. Диффузионные модели можно запрограммировать на прохождение заданного количества этапов «шумоподавление» при генерации изображения или видео, при этом каждый этап представляет собой итерацию алгоритма, добавляющую больше деталей к изображению. При заданном количестве этапов и модели все сгенерированные изображения имеют одинаковый энергетический след.
Чем больше этапов, тем выше качество конечного результата, но тем больше энергии потребляется. Количество этапов варьируется в зависимости от модели и области применения, но 25 — довольно распространённое число, и именно его мы использовали для нашего стандарта качества. Для более высокого качества мы использовали 50 этапов.
Мы упоминали, что графические процессоры обычно отвечают примерно за половину энергопотребления при больших запросах к языковым моделям. Недостаточно исследований, чтобы понять, как это меняется для диффузионных моделей, генерирующих изображения и видео. В отсутствие более точной оценки и после консультаций с исследователями мы решили придерживаться этого 50%-ного правила и для изображений и видео.
Видео модели
Чунг и Чоудхури тестируют видеомодели, но только те, которые генерируют короткие GIF-анимации низкого качества. Мы не считаем, что видео, создаваемые этими моделями, соответствуют качеству видео, сгенерированного ИИ, к которому многие привыкли.
Вместо этого мы обратились к Саше Луччони, руководителю отдела ИИ и климата в Hugging Face, которая руководит проектом AI Energy Score. Она измеряет энергию, потребляемую графическим процессором во время запросов ИИ. Для тестирования мы выбрали две версии модели CogVideoX: старую, более низкого качества, и новую, более высокого качества.
Мы попросили Луччиони использовать её инструмент Code Carbon для тестирования обоих вариантов и измерения результатов набора выбранных нами видеоподсказок, используя то же оборудование, что и в наших тестах с текстом и изображениями, чтобы максимально сохранить одинаковое количество переменных. Она сообщила данные об энергопотреблении графического процессора, которые мы снова удвоили для оценки общего энергопотребления.
Отслеживание источника этой энергии
Поняв, сколько энергии требуется для ответа на запрос, мы можем перевести это в общий объём выбросов. Для этого необходимо проанализировать энергосистему, из которой центры обработки данных получают электроэнергию.
Оценка влияния энергосистемы на климат может быть сложной задачей, поскольку она одновременно взаимосвязана и крайне локальна. Представьте себе энергосистему как систему соединённых каналов и водоёмов. Электростанции добавляют воду в каналы, а потребители электроэнергии, или потребители, её забирают. В США энергосистемы протягиваются по всей стране. Так что, в некотором смысле, мы все связаны, но мы также можем разбить энергосистему на составляющие, чтобы понять, как различаются источники энергии по всей стране.
Понимание интенсивности выбросов углерода
Ключевой показатель, который здесь следует понимать, — это так называемая углеродоемкость, которая по сути является мерой того, сколько граммов углекислого газа выбрасывается на каждый киловатт-час произведенной электроэнергии.
Чтобы получить данные об интенсивности выбросов углерода, мы обратились к Electricity Maps, датскому стартапу, который собирает данные о сетях по всему миру. Команда собирает информацию из различных источников, включая государственные органы и коммунальные службы, и использует её для публикации исторических и актуальных оценок интенсивности выбросов углерода в сетях. Подробнее об их методологии можно узнать здесь.
Компания предоставила нам исторические данные за 2024 год как по всей территории США, так и по нескольким ключевым организациям, осуществляющим балансировку (подробнее об этом чуть позже). После обсуждения с основателем Electricity Maps Оливье Корради и другими экспертами мы приняли несколько решений о том, какие данные будем использовать в наших расчётах.
Один из способов измерить углеродоемкость — просто посмотреть на все электростанции, работающие в сети, сложить выбросы, которые они производят в данный момент, и разделить эту сумму на количество вырабатываемой ими электроэнергии. Однако это не учитывает выбросы, связанные со строительством и демонтажем электростанций, которые могут быть значительными. Поэтому мы решили использовать показатели углеродоемкости, учитывающие весь жизненный цикл электростанции.
Мы также решили использовать показатель углеродоёмкости энергии, основанный на потреблении, а не на производстве. Этот показатель учитывает импорт и экспорт, перемещаемые между различными частями энергосистемы, и наилучшим образом отражает потребление электроэнергии в режиме реального времени в данном регионе.
Для большинства расчетов, которые вы видите в статье, мы использовали среднюю интенсивность выбросов углерода в США за 2024 год по данным Electricity Maps, которая составляет 402,49 грамма эквивалента диоксида углерода на киловатт-час.
Понимание балансирующих органов
Хотя понимание общей картины по всем США может быть полезным, в разных местах сетка может выглядеть совершенно по-разному.
Один из способов разбить ситуацию на части — рассмотреть балансирующие организации. Это независимые организации, отвечающие за балансировку сети в конкретном регионе. Они действуют в основном независимо, хотя между ними также происходит постоянный обмен электроэнергией. В США существует 66 балансирующих организаций, и мы можем рассчитать углеродоёмкость для той части сети, которая находится под контролем конкретной балансирующей организации.
Компания Electricity Maps предоставила данные об интенсивности выбросов углерода для нескольких ключевых балансирующих организаций, и мы сосредоточились на нескольких, которые играют наибольшую роль в работе центров обработки данных. Согласно исследованию Гарвардской школы общественного здравоохранения, ERCOT (охватывает большую часть Техаса) и PJM (группа штатов на Восточном побережье, включая Вирджинию, Пенсильванию и Нью-Джерси) — два региона с наибольшей нагрузкой на центры обработки данных.
Мы добавили CAISO (в Калифорнии), поскольку он охватывает самый густонаселенный штат США. CAISO также управляет сетью со значительным количеством возобновляемых источников энергии, что является хорошим примером того, как интенсивность выбросов углерода может существенно меняться в зависимости от времени суток. (Например, в середине дня, как правило, доминирует солнечная энергетика, в то время как природный газ играет более важную роль ночью.)
Одно из ключевых замечаний заключается в том, что мы не совсем уверены, куда компании обычно направляют отдельные запросы на вывод данных с помощью ИИ. В регионах, выбранных нами в качестве примеров, есть кластеры центров обработки данных, но при использовании модели ИИ технологического гиганта ваш запрос может быть обработан любым количеством центров обработки данных, принадлежащих компании или работающих по контракту с ней. Одним из разумных приближений является местоположение: вероятно, центр обработки данных, обслуживающий запрос, находится недалеко от места его отправки, поэтому запрос на Западном побережье, скорее всего, будет перенаправлен в центр обработки данных в этой части страны.
Объясняя то, что мы обнаружили
Чтобы лучше согласовать наши расчёты, мы ввели несколько сравнений, которые могут быть более привычны, чем киловатт-часы и граммы углекислого газа. В некоторых случаях мы брали предполагаемое количество электроэнергии, потребляемое моделью, и рассчитали, сколько времени этого электричества хватит для питания стандартной микроволновки, а также какое расстояние можно проехать на электровелосипеде.
В случае электровелосипеда мы предположили эффективность 25 Вт·ч на милю, что соответствует часто упоминаемому диапазону эффективности для велосипедов с педальным приводом. Для микроволновой печи мы предположили мощность модели 800 Вт, что соответствует среднему диапазону в США.
Мы также ввели сравнение для контекстуализации выбросов парниковых газов: пробег автомобиля с бензиновым двигателем. Для этого мы использовали данные Агентства по охране окружающей среды США, согласно которым средневзвешенный расход топлива транспортных средств в США в 2022 году составил 393 грамма эквивалента углекислого газа на милю.
Прогнозирование того, сколько энергии будет потреблять ИИ в будущем
После измерения потребности в энергии для отдельного запроса и генерируемых им выбросов пришло время оценить, как все это в совокупности влияет на общенациональный спрос.
Это можно сделать двумя способами. При анализе «снизу вверх» вы оцениваете количество отдельных запросов, рассчитываете энергопотребление каждого из них и суммируете их для определения общего значения. При анализе «сверху вниз» вы оцениваете потребление энергии всеми центрами обработки данных, анализируя общие тенденции.
Работа снизу вверх особенно сложна, поскольку, опять же, компании с закрытым исходным кодом не делятся такой информацией и отказались обсуждать с нами подробности. Хотя мы можем делать обоснованные предположения, чтобы составить представление о том, что происходит сейчас, для прогнозирования будущего, пожалуй, лучше использовать подход «сверху вниз».
Эти данные также скудны. Самый важный отчёт был опубликован в декабре Национальной лабораторией имени Лоуренса в Беркли, финансируемой Министерством энергетики. Авторы отчёта отметили, что это всего лишь третий подобный отчёт за последние 20 лет. Исследователи климата и энергетики, с которыми мы общались, отметили серьёзную проблему в том, что ИИ не рассматривается как самостоятельный сектор экономики при измерении выбросов, и отсутствуют строгие требования к отчётности. В результате сложно отслеживать влияние ИИ на климат.
Тем не менее, мы изучили результаты отчёта, сравнили их с другими выводами и оценками, а также проконсультировались с независимыми экспертами по поводу данных. Хотя большая часть отчёта была посвящена центрам обработки данных в более широком смысле, мы выделили данные, имеющие отношение к будущему ИИ.
Цели компании
Мы хотели сопоставить эти цифры с объёмами энергии, которые, по заявлениям самих компаний, занимающихся ИИ, им необходимы. Для этого мы собрали отчёты ведущих технологических и ИИ-компаний об их планах по расширению энергетических и дата-центров, а также о суммах, которые они обещали инвестировать. По возможности мы проверяли факты, содержащиеся в этих заявлениях. (Например, обещания Meta и Microsoft увеличить использование ядерной энергии действительно сократят выбросы углерода этими компаниями, но для ввода в эксплуатацию этих дополнительных АЭС потребуются годы, если не десятилетия.)
Запросы к компаниям
Мы направили запросы в Microsoft, Google и OpenAI с просьбой провести основанные на данных обсуждения энергопотребления их моделей для вывода результатов с помощью ИИ. Ни одна из компаний не предоставила руководителей или руководства для официальных интервью об энергопотреблении.
Эта статья была поддержана грантом Центра искусственного интеллекта журналистики Тарбелла.
Жаждущие власти:
ИИ и наше энергетическое будущее
Источник: www.technologyreview.com



























