Более быстрый способ оценки энергопотребления ИИ.
Метод «EnergAIzer» позволяет получать надежные результаты за считанные секунды, что дает операторам центров обработки данных возможность эффективно распределять ресурсы и сокращать потери энергии.
Исследователи из MIT и лаборатории MIT-IBM Watson AI Lab разработали инструмент, который прогнозирует энергопотребление рабочих нагрузок ИИ, помогая центрам обработки данных эффективно распределять ресурсы и сокращать потери электроэнергии. Источник: iStock
По оценкам Национальной лаборатории имени Лоуренса в Беркли, из-за стремительного развития искусственного интеллекта к 2028 году центры обработки данных будут потреблять до 12 процентов всей электроэнергии в США. Повышение энергоэффективности центров обработки данных — один из способов, с помощью которого ученые стремятся сделать ИИ более экологичным.
Для достижения этой цели исследователи из Массачусетского технологического института и лаборатории MIT-IBM Watson AI разработали инструмент быстрого прогнозирования, который сообщает операторам центров обработки данных, сколько энергии будет потребляться при выполнении конкретной задачи искусственного интеллекта на определенном процессоре или чипе-ускорителе ИИ.
Их метод позволяет получать надежные оценки энергопотребления за несколько секунд, в отличие от традиционных методов моделирования, на получение результатов которых могут уйти часы или даже дни. Более того, их инструмент прогнозирования может применяться к широкому спектру аппаратных конфигураций — даже к новым разработкам, которые еще не внедрены.
Операторы центров обработки данных могли бы использовать эти оценки для эффективного распределения ограниченных ресурсов между несколькими моделями ИИ и процессорами, повышая энергоэффективность. Кроме того, этот инструмент мог бы позволить разработчикам алгоритмов и поставщикам моделей оценить потенциальное энергопотребление новой модели до ее развертывания.
«Проблема устойчивого развития ИИ — это насущный вопрос, на который нам необходимо ответить. Поскольку наш метод оценки быстр, удобен и обеспечивает прямую обратную связь, мы надеемся, что он побудит разработчиков алгоритмов и операторов центров обработки данных задуматься о сокращении энергопотребления», — говорит Кёнми Ли, научный сотрудник Массачусетского технологического института и ведущий автор статьи об этой методике.
Вместе с ней в работе над статьей приняли участие Чжие Сонг, аспирант в области электротехники и информатики (EECS); Ын Кён Ли и Синь Чжан, руководители исследовательских проектов в IBM Research и лаборатории искусственного интеллекта MIT-IBM Watson; Тамар Эйлам, научный сотрудник IBM, главный научный сотрудник по устойчивым вычислениям в IBM Research и член лаборатории искусственного интеллекта MIT-IBM Watson; и старший автор Ананта П. Чандракасан, проректор MIT, профессор электротехники и информатики имени Ванневара Буша и член лаборатории искусственного интеллекта MIT-IBM Watson. Результаты исследования будут представлены на этой неделе на Международном симпозиуме IEEE по анализу производительности систем и программного обеспечения.
Ускорение оценки энергопотребления
Внутри центра обработки данных тысячи мощных графических процессоров (GPU) выполняют операции по обучению и развертыванию моделей искусственного интеллекта. Энергопотребление конкретного графического процессора будет варьироваться в зависимости от его конфигурации и обрабатываемой нагрузки.
Многие традиционные методы прогнозирования энергопотребления предполагают разбиение рабочей нагрузки на отдельные этапы и эмуляцию использования каждого модуля внутри графического процессора на каждом этапе. Однако рабочие нагрузки в области искусственного интеллекта, такие как обучение моделей и предварительная обработка данных, чрезвычайно велики и могут занимать часы или даже дни для моделирования таким образом.
«Если я, как оператор, хочу сравнить различные алгоритмы или конфигурации, чтобы найти наиболее энергоэффективный способ работы, то если на эмуляцию одного задания уйдут дни, это станет очень непрактичным», — говорит Ли.
Чтобы ускорить процесс прогнозирования, исследователи из Массачусетского технологического института стремились использовать менее подробную информацию, которую можно было бы оценить быстрее. Они обнаружили, что в задачах искусственного интеллекта часто встречаются повторяющиеся закономерности. Эти закономерности можно использовать для генерации информации, необходимой для надежной, но быстрой оценки мощности.
Во многих случаях разработчики алгоритмов пишут программы, максимально эффективно работающие на графическом процессоре. Например, они используют хорошо структурированные оптимизации для распределения работы между параллельными процессорами и перемещения блоков данных наиболее эффективным способом.
«Эти оптимизации, которые используют разработчики программного обеспечения, создают упорядоченную структуру, и именно это мы и пытаемся использовать», — объясняет Ли.
Исследователи разработали облегченную модель оценки энергопотребления под названием EnergAIzer, которая позволяет определить характер энергопотребления графического процессора на основе этих оптимизаций.
Точная оценка
Однако, несмотря на скорость их оценки, исследователи обнаружили, что она не учитывает все энергетические затраты. Например, каждый раз, когда графический процессор запускает программу, возникают фиксированные энергетические затраты, необходимые для настройки и конфигурирования этой программы. Затем каждый раз, когда графический процессор выполняет операцию над блоком данных, необходимо дополнительно оплачивать энергопотребление.
Из-за колебаний в аппаратном обеспечении или конфликтов при доступе к данным или их передаче графический процессор может быть не в состоянии использовать всю доступную пропускную способность, что замедляет работу и со временем приводит к увеличению энергопотребления.
Чтобы учесть эти дополнительные затраты и отклонения, исследователи собрали реальные данные измерений с графических процессоров для генерации поправочных коэффициентов, которые они применили к своей модели оценки.
«Таким образом, мы можем получить быструю и очень точную оценку», — говорит она.
В итоге пользователь может указать информацию о своей рабочей нагрузке, например, модель ИИ, которую он хочет запустить, а также количество и длину обрабатываемых пользовательских входных данных, и EnergAIzer выдаст оценку энергопотребления за считанные секунды.
Пользователь также может изменить конфигурацию графического процессора или отрегулировать рабочую скорость, чтобы увидеть, как такие конструктивные решения влияют на общее энергопотребление.
Когда исследователи протестировали EnergAIzer, используя реальную информацию о нагрузке ИИ с реальных графических процессоров, программа смогла оценить энергопотребление с погрешностью всего около 8 процентов, что сопоставимо с традиционными методами, получение результатов которых может занять несколько часов.
Их метод также можно использовать для прогнозирования энергопотребления будущих графических процессоров и новых конфигураций устройств, если только аппаратная часть не претерпит существенных изменений за короткий промежуток времени.
В будущем исследователи планируют протестировать EnergAIzer на новейших конфигурациях графических процессоров и масштабировать модель, чтобы ее можно было применять ко многим графическим процессорам, работающим совместно над выполнением рабочей нагрузки.
«Чтобы действительно добиться успеха в области устойчивого развития, нам нужен инструмент, который сможет обеспечить быструю оценку энергопотребления на всех уровнях системы — для разработчиков оборудования, операторов центров обработки данных и разработчиков алгоритмов, — чтобы все они могли лучше понимать проблему потребления энергии. С помощью этого инструмента мы сделали шаг к достижению этой цели», — говорит Ли.
Данное исследование частично финансировалось лабораторией искусственного интеллекта MIT-IBM Watson.
Источник: news.mit.edu

Добавить комментарий
Для отправки комментария вам необходимо авторизоваться.