Цифровой процесс обработки данных в серверной. Технология блокчейн в дата-центре.

Помогаем центрам обработки данных достигать более высокой производительности при меньшем количестве оборудования.

Исследователи разработали систему, которая интеллектуально балансирует рабочие нагрузки для повышения эффективности работы флэш-накопителей в центре обработки данных. Центр обработки данных с эфемерно светящимися синими коробками. Исследователи из Массачусетского технологического института разработали интеллектуальную систему для балансировки задач устройств хранения данных внутри центра обработки данных, что может продлить срок службы оборудования хранения и помочь центру обработки данных работать более эффективно. Изображение: MIT News; iStock

Для повышения эффективности центров обработки данных несколько устройств хранения данных часто объединяют в пул по сети, чтобы множество приложений могли совместно их использовать. Но даже при объединении в пулы значительная часть емкости устройств остается недоиспользованной из-за различий в производительности разных устройств.

Исследователи из Массачусетского технологического института разработали систему, которая повышает производительность устройств хранения данных, обрабатывая одновременно три основных источника изменчивости. Их подход обеспечивает значительное повышение скорости по сравнению с традиционными методами, которые обрабатывают только один источник изменчивости за раз.

Система использует двухуровневую архитектуру: центральный контроллер принимает общие решения о том, какие задачи должно выполнять каждое устройство хранения данных, а локальные контроллеры для каждой машины быстро перенаправляют данные, если устройство испытывает трудности.

Этот метод, способный адаптироваться в режиме реального времени к изменяющимся нагрузкам, не требует специализированного оборудования. Когда исследователи протестировали эту систему на реалистичных задачах, таких как обучение моделей ИИ и сжатие изображений, она почти вдвое превзошла по производительности традиционные подходы. Благодаря интеллектуальному балансированию нагрузок нескольких устройств хранения данных, система может повысить общую эффективность центров обработки данных.

«Существует тенденция направлять больше ресурсов на решение проблемы, но это во многих отношениях не является устойчивым решением. Мы хотим максимально продлить срок службы этих очень дорогих и углеродоемких ресурсов», — говорит Гохар Чаудхри, аспирант факультета электротехники и информатики (EECS) и ведущий автор статьи об этой методике. «С помощью нашего адаптивного программного решения вы можете по-прежнему выжимать максимум производительности из существующих устройств, прежде чем вам придется выбросить их и купить новые».

В работе над статьей к Чаудхри присоединились Анкит Бхардвадж, доцент Университета Тафтса; Чжэньюань Жуань, доктор философии (выпуск 2024 года); и старший автор Адам Белай, доцент кафедры электротехники и информатики и сотрудник Лаборатории компьютерных наук и искусственного интеллекта Массачусетского технологического института. Результаты исследования будут представлены на симпозиуме USENIX по проектированию и внедрению сетевых систем.

Использование нераскрытого потенциала

Твердотельные накопители (SSD) — это высокопроизводительные цифровые устройства хранения данных, позволяющие приложениям считывать и записывать данные. Например, SSD может хранить огромные массивы данных и быстро передавать данные процессору для обучения моделей машинного обучения.

Объединение нескольких SSD-накопителей в пул, позволяющее множеству приложений использовать их совместно, повышает эффективность, поскольку не каждому приложению требуется использовать всю емкость SSD в данный момент времени. Однако не все SSD-накопители работают одинаково, и самое медленное устройство может ограничивать общую производительность пула.

Эти недостатки возникают из-за различий в аппаратном обеспечении SSD и выполняемых ими задачах.

Чтобы использовать этот нераскрытый потенциал производительности SSD, исследователи разработали Sandook — программную систему, которая одновременно решает три основных проблемы, снижающих производительность. «Sandook» — это слово на урду, означающее «коробка», что в переводе означает «хранилище».

Один из типов изменчивости обусловлен различиями в возрасте, степени износа и емкости твердотельных накопителей, которые могли быть приобретены в разное время у разных поставщиков.

Второй тип изменчивости обусловлен несоответствием между операциями чтения и записи, происходящими на одном и том же SSD-накопителе. Для записи новых данных на устройство SSD-накопитель должен стереть часть существующих данных. Этот процесс может замедлить одновременное чтение или извлечение данных.

Третий источник изменчивости — это сборка мусора, процесс сбора и удаления устаревших данных для освобождения места. Этот процесс, замедляющий работу SSD-накопителей, запускается через случайные промежутки времени, которые оператор центра обработки данных не может контролировать.

«Я не могу предполагать, что все SSD-накопители будут вести себя одинаково на протяжении всего цикла развертывания. Даже если я дам им всем одинаковую нагрузку, некоторые из них все равно будут работать с перебоями, что снизит общую пропускную способность, которую я могу достичь», — объясняет Чаудхри.

Планируйте глобально, реагируйте локально.

Для обработки всех трех источников изменчивости Sandook использует двухуровневую структуру. Глобальный планировщик оптимизирует распределение задач для всего пула, в то время как более быстрые планировщики на каждом SSD реагируют на срочные события и перенаправляют операции с перегруженных устройств.

Система преодолевает задержки, вызванные помехами при чтении и записи, путем чередования SSD-накопителей, которые приложение может использовать для чтения и записи. Это снижает вероятность одновременного выполнения операций чтения и записи на одном и том же устройстве.

Sandook также анализирует типичную производительность каждого SSD. Эта информация используется для определения случаев, когда сборка мусора может замедлять работу системы. После обнаружения таких случаев Sandook снижает нагрузку на данный SSD, перенаправляя некоторые задачи на выполнение до завершения сборки мусора.

«Если SSD-накопитель выполняет сборку мусора и больше не справляется с той же нагрузкой, я хочу уменьшить его нагрузку и постепенно наращивать её. Мы хотим найти оптимальный режим, при котором он всё ещё будет выполнять некоторую работу, и использовать этот потенциал производительности», — говорит Чаудхри.

Профили SSD также позволяют глобальному контроллеру Sandook распределять рабочие нагрузки с учетом характеристик и емкости каждого устройства.

Поскольку глобальный контроллер видит общую картину, а локальные контроллеры реагируют на лету, Sandook может одновременно управлять различными формами изменчивости, возникающими в разных временных масштабах. Например, задержки, связанные со сборкой мусора, возникают внезапно, в то время как задержки, вызванные износом, накапливаются в течение многих месяцев.

Исследователи протестировали Sandook на пуле из 10 SSD-накопителей и оценили систему по четырем задачам: запуск базы данных, обучение модели машинного обучения, сжатие изображений и хранение пользовательских данных. Sandook увеличил пропускную способность каждого приложения на 12–94 процента по сравнению со статическими методами и улучшил общее использование емкости SSD на 23 процента.

Система позволила твердотельным накопителям достичь 95 процентов от их теоретически максимальной производительности без необходимости в специализированном оборудовании или обновлениях, предназначенных для конкретных приложений.

«Наше динамическое решение позволяет раскрыть потенциал всех SSD-накопителей и действительно использовать их на пределе возможностей. В таких масштабах каждая сэкономленная единица емкости имеет огромное значение», — говорит Чаудхри.

В будущем исследователи планируют внедрить новые протоколы, доступные на новейших твердотельных накопителях (SSD), которые предоставят операторам больший контроль над размещением данных. Они также хотят использовать предсказуемость рабочих нагрузок в области искусственного интеллекта для повышения эффективности работы SSD.

«Флэш-память — это мощная технология, лежащая в основе современных приложений для центров обработки данных, однако совместное использование этого ресурса рабочими нагрузками с сильно различающимися требованиями к производительности остается нерешенной проблемой. Эта работа значительно продвигает прогресс, предлагая элегантное и практичное решение, готовое к развертыванию, приближая флэш-память к ее полному раскрытию в облачных средах», — говорит Джош Фрид, инженер-программист Google и будущий доцент Пенсильванского университета, который не принимал участия в этой работе.

Данное исследование было частично профинансировано Национальным научным фондом, Агентством перспективных оборонных исследований США и Корпорацией по исследованию полупроводников.

Источник: news.mit.edu

✅ Найденные теги: новости, Оборудование, Помогаем, Производительность, Центры Обработки Данных

ОСТАВЬТЕ СВОЙ КОММЕНТАРИЙ

Каталог бесплатных опенсорс-решений, которые можно развернуть локально и забыть о подписках

галерея

Исследование возможностей проектирования масштабируемой космической системы инфраструктуры искусственного интеллекта.
Пероральные пробы позволили снять диагноз аллергии на пенициллин у большинства пациентов. Их проведение было безопасным
Знакомьтесь — Чилийский дикий кот, или конкод — уникальный представитель фауны Чили
Плата для оверклокеров GIGABYTE Z890 AORUS TACHYON DUO X ICE поддерживает DDR5-10400
Плата для оверклокеров GIGABYTE Z890 AORUS TACHYON DUO X ICE поддерживает DDR5-10400
Обнаруженный в “колыбели христианства” артефакт изменил взгляд на историю крещения
Императорских пингвинов внесли в список вымирающих видов после резкого сокращения численности.
Изображение человека в очках и жилете с насекомыми на фоне оливкового цвета.
Человек в очках и жилете с жуками на фоне нейтрального цвета.
Image Not Found
Исследование возможностей проектирования масштабируемой космической системы инфраструктуры искусственного интеллекта.

Исследование возможностей проектирования масштабируемой космической системы инфраструктуры искусственного интеллекта.

Проект Suncatcher — это амбициозный проект, осваивающий новые горизонты: оснащение спутниковых группировок, работающих на солнечной энергии, процессорами TPU и оптическими каналами связи в открытом космосе, чтобы в будущем масштабировать вычисления машинного обучения в космосе. Быстрые ссылки Бумага…

Апр 13, 2026
Пероральные пробы позволили снять диагноз аллергии на пенициллин у большинства пациентов. Их проведение было безопасным

Пероральные пробы позволили снять диагноз аллергии на пенициллин у большинства пациентов. Их проведение было безопасным

Их проведение было безопасным Ученые из восьми стран провели гибридное проспективное исследование и пришли к выводу, что оценка риска с помощью приложения и назначение при невысоком риске прямой пероральной провокационной пробы позволяет исключить аллергию на пенициллины более чем…

Апр 13, 2026
Знакомьтесь — Чилийский дикий кот, или конкод — уникальный представитель фауны Чили

Знакомьтесь — Чилийский дикий кот, или конкод — уникальный представитель фауны Чили

Его агрессивный характер и охотничьи навыки делают его серьезным хищником, несмотря на миниатюрные размеры. Эта кошка адаптировалась к условиям обитания и развила специфическую технику охоты, которая позволяет ей эффективно охотиться на жертву, значительно превосходящую её по размеру.…

Апр 13, 2026
Плата для оверклокеров GIGABYTE Z890 AORUS TACHYON DUO X ICE поддерживает DDR5-10400

Плата для оверклокеров GIGABYTE Z890 AORUS TACHYON DUO X ICE поддерживает DDR5-10400

На официальном сайте GIGABYTE появилась страничка, посвящённая новой флагманской материнской плате Z890 AORUS TACHYON DUO X ICE, ориентированной на пользователей, желающих или раскрыть весь потенциал своей системы, или устанавливать мировые рекорды разгона. Плата построена на 8-слойном текстолите…

Апр 13, 2026

Впишите свой почтовый адрес и мы будем присылать вам на почту самые свежие новости в числе самых первых