Цифровой процесс обработки данных в серверной. Технология блокчейн в дата-центре.

Помогаем центрам обработки данных достигать более высокой производительности при меньшем количестве оборудования.

Исследователи разработали систему, которая интеллектуально балансирует рабочие нагрузки для повышения эффективности работы флэш-накопителей в центре обработки данных. Центр обработки данных с эфемерно светящимися синими коробками. Исследователи из Массачусетского технологического института разработали интеллектуальную систему для балансировки задач устройств хранения данных внутри центра обработки данных, что может продлить срок службы оборудования хранения и помочь центру обработки данных работать более эффективно. Изображение: MIT News; iStock

Для повышения эффективности центров обработки данных несколько устройств хранения данных часто объединяют в пул по сети, чтобы множество приложений могли совместно их использовать. Но даже при объединении в пулы значительная часть емкости устройств остается недоиспользованной из-за различий в производительности разных устройств.

Исследователи из Массачусетского технологического института разработали систему, которая повышает производительность устройств хранения данных, обрабатывая одновременно три основных источника изменчивости. Их подход обеспечивает значительное повышение скорости по сравнению с традиционными методами, которые обрабатывают только один источник изменчивости за раз.

Система использует двухуровневую архитектуру: центральный контроллер принимает общие решения о том, какие задачи должно выполнять каждое устройство хранения данных, а локальные контроллеры для каждой машины быстро перенаправляют данные, если устройство испытывает трудности.

Этот метод, способный адаптироваться в режиме реального времени к изменяющимся нагрузкам, не требует специализированного оборудования. Когда исследователи протестировали эту систему на реалистичных задачах, таких как обучение моделей ИИ и сжатие изображений, она почти вдвое превзошла по производительности традиционные подходы. Благодаря интеллектуальному балансированию нагрузок нескольких устройств хранения данных, система может повысить общую эффективность центров обработки данных.

«Существует тенденция направлять больше ресурсов на решение проблемы, но это во многих отношениях не является устойчивым решением. Мы хотим максимально продлить срок службы этих очень дорогих и углеродоемких ресурсов», — говорит Гохар Чаудхри, аспирант факультета электротехники и информатики (EECS) и ведущий автор статьи об этой методике. «С помощью нашего адаптивного программного решения вы можете по-прежнему выжимать максимум производительности из существующих устройств, прежде чем вам придется выбросить их и купить новые».

В работе над статьей к Чаудхри присоединились Анкит Бхардвадж, доцент Университета Тафтса; Чжэньюань Жуань, доктор философии (выпуск 2024 года); и старший автор Адам Белай, доцент кафедры электротехники и информатики и сотрудник Лаборатории компьютерных наук и искусственного интеллекта Массачусетского технологического института. Результаты исследования будут представлены на симпозиуме USENIX по проектированию и внедрению сетевых систем.

Использование нераскрытого потенциала

Твердотельные накопители (SSD) — это высокопроизводительные цифровые устройства хранения данных, позволяющие приложениям считывать и записывать данные. Например, SSD может хранить огромные массивы данных и быстро передавать данные процессору для обучения моделей машинного обучения.

Объединение нескольких SSD-накопителей в пул, позволяющее множеству приложений использовать их совместно, повышает эффективность, поскольку не каждому приложению требуется использовать всю емкость SSD в данный момент времени. Однако не все SSD-накопители работают одинаково, и самое медленное устройство может ограничивать общую производительность пула.

Эти недостатки возникают из-за различий в аппаратном обеспечении SSD и выполняемых ими задачах.

Чтобы использовать этот нераскрытый потенциал производительности SSD, исследователи разработали Sandook — программную систему, которая одновременно решает три основных проблемы, снижающих производительность. «Sandook» — это слово на урду, означающее «коробка», что в переводе означает «хранилище».

Один из типов изменчивости обусловлен различиями в возрасте, степени износа и емкости твердотельных накопителей, которые могли быть приобретены в разное время у разных поставщиков.

Второй тип изменчивости обусловлен несоответствием между операциями чтения и записи, происходящими на одном и том же SSD-накопителе. Для записи новых данных на устройство SSD-накопитель должен стереть часть существующих данных. Этот процесс может замедлить одновременное чтение или извлечение данных.

Третий источник изменчивости — это сборка мусора, процесс сбора и удаления устаревших данных для освобождения места. Этот процесс, замедляющий работу SSD-накопителей, запускается через случайные промежутки времени, которые оператор центра обработки данных не может контролировать.

«Я не могу предполагать, что все SSD-накопители будут вести себя одинаково на протяжении всего цикла развертывания. Даже если я дам им всем одинаковую нагрузку, некоторые из них все равно будут работать с перебоями, что снизит общую пропускную способность, которую я могу достичь», — объясняет Чаудхри.

Планируйте глобально, реагируйте локально.

Для обработки всех трех источников изменчивости Sandook использует двухуровневую структуру. Глобальный планировщик оптимизирует распределение задач для всего пула, в то время как более быстрые планировщики на каждом SSD реагируют на срочные события и перенаправляют операции с перегруженных устройств.

Система преодолевает задержки, вызванные помехами при чтении и записи, путем чередования SSD-накопителей, которые приложение может использовать для чтения и записи. Это снижает вероятность одновременного выполнения операций чтения и записи на одном и том же устройстве.

Sandook также анализирует типичную производительность каждого SSD. Эта информация используется для определения случаев, когда сборка мусора может замедлять работу системы. После обнаружения таких случаев Sandook снижает нагрузку на данный SSD, перенаправляя некоторые задачи на выполнение до завершения сборки мусора.

«Если SSD-накопитель выполняет сборку мусора и больше не справляется с той же нагрузкой, я хочу уменьшить его нагрузку и постепенно наращивать её. Мы хотим найти оптимальный режим, при котором он всё ещё будет выполнять некоторую работу, и использовать этот потенциал производительности», — говорит Чаудхри.

Профили SSD также позволяют глобальному контроллеру Sandook распределять рабочие нагрузки с учетом характеристик и емкости каждого устройства.

Поскольку глобальный контроллер видит общую картину, а локальные контроллеры реагируют на лету, Sandook может одновременно управлять различными формами изменчивости, возникающими в разных временных масштабах. Например, задержки, связанные со сборкой мусора, возникают внезапно, в то время как задержки, вызванные износом, накапливаются в течение многих месяцев.

Исследователи протестировали Sandook на пуле из 10 SSD-накопителей и оценили систему по четырем задачам: запуск базы данных, обучение модели машинного обучения, сжатие изображений и хранение пользовательских данных. Sandook увеличил пропускную способность каждого приложения на 12–94 процента по сравнению со статическими методами и улучшил общее использование емкости SSD на 23 процента.

Система позволила твердотельным накопителям достичь 95 процентов от их теоретически максимальной производительности без необходимости в специализированном оборудовании или обновлениях, предназначенных для конкретных приложений.

«Наше динамическое решение позволяет раскрыть потенциал всех SSD-накопителей и действительно использовать их на пределе возможностей. В таких масштабах каждая сэкономленная единица емкости имеет огромное значение», — говорит Чаудхри.

В будущем исследователи планируют внедрить новые протоколы, доступные на новейших твердотельных накопителях (SSD), которые предоставят операторам больший контроль над размещением данных. Они также хотят использовать предсказуемость рабочих нагрузок в области искусственного интеллекта для повышения эффективности работы SSD.

«Флэш-память — это мощная технология, лежащая в основе современных приложений для центров обработки данных, однако совместное использование этого ресурса рабочими нагрузками с сильно различающимися требованиями к производительности остается нерешенной проблемой. Эта работа значительно продвигает прогресс, предлагая элегантное и практичное решение, готовое к развертыванию, приближая флэш-память к ее полному раскрытию в облачных средах», — говорит Джош Фрид, инженер-программист Google и будущий доцент Пенсильванского университета, который не принимал участия в этой работе.

Данное исследование было частично профинансировано Национальным научным фондом, Агентством перспективных оборонных исследований США и Корпорацией по исследованию полупроводников.

Источник: news.mit.edu

✅ Найденные теги: новости, Оборудование, Помогаем, Производительность, Центры Обработки Данных

ОСТАВЬТЕ СВОЙ КОММЕНТАРИЙ

Каталог бесплатных опенсорс-решений, которые можно развернуть локально и забыть о подписках

галерея

Чем дорогой телескоп отличается от дешёвого
Сыворотка Reviva Shot в лаборатории, яркие зелёные и фиолетовые оттенки.
«Умные» очки с камерой, динамиками и ИИ-ассистентом
Конференция Global Physics Summit, люди в холле, баннер APS, большое остекление.
Мозг с рычагом переключения в положении "ON", символизирующий активацию идей.
Диаграммы нейронных соединений и классификация нейронных типов в мозге.
Иллюстрация нейронных связей и типов клеток мозга мыши.
Космический корабль NASA с эмблемой и флагом США на фоне космоса.
По сообщениям, Apple тестирует четыре варианта дизайна будущих умных очков.
Image Not Found
Чем дорогой телескоп отличается от дешёвого

Чем дорогой телескоп отличается от дешёвого

Потрясающие снимки в разных странах делают астрономы-любители. Это люди, которые просто ради удовольствия наблюдают за звёздным небом! И им сейчас помогают технические новинки. Которые делают прекрасное хобби совсем не сложным! Мог ли думать Гагарин (кстати, ровно 65…

Апр 13, 2026
Сыворотка Reviva Shot в лаборатории, яркие зелёные и фиолетовые оттенки.

Сыворотки и патчи с микроиглами против прыщей и возрастных изменений

Готовы ради красоты втыкать себе в лицо или другие нежные части тела иголки? Положительно ответят немногие, хотя и понимают, что эффект от глубокого введения препаратов, наверное, более сильный, чем от намазывания кремов. Впрочем, сейчас появилось огромное количество…

Апр 13, 2026
«Умные» очки с камерой, динамиками и ИИ-ассистентом

«Умные» очки с камерой, динамиками и ИИ-ассистентом

Будущее уже у вас на носу — уверяют производители «умных» очков, которые стремительно приобретают новые функции и при этом становятся дешевле. Например, очки от известного китайского бренда обойдутся в 45 000 рублей. Они оснащены камерой, динамиками и…

Апр 13, 2026
Конференция Global Physics Summit, люди в холле, баннер APS, большое остекление.

Как искусственный интеллект потряс крупнейшую в мире встречу физиков

Физики пытаются понять, как растущее присутствие искусственного интеллекта изменит характер их профессии. Глобальный физический саммит Американского физического общества — это крупнейшее в мире собрание физиков. Американское физическое общество Я сижу в лекционном зале, и передо мной картина,…

Апр 13, 2026

Впишите свой почтовый адрес и мы будем присылать вам на почту самые свежие новости в числе самых первых