Металлические конструкции моста в ночи, вид снизу, освещенные оранжевым светом.

Масштабирование конвейеров проектирования признаков с помощью Feast и Ray.

Использование хранилищ признаков, таких как Feast, и распределенных вычислительных фреймворков, таких как Ray, в системах машинного обучения, применяемых в производственной среде.

Делиться

3faf0d955d9990347882402cc662e473

В недавнем проекте, связанном с построением моделей прогнозирования потенциальных покупок клиентов, я столкнулся с проблемами проектирования признаков , с которыми сталкивался уже много раз.

Эти проблемы можно условно разделить на две категории:

1) Неадекватное управление функциями

  • Определения, происхождение и версии функций, созданных командой, не отслеживались систематически, что ограничивало повторное использование функций и воспроизводимость результатов моделирования.
  • Логика работы с признаками поддерживалась вручную в отдельных скриптах для обучения и вывода, что создавало риск несогласованности признаков для обучения и вывода (т.е., неравномерность распределения признаков между обучающей выборкой и выводом).
  • Характеристики хранились в виде плоских файлов (например, CSV), в которых отсутствует принудительная проверка схемы и поддержка доступа с низкой задержкой или масштабируемого доступа.

2) Высокая задержка при разработке характеристик.

  • При работе с временными рядами часто возникают сложные задачи по проектированию признаков, требующие вычисления множества преобразований на основе окон.
  • Когда эти вычисления выполняются последовательно, а не оптимизированы для параллельного выполнения, задержка при разработке признаков может значительно возрасти.

В этой статье я подробно объясняю концепции и реализацию хранилищ признаков (Feast) и распределенных вычислительных фреймворков (Ray) для проектирования признаков в производственных конвейерах машинного обучения (ML).

Содержание

(1) Пример использования
(2) Понимание Пира и Луча
(3) Роль Feast и Ray в разработке функций
(4) Пошаговое описание кода

Соответствующий репозиторий на GitHub можно найти здесь.

Источник: towardsdatascience.com

✅ Найденные теги: Feast, Конвейеры, Масштабирование, новости, признаки, Проектирование

ОСТАВЬТЕ СВОЙ КОММЕНТАРИЙ

Каталог бесплатных опенсорс-решений, которые можно развернуть локально и забыть о подписках

галерея

Изображение урагана над Землей с яркими красными и синими контурами на фоне облаков.
Коллаж с кабанами на цветных полосах, характеризующий их поведение и агрессивность.
Спортивный автомобиль на фоне современного здания под вечерним небом.
Фонарь освещает зимний лес, снежные деревья и склоны.
Робот помещает арбуз в упаковку на деревянном столе, три стадии процесса, чёрный фон.
Четыре флакона с яркими флуоресцентными жидкостями под ультрафиолетовым светом.
Человек накачивает копилку-воздушный шар насосом, концепция финансового роста.
ideipro logotyp
eClinicalWorks расширяет возможности взаимодействия благодаря аналитическим данным, полученным с помощью искусственного интеллекта, что преобразует оказание медицинской помощи.
Image Not Found
Спортивный автомобиль на фоне современного здания под вечерним небом.

Гибрид Ауду RS 5: новинка с 630 силами и умной системой

Новая модель Audi RS стала первым в истории бренда высокопроизводительным гибридом, объединив мощность, «умную» систему и фирменный полный привод. Новинка идёт в кузове Sportback, а на европейском рынке также появится версия Avant. Под капотом работает 2,9-литровый бензиновый…

Мар 6, 2026
Фонарь освещает зимний лес, снежные деревья и склоны.

Фонарик Sodiumfrostglow для экстремального холода

Вместо привычного литий-ионного аккумулятора в фонарике Sodiumfrostglow используется натрий-ионная батарея. В условиях экстремального холода именно химический состав источника питания играет ключевую роль и напрямую влияет на стабильность работы устройства. Новинка оснащена аккумулятором на 10 000 мАч и…

Мар 6, 2026
Робот помещает арбуз в упаковку на деревянном столе, три стадии процесса, чёрный фон.

Роботизированные пальцы, вдохновленные виноградной лозой, могут дотянуться и схватить кого-нибудь.

Новая конструкция может быть адаптирована для сортировки складских товаров, разгрузки тяжелых грузов или помощи при подъеме пациентов с постели. ПРЕДОСТАВЛЕНО ИССЛЕДОВАТЕЛЯМИ В садоводстве некоторые лианы особенно цепкие. По мере роста их одревесневшие усики могут с такой силой…

Мар 6, 2026
Четыре флакона с яркими флуоресцентными жидкостями под ультрафиолетовым светом.

Ученые получили молекулярный термометр с рекордной точностью

Люминесцентные комплексы ионов европия в ультрафиолетовом свете. © Илья Тайдаков Ученые разработали светящиеся материалы, которые позволяют измерять температуру очень маленьких объектов, например отдельных клеток или микросхем, без контакта с ними. Новые соединения металлов европия и тербия работают…

Мар 6, 2026

Впишите свой почтовый адрес и мы будем присылать вам на почту самые свежие новости в числе самых первых