Металлические конструкции моста в ночи, вид снизу, освещенные оранжевым светом.

Масштабирование конвейеров проектирования признаков с помощью Feast и Ray.

Использование хранилищ признаков, таких как Feast, и распределенных вычислительных фреймворков, таких как Ray, в системах машинного обучения, применяемых в производственной среде.

Делиться

3faf0d955d9990347882402cc662e473

В недавнем проекте, связанном с построением моделей прогнозирования потенциальных покупок клиентов, я столкнулся с проблемами проектирования признаков , с которыми сталкивался уже много раз.

Эти проблемы можно условно разделить на две категории:

1) Неадекватное управление функциями

  • Определения, происхождение и версии функций, созданных командой, не отслеживались систематически, что ограничивало повторное использование функций и воспроизводимость результатов моделирования.
  • Логика работы с признаками поддерживалась вручную в отдельных скриптах для обучения и вывода, что создавало риск несогласованности признаков для обучения и вывода (т.е., неравномерность распределения признаков между обучающей выборкой и выводом).
  • Характеристики хранились в виде плоских файлов (например, CSV), в которых отсутствует принудительная проверка схемы и поддержка доступа с низкой задержкой или масштабируемого доступа.

2) Высокая задержка при разработке характеристик.

  • При работе с временными рядами часто возникают сложные задачи по проектированию признаков, требующие вычисления множества преобразований на основе окон.
  • Когда эти вычисления выполняются последовательно, а не оптимизированы для параллельного выполнения, задержка при разработке признаков может значительно возрасти.

В этой статье я подробно объясняю концепции и реализацию хранилищ признаков (Feast) и распределенных вычислительных фреймворков (Ray) для проектирования признаков в производственных конвейерах машинного обучения (ML).

Содержание

(1) Пример использования
(2) Понимание Пира и Луча
(3) Роль Feast и Ray в разработке функций
(4) Пошаговое описание кода

Соответствующий репозиторий на GitHub можно найти здесь.

Источник: towardsdatascience.com

ОСТАВЬТЕ СВОЙ КОММЕНТАРИЙ

Каталог бесплатных опенсорс-решений, которые можно развернуть локально и забыть о подписках

галерея

Люди, с которыми вы живете, могут изменять состав вашей кишечной микрофлоры.
Люди, с которыми вы живете, могут изменять состав вашей кишечной микрофлоры.
GE и DeepHealth расширяют партнерство в области решений для скрининга рака молочной железы.
GE и DeepHealth расширяют партнерство в области решений для скрининга рака молочной железы.
dummy-img
STAT+: Доступ предоставлен: CMS одобрила участие более чем 150 человек в эксперименте по лечению хронических заболеваний.
STAT+: Доступ предоставлен: CMS одобрила участие более чем 150 человек в эксперименте по лечению хронических заболеваний.
Высокодозовая терапия нусинерсеном при спинальной мышечной атрофии: рандомизированное исследование III фазы.
Высокодозовая терапия нусинерсеном при спинальной мышечной атрофии: рандомизированное исследование III фазы.
Image Not Found
Люди, с которыми вы живете, могут изменять состав вашей кишечной микрофлоры.

Люди, с которыми вы живете, могут изменять состав вашей кишечной микрофлоры.

Тесные отношения могут незаметно синхронизировать вашу кишечную микрофлору. Исследования показывают, что частые социальные контакты способствуют передаче ключевых микробов, что говорит о том, что люди, с которыми вы живете, могут влиять на ваше здоровье больше, чем вы думаете.…

Апр 20, 2026
Люди, с которыми вы живете, могут изменять состав вашей кишечной микрофлоры.

Люди, с которыми вы живете, могут изменять состав вашей кишечной микрофлоры.

Тесные отношения могут незаметно синхронизировать вашу кишечную микрофлору. Исследования показывают, что частые социальные контакты способствуют передаче ключевых микробов, что говорит о том, что люди, с которыми вы живете, могут влиять на ваше здоровье больше, чем вы думаете.…

Апр 20, 2026
GE и DeepHealth расширяют партнерство в области решений для скрининга рака молочной железы.

GE и DeepHealth расширяют партнерство в области решений для скрининга рака молочной железы.

GE HealthCare предлагает модульный облачный комплекс решений, интегрируемый в существующие системы маммографии. Фото: ORION PRODUCTION / Shutterstock.com. Компания GE HealthCare расширила партнерство с дочерней компанией RadNet, DeepHealth, для расширения доступа к решениям для скрининга рака молочной железы…

Апр 20, 2026
GE и DeepHealth расширяют партнерство в области решений для скрининга рака молочной железы.

GE и DeepHealth расширяют партнерство в области решений для скрининга рака молочной железы.

GE HealthCare предлагает модульный облачный комплекс решений, интегрируемый в существующие системы маммографии. Фото: ORION PRODUCTION / Shutterstock.com. Компания GE HealthCare расширила партнерство с дочерней компанией RadNet, DeepHealth, для расширения доступа к решениям для скрининга рака молочной железы…

Апр 20, 2026

Впишите свой почтовый адрес и мы будем присылать вам на почту самые свежие новости в числе самых первых