Металлические конструкции моста в ночи, вид снизу, освещенные оранжевым светом.

Масштабирование конвейеров проектирования признаков с помощью Feast и Ray.

Использование хранилищ признаков, таких как Feast, и распределенных вычислительных фреймворков, таких как Ray, в системах машинного обучения, применяемых в производственной среде.

Делиться

3faf0d955d9990347882402cc662e473

В недавнем проекте, связанном с построением моделей прогнозирования потенциальных покупок клиентов, я столкнулся с проблемами проектирования признаков , с которыми сталкивался уже много раз.

Эти проблемы можно условно разделить на две категории:

1) Неадекватное управление функциями

  • Определения, происхождение и версии функций, созданных командой, не отслеживались систематически, что ограничивало повторное использование функций и воспроизводимость результатов моделирования.
  • Логика работы с признаками поддерживалась вручную в отдельных скриптах для обучения и вывода, что создавало риск несогласованности признаков для обучения и вывода (т.е., неравномерность распределения признаков между обучающей выборкой и выводом).
  • Характеристики хранились в виде плоских файлов (например, CSV), в которых отсутствует принудительная проверка схемы и поддержка доступа с низкой задержкой или масштабируемого доступа.

2) Высокая задержка при разработке характеристик.

  • При работе с временными рядами часто возникают сложные задачи по проектированию признаков, требующие вычисления множества преобразований на основе окон.
  • Когда эти вычисления выполняются последовательно, а не оптимизированы для параллельного выполнения, задержка при разработке признаков может значительно возрасти.

В этой статье я подробно объясняю концепции и реализацию хранилищ признаков (Feast) и распределенных вычислительных фреймворков (Ray) для проектирования признаков в производственных конвейерах машинного обучения (ML).

Содержание

(1) Пример использования
(2) Понимание Пира и Луча
(3) Роль Feast и Ray в разработке функций
(4) Пошаговое описание кода

Соответствующий репозиторий на GitHub можно найти здесь.

Источник: towardsdatascience.com

ОСТАВЬТЕ СВОЙ КОММЕНТАРИЙ

Каталог бесплатных опенсорс-решений, которые можно развернуть локально и забыть о подписках

галерея

Дифференциально приватное машинное обучение в масштабе с использованием JAX-Privacy
dummy-img
Следующим узким местом в развитии ИИ станут не модели, а способность агентов мыслить сообща.
Следующим узким местом в развитии ИИ станут не модели, а способность агентов мыслить сообща.
Под базельским концертным залом нашли жертв последней швейцарской чумы. Большинство из них умерли в юном возрасте
СОСТОЯЛОСЬ ЗАСЕДАНИЕ МЕТОДИЧЕСКОГО СОВЕТА, ПОСВЯЩЕННОЕ ПОКОЛЕНИЮ «РОЖДЕННЫХ ЦИФРОВЫМИ»
СОСТОЯЛОСЬ ЗАСЕДАНИЕ МЕТОДИЧЕСКОГО СОВЕТА, ПОСВЯЩЕННОЕ ПОКОЛЕНИЮ «РОЖДЕННЫХ ЦИФРОВЫМИ»
Биофизический мир внутри переполненной клетки
Появились новые доказательства того, как одиночество влияет на память в пожилом возрасте.
Image Not Found
Дифференциально приватное машинное обучение в масштабе с использованием JAX-Privacy

Дифференциально приватное машинное обучение в масштабе с использованием JAX-Privacy

Мы объявляем о выпуске JAX-Privacy 1.0, библиотеки для машинного обучения с дифференциальной приватностью, использующей высокопроизводительную вычислительную библиотеку JAX. Быстрые ссылки GitHub Делиться Скопировать ссылку × От персонализированных рекомендаций до научных достижений, модели ИИ помогают улучшать жизнь и…

Апр 21, 2026
dummy-img

Следующий этап развития Agents SDK | OpenAI

Обновленный SDK для агентов помогает разработчикам создавать агентов, которые могут проверять файлы, выполнять команды, редактировать код и работать над долгосрочными задачами в контролируемых изолированных средах. Мы представляем новые возможности в Agents SDK (открывается в новом окне) ,…

Апр 21, 2026
Следующим узким местом в развитии ИИ станут не модели, а способность агентов мыслить сообща.

Следующим узким местом в развитии ИИ станут не модели, а способность агентов мыслить сообща.

Тарин Пламб CleoP создан с помощью Midjourney. «Агенты ИИ могут взаимодействовать друг с другом, но не могут мыслить вместе. Это огромная разница и узкое место для систем следующего поколения», — говорит Виджой Пандей, старший вице-президент и генеральный…

Апр 21, 2026
Следующим узким местом в развитии ИИ станут не модели, а способность агентов мыслить сообща.

Следующим узким местом в развитии ИИ станут не модели, а способность агентов мыслить сообща.

Тарин Пламб CleoP создан с помощью Midjourney. «Агенты ИИ могут взаимодействовать друг с другом, но не могут мыслить вместе. Это огромная разница и узкое место для систем следующего поколения», — говорит Виджой Пандей, старший вице-президент и генеральный…

Апр 21, 2026

Впишите свой почтовый адрес и мы будем присылать вам на почту самые свежие новости в числе самых первых