Металлические конструкции моста в ночи, вид снизу, освещенные оранжевым светом.

Масштабирование конвейеров проектирования признаков с помощью Feast и Ray.

Мар 6, 2026 0

Использование хранилищ признаков, таких как Feast, и распределенных вычислительных фреймворков, таких как Ray, в системах машинного обучения, применяемых в производственной среде.

Делиться

В недавнем проекте, связанном с построением моделей прогнозирования потенциальных покупок клиентов, я столкнулся с проблемами проектирования признаков , с которыми сталкивался уже много раз.

Эти проблемы можно условно разделить на две категории:

1) Неадекватное управление функциями

Определения, происхождение и версии функций, созданных командой, не отслеживались систематически, что ограничивало повторное использование функций и воспроизводимость результатов моделирования.
Логика работы с признаками поддерживалась вручную в отдельных скриптах для обучения и вывода, что создавало риск несогласованности признаков для обучения и вывода (т.е., неравномерность распределения признаков между обучающей выборкой и выводом).
Характеристики хранились в виде плоских файлов (например, CSV), в которых отсутствует принудительная проверка схемы и поддержка доступа с низкой задержкой или масштабируемого доступа.

2) Высокая задержка при разработке характеристик.

При работе с временными рядами часто возникают сложные задачи по проектированию признаков, требующие вычисления множества преобразований на основе окон.
Когда эти вычисления выполняются последовательно, а не оптимизированы для параллельного выполнения, задержка при разработке признаков может значительно возрасти.

В этой статье я подробно объясняю концепции и реализацию хранилищ признаков (Feast) и распределенных вычислительных фреймворков (Ray) для проектирования признаков в производственных конвейерах машинного обучения (ML).

Содержание

(1) Пример использования
(2) Понимание Пира и Луча
(3) Роль Feast и Ray в разработке функций
(4) Пошаговое описание кода

Соответствующий репозиторий на GitHub можно найти здесь.

Источник: towardsdatascience.com

Метки:

Человек накачивает копилку-воздушный шар насосом, концепция финансового роста.

ПРЕДЫДУЩАЯ ЗАПИСЬ

06.03.2026

В прошлом месяце лишь три компании доминировали на рынке венчурных инвестиций на сумму 189 миллиардов долларов.

СЛЕДУЮЩАЯ ЗАПИСЬ

06.03.2026

Ученые получили молекулярный термометр с рекордной точностью

Четыре флакона с яркими флуоресцентными жидкостями под ультрафиолетовым светом.

ОСТАВЬТЕ СВОЙ КОММЕНТАРИЙ
Отменить ответ

Для отправки комментария вам необходимо авторизоваться.

Каталог бесплатных опенсорс-решений, которые можно развернуть локально и забыть о подписках

Еще новости рубрики

Архив рубрики ~Обо всем~

Фантазии

Июл 2, 2024

Архив рубрики ~Обо всем~

Мировоззрение

Июл 2, 2024

Архив рубрики ~Обо всем~

Влияние выдумщиков и фантазеров на развитие…

Июл 2, 2024

Архив рубрики ~Обо всем~

Нет ничего невозможного

Июл 2, 2024

Присоединяйтесь
к нам в

TELEGRAM

галерея

Дифференциально приватное машинное обучение в масштабе с использованием JAX-Privacy

Следующим узким местом в развитии ИИ станут не модели, а способность агентов мыслить сообща.

Под базельским концертным залом нашли жертв последней швейцарской чумы. Большинство из них умерли в юном возрасте

СОСТОЯЛОСЬ ЗАСЕДАНИЕ МЕТОДИЧЕСКОГО СОВЕТА, ПОСВЯЩЕННОЕ ПОКОЛЕНИЮ «РОЖДЕННЫХ ЦИФРОВЫМИ»

Биофизический мир внутри переполненной клетки

Появились новые доказательства того, как одиночество влияет на память в пожилом возрасте.

НОВОСТИ ДРУГИХ РУБРИК

Архив рубрики ~Лента новостей~

Дифференциально приватное машинное обучение в масштабе с использованием JAX-Privacy

Мы объявляем о выпуске JAX-Privacy 1.0, библиотеки для машинного обучения с дифференциальной приватностью, использующей высокопроизводительную вычислительную библиотеку JAX. Быстрые ссылки GitHub Делиться Скопировать ссылку × От персонализированных рекомендаций до научных достижений, модели ИИ помогают улучшать жизнь и…

ЧИТАТЬ

Апр 21, 2026

Архив рубрики ~Лента новостей~

Следующий этап развития Agents SDK | OpenAI

Обновленный SDK для агентов помогает разработчикам создавать агентов, которые могут проверять файлы, выполнять команды, редактировать код и работать над долгосрочными задачами в контролируемых изолированных средах. Мы представляем новые возможности в Agents SDK (открывается в новом окне) ,…

ЧИТАТЬ

Апр 21, 2026

Архив рубрики ~Лента новостей~

Следующим узким местом в развитии ИИ станут не модели, а способность агентов мыслить сообща.

Тарин Пламб CleoP создан с помощью Midjourney. «Агенты ИИ могут взаимодействовать друг с другом, но не могут мыслить вместе. Это огромная разница и узкое место для систем следующего поколения», — говорит Виджой Пандей, старший вице-президент и генеральный…

ЧИТАТЬ

Апр 21, 2026

Архив рубрики ~Лента новостей~

Следующим узким местом в развитии ИИ станут не модели, а способность агентов мыслить сообща.

ЧИТАТЬ

Апр 21, 2026

Впишите свой почтовый адрес и мы будем присылать вам на почту самые свежие новости в числе самых первых

ИдеиPRO

Масштабирование конвейеров проектирования признаков с помощью Feast и Ray.

1) Неадекватное управление функциями

2) Высокая задержка при разработке характеристик.

Содержание

ОСТАВЬТЕ СВОЙ КОММЕНТАРИЙ Отменить ответ

Еще новости рубрики

Присоединяйтесь к нам в

Рубрики

галерея

НОВОСТИ ДРУГИХ РУБРИК

ОСТАВЬТЕ СВОЙ КОММЕНТАРИЙ
Отменить ответ

Присоединяйтесь
к нам в