Закажи экспресс-аудит своего дела онлайн всего за 199 ₽
и получи рекомендации по улучшению - Жми сюда !

Контракты данных Python: предотвращение дрейфа схем и сбоев конвейера

Предотвратите сбои в работе ваших трубопроводов по пятницам после обеда с помощью простой проверки с открытым исходным кодом от Pandera.

Делиться

Изображение, показывающее, как контракты данных проверяют данные.

Проблема

Давайте будем честны: мы все через это проходили.

Пятница, вечер. Вы обучили модель, проверили её и развернули конвейер вывода. Метрики выглядят зелёными. Вы закрываете ноутбук на выходные и наслаждаетесь отдыхом.

В понедельник утром при регистрации на работу вы видите сообщение «Сбой конвейера» . Что происходит? Всё было идеально, когда вы развернули конвейер вывода.

На самом деле проблема может быть в нескольких вещах. Возможно, команда разработчиков изменила столбец user_id с целого числа на строку. Или столбец price внезапно стал содержать отрицательные числа. Или, например, мой любимый вариант: название столбца изменилось с created_at на createdAt (camelCase снова в деле!).

В индустрии это называется «дрейф схемы» . Я называю это головной болью.

В последнее время много говорят о контрактах на данные . Обычно это подразумевает продажу вам дорогой SaaS-платформы или сложной архитектуры микросервисов. Но если вы просто специалист по анализу данных или инженер, пытающийся предотвратить взрывной рост своих конвейеров Python, вам не обязательно раздувать корпоративные системы.

Источник: towardsdatascience.com

✅ Найденные теги: Контракты, новости

Нет других записей в этой рубрике.

Новости других рубрик

Архив рубрики ~Лента новостей~: Почему дипломированные юристы повреждают ваши документы при делегировании полномочий? Архив рубрики ~Лента новостей~: Apple вносит изменения в свой спорный дизайн Liquid Glass. Архив рубрики ~Лента новостей~: ИИ уже пишет 80% кода Anthropic. Самое тревожное спрятано в цифре, которую подают как успех Архив рубрики ~Лента новостей~: Компания Aviva использует искусственный интеллект для предотвращения мошенничества в сфере страхования на сумму 230 миллионов фунтов стерлингов. Архив рубрики ~Лента новостей~: ФИФА расширяет использование ИИ на чемпионате мира, чтобы уменьшить количество оскорблений со стороны игроков. Архив рубрики ~Лента новостей~: DuckDuckGo устанавливает Spike, поскольку Google пытается заменить поиск искусственным интеллектом Архив рубрики ~Лента новостей~: AI неожиданно вернул человечество к вопросу о смысле Архив рубрики ~Лента новостей~: Рассматриваем первую фотографию контактной площадки процессоров Intel Nova Lake