Графики инцидентов CPD: тренды за 30 дней, типы и время по часам.

Создание конвейера данных для мониторинга тенденций преступности в регионе.

Пошаговое руководство по созданию ETL-конвейера для извлечения данных о локальных преступлениях и их визуализации в Metabase.

Делиться

fc80d1f3becaef20da6e5f4c5d27db82

Вы заинтересованы в изучении тенденций преступности в вашем районе. Вы знаете, что соответствующие данные существуют, и обладаете базовыми аналитическими навыками, которые можете использовать для их анализа. Однако эти данные часто меняются, и вы хотите, чтобы ваш анализ был актуальным и учитывал самые последние случаи преступлений, не повторяя его. Как можно автоматизировать этот процесс?

Если вы наткнулись на эту статью, вам повезло! Вместе мы разберем, как создать конвейер обработки данных для извлечения данных из местных полицейских протоколов и подключить его к платформе визуализации для изучения тенденций преступности в регионе с течением времени. В этой статье мы извлечем данные об инцидентах, зарегистрированных в полицейском управлении Кембриджа (штат Массачусетс), а затем визуализируем эти данные в виде панели мониторинга в Metabase.

84083d1ebc25c325326acaaa513a6844

Кроме того, эта статья может служить общим шаблоном для всех, кто хочет создавать ETL-конвейеры, управляемые с помощью Prefect, и/или для тех, кто хочет подключить Metabase к своим хранилищам данных для создания информативных анализов/отчетов.

Примечание: Я не имею никакого отношения к Metabase — мы просто будем использовать Metabase в качестве примера платформы для создания нашей итоговой панели мониторинга. Существует множество других жизнеспособных альтернатив, которые описаны в этом разделе.

Содержание :

  • Предварительные знания
  • Интересующие данные
  • Конвейер ETL
    • ETL: Извлечение
    • ETL: Проверка
    • ETL: Преобразование
    • ETL: Загрузка
    • Определение конвейера обработки данных
  • Визуализация в Metabase
  • Подведение итогов и дальнейшая работа
  • Исходный код и GitHub

Источник: towardsdatascience.com

ОСТАВЬТЕ СВОЙ КОММЕНТАРИЙ

Каталог бесплатных опенсорс-решений, которые можно развернуть локально и забыть о подписках

галерея

Многоразовая ракета New Glenn компании Blue Origin успешно приземлилась, но доставка полезной нагрузки не удалась.
Какой язык выбрать программисту в 2026 году?
Vantage Markets представит торговые решения на Blockchain Forum 2026
Моделирование данных для инженеров-аналитиков: полное руководство
В методе моделирования новых материалов обнаружилась «слепая зона»: Химия и науки о материалах
Компания Tesla запускает свою службу роботакси в Далласе и Хьюстоне.
Ученые говорят: Клонировать
dummy-img
Как максимально эффективно использовать возможности коворкинга в Claude
Image Not Found
Многоразовая ракета New Glenn компании Blue Origin успешно приземлилась, но доставка полезной нагрузки не удалась.

Многоразовая ракета New Glenn компании Blue Origin успешно приземлилась, но доставка полезной нагрузки не удалась.

Однако ей не удалось доставить полезную нагрузку с космической вышки сотовой связи. Теренс О'Брайен, редактор раздела «Выходные». Публикации этого автора будут добавляться в вашу ежедневную рассылку по электронной почте и в ленту новостей на главной странице вашего…

Апр 20, 2026
Vantage Markets представит торговые решения на Blockchain Forum 2026

Vantage Markets представит торговые решения на Blockchain Forum 2026

14–15 апреля 2026 года в Москве, в Крокус Экспо, пройдет Blockchain Forum 2026 — одно из ключевых событий региона для профессионалов в сфере криптовалют, трейдинга и блокчейн-технологий. По мере того как индустрия продолжает развиваться в направлении цифровых…

Апр 20, 2026
Моделирование данных для инженеров-аналитиков: полное руководство

Моделирование данных для инженеров-аналитиков: полное руководство

Лучшие модели данных затрудняют постановку неправильных вопросов и упрощают ответы на правильные. Делиться Ваша модель данных — это не технические характеристики. Это мышление с точки зрения бизнеса. Рассматривайте её как план всей вашей аналитической системы. Если план…

Апр 20, 2026
В методе моделирования новых материалов обнаружилась «слепая зона»: Химия и науки о материалах

В методе моделирования новых материалов обнаружилась «слепая зона»: Химия и науки о материалах

Графическое резюме исследования © Михаил Медведев / Институт органической химии имени Н.Д. Зелинского РАН. Исследователи показали, что широко используемые методы квантовой химии могут не различать некоторые варианты распределения электронов в молекулах, из-за чего допускают ошибки при моделировании…

Апр 20, 2026

Впишите свой почтовый адрес и мы будем присылать вам на почту самые свежие новости в числе самых первых