Гистограмма с разноцветными столбцами на темном фоне.

Сохранение точности вероятностей: корректировка Якоби

Интуитивное объяснение правильного преобразования случайных величин

Делиться

baa0d5b1e34a7f1455cb25a30ec7f18b

Введение

Представьте, что вы моделируете недовольство клиентов, вызванное временем ожидания. Звонки поступают случайным образом, поэтому время ожидания X подчиняется экспоненциальному распределению — большинство ожиданий короткие, а некоторые мучительно долгие.

Теперь я бы сказал, что раздражение не является линейной величиной: 10-минутное ожидание ощущается более чем в два раза хуже, чем 5-минутное. Поэтому вы решаете моделировать «единицы раздражения» как (Y = X²).

Просто, правда? Просто возьмите функцию плотности вероятности X, замените x на (sqrt{y}), и всё готово.

Вы строите график. Он выглядит правдоподобно — пик около нуля, длинный хвост.

А что, если вычислить функцию распределения вероятностей? Вы бы ожидали получить 1, верно?

Результат? 2.

Краткий фрагмент кода numpy для подтверждения этого: import numpy as np import matplotlib.pyplot as plt from scipy.stats import expon # Функция распределения экспоненциального распределения (1): F(x) = 1 — exp(-x) для x >= 0 def cdf_exp(x): return 1 — np.exp(-x) # Неправильная (наивная) функция плотности вероятности для Y = X²: просто подставьте x = sqrt(y) def wrong_pdf(y): return np.exp(-np.sqrt(y)) # Интеграл равен 2! # Быстрая численная проверка интеграла from scipy.integrate import quad integral, err = quad(wrong_pdf, 0, np.inf) print(f»Численный интеграл ≈ {integral:.3f} (должен быть 1, но он равен 2)») # выводит 2

Согласно вашей новой модели распределения, вероятность каждого возможного исхода вдвое выше, чем должна быть.

Это невозможно… но это произошло из-за того, что вы упустили одну небольшую корректировку.

Эта «корректировка» — это якобиан, масштабный коэффициент, компенсирующий растяжение или сжатие оси в разных точках в результате преобразования. Если его не учитывать, ваши вероятности будут искажены. Если же он присутствует, всё снова идеально складывается.

В этой статье мы сформируем интуитивное понимание, шаг за шагом выведем математические формулы, увидим, как это естественным образом проявляется при выравнивании гистограммы, эмпирически визуализируем растяжение/сжатие и докажем это с помощью моделирования.

Источник: towardsdatascience.com

ОСТАВЬТЕ СВОЙ КОММЕНТАРИЙ

Каталог бесплатных опенсорс-решений, которые можно развернуть локально и забыть о подписках

галерея

Загрузка: обход банковских систем кибермошенниками и проблемы с удалением углерода.
Загрузка: обход банковских систем кибермошенниками и проблемы с удалением углерода.
dummy-img
dummy-img
Взаимодействие человека и машины погружается под воду.
Взаимодействие человека и машины погружается под воду.
Дифференциально приватное машинное обучение в масштабе с использованием JAX-Privacy
dummy-img
Следующим узким местом в развитии ИИ станут не модели, а способность агентов мыслить сообща.
Image Not Found
Загрузка: обход банковских систем кибермошенниками и проблемы с удалением углерода.

Загрузка: обход банковских систем кибермошенниками и проблемы с удалением углерода.

Это сегодняшний выпуск The Download, нашей ежедневной новостной рассылки, которая предоставляет вам ежедневную порцию событий в мире технологий. Кибермошенники обходят системы безопасности банков с помощью незаконных инструментов, продаваемых в Telegram. В центре по отмыванию денег в Камбодже…

Апр 21, 2026
Загрузка: обход банковских систем кибермошенниками и проблемы с удалением углерода.

Загрузка: обход банковских систем кибермошенниками и проблемы с удалением углерода.

Это сегодняшний выпуск The Download, нашей ежедневной новостной рассылки, которая предоставляет вам ежедневную порцию событий в мире технологий. Кибермошенники обходят системы безопасности банков с помощью незаконных инструментов, продаваемых в Telegram. В центре по отмыванию денег в Камбодже…

Апр 21, 2026
dummy-img

Взгляд на количественную генетику глазами гена

arXiv:2502.12831v3 Тип объявления: замена-кросс Аннотация: Моделирование эволюции непрерывного признака в биологической популяции — одна из старейших проблем эволюционной биологии, которая привела к появлению количественной генетики. С недавним развитием методов GWAS стало крайне важно связать эволюцию распределения признака…

Апр 21, 2026
dummy-img

Взгляд на количественную генетику глазами гена

arXiv:2502.12831v3 Тип объявления: замена-кросс Аннотация: Моделирование эволюции непрерывного признака в биологической популяции — одна из старейших проблем эволюционной биологии, которая привела к появлению количественной генетики. С недавним развитием методов GWAS стало крайне важно связать эволюцию распределения признака…

Апр 21, 2026

Впишите свой почтовый адрес и мы будем присылать вам на почту самые свежие новости в числе самых первых