Image

Множественная линейная регрессия: простое объяснение (часть 1)

Математика, лежащая в основе построения плоскости вместо линии

Делиться

61988b14d0fce9876ff43891a80f7cde

В этой записи блога мы обсуждаем множественную линейную регрессию .

Мы все знаем, что это один из первых алгоритмов, который мы изучаем на нашем пути машинного обучения, поскольку он является расширением простой линейной регрессии.

Мы знаем, что в простой линейной регрессии у нас есть одна независимая переменная и одна целевая переменная, а в множественной линейной регрессии у нас есть две или более независимых переменных и одна целевая переменная.

Вместо того чтобы просто применить алгоритм с помощью Python, в этой статье мы рассмотрим математические основы алгоритма множественной линейной регрессии.

Давайте рассмотрим набор данных Fish Market, чтобы понять математику множественной линейной регрессии.

Этот набор данных включает в себя физические характеристики каждой рыбы, такие как:

  • Вид – тип рыбы (например, лещ, плотва, щука)
  • Вес – вес рыбы в граммах (это будет наша целевая переменная)
  • Длина1, Длина2, Длина3 – различные измерения длины (в см)
  • Высота – высота рыбы (в см)
  • Ширина – диагональная ширина тела рыбы (в см).

Чтобы понять множественную линейную регрессию, мы будем использовать две независимые переменные, чтобы упростить и облегчить визуализацию.

Мы рассмотрим выборку из 20 точек из этого набора данных.

cb1aa4add2ceb220d012933cfdc9ac60

Мы рассмотрели 20-точечную выборку из набора данных Fish Market, которая включает измерения 20 отдельных рыб, а именно их высоту и ширину, а также соответствующий вес. Эти три значения помогут нам понять, как работает множественная линейная регрессия на практике.

Сначала давайте используем Python для построения модели множественной линейной регрессии на основе нашей выборки из 20 точек.

Код:

import numpy as np import pandas as pd from sklearn.linear_model import LinearRegression # 20-точечная выборка данных из набора данных Fish Market data = [ [11.52, 4.02, 242.0], [12.48, 4.31, 290.0], [12.38, 4.70, 340.0], [12.73, 4.46, 363.0], [12.44, 5.13, 430.0], [13.60, 4.93, 450.0], [14.18, 5.28, 500.0], [12.67, 4.69, 390.0], [14.00, 4.84, 450.0], [14.23, 4.96, 500.0], [14.26, 5.10, 475.0], [14.37, 4.81, 500.0], [13.76, 4.37, 500.0], [13.91, 5.07, 340.0], [14.95, 5.17, 600.0], [15.44, 5.58, 600.0], [14.86, 5.29, 700.0], [14.94, 5.20, 700.0], [15.63, 5.13, 610.0], [14.47, 5.73, 650.0] ] # Создать DataFrame df = pd.DataFrame(data, columns=[«Height», «Width», «Вес»]) # Независимые переменные (Рост и Ширина) X = df[[«Рост», «Ширина»]] # Целевая переменная (Вес) y = df[«Вес»] # Подгонка модели model = LinearRegression().fit(X, y) # Извлечение коэффициентов b0 = model.intercept_ # β₀ b1, b2 = model.coef_ # β₁ (Рост), β₂ (Ширина) # Печать результатов print(f»Intercept (β₀): {b0:.4f}») print(f»Height slope (β₁): {b1:.4f}») print(f»Width slope (β₂): {b2:.4f}»)

Результаты:

Перехват (β₀): -1005,2810

Высота наклона (β₁): 78,1404

Наклон ширины (β₂): 82,0572

Здесь мы не делали разделения на обучающую и тестовую выборки, поскольку набор данных небольшой, и мы пытаемся понять математику, лежащую в основе модели, а не построить ее.

Источник: towardsdatascience.com

✅ Найденные теги: Множественная, новости

ОСТАВЬТЕ СВОЙ КОММЕНТАРИЙ

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Каталог бесплатных опенсорс-решений, которые можно развернуть локально и забыть о подписках

галерея

Фото сгенерированных лиц: исследование показывает, что люди не могут отличить настоящие лица от сгенерированных
Нейросети построили капитализм за трое суток: 100 агентов Claude заперли…
Скетч: цифровой осьминог и виртуальный мир внутри компьютера с человечком.
Сцена с жестами пальцами, где один жест символизирует "VPN", а другой "KHP".
‼️Paramount купила Warner Bros. Discovery — сумма сделки составила безумные…
Скриншот репозитория GitHub "Claude Scientific Skills" AI для научных исследований.
Структура эффективного запроса Claude с элементами задачи, контекста и референса.
Эскиз и готовая веб-страница платформы для AI-дизайна в современном темном режиме.
ideipro logotyp
Image Not Found
Звёздное небо с галактиками и туманностями, космос, Вселенная, астрофотография.

Система оповещения обсерватории Рубина отправила 800 000 сигналов в первую ночь наблюдений.

Астрономы будут получать оповещения о небесных явлениях в течение нескольких минут после их обнаружения. Теренс О'Брайен, редактор раздела «Выходные». Публикации этого автора будут добавляться в вашу ежедневную рассылку по электронной почте и в ленту новостей на главной…

Мар 2, 2026
Женщина с длинными тёмными волосами в синем свете, нейтральный фон.

Расследование в отношении 61-фунтовой машины, которая «пожирает» пластик и выплевывает кирпичи.

Обзор компактного пресса для мягкого пластика Clear Drop — и что будет дальше. Шон Холлистер, старший редактор Публикации этого автора будут добавляться в вашу ежедневную рассылку по электронной почте и в ленту новостей на главной странице вашего…

Мар 2, 2026
Черный углеродное волокно с текстурой плетения, отражающий свет.

Материал будущего: как работает «бессмертный» композит

Учёные из Университета штата Северная Каролина представили композит нового поколения, способный самостоятельно восстанавливаться после серьёзных повреждений.  Речь идёт о модифицированном армированном волокном полимере (FRP), который не просто сохраняет прочность при малом весе, но и способен «залечивать» внутренние…

Мар 2, 2026
Круглый экран с изображением замка и горы, рядом электронная плата.

Круглый дисплей Waveshare для креативных проектов

Круглый 7-дюймовый сенсорный дисплей от Waveshare создан для разработчиков и дизайнеров, которым нужен нестандартный экран.  Это IPS-панель с разрешением 1 080×1 080 пикселей, поддержкой 10-точечного ёмкостного сенсора, оптической склейкой и защитным закалённым стеклом, выполненная в круглом форм-факторе.…

Мар 2, 2026

Впишите свой почтовый адрес и мы будем присылать вам на почту самые свежие новости в числе самых первых