Regresi linear berganda (multiple linear regression) adalah teknik statistik yang memperkirakan hubungan antara satu variabel dependen (yang ingin diprediksi) dengan dua atau lebih variabel independen (pembentuk). Model ini memperluas regresi linear sederhana sehingga memungkinkan analisis faktor-faktor yang mempengaruhi suatu fenomena secara bersamaan.
Model regresi linear berganda dapat dituliskan dalam bentuk:
Y = 0 + 1X1 + 2X2 + + kXk +
Misalkan sebuah perusahaan ingin memprediksi penjualan (Y) berdasarkan iklan TV (X1), iklan radio (X2), dan iklan online (X3). Data historis 30 minggu diperoleh dan dianalisis menggunakan OLS.
| Koefisien | Estimasi | Std. Error | tvalue | pvalue |
|---|---|---|---|---|
| Intercept (0) | 2.5 | 0.8 | 3.13 | 0.004 |
| TV (1) | 0.045 | 0.010 | 4.50 | <0.001 |
| Radio (2) | 0.030 | 0.015 | 2.00 | 0.054 |
| Online (3) | 0.012 | 0.006 | 2.00 | 0.052 |
Dari tabel, iklan TV berpengaruh signifikan (p<0.001) terhadap penjualan. Iklan radio dan online hampir signifikan pada level 5% (p0.05). Model menghasilkan R2 = 0.87, artinya 87% variasi penjualan dapat dijelaskan oleh ketiga jenis iklan.
import pandas as pdfrom sklearn.model_selection import train_test_splitfrom sklearn.linear_model import LinearRegressionfrom sklearn.metrics import r2_score# Membaca datadata = pd.read_csv('penjualan.csv')X = data[['TV','Radio','Online']]y = data['Penjualan']# SplitX_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)# Modelmodel = LinearRegression()model.fit(X_train, y_train)# Koefisienprint('Intercept:', model.intercept_)print('Koefisien:', model.coef_)# Prediksi & evaluasiy_pred = model.predict(X_test)print('R2:', r2_score(y_test, y_pred)) Regresi linear berganda merupakan alat yang kuat untuk memahami hubungan simultan antara satu variabel target dan beberapa faktor prediktor. Dengan memperhatikan asumsiasumsi model, melakukan pemeriksaan multikolinearitas, serta menilai signifikansi statistik, analyst dapat menghasilkan model yang dapat diandalkan untuk prediksi dan pengambilan keputusan.
Untuk mempelajari lebih lanjut, kunjungi Wikipedia tentang Multiple Linear Regression atau sumber statistik terakreditasi lainnya.
