Regresi Linear Berganda dan Link Download File Referensi

https://eu2.contabostorage.com/00f3241116844f24b628f46d81abb929:st1/folder8/8083/1656358681_latihan_5__statistika_dasar___Matematika.pdf

2026-05-31 19:06:04 - Admin

<style> body{ font-family: Arial, Helvetica, sans-serif; line-height: 1.6; margin:0; padding:0 20px; background-color:#f9f9f9; color:#333; } h1, h2, h3{ color:#2c3e50; } .container{ max-width:800px; margin:30px auto; background:#fff; padding:20px; box-shadow:0 2px 5px rgba(0,0,0,0.1); } table{ width:100%; border-collapse:collapse; margin:15px 0; } th, td{ border:1px solid #ddd; padding:8px; text-align:center; } th{ background:#f2f2f2; } pre{ background:#eee; padding:10px; overflow-x:auto; } a{ color:#2980b9; text-decoration:none; } a:hover{ text-decoration:underline; } </style><div class="container"> <h1>Regresi Linear Berganda</h1> <p>Regresi linear berganda (multiple linear regression) adalah teknik statistik yang memperkirakan hubungan antara satu variabel dependen (yang ingin diprediksi) dengan dua atau lebih variabel independen (pembentuk). Model ini memperluas regresi linear sederhana sehingga memungkinkan analisis faktor-faktor yang mempengaruhi suatu fenomena secara bersamaan.</p> <h2>Persamaan Dasar</h2> <p>Model regresi linear berganda dapat dituliskan dalam bentuk:</p> <pre>Y = 0 + 1X1 + 2X2 + + kXk + </pre> <ul> <li><strong>Y</strong> : variabel dependen.</li> <li><strong>0</strong> : intercept (titik potong pada sumbu Y).</li> <li><strong>i</strong> : koefisien regresi untuk variabel independen <em>Xi</em>, menunjukkan perubahan ratarata Y bila Xi bertambah satu satuan, dengan asumsi variabel lain tetap.</li> <li><strong></strong> : error term, selisih antara nilai aktual dan nilai yang diprediksi oleh model.</li> </ul> <h2>Asumsiasumsi Model</h2> <ol> <li><strong>Linearitas</strong>: Hubungan antara Y dan setiap Xi bersifat linear.</li> <li><strong>Independensi error</strong>: Error pada satu observasi tidak berkorelasi dengan error pada observasi lain.</li> <li><strong>Homoskedastisitas</strong>: Variansi error konstan untuk semua nilai prediktor.</li> <li><strong>Normalitas error</strong>: Distribusi error mengikuti distribusi normal.</li> <li><strong>No multicollinearity</strong>: Variabel independen tidak saling berkorelasi tinggi.</li> </ol> <h2>Langkahlangkah Analisis</h2> <ol> <li><strong>Pengumpulan Data</strong>: Kumpulkan data Y dan semua variabel independen Xi.</li> <li><strong>Eksplorasi Data</strong>: Periksa statistik deskriptif, visualisasi, dan korelasi antar variabel.</li> <li><strong>Uji Asumsi</strong>: Lakukan uji linearitas (scatter plot), uji heteroskedastisitas (BreuschPagan), uji normalitas (ShapiroWilk), dan cek multikolinearitas (VIF).</li> <li><strong>Estimasi Koefisien</strong>: Biasanya memakai metode kuadrat terkecil (ordinary least squares OLS).</li> <li><strong>Evaluasi Model</strong>: Lihat nilai R<sup>2</sup>, Adjusted R<sup>2</sup>, ANOVA, dan nilai pvalue tiap koefisien.</li> <li><strong>Interpretasi</strong>: Tinjau signifikansi dan arah pengaruh variabel independen.</li> <li><strong>Prediksi</strong>: Gunakan persamaan untuk memperkirakan nilai Y pada data baru.</li> </ol> <h2>Contoh Praktis</h2> <p>Misalkan sebuah perusahaan ingin memprediksi penjualan (Y) berdasarkan iklan TV (X1), iklan radio (X2), dan iklan online (X3). Data historis 30 minggu diperoleh dan dianalisis menggunakan OLS.</p> <h3>Hasil Estimasi</h3> <table> <thead> <tr> <th>Koefisien</th> <th>Estimasi</th> <th>Std. Error</th> <th>tvalue</th> <th>pvalue</th> </tr> </thead> <tbody> <tr> <td>Intercept (0)</td> <td>2.5</td> <td>0.8</td> <td>3.13</td> <td>0.004</td> </tr> <tr> <td>TV (1)</td> <td>0.045</td> <td>0.010</td> <td>4.50</td> <td>&lt;0.001</td> </tr> <tr> <td>Radio (2)</td> <td>0.030</td> <td>0.015</td> <td>2.00</td> <td>0.054</td> </tr> <tr> <td>Online (3)</td> <td>0.012</td> <td>0.006</td> <td>2.00</td> <td>0.052</td> </tr> </tbody> </table> <p>Dari tabel, iklan TV berpengaruh signifikan (p&lt;0.001) terhadap penjualan. Iklan radio dan online hampir signifikan pada level 5% (p0.05). Model menghasilkan R<sup>2</sup> = 0.87, artinya 87% variasi penjualan dapat dijelaskan oleh ketiga jenis iklan.</p> <h2>Cara Mengatasi Masalah Umum</h2> <ul> <li><strong>Multikolinearitas</strong>: Jika VIF > 10, pertimbangkan menghapus atau menggabungkan variabel yang berkorelasi tinggi.</li> <li><strong>Heteroskedastisitas</strong>: Transformasi variabel (mis. log) atau gunakan metode regresi robust.</li> <li><strong>Outlier</strong>: Identifikasi menggunakan leverage dan Cooks distance; pertimbangkan mengeluarkan atau memeriksa data kembali.</li> </ul> <h2>Implementasi dengan Python (Opsional)</h2> <pre>import pandas as pdfrom sklearn.model_selection import train_test_splitfrom sklearn.linear_model import LinearRegressionfrom sklearn.metrics import r2_score# Membaca datadata = pd.read_csv('penjualan.csv')X = data[['TV','Radio','Online']]y = data['Penjualan']# SplitX_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)# Modelmodel = LinearRegression()model.fit(X_train, y_train)# Koefisienprint('Intercept:', model.intercept_)print('Koefisien:', model.coef_)# Prediksi & evaluasiy_pred = model.predict(X_test)print('R2:', r2_score(y_test, y_pred)) </pre> <h2>Kesimpulan</h2> <p>Regresi linear berganda merupakan alat yang kuat untuk memahami hubungan simultan antara satu variabel target dan beberapa faktor prediktor. Dengan memperhatikan asumsiasumsi model, melakukan pemeriksaan multikolinearitas, serta menilai signifikansi statistik, analyst dapat menghasilkan model yang dapat diandalkan untuk prediksi dan pengambilan keputusan.</p> <p>Untuk mempelajari lebih lanjut, kunjungi <a href="https://en.wikipedia.org/wiki/Multiple_linear_regression" target="_blank">Wikipedia tentang Multiple Linear Regression</a> atau sumber statistik terakreditasi lainnya.</p></div>

Lebih banyak