Summary 17/03/2023 M Daffa Nafis Shafwan
Regresi linier adalah metode statistik untuk mengukur hubungan antara variabel independen (biasanya diwakili oleh x) dan variabel dependen (biasanya diwakili oleh y) dengan menggunakan persamaan linier. Regresi linier dapat digunakan untuk memprediksi nilai variabel dependen berdasarkan nilai variabel independen. Beberapa konsep penting dalam regresi linier antara lain: 1. Garis Regresi: Garis regresi adalah garis lurus yang paling baik mewakili hubungan antara variabel independen dan dependen dalam data. Garis regresi didefinisikan oleh persamaan y = mx + b, di mana m adalah kemiringan garis regresi dan b adalah titik potong dengan sumbu y.
2. Koefisien Determinasi: Koefisien determinasi (R-squared) adalah ukuran seberapa baik garis regresi cocok dengan data. R-squared berkisar antara 0 dan 1, dengan nilai yang lebih tinggi menunjukkan bahwa garis regresi lebih cocok dengan data.
3. Residuals: Residuals adalah selisih antara nilai sebenarnya dari variabel dependen dan nilai yang diprediksi oleh garis regresi. Residuals digunakan untuk mengevaluasi seberapa baik garis regresi cocok dengan data.
4. Outlier: Outlier adalah titik data yang jauh dari titik-titik lain dalam data. Outlier dapat memengaruhi hasil analisis regresi linier, dan perlu diidentifikasi dan diperiksa.
5. Jenis-jenis regresi linier: Selain regresi linier sederhana, di mana hanya satu variabel independen yang digunakan, terdapat juga regresi linier berganda di mana lebih dari satu variabel independen digunakan untuk memprediksi variabel dependen. Ada juga regresi non�linier, di mana hubungan antara variabel independen dan dependen tidak terjadi secara linier.
6. Asumsi regresi linier: Ada beberapa asumsi yang mendasari analisis regresi linier, seperti homoskedastisitas (varians yang konstan), independensi residual (tidak ada korelasi antara residual), normalitas residual (distribusi residual terdistribusi normal), dan linearitas (hubungan antara variabel independen dan dependen adalah linier). Jika asumsi-asumsi ini tidak terpenuhi, hasil dari analisis regresi linier dapat menjadi tidak akurat atau tidak dapat diandalkan.
7. Regresi linier dalam machine learning: Regresi linier juga digunakan dalam machine learning untuk memprediksi variabel dependen berdasarkan variabel independen. Namun, dalam machine learning, terdapat variasi dari regresi linier, seperti regresi linier Ridge dan Lasso yang digunakan untuk mencegah overfitting pada model regresi linier.
8. Evaluasi model regresi linier: Untuk mengevaluasi model regresi linier, selain R-squared dan residual, terdapat beberapa metode evaluasi model lain, seperti Mean Squared Error (MSE) dan Root Mean Squared Error (RMSE), yang digunakan untuk mengukur seberapa besar deviasi antara nilai prediksi dan nilai aktual.
9. Interpretasi model regresi linier: Setelah membangun model regresi linier, penting untuk melakukan interpretasi terhadap hasilnya. Interpretasi dapat dilakukan dengan mengamati koefisien regresi untuk masing-masing variabel independen, sertamelakukan uji signifikansi untuk melihat apakah koefisien tersebut signifikan atau tidak.
Regresi linier merupakan teknik analisis statistik yang umum digunakan untuk memahami hubungan antara dua atau lebih variabel. Dalam penerapannya, regresi linier memiliki kelebihan dalam kemudahan pemahaman dan interpretasi hasil, namun juga memerlukan pemahaman yang baik mengenai asumsi-asumsinya agar hasil analisis dapat diandalkan.
Regresi linier dapat digunakan dalam berbagai aplikasi, seperti dalam analisis keuangan, ilmu sosial, dan ilmu alam. Namun, sebelum menggunakan regresi linier, penting untuk memeriksa asumsi�asumsi yang mendasarinya dan memastikan bahwa data cocok untuk digunakan dalam analisis regresi linier