Analisis Regresi dan Korelasi

1. ๐Ÿ”— Analisis Korelasi

Korelasi mengukur seberapa kuat dan dalam arah apa dua variabel kuantitatif berhubungan secara linier.

Koefisien Korelasi Pearson ($r$)

Ini adalah ukuran paling umum untuk korelasi linier, di mana nilainya berkisar antara -1.0 hingga +1.0.

$$r = \frac{n(\sum xy) – (\sum x)(\sum y)}{\sqrt{[n\sum x^2 – (\sum x)^2][n\sum y^2 – (\sum y)^2]}}$$

  • Arah Hubungan:
    • $r$ positif: Hubungan searah. Jika X meningkat, Y cenderung meningkat (Contoh: Jam belajar dan Nilai Ujian).
    • $r$ negatif: Hubungan berlawanan arah. Jika X meningkat, Y cenderung menurun (Contoh: Jumlah rokok yang dikonsumsi dan Usia Harapan Hidup).
    • $r$ mendekati 0: Hubungan sangat lemah atau tidak ada hubungan linier.
  • Kekuatan Hubungan: Nilai $r$ yang mendekati $\pm 1$ menunjukkan hubungan yang sangat kuat, sementara nilai yang mendekati 0 menunjukkan hubungan lemah.

Koefisien Determinasi ($r^2$)

Koefisien determinasi adalah nilai $r$ yang dikuadratkan. Nilai ini menunjukkan persentase variasi pada variabel terikat (Y) yang dapat dijelaskan oleh variabel bebas (X).

  • Contoh: Jika $r = 0,80$, maka $r^2 = 0,64$. Artinya, 64% variasi pada Nilai Ujian dapat dijelaskan oleh variasi pada Jam Belajar.

2. ๐Ÿ“ˆ Analisis Regresi

Regresi lebih dari sekadar mengukur hubungan; tujuannya adalah membangun model matematika untuk memprediksi nilai variabel terikat berdasarkan nilai variabel bebas.

Regresi Linear Sederhana

Model ini menggunakan satu variabel bebas (X) untuk memprediksi satu variabel terikat (Y).

Persamaan Regresi:

$$Y = a + bX$$

Di mana:

  • $Y$ adalah variabel terikat/respons (yang diprediksi).
  • $X$ adalah variabel bebas/prediktor.
  • $a$ (Intercept) adalah nilai Y ketika X sama dengan 0.
  • $b$ (Slope/Koefisien Regresi) adalah besarnya perubahan Y untuk setiap satu satuan perubahan pada X.

Interpretasi Koefisien Regresi ($b$)

Koefisien $b$ adalah inti dari analisis regresi:

  • Jika $b = 2$, artinya setiap peningkatan 1 unit pada X akan menyebabkan peningkatan 2 unit pada Y.
  • Jika $b = -0,5$, artinya setiap peningkatan 1 unit pada X akan menyebabkan penurunan 0,5 unit pada Y.

Metode Kuadrat Terkecil (Least Squares)

Garis regresi yang paling “pas” (best fit) pada data adalah garis yang meminimalkan jumlah kuadrat dari kesalahan prediksi (disebut residual). Residual adalah perbedaan antara nilai Y yang diamati dan nilai Y yang diprediksi oleh garis regresi.

Regresi Linear Berganda

Teknik ini memperluas regresi sederhana dengan menggunakan dua atau lebih variabel bebas ($X_1, X_2, \dots$) untuk memprediksi satu variabel terikat (Y).

$$Y = a + b_1X_1 + b_2X_2 + \dots + b_kX_k$$

Setiap koefisien ($b_i$) diinterpretasikan sebagai perubahan Y untuk setiap peningkatan 1 unit pada $X_i$, dengan asumsi variabel bebas lainnya tetap konstan (ceteris paribus).


Leave a Reply

Your email address will not be published. Required fields are marked *