1. ๐Ÿ“‹ Teknik Sampling (Pengambilan Sampel)

Inferensi statistik hanya akan akurat jika sampel yang diambil bersifat representatif (mewakili populasi). Jika pengambilan sampel bias, maka hasil uji hipotesis atau interval kepercayaan akan menyesatkan.

A. Probability Sampling (Sampel Acak)

Setiap anggota populasi memiliki peluang yang diketahui dan bukan nol untuk terpilih. Ini adalah syarat utama untuk statistika inferensial parametrik.

  1. Simple Random Sampling: Setiap anggota populasi memiliki peluang yang sama. (Contoh: Mengundi nama dari kotak).
  2. Systematic Sampling: Mengambil anggota setiap urutan ke-$k$ (Contoh: Mengambil setiap orang ke-10 yang masuk toko).
  3. Stratified Random Sampling: Populasi dibagi menjadi sub-kelompok (strata) berdasarkan karakteristik tertentu (usia, gender), lalu sampel acak diambil dari setiap strata.
  4. Cluster Sampling: Populasi dibagi menjadi kelompok berdasarkan area (klaster). Peneliti memilih beberapa klaster secara acak dan mendata seluruh anggota di dalam klaster terpilih tersebut.

B. Non-Probability Sampling

Anggota populasi dipilih berdasarkan ketersediaan atau pertimbangan peneliti. Hasilnya sulit digeneralisasi ke populasi secara akurat.

  • Convenience Sampling: Mengambil data dari orang yang paling mudah ditemui.
  • Snowball Sampling: Responden awal merekomendasikan responden berikutnya (sering untuk populasi yang sulit dijangkau).

2. ๐Ÿ“‰ Distribusi Sampling dan Teorema Limit Pusat (CLT)

Ini adalah konsep “jembatan” yang menghubungkan sampel dengan populasi.

Apa itu Distribusi Sampling?

Jika Anda mengambil ribuan sampel dari populasi yang sama dan menghitung rata-ratanya, rata-rata dari ribuan sampel tersebut akan membentuk distribusinya sendiri. Inilah yang disebut Distribusi Sampling.

Teorema Limit Pusat (Central Limit Theorem)

CLT adalah aturan emas dalam statistika yang menyatakan:

Terlepas dari apapun bentuk distribusi populasi asli Anda (menceng, seragam, atau aneh sekalipun), jika ukuran sampel ($n$) cukup besar (biasanya $n \geq 30$), maka distribusi sampling dari rata-rata sampel akan mendekati Distribusi Normal.

Mengapa ini penting?

Karena CLT memungkinkan kita menggunakan uji statistik yang mengasumsikan normalitas (seperti Uji-t atau Z-test) bahkan ketika kita tidak tahu pasti apakah populasi aslinya normal atau tidak.


3. ๐Ÿ“ Kesalahan Baku (Standard Error)

Seringkali orang bingung antara Standar Deviasi dan Standar Error. Keduanya berbeda:

  • Standar Deviasi ($s$): Mengukur seberapa tersebar data individu di dalam satu sampel.
  • Standar Error ($SE$): Mengukur seberapa akurat rata-rata sampel mewakili rata-rata populasi. Ini adalah standar deviasi dari distribusi sampling.

$$SE = \frac{s}{\sqrt{n}}$$

Kuncinya: Semakin besar ukuran sampel ($n$), semakin kecil Standard Error-nya. Artinya, rata-rata sampel Anda akan semakin dekat dengan rata-rata populasi yang sebenarnya.

Leave a Reply

Your email address will not be published. Required fields are marked *