Statistik Deskriptif adalah langkah awal yang krusial dalam setiap analisis data. Tujuannya adalah untuk mengubah tumpukan angka mentah menjadi wawasan yang ringkas dan mudah dicerna melalui angka ringkasan dan visualisasi.

Fungsi utamanya adalah menjelaskan dan menggambarkan karakteristik kumpulan data yang sedang di tangan. Ini ibarat membuat ringkasan naratif dari sebuah novel panjang: Anda tidak membuat prediksi tentang masa depan cerita, tetapi Anda merangkum poin-poin penting yang ada saat ini.

A. Ukuran Pemusatan Data (Measures of Central Tendency)

Ukuran pemusatan adalah nilai tunggal yang mencoba memberikan gambaran “tipikal” atau “pusat” dari data.

UkuranFungsi MendalamKelebihan & Kekurangan
Mean (Rata-rata)Nilai yang paling stabil dan umum digunakan. Dihitung dengan menjumlahkan semua nilai kemudian dibagi dengan jumlah data (xห‰=nโˆ‘xโ€‹).Kelebihan: Memanfaatkan semua nilai dalam data. Kekurangan: Sangat sensitif terhadap outlier (nilai ekstrem). Contoh: Jika dalam data gaji ada gaji CEO yang sangat tinggi, rata-rata akan terdorong naik.
Median (Nilai Tengah)Nilai tengah dalam data yang sudah diurutkan. Jika jumlah data genap, median adalah rata-rata dari dua nilai tengah.Kelebihan: Sangat tahan terhadap outlier. Ideal digunakan untuk data yang cenderung miring (skewed) atau terdapat nilai ekstrem. Contoh: Rata-rata harga rumah di suatu lingkungan lebih baik diwakili oleh median.
Modus (Nilai Terbanyak)Nilai atau kategori yang frekuensinya paling tinggi. Kumpulan data bisa memiliki satu modus (unimodal), dua modus (bimodal), atau lebih (multimodal).Kelebihan: Satu-satunya ukuran pemusatan yang dapat digunakan untuk data nominal (kategorikal). Kekurangan: Mungkin tidak ada modus sama sekali, atau nilainya tidak unik.

B. Ukuran Penyebaran Data (Measures of Dispersion) ๐Ÿ“ˆ

Menggambarkan seberapa homogen atau heterogen kumpulan data tersebut. Informasi ini sangat penting karena data dengan rata-rata yang sama bisa memiliki penyebaran yang sangat berbeda.

UkuranFungsi MendalamSignifikansi
Range (Jangkauan)Nilai tertinggi dikurangi nilai terendah (Range=Xmaxโ€‹โˆ’Xminโ€‹). Memberikan gambaran cepat tentang jarak total data.Sangat sederhana dihitung, namun terlalu sensitif terhadap outlier karena hanya melibatkan dua nilai ekstrem.
Varians (ฯƒ2 atau s2)Rata-rata kuadrat dari selisih setiap titik data dari mean. Semakin besar varians, semakin besar penyebaran data dari rata-ratanya.Penting sebagai landasan matematis untuk banyak uji statistik inferensial, namun sulit diinterpretasikan karena satuannya adalah kuadrat dari satuan data asli.
Standar Deviasi (ฯƒ atau s)Akar kuadrat dari Varians.s=nโˆ’1โˆ‘(xโˆ’xห‰)2โ€‹โ€‹(untuk sampel).Ukuran penyebaran yang paling praktis. Memiliki satuan yang sama dengan data asli, sehingga mudah diinterpretasikan. Digunakan untuk menilai risiko dalam keuangan atau variabilitas dalam pengukuran ilmiah.
Kuartil, Desil, PersentilUkuran posisi yang membagi data menjadi bagian-bagian yang sama (kuartil menjadi 4, desil 10, persentil 100).Digunakan untuk mengidentifikasi nilai-nilai relatif dalam data (misalnya, nilai Anda berada di persentil ke-90). Jangkauan Antar Kuartil (Interquartile Range/IQR) digunakan untuk mengukur penyebaran di 50% data di tengah dan sangat tahan terhadap outlier.

C. Penyajian Data (Data Presentation) ๐Ÿ“Š

Visualisasi adalah cara paling efektif untuk menyampaikan hasil statistik deskriptif.

  1. Histogram:
    • Digunakan untuk data kuantitatif kontinu.
    • Batang-batang saling berhimpitan, dan area batang melambangkan frekuensi.
    • Berguna untuk menunjukkan bentuk distribusi data (misalnya, normal, miring ke kiri/kanan, atau multimodal).
  2. Diagram Batang (Bar Chart):
    • Digunakan untuk data kategorikal atau diskrit.
    • Terdapat jarak antar batang, karena setiap batang mewakili kategori yang berbeda.
    • Efektif untuk membandingkan frekuensi atau nilai antar kategori.
  3. Diagram Lingkaran (Pie Chart):
    • Digunakan untuk menunjukkan proporsi (persentase) setiap kategori terhadap total keseluruhan.
    • Terbaik digunakan ketika jumlah kategori sedikit (idealnya kurang dari 5) agar visualisasi tetap jelas.
  4. Diagram Kotak Garis (Box Plot):
    • Visualisasi yang ringkas yang menunjukkan lima angka ringkasan: nilai minimum, kuartil pertama (Q1โ€‹), median (Q2โ€‹), kuartil ketiga (Q3โ€‹), dan nilai maksimum.
    • Sangat efektif untuk membandingkan penyebaran dan pusat dari beberapa kumpulan data secara bersamaan dan untuk mengidentifikasi outlier.