Search icon

Statistika Data Berkelompok - Rata-Rata, Median, Modus, Simpangan

Materi dasar statistika data berkelompok lengkap
Menggali informasi data dengan cara mengelompokkannya.

Ada cara lain ketika kita ingin menyajikan data yang jumlahnya banyak sehingga penyajiannya menjadi lebih sederhana.

Yakni dengan menyajikan data ke dalam bentuk suatu interval tertentu menggunakan ilmu statistika data berkelompok.

Daftar Isi

Penyajian Data

Misal kita punya data berupa berat badan 40 siswa-siswi kelas XII, penyajian data tersebut dapat dibagi-bagi berdasarkan kelas-kelasnya.

Seperti contoh kelas 43 - 48 kg, kelas 49 - 54 kg, dan lainnya. Kemudian dari data yang kita miliki, diperhatikan seberapa sering muncul (frekuensi) berat badan pada interval tersebut.

Termasuk batas atas dan bawahnya, contoh batas bawah pada interval sebelumnya 43 dan 49, batas atasnya yaitu 48 dan 54.

Hal ini yang membedakan antara statistika dasar yang pernah dipelajari semasa SMP.

Kita langsung coba implementasi aja, misal data berat badan siswa-siwi kelas XII tersebut secara keseluruhannya adalah:

4851756043568363
5352437567817549
6679516370476659
5761488064705762
7863576579466773

Jika diinginkan terdapat sebanyak 5 buah interval, maka masing-masing rentang pada interval tersebut mempunyai selisih sebesar rentang antara nilai terbesar dan terkecil dibagi dengan banyak intervalnya, (83 - 43)/5 = 8.

Pada data sebelumnya, nilai terkecilnya adalah 43, maka dimulai dari nilai tersebut naik 8 langkah menjadi 51.

Lalu interval berikutnya adalah satu langkah dari batas atas interval sebelumnya, yaitu 52, dan mulai lagi seperti di awal. Secara keseluruhan, rentang-rentang tersebut yaitu:

KelasFrekuensi f
43 - 519
52 - 608
61 - 6912
70 - 787
79 - 874

Hilangnya Sebagian Informasi

Kalau sekilas, memang terlihat lebih nyaman untuk diamati penyajian data seperti ini. Itulah kelebihan dari penyajian data dalam bentuk distribusi frekuensi.

Kira-kira ada yang tau kekurangannya gak? Coba perhatikan bahwa, misal pada kelas 61 - 69 kita melihat terdapat 12 data pada interval tersebut.

Hilangnya rincian informasi data berkelompok

Nah, di situ tidak diketahui rincian datanya, maksudnya, dari 12 data tersebut kita gak tahu persebaran datanya.

Bisa aja dari 12 data tersebut, ternyata berisi 53 kg semua, atau bisa juga berisi 60 kg semua, mungkin juga ternyata beragam nilainya.

Jadi ada rincian informasi yang hilang ketika merepresentasikan dalam bentuk ini. Tapi gak masalah, mari ikhlaskan aja fakta tersebut.

Terdapat trade-off berupa rincian informasi ketika menggunakan representasi data berkelompok.

Ukuran Pemusatan Data

Sekarang, alihkan fokus kalian buat mengamati serta menggali (mengekstrak) informasi dari penyajian data tersebut. Kali ini kita tertarik untuk mengetahui rata-rata berdasarkan penyajian sebelumnya.

Menghitung Rata-Rata

Ide mencari rata-ratanya adalah, kita gunakan nilai tengah dari masing-masing interval.

Setelah didapat nilai tengahnya, kita asumsikan nilai tersebut sebagai nilai yang merepresentasikan rentang tersebut. Kemudian kalikan dengan banyak data pada rentang tersebut.

Contoh, nilai tengah pada interval 43 - 51 yaitu (51 + 43)/2 = 49 (nilai yang berada di tengah-tengah antara nilai atas dan nilai bawah).

Selanjutnya mari dihitung semua nilai tengah untuk masing-masing interval, yakni sebagai berikut:

KelasFrekuensi fNilai Tengah xi
43 - 51949
52 - 60856
61 - 691265
70 - 78774
79 - 87483

Konsep rata-rata sendiri yang kita ketahui sejauh ini adalah jumlahan dari masing-masing anggota suatu data kemudian dibagi dengan banyaknya data tersebut.

Nah, dalam kasus ini jumlahan data tersebut diwakili oleh nilai tengah dikalikan dengan frekuensinya, kemudian untuk banyak datanya yaitu jumlahan semua frekuensi.

Secara matematis rata-ratanya dirumuskan seperti berikut:

\begin{align*}\bar x&=\frac{x_1f_1+x_2f_2+\cdots+x_nf_n}{f_1+f_2+\cdots+f_n}\\\bar x&=\frac{\Sigma_{n}x_i f_i}{\Sigma_{n}f_i}\end{align*}

Dan dalam hal ini rata-rata dari berat badan sebelumnya adalah 62.975.

Menggunakan Rata-Rata Sementara

Selain itu ada cara lainnya, yakni dengan memanfaatkan penalaran kita. Maksudnya, secara nalar kita berspekulasi bahwa data tersebut kemungkinan rata-ratanya berada di interval 61 - 69.

Karena jumlah data pada interval tersebut paling dominan. Nah, nilai tengah dari interval tersebut bakal dijadikan sebagai rata-rata sementara.

Secara matematis, rumus untuk rata-rata data berkelompok yaitu:

\bar x=x_s+\frac{\Sigma_n f_i d_i}{\Sigma_n f_i}

Variabel di sendiri merupakan selisih antara rata-rata sementara dengan nilai tengah pada tiap interval, xi - xs.

Apa maksudnya dari rumus tersebut? Artinya kurang lebih seperti ini, dengan mengasumsikan xs sebagai rata-rata sementara, kemudian rata-rata datanya diketahui berdasarkan pembobotan dari interval yang memiliki frekuensi terbanyak kedua.

Lalu dipengaruhi lagi oleh pembobotan dari interval-interval lainnya. Semakin besar frekuensinya maka semakin besar juga pengaruh dari kelas tersebut.

Jika interval yang nilainya kurang dari interval rata-rata sementara lebih banyak ketimbang yang lebih besar, maka akan membuat \frac{\Sigma_n f_i d_i}{\Sigma_n f_i} menjadi negatif, alhasil \bar x akan kurang dari xs, dan sebaliknya.

Untuk data sebelumnya, bila sajikan kembali datanya menjadi:

KelasFrekuensi fNilai Tengah xidi = xi - xs
43 - 51949-16
52 - 60856-9
61 - 6912650
70 - 787749
79 - 8748316

Dengan menggunakan rumus rata-rata sebelumnya didapat rata-ratanya sebesar 62.775.

Modus

Kemudian untuk mengetahui modusnya (data yang sering muncul), dapat dihitung berdasarkan rumus berikut:

M_o=t_b+k\frac{d_1}{d_1+d_2}

Di mana:

  • tb merupakan tepi bawah kelas modus.
  • d1 selisih frekuensi kelas modus dengan kelas sebelumnya.
  • d2 selisih dengan kelas sesudahnya.
  • k panjang kelas.

Untuk data berat badan sebelumnya, kelas modusnya yaitu 61 - 69 (frekuensi terbanyak), sehingga:

\begin{align*}t_b&=61-0.5=60.5\\d_1&=12-8=4\\d_2&=12-7=5\\k&=(69-61)+1=9\end{align*}

Dengan demikian modusnya adalah:

\begin{align*}M_o&=60.5+9\frac{4}{4+5}\\M_o&=64.5\end{align*}

Perhatikan bahwa, ada hal menarik di sini. Ingat lagi pada fakta-fakta sebelumnya, bisa saja interval 52 - 60 meskipun mempunyai frekuensi 8 tapi isinya 55 sebanyak 8 buah. Sedangkan pada 69 - 61 isinya beragam semua.

Jadi masih ada jaminan modus hasil perhitungannya belum tentu mewakili nilai yang sering muncul sesungguhnya.

Median

Selanjutnya, kita akan coba mencari mediannya alias nilai tengah dari keseluruhan data. Untuk mengetahuinya, dapat dimanfaatkan rumus sebagai berikut ini:

M_e=t_m+k\frac{\frac{n}{2}-F}{f_m}

Di mana:

  • tm merupakan tepi bawah kelas median.
  • n banyak data.
  • F frekuensi kumulatif tepat sebelum kelas median.
  • fm frekuensi kelas median.
  • k panjang kelas.

Untuk data sebelumnya, kelas median berada di interval 61 - 69. Dengan nilai variabel yang diperlukannya:

\begin{align*}t_m&=61-0.5=60.5\\n&=40\\F&=9+8=17\\f_m&=12\\k&=(69-61)+1=9\end{align*}

Nilai mediannya adalah:

\begin{align*}M_e&=60.5+9\frac{\frac{40}{2}-17}{12}\\M_e&=67.25\end{align*}
Rumus ukuran pemusatan data

Ukuran Persebaran Data

Selain pengen tahu sekumpulan datanya terpusat di mana, ada ukuran data lainnya untuk mengetahui seberapa merata kah informasinya.

Jangkauan atau Range

Konsep paling sederhana untuk melihat seberapa menyebar suatu data adalah melihat rentang data atau jangkauan (range).

Untuk data tunggal, bisa dicari selisih antara data tertinggi dengan data terendah.

Pada data berdistribusi, jangkauan R merupakan selisih antara nilai tengah pada kelas tertinggi dengan kelas terendah. Pada data berat badan sebelumnya, jangkauannya adalah:

R=\frac{87+79}{2}-\frac{51+43}{2}=36

Simpangan Rata-Rata

Nampaknya, jangkauan saja tidak cukup untuk merepresentasikan persebaran data. Ingat! Bisa saja data berkumpul disekitar nilai tertentu, tentu dibutuhkan konsep lainnya yang lebih "mantap".

Oke, kita lanjutkan dengan konsep simpangan rata-rata, untuk data berdistribusi simpangan rata-ratanya yaitu:

S_R=\frac{\Sigma^{n}f_i\lvert x_i-\bar x\rvert}{\Sigma^{n} f_i}

Di mana xi nilai tengah pada kelas ke-i, dan \bar x rata-rata data.

Dari rumus tersebut bisa digaris bawahi bahwa, semakin tersebar datanya maka akan semakin besar selisihnya (simpangannya) terhadap rata-ratanya.

Simpangan Baku

Namun perlu diperhatikan lagi, karena ada yang menjadi daya tarik pada simpangan rata-rata.

Misal pada rentang yang jauh dari rata-rata mempunyai frekuensi kecil, sedangkan interval yang dekat mempunyai frekuensi lebih besar.

Ada kemungkinan kita tidak bisa membedakan ketika hal sebaliknya terjadi (interval jauh frekuensi besar, interval dekat frekuensi kecil).

Perbedaan simpangan rata-rata dengan simpangan baku

Dengan itu, bisa gunakan konsep lain yang disebut sebagai simpangan baku atau standar deviasi.

Di mana selisih (simpangan) nilai tengah dengan rata-rata dihitung berdasarkan bentuk kuadrat, rumusnya yakni seperti berikut:

S_B=\sqrt{\frac{1}{n}\Sigma^{n}f_i\cdot(x_i-\bar x)^2}

Dengan penjelasan variabel-variabel yang persis seperti sebelumnya.

Perbedaannya Dengan Simpangan Rata-Rata

Apa yang berbeda di sini? Perbedannya yaitu, simpangan yang lebih jauh akan memiliki bobot lebih besar karena selisihnya dikuadratkan.

Dengan demikian kita lebih mudah membedakan mana distribusi yang tersebar hanya disekitar nilai tertentu, dengan yang benar-benar tersebar.

Rumus ukuran persebaran data
Label

Komentar