Statistika Data Berkelompok - Rata-Rata, Median, Modus, Simpangan
Penulis: Lintang ErlanggaAda cara lain ketika kita ingin menyajikan data yang jumlahnya banyak sehingga penyajiannya menjadi lebih sederhana.
Yakni dengan menyajikan data ke dalam bentuk suatu interval tertentu menggunakan ilmu statistika data berkelompok.
Daftar Isi
Penyajian Data
Misal kita punya data berupa berat badan 40 siswa-siswi kelas XII, penyajian data tersebut dapat dibagi-bagi berdasarkan kelas-kelasnya.
Seperti contoh kelas 43 - 48 kg, kelas 49 - 54 kg, dan lainnya. Kemudian dari data yang kita miliki, diperhatikan seberapa sering muncul (frekuensi) berat badan pada interval tersebut.
Termasuk batas atas dan bawahnya, contoh batas bawah pada interval sebelumnya 43 dan 49, batas atasnya yaitu 48 dan 54.
Hal ini yang membedakan antara statistika dasar yang pernah dipelajari semasa SMP.
Kita langsung coba implementasi aja, misal data berat badan siswa-siwi kelas XII tersebut secara keseluruhannya adalah:
48 | 51 | 75 | 60 | 43 | 56 | 83 | 63 |
53 | 52 | 43 | 75 | 67 | 81 | 75 | 49 |
66 | 79 | 51 | 63 | 70 | 47 | 66 | 59 |
57 | 61 | 48 | 80 | 64 | 70 | 57 | 62 |
78 | 63 | 57 | 65 | 79 | 46 | 67 | 73 |
Jika diinginkan terdapat sebanyak 5 buah interval, maka masing-masing rentang pada interval tersebut mempunyai selisih sebesar rentang antara nilai terbesar dan terkecil dibagi dengan banyak intervalnya, (83 - 43)/5 = 8.
Pada data sebelumnya, nilai terkecilnya adalah 43, maka dimulai dari nilai tersebut naik 8 langkah menjadi 51.
Lalu interval berikutnya adalah satu langkah dari batas atas interval sebelumnya, yaitu 52, dan mulai lagi seperti di awal. Secara keseluruhan, rentang-rentang tersebut yaitu:
Kelas | Frekuensi f |
---|---|
43 - 51 | 9 |
52 - 60 | 8 |
61 - 69 | 12 |
70 - 78 | 7 |
79 - 87 | 4 |
Hilangnya Sebagian Informasi
Kalau sekilas, memang terlihat lebih nyaman untuk diamati penyajian data seperti ini. Itulah kelebihan dari penyajian data dalam bentuk distribusi frekuensi.
Kira-kira ada yang tau kekurangannya gak? Coba perhatikan bahwa, misal pada kelas 61 - 69 kita melihat terdapat 12 data pada interval tersebut.
Nah, di situ tidak diketahui rincian datanya, maksudnya, dari 12 data tersebut kita gak tahu persebaran datanya.
Bisa aja dari 12 data tersebut, ternyata berisi 53 kg semua, atau bisa juga berisi 60 kg semua, mungkin juga ternyata beragam nilainya.
Jadi ada rincian informasi yang hilang ketika merepresentasikan dalam bentuk ini. Tapi gak masalah, mari ikhlaskan aja fakta tersebut.
Terdapat trade-off berupa rincian informasi ketika menggunakan representasi data berkelompok.
Ukuran Pemusatan Data
Sekarang, alihkan fokus kalian buat mengamati serta menggali (mengekstrak) informasi dari penyajian data tersebut. Kali ini kita tertarik untuk mengetahui rata-rata berdasarkan penyajian sebelumnya.
Menghitung Rata-Rata
Ide mencari rata-ratanya adalah, kita gunakan nilai tengah dari masing-masing interval.
Setelah didapat nilai tengahnya, kita asumsikan nilai tersebut sebagai nilai yang merepresentasikan rentang tersebut. Kemudian kalikan dengan banyak data pada rentang tersebut.
Contoh, nilai tengah pada interval 43 - 51 yaitu (51 + 43)/2 = 49 (nilai yang berada di tengah-tengah antara nilai atas dan nilai bawah).
Selanjutnya mari dihitung semua nilai tengah untuk masing-masing interval, yakni sebagai berikut:
Kelas | Frekuensi f | Nilai Tengah xi |
---|---|---|
43 - 51 | 9 | 49 |
52 - 60 | 8 | 56 |
61 - 69 | 12 | 65 |
70 - 78 | 7 | 74 |
79 - 87 | 4 | 83 |
Konsep rata-rata sendiri yang kita ketahui sejauh ini adalah jumlahan dari masing-masing anggota suatu data kemudian dibagi dengan banyaknya data tersebut.
Nah, dalam kasus ini jumlahan data tersebut diwakili oleh nilai tengah dikalikan dengan frekuensinya, kemudian untuk banyak datanya yaitu jumlahan semua frekuensi.
Secara matematis rata-ratanya dirumuskan seperti berikut:
Dan dalam hal ini rata-rata dari berat badan sebelumnya adalah 62.975.
Menggunakan Rata-Rata Sementara
Selain itu ada cara lainnya, yakni dengan memanfaatkan penalaran kita. Maksudnya, secara nalar kita berspekulasi bahwa data tersebut kemungkinan rata-ratanya berada di interval 61 - 69.
Karena jumlah data pada interval tersebut paling dominan. Nah, nilai tengah dari interval tersebut bakal dijadikan sebagai rata-rata sementara.
Secara matematis, rumus untuk rata-rata data berkelompok yaitu:
Variabel di sendiri merupakan selisih antara rata-rata sementara dengan nilai tengah pada tiap interval, xi - xs.
Apa maksudnya dari rumus tersebut? Artinya kurang lebih seperti ini, dengan mengasumsikan xs sebagai rata-rata sementara, kemudian rata-rata datanya diketahui berdasarkan pembobotan dari interval yang memiliki frekuensi terbanyak kedua.
Lalu dipengaruhi lagi oleh pembobotan dari interval-interval lainnya. Semakin besar frekuensinya maka semakin besar juga pengaruh dari kelas tersebut.
Jika interval yang nilainya kurang dari interval rata-rata sementara lebih banyak ketimbang yang lebih besar, maka akan membuat menjadi negatif, alhasil akan kurang dari xs, dan sebaliknya.
Untuk data sebelumnya, bila sajikan kembali datanya menjadi:
Kelas | Frekuensi f | Nilai Tengah xi | di = xi - xs |
---|---|---|---|
43 - 51 | 9 | 49 | -16 |
52 - 60 | 8 | 56 | -9 |
61 - 69 | 12 | 65 | 0 |
70 - 78 | 7 | 74 | 9 |
79 - 87 | 4 | 83 | 16 |
Dengan menggunakan rumus rata-rata sebelumnya didapat rata-ratanya sebesar 62.775.
Modus
Kemudian untuk mengetahui modusnya (data yang sering muncul), dapat dihitung berdasarkan rumus berikut:
Di mana:
- tb merupakan tepi bawah kelas modus.
- d1 selisih frekuensi kelas modus dengan kelas sebelumnya.
- d2 selisih dengan kelas sesudahnya.
- k panjang kelas.
Untuk data berat badan sebelumnya, kelas modusnya yaitu 61 - 69 (frekuensi terbanyak), sehingga:
Dengan demikian modusnya adalah:
Perhatikan bahwa, ada hal menarik di sini. Ingat lagi pada fakta-fakta sebelumnya, bisa saja interval 52 - 60 meskipun mempunyai frekuensi 8 tapi isinya 55 sebanyak 8 buah. Sedangkan pada 69 - 61 isinya beragam semua.
Jadi masih ada jaminan modus hasil perhitungannya belum tentu mewakili nilai yang sering muncul sesungguhnya.
Median
Selanjutnya, kita akan coba mencari mediannya alias nilai tengah dari keseluruhan data. Untuk mengetahuinya, dapat dimanfaatkan rumus sebagai berikut ini:
Di mana:
- tm merupakan tepi bawah kelas median.
- n banyak data.
- F frekuensi kumulatif tepat sebelum kelas median.
- fm frekuensi kelas median.
- k panjang kelas.
Untuk data sebelumnya, kelas median berada di interval 61 - 69. Dengan nilai variabel yang diperlukannya:
Nilai mediannya adalah:
Ukuran Persebaran Data
Selain pengen tahu sekumpulan datanya terpusat di mana, ada ukuran data lainnya untuk mengetahui seberapa merata kah informasinya.
Jangkauan atau Range
Konsep paling sederhana untuk melihat seberapa menyebar suatu data adalah melihat rentang data atau jangkauan (range).
Untuk data tunggal, bisa dicari selisih antara data tertinggi dengan data terendah.
Pada data berdistribusi, jangkauan R merupakan selisih antara nilai tengah pada kelas tertinggi dengan kelas terendah. Pada data berat badan sebelumnya, jangkauannya adalah:
Simpangan Rata-Rata
Nampaknya, jangkauan saja tidak cukup untuk merepresentasikan persebaran data. Ingat! Bisa saja data berkumpul disekitar nilai tertentu, tentu dibutuhkan konsep lainnya yang lebih "mantap".
Oke, kita lanjutkan dengan konsep simpangan rata-rata, untuk data berdistribusi simpangan rata-ratanya yaitu:
Di mana xi nilai tengah pada kelas ke-i, dan rata-rata data.
Dari rumus tersebut bisa digaris bawahi bahwa, semakin tersebar datanya maka akan semakin besar selisihnya (simpangannya) terhadap rata-ratanya.
Simpangan Baku
Namun perlu diperhatikan lagi, karena ada yang menjadi daya tarik pada simpangan rata-rata.
Misal pada rentang yang jauh dari rata-rata mempunyai frekuensi kecil, sedangkan interval yang dekat mempunyai frekuensi lebih besar.
Ada kemungkinan kita tidak bisa membedakan ketika hal sebaliknya terjadi (interval jauh frekuensi besar, interval dekat frekuensi kecil).
Dengan itu, bisa gunakan konsep lain yang disebut sebagai simpangan baku atau standar deviasi.
Di mana selisih (simpangan) nilai tengah dengan rata-rata dihitung berdasarkan bentuk kuadrat, rumusnya yakni seperti berikut:
Dengan penjelasan variabel-variabel yang persis seperti sebelumnya.
Perbedaannya Dengan Simpangan Rata-Rata
Apa yang berbeda di sini? Perbedannya yaitu, simpangan yang lebih jauh akan memiliki bobot lebih besar karena selisihnya dikuadratkan.
Dengan demikian kita lebih mudah membedakan mana distribusi yang tersebar hanya disekitar nilai tertentu, dengan yang benar-benar tersebar.