Statistika

Menggali informasi dari sebuah data
Menggali informasi dari sebuah data.

Statistika

Sekumpulan informasi atau data selalu menjadi hal yang menarik untuk dibicarakan, bagaimana kita mengelompokkan data menjadi sebuah himpunan, kemudian sekumpulan informasi tersebut kita sajikan dalam suatu tabel dan diagram, dengan tujuan untuk mempermudah melakukan pengamatan pada data tersebut.

Dan kali ini, kita juga bakal berurusan dengan sekumpulan informasi atau data, pada pembahasan kali ini kita tertarik untuk mengetahui "ciri-ciri" suatu data, ciri-ciri yang dimaksud akan berupa suatu angka yang dapat mewakili sekumpulan informasi tersebut.

Ibaratnya seperti ini, misal kita mendapatkan pengumuman bahwa seluruh nilai UTS pada mata pelajaran matematika untuk murid kelas 8 telah tersedia di mading sekolah, mungkin bagi kalian yang "iseng" berpikir bahwa ada informasi-informasi yang bisa kita gali dari sekumpulan nilai tersebut.

Seperti, seberapa besar perbedaan nilai antar kelas tersebut, kelas mana yang mempunyai "rata-rata" tertinggi, kemudian sebaliknya, kelas mana yang mempunyai "rata-rata" terendah, dan masih banyak lagi. Apa tujuannya kita gali informasi tersebut? Bagi siswa mungkin kalian bisa membantu teman-teman kalian yang berada di kelas dengan nilai "rata-rata" yang rendah.

Selain itu, kalian juga bisa ikut belajar dengan murid-murid yang berada di kelas dengan nilai "rata-rata" yang tinggi. Dari sudut pandang guru, mungkin dapat melihat apakah sistem pembelajarannya efektif atau tidak, dan juga dapat mengetahui kelas mana yang perlu penanganan khusus.

Rata-Rata atau Mean

Memang agak sedikit aneh pembahasan kali ini, mau menjelaskan sesuatu tapi istilahnya udah disinggung duluan buat ngejelasin hal yang lain, tapi tenang aja, inti maknanya belum dijelaskan kok. Oke lupakan aja, sekarang coba kita bayangkan kita punya 5 buah naga dan 5 buah belimbing (biar gak mainstream, biasanya apel terus).

Kita pengen membagikan buah tersebut ke empat teman kita (kitanya gak perlu dihitung), mungkin ada beberapa cara untuk membagikannya, ada yang memberinya dengan cara 3,3,3,1, kemudian 3,3,2,2, atau bisa juga 4,2,2,2, dan masih banyak lagi. Namun kita lihat, tidak ada kombinasi yang adil.

Maksudnya, keempat teman kita tersebut selalu ada yang lebih dan ada yang kurang, sedangkan kita disisi lain bisa saja memakan/mengambil dua buah kemudian membagikannya sehingga sama rata, tapi anggap saja kita udah kenyang, dan kita bersikeras untuk membagikannya secara sama rata.

Supaya adil, kita bisa menjumlahkan banyak keseluruhan buah kita terlebih dahulu, kemudian kita bagi total/jumlah tersebut dengan banyak teman-teman kita. Dengan demikian, berdasarkan ide tersebut kita hitung total buahnya ada 5+5 = 10, kemudian jumlah teman kita ada 4, sehingga
\frac{10}{4}= 2.5\,\text{buah} .

Kita perlu membagikannya sebanyak 2.5 buah atau secara bahasa 2 buah utuh, kemudian setengah potongan buah kepada teman-teman kita. Dan ini selaras seperti konsep rata-rata, yaitu menjumlahkan nilai suatu informasi kemudian membagi dengan banyaknya informasi tersebut.

Secara matematis, rata-rata \overline{x} dapat kita ekspresikan sebagai

\overline{x} = \frac{x_1 + x_2 + x_3 + \dotsc + x_n}{n}

, di mana n merupakan banyaknya informasi yang kita miliki.

Misal, kita punya data berupa rata-rata nilai UTS matematika kelas 8 pada contoh di awal, untuk kelas 8A mempunyai rata-rata 85.5, kelas 8B rata-ratanya 81.5, kelas 8C rata-ratanya 87.3, kelas 8D rata-ratanya 90, dan kelas 8E rata-ratanya 88.7. Bisa kah kalian hitung rata-rata nilai untuk keseluruhan kelas, guna membantu guru mengevaluasi pembelajarannya?

Langsung aja kita manfaatkan ide sebelumnya, totalkan terlebih dahulu nilai tersebut, kemudian dibagi dengan banyak nilainya

\overline{x} = \frac{85.5+81.5+87.3+90+88.7}{5}
\rightarrow \overline{x} = \frac{433}{5}
\rightarrow \overline{x} = 86.6

Median dan Modus

Sengaja nih median dan modus saya gabungin aja, mengingat keduanya lebih enak kalau dijelasin secara bahasa sehari-hari aja, saya gak bakal ngejelasinnya secara matematis banget. Oke lanjut, misal kita punya sekumpulan nilai fisika anak-anak kelas 8C.

Data tersebut yaitu

75,70,90,86,79,95,88,90,77,80,81,90,78,82,79

, anggap aja ada 15 murid dalam satu kelas tersebut. Dan kali kita tertarik nyari tahu nilai tengah atau nilai yang berada di posisi di mana, dapat membagi distribusi nilai tersebut menjadi dua bagian yang sama rata, atau yang dikenal sebagai median.

Selain itu kita juga tertarik buat nyari tahu nilai yang sering muncul pada distribusi nilai tersebut, atau yang dikenal sebagai modus. Mungkin untuk modus kalian bisa mengetahuinya dengan mudah, dalam sekumpulan informasi nilai tersebut kalian bisa langsung tahu bahwa modusnya adalah \text{Mo} = 90.

Untuk median tidak semudah itu, kalau ada yang menerka bahwa median dari distribusi ini adalah 90, mari kita lanjutkan pembahasannya. Ada satu hal yang perlu kalian lakukan terlebih dahulu, yaitu menyusunnya terlebih dahulu dengan urutan berdasarkan besar nilai tersebut, apabila kita susun distribusi sebelumnya menjadi

70,75,77,78,79,79,80,81,82,86,88,90,90,90,95

Setelah disusun seperti itu, silahkan kalian temukan mediannya. Dalam distribusi ini akan ditemukan bahwa mediannya adalah \text{Me} = 81, nah, yang jadi pertanyaan sekarang, bagaimana ketika jumlah datanya genap?

Median untuk banyak data ganjil

Pada banya data yang ganjil (sebanyak 15) seperti sebelumnya kita dapat dengan mudah mencari nilai tengahnya yaitu berada di posisi ke-8, karena ada sebanyak 7 nilai disebelah kirinya, dan ada 7 juga disebelah kananya.

Ketika datanya kita tambah, misal menjadi 16, yang perlu kita lakukan adalah mencari nilai rata-rata pada dua nilai, karena kita gak bisa mencari posisi pastinya. Kalau kita pilih posisi ke-8, di kiri ada 7 nilai tapi di kanan ada 8 nilai, begitu juga sebaliknya, ketika kita pilih posisi ke-9, disebelah kiri ada 8, disebelah kanan jadinya ada 7.

Dengan ide sebelumnya, maka kita akan merata-ratakan nilai pada posisi ke-8 dan ke-9. Apabila kita tambahkan satu nilai lagi yaitu 77, maka distribusinya menjadi

70,75,77,77,78,79,79,80,81,82,86,88,90,90,90,95

, maka mediannya

\text{Me} = \frac{x_8 + x_9}{2} = \frac{80+81}{2} = 80.5 .
Median untuk banyak data genap

Secara matematis, median dapat kita ekspresikan sebagai berikut

\text{Me} = x_{\frac{n+1}{2}}

, jika n atau jumlah data ganjil. Dan juga

\text{Me} = \frac{x_{\frac{n}{2}} + x_{\frac{n}{2}+1}}{2}

, jika n atau jumlah data genap.

Ukuran Persebaran Data

Ingat lagi pada ilustrasi yang di awal, kita telah menyinggung bahwa kita tertarik untuk mengetahui seberapa berbedanya nilai rata-rata antar kelas. Sekarang, saya ambil contoh sederhana aja, misal kita punya data yang pertama

85,84,85,86,85,85,84,86

, kemudian data yang kedua kita

75,81,70,90,85,71,98,79 .

Kalau saya tanya mana yang paling beragam nilainya, dan mana yang tidak begitu beragam, tentu kalian bakal ngejawab, bahwa data yang pertama tidak begitu beragam, sedangkan untuk data yang kedua sangat beragam. Namun perlu diingat, kita perlu sesuatu yang objektif alias ada ukurannya secara angka.

Dan keberagaman nilai tersebut dapat diukur menggunakan apa yang kita sebut sebagai standar deviasi. Idenya adalah kita menghitung seberapa besar simpangan nilai-nilai tersebut terhadap nilai rata-ratanya, kemudian total simpangannya dibagi dengan banyak datanya.

Untuk data yang pertama, rata-ratanya \overline{x_1} = 85, sedangka data yang kedua \overline{x_2} = 81.125. Kalau gitu, kita langsung aja hitung standar deviasinya \sigma, berdasarkan ide sebelumnya. Untuk data pertama

\sigma_1 = \sqrt{\frac{{(85-85)}^2+{(84-85)}^2+{(85-85)}^2+{(86-85)}^2+{(85-85)}^2+{(85-85)}^2+{(84-85)}^2+{(86-85)}^2}{8}}
\rightarrow \sigma_1 = \sqrt{\frac{{(0)}^2+{(-1)}^2+{(0)}^2+{(1)}^2+{(0)}^2+{(0)}^2+{(-1)}^2+{(1)}^2}{8}}
\rightarrow \sigma_1 = \sqrt{\frac{4}{8}}
\rightarrow \sigma_1 = \sqrt{\frac{1}{2}}
\rightarrow \sigma_1 \approx 0.707

, bisakah kalian hitung untuk data yang kedua?

Hasil standar deviasi untuk data yang kedua sebesar \sigma_2 \approx 9.613, nah sekarang jelas, semakin besar standar deviasinya semakin besar pula keberagaman datanya.

Label
< Materi SebelumnyaSegiempat dan Segitiga
Search icon