@dewiasiandaru – SMAN 2 Wonosari pg. 1
Selamat datang di modul analisis data – part 1 Tujuan pembelajaran yang dibahas pada modul ini yaitu : 1. Memahami analisis data dan jenis-jenis data. 2. Mengidentifikasi data variabel kategorikal dan variabel numerikal. 3. Memahami jenis-jenis interpretasi data. 4. Menentukan kuartil data tunggal dan kelompok dengan interpolasi. 5. Merepresentasikan dan menginterpretasi data dengan cara menentukan jangkauan interkuartil Asesmen / Penilaian Awal Sebelum membahas lebih lanjut apa itu analisis data, lakukan asesmen awal terlebih dahulu dengan link yang akan dibagikan oleh guru. Quotes : \"Ketika kamu merasa malas belajar, ingatlah bahwa setiap hal yang kamu pelajari membawa kamu satu langkah lebih dekat menuju kesuksesanmu di masa depan.\" 1. PENGERTIAN ANALISIS DATA DAN JENIS-JENIS DATA Analisis data adalah proses pengumpulan, pemeriksaan, dan transformasi data menjadi informasi yang berguna untuk mengambil keputusan atau menyajikan informasi yang bermanfaat. Ada beberapa tahapan dalam analisis data, yaitu: Penyajian data Analisis data Interpretasi data Pengumpulan Pemrosesan data data a. Pengumpulan data: data dikumpulkan dari berbagai sumber seperti survei, wawancara, database, dan sebagainya. b. Pemrosesan data: data yang telah dikumpulkan kemudian diolah dengan menggunakan perangkat lunak atau aplikasi analisis data, seperti Microsoft Excel, SPSS, atau Python. c. Analisis data: pada tahap ini, data dijelajahi untuk mencari pola, hubungan, atau tren dalam data. Analisis data dapat dilakukan dengan menggunakan teknik statistik seperti uji hipotesis, regresi, dan analisis multivariat. d. Interpretasi data: hasil analisis kemudian diinterpretasikan untuk mengambil kesimpulan dan membuat rekomendasi. e. Penyajian data: hasil analisis kemudian disajikan dalam bentuk grafik, tabel, atau laporan untuk mempermudah pemahaman dan pengambilan keputusan. @dewiasiandaru – SMAN 2 Wonosari pg. 2
Analisis data sangat penting dalam berbagai bidang seperti bisnis, ilmu sosial, kedokteran, dan lainnya. Dengan melakukan analisis data, kita dapat memperoleh wawasan yang berharga untuk mengambil keputusan yang lebih baik dan mencapai tujuan yang diinginkan. Berdasarkan cara pengumpulannya data dibedakan menjadi data tunggal dan data berkelompok a. Data tunggal adalah data yang terdiri dari satu nilai atau satu angka saja. Contohnya adalah tinggi badan seseorang, umur seseorang, atau berat suatu objek. b. Data berkelompok adalah data yang terdiri dari beberapa nilai atau angka yang telah dikelompokkan ke dalam kategori-kategori tertentu. Contohnya adalah pendapatan keluarga yang dibagi ke dalam kelompok-kelompok gaji, atau hasil ujian siswa yang dibagi ke dalam kelas-kelas tertentu. Dilihat dari sifatnya, jenis data statistik terbagi menjadi dua, yakni: a. Data numerikal Data numerikal diartikan sebagai ukuran, seperti tinggi badan, berat badan, IQ, tekanan darah, jumlah saham, jumlah apel, dan lain sebagainya. Para ahli statistik juga menyebut data numerikal sebagai data kuantitatif. Data numerikal dibagi menjadi dua jenis, yaitu data diskrit dan data kontinu. Data diskrit mewakili item yang dapat dihitung. Contohnya adalah jumlah buku di perpustakaan ada 1000, jumlah mobil yang dimiliki ayah adalah 2, dan lain sebagainya. Data kontinu mewakili sebuah pengukuran yang kemungkinan nilainya tidak dapat dihitung dan hanya bisa dijelaskan menggunakan interval. Misalnya tinggi sebuah tiang bendera adalah 3,5 meter, berat badan kucing adalah 3,8 kg. Source : https://cdns.klimg.com/merdeka.com/i/w/news/2021/09/29/1358264/content_images/670x335/20210929073925 -2- contoh-jenis-data-statistik-001-kurnia-azizah.jpg b. Data kategorik Data kategorik mewakili karakteristik pada data seperti jenis kelamin seseorang, status perkawinan, hobi, pekerjaan, dan lain sebagainya. Data karegorik dapat dikonversi menjadi data numerikal, misalnya nilai 0 mewakili jenis kelamin perempuan dan nilai 1 mewakili jenis kelamin laki-laki. Namun, angka ini hanya menjadi simbol saja sehingga @dewiasiandaru – SMAN 2 Wonosari pg. 3
tidak bisa mengaplikasikan operasi matematika pada angka tersebut. Nama lain untuk data kategorik adalah data kualitatif, atau beberapa orang juga menyebut sebagai yes or no data. source: https://cdns.klimg.com/merdeka.com/i/w/news/2021/09/29/1358264/content_images/670x335/20210929073925 -1- contoh-jenis-data-statistik-001-kurnia-azizah.jpg LKPD 1 Pada LKPD ini, kalian akan berlatih membedakan data kategorik dan numerik. LKPD dapat diakses pada link berikut : https://wordwall.net/resource/58487919 2. Jenis-jenis Representasi data a. Tabel distribusi frekuensi Tabel distribusi frekuensi adalah tabel yang menunjukkan jumlah pengamatan atau frekuensi dari nilai-nilai yang muncul dalam suatu sampel atau populasi. Tabel ini terdiri dari kolom-kolom yang menunjukkan nilai-nilai yang diamati dan kolom-kolom lainnya yang menunjukkan frekuensi masing-masing nilai. Tabel distribusi frekuensi umumnya digunakan untuk memvisualisasikan data secara terstruktur dan memberikan gambaran tentang bagaimana nilai-nilai data terdistribusi. Tabel ini dapat membantu dalam menganalisis dan menarik kesimpulan dari data yang diperoleh dan dapat digunakan dalam berbagai bidang, seperti statistik, matematika, ilmu sosial, dan bisnis. @dewiasiandaru – SMAN 2 Wonosari pg. 4
b. Dot Plot Dot plot adalah salah satu jenis grafik yang digunakan untuk memvisualisasikan data. Dot plot biasanya digunakan untuk menampilkan data numerikal tunggal atau beberapa kelompok data numerikal. Dot plot sering digunakan untuk memvisualisasikan data dengan jumlah pengamatan yang relatif kecil, karena setiap titik dapat mewakili satu pengamatan. Grafik ini juga berguna untuk memvisualisasikan pola dalam data, seperti skewness (kemiringan) atau modus (nilai terbanyak). Keuntungan dari dot plot adalah mudah dibaca, memperlihatkan distribusi data secara jelas dan juga dapat memungkinkan untuk membandingkan beberapa set data. Namun, dot plot kurang cocok untuk data dengan jumlah pengamatan yang sangat besar, karena dapat terlihat padat dan sulit dibaca. Contoh : Berikut ini adalah jumlah kelereng yang diperoleh Amir Hari ke 1-12 Sumber : https://www.belajarstatistik.com/blog/2021/05/18/cara-membuat-diagram-titik/ c. Histogram Histogram biasanya digunakan untuk menunjukkan distribusi dari suatu kelompok data, sedangkan diagram batang digunakan untuk membandingkan data. Histogram menampilkan data yang sifatnya kuantitatif dengan rentang data yang dikelompokkan ke dalam interval, sedangkan diagram batang menampilkan data yang sifatnya kategori. Perbedaan lainnya, pada histogram, gambar batang menempel satu sama lain, sedangkan pada diagram batang, ada spasi antarbatang. Perbedaan terakhir, diagram batang biasanya memiliki batang dengan lebar yang sama, sedangkan lebar batang dalam histogram tidak perlu sama selama luas totalnya seratus persen jika digunakan persen atau luas total sama dengan jumlah data. Oleh karena itu, frekuensi data dalam @dewiasiandaru – SMAN 2 Wonosari pg. 5
diagram batang dilihat dari panjang batang, sedangkan frekuensi dalam histogram diberikan berdasarkan area pada masing-masing batang. Perhatikan Gambar 7.3. Kedua histogram menampilkan data yang sama. Cobalah mencari bagaimana kedua histogram ini menjelaskan data yang sama walaupun terlihat berbeda. Kalian bisa menggunakan pendekatan luas persegi panjang dalam menggambar histogram. Pada histogram sebelah kiri: • Frekuensi Kelas 0-2 adalah 8, luas persegi panjangnya adalah 2 × 8 = 16 • Frekuensi Kelas 2-4 adalah 16, luas persegi panjangnya adalah 2 × 16 = 32 • Luas gabungan kedua kelas tersebut adalah 16 + 32 = 48 Pada histogram sebelah kanan: • Frekuensi Kelas 0-4 adalah 12, luas persegi panjangnya adalah 4 × 12 = 48 Jadi, kelas 0-2 dan 2-4 pada histogram kiri memiliki luas yang sama dengan kelas 2-4 pada histogram kanan, sehingga dapat dikatakan bahwa histogram kiri dan histogram kanan menjelaskan data yang sama. d. Diagram Pencar (Scatter Plot) Diagram Pencar / scatter plot adalah grafik yang menunjukkan hubungan antara dua variabel. Data direpresentasikan dengan menempatkan titik pada koordinat dua dimensi, di mana sumbu x dan y masing-masing mewakili satu variabel. Scatter plot @dewiasiandaru – SMAN 2 Wonosari pg. 6
biasanya digunakan untuk menunjukkan apakah ada hubungan antara dua variabel, dan jika ada, seberapa kuat hubungan tersebut. e. Box Plot Source : https://help.ezbiocloud.net/box-plot/ Box Plot adalah jenis diagram statistik yang digunakan untuk mewakili distribusi data numerikal secara grafis. Box plot terdiri dari sebuah kotak yang menunjukkan kuartil pertama, median (kuartil kedua), dan kuartil ketiga dari data. Garis di tengah kotak menunjukkan posisi median, sedangkan garis di atas dan di bawah kotak menunjukkan kuartil ketiga dan kuartil pertama, secara berturut-turut. Box plot sangat berguna dalam analisis statistik dan penelitian karena memungkinkan pengguna untuk memvisualisasikan distribusi data secara efektif, dengan cara yang mudah dimengerti oleh orang yang tidak memiliki latar belakang statistik yang mendalam. LKPD 2 Pada LKPD ini, kalian akan berlatih untuk memahami jenis-jenis representasi data. Pasangkan gambar yang ada dengan judul yang tepat. LKPD dapat diakses pada link berikut : https://wordwall.net/resource/58518323 3. Ukuran Penempatan (Measure of Location) a. Kuartil Data Tunggal Untuk mencari kuartil data tunggal, data perlu diurutkan terlebih dahulu dari yang terkecil hingga terbesar. @dewiasiandaru – SMAN 2 Wonosari pg. 7
Selanjutnya, kuartil membagi data menjadi 4 bagian yang sama sehingga ada 3 kuartil: o Kuartil bawah (Q1) adalah data ke 1 dari total data 4 o Kuartil Tengah (Q2) adalah data ke 2 atau 1dari total data 42 3 o Kuartil Atas (Q3) adalah data ke 4 dari total data untuk mencari letak kuartil bawah atau Q1, bagilah banyaknya data dengan 4. • Jika hasilnya adalah bilangan bulat, m, maka Q1 terletak di tengah-tengah antara urutan ke-m dan ke-(m + 1). • Tetapi jika hasil baginya bukan merupakan bilangan bulat, bulatkanlah hasilnya ke atas, maka Q₂ terletak di urutan sesuai hasil pembulatan. Misalkan jika banyaknya data ada 20 buah, di manakah letak median(Q2)? Di manakah letak Q₁? Untuk median (Q2), 20 dibagi 2 yaitu 10, maka median terletak di antara data urutan ke-10 dan ke-11. Untuk Q₁, 20 dibagi 4 yaitu 5, maka Q₁ terletak di antara data urutan ke-5 dan ke- 6. Untuk lebih jelas, perhatikan gambar berikut ini. b. Kuartil Data Berkelompok Untuk menentukan kuartil data berkelompok hampir sama dengan data tunggal : o Kuartil bawah (Q1) adalah data ke 1 dari total data 4 o Kuartil Tengah (Q2) adalah data ke 2 atau 1 dari total data 42 o Kuartil Atas (Q3) adalah data ke 3 dari total data 4 Namun perlu dilanjutkan dengan cara interpolasi sbb : Contoh : Perhatikan data berikut ini! Tentukan : Kuartil Bawah (Q1) pg. 8 Pembahasan : Total frekuensi = 30 Maka Q1 ada pada data ke ¼ x 30 = 7,5 Pada tabel, data ke 7,5 terletak pada kelas 40-42. Tepi bawah kelas 40-42 adalah 39,5 dan tepi atas kelas 40-42 adalah 42,5. Banyaknya data yang berada sebelum 39,5 ada sebanyak 2 buah. Banyaknya data yang berada sebelum 42,5 ada sebanyak 13 buah. @dewiasiandaru – SMAN 2 Wonosari
Tempatkan angka-angka tersebut dalam garis bilangan sebagai berikut. Q1 = 41, artinya 25% dari sepatu yang terjual memiliki ukuran lebih kecil sama dengan 41, atau ukuran 38, 39, 40, dan 41. Sebanyak 75% sepatu yang terjual merupakan sepatu dengan ukuran di atas 41. c. Jangkauan Kuartil / Interquartile Range (IQR) Jangkauan interkuartil adalah selisih antara kuartil atas (Q3) dan kuartil bawah (Q1). Jika jangkauan interkuartil dinotasikan dengan IQR maka: IQR = Q3 – Q1. Contoh 1 : Misalkan kita memiliki data tunggal sebagai berikut: 15, 10, 25, 20, 50, 35, 45, 40, 30 Langkah pertama adalah mengurutkan data dalam urutan dari terkecil hingga terbesar: 10, 15, 20, 25, 30, 35, 40, 45, 50 Total 9 data sehingga : ������1 = 1 × 9 = 2,25 4 Kuartil 1 terletak pada data ke 3 yaitu 20 ������3 = 3 × 9 = 6,75 4 Kuartil 3 terletak pada data ke 7 yaitu 40 Langkah terakhir adalah menghitung jangkauan interkuartil (IQR), yang merupakan selisih antara Q3 dan Q1: IQR = Q3 - Q1 = 40 - 20 = 20 Jadi, dalam contoh ini, jangkauan interkuartil (IQR) dari data tunggal tersebut adalah 20. @dewiasiandaru – SMAN 2 Wonosari pg. 9
UJI KOMPETENSI 1 1. Jelaskan tahapan analisis data! 2. Jelaskan perbedaan data kategorik dan numerikal, serta berikan contohnya! 3. Tentukan jangkauan interkuartil (IQR) data berikut ini! a. 4, 6, 8, 10, 12, 14, 16 b. 5, 1, 3, 2, 2, 4, 1, 3, 6, 1, 0 c. 5, 1, 3, 2, 2, 4, 1, 6, 1, 0, 7, 5 4. Perhatikan data box plot berikut! Jangkauan interkuartil data di atas adalah ... 5. Perhatikan tabel distribusi frekuensi berikut! Nilai 50 60 70 80 90 100 Frekuensi 5 6 7 963 Jangkauan interkuartil tabel di atas adalah ... @dewiasiandaru – SMAN 2 Wonosari pg. 10
Tujuan Pembelajaran 2 : Membuat dan menginterpretasi boxplot (box-and-whisker plot) dan menggunakannya untuk membandingkan data A. Statistika Lima Serangkai Statistika lima serangkai adalah statistika deskriptif yang memberikan informasi tentang sekumpulan pengamatan. Pengamatan ini terdiri dari statistika berikut : 1. Median, 2. Kuartil 1 3. Kuartil 3 4. data terendah 5. data tertinggi Kelima angka tersebut dapat disajikan dalam bentuk berikut ini : Median atau Kuartil 2 merupakan nilai tengah data setelah data diurutkan. Karena median bersifat robust atau tidak terpengaruh oleh adanya data ekstrim, maka median ini digunakan untuk menunjukkan pusat data dalam ringkasan lima angka. Sedangkan empat angka yang lain, yaitu Q1 (Kuartil 1), Q3 (Kuartil 3), Xb (nilai data terendah), dan Xa (nilai data tertinggi) digunakan untuk menunjukkan sebaran data. Ringkasan lima angka ini juga menjadi acuan ketika membuat boxplot atau diagram kotak. Boxplot merupakan salah satu metode penyajian data yang penting dalam analisis data eksploratif. Dengan boxplot bisa diketahui bentuk sebaran data dan distribusi data. @dewiasiandaru – SMAN 2 Wonosari pg. 11
B. Pengertian Box Plot Source : https://help.ezbiocloud.net/box-plot/ Box Plot adalah jenis diagram statistik yang digunakan untuk mewakili distribusi data numerikal secara grafis. Box plot terdiri dari sebuah kotak yang menunjukkan kuartil pertama, median (kuartil kedua), dan kuartil ketiga dari data. Garis di tengah kotak menunjukkan posisi median, sedangkan garis di atas dan di bawah kotak menunjukkan kuartil ketiga dan kuartil pertama, secara berturut-turut. Box plot sangat berguna dalam analisis statistik dan penelitian karena memungkinkan pengguna untuk memvisualisasikan distribusi data secara efektif, dengan cara yang mudah dimengerti oleh orang yang tidak memiliki latar belakang statistik yang mendalam. C. Cara Membuat Box plot Berikut adalah langkah-langkah untuk membuat box plot: 1. Siapkan data yang sudah diurutkan. 2. Hitung nilai kuartil pertama (Q1), kuartil kedua (median atau Q2), dan kuartil ketiga (Q3) dari data. 3. Hitung jangkauan interkuartil (IQR) = Q3 – Q1. 4. Hitung batas bawah (lower fence) dengan rumus Q1 - 1,5 x IQR. Batas bawah adalah batas terendah data yang masih dianggap normal. Lower fence (batas bawah) adalah nilai batas bawah dari jangkauan data dalam sebuah himpunan data. Lower fence dapat digunakan untuk mengidentifikasi apakah terdapat outlier (pencilan) pada data. 5. Hitung batas atas (upper fence) dengan rumus Q3 + 1,5 x IQR. Batas atas adalah batas tertinggi data yang masih dianggap normal. Upper fence (batas atas) adalah nilai batas atas dari jangkauan data dalam sebuah himpunan data. Upper fence dapat digunakan untuk mengidentifikasi apakah terdapat outlier (pencilan) pada data. 6. Menentukan nilai minimal dan maksimal yang bukan termasuk outlier (pencilan) 7. Gambarkan kotak dari Q1 hingga Q3. Garis vertikal di dalam kotak menunjukkan median atau Q2. 8. Gambarkan garis horizontal dari kotak ke lower fence dan upper fence. Garis-garis ini disebut sebagai whisker. @dewiasiandaru – SMAN 2 Wonosari pg. 12
9. Gambarkan titik-titik di luar batas atas dan batas bawah yang dianggap sebagai pencilan atau outlier. 10. Box plot bisa dalam bentuk horizontal atau vertikal. D. Contoh dan Pembahasan Contoh 1 : Data tinggi badan (dalam sentimeter) siswa laki-laki kelas 10 di sebuah sekolah adalah sbb: 172, 168, 175, 192, 166, 174, 178, 171, 173, 177, 169, 165, 179, 176, 170 Buatlah data di atas ke dalam bentuk box plot! Pembahasan : Berikut ini adalah langkah-langkah untuk membuat box plot dari data tersebut: 1. Urutkan data dari terkecil hingga terbesar: 165, 166, 168, 169, 170, 171, 172, 173, 174, 175, 176, 177, 178, 179, 192 2. Hitung nilai kuartil pertama (Q1), kuartil kedua (median atau Q2), dan kuartil ketiga (Q3) dari data: Q1 = ¼ x 15 = 3,75 Q1 = 3,75 dibulatkan menjadi 4, maka Q1 adalah data ke-4 yaitu 169 Q2 = ½ x 15 = 7,5 Q2 = 7,5 dibulatkan menjadi 8, maka Q2 adalah data ke-8 yaitu 173 Q3 = ¾ x 15 = 11,25 Q3 = 11,25 dibulatkan menjadi 12, maka Q3 adalah data ke-12 yaitu 177 3. Hitung jangkauan interkuartil (IQR) = Q3 – Q1 IQR = 177 - 169 = 8 4. Hitung batas bawah (lower fence) dengan rumus Q1 - 1,5 x IQR: Lower fence = 169 - 1,5 x 8 = 157 5. Hitung batas atas (upper fence) dengan rumus Q3 + 1,5 x IQR: Upper fence = 177 + 1,5 x 8 = 189 6. Menentukan nilai minimal dan maksimal yang bukan outlier (pencilan) Nilai minimal = 165 Nilai maksimal = 179 7. Gambarkan kotak dari Q1 hingga Q3, dan garis vertikal di dalam kotak menunjukkan median atau Q2: Q1 Q2 Q3 8. Gambarkan garis horizontal dari kotak ke lower fence dan upper fence. Garis-garis ini disebut sebagai whisker Batas Nilai minimal Nilai maksimal atas Batas Q1 Q2 Q3 Outlier / Pencilan bawah 160 165 170 175 180 185 190 195 pg. 13 @dewiasiandaru – SMAN 2 Wonosari
9. Titik-titik di luar batas atas dan batas bawah dianggap sebagai pencilan atau outlier. Dalam data ini terdapat satu pencilan dalam data ini, yaitu 192 karena nilainya melebihi batas atas (Upper fence) 189 sehingga ada satu titik outlier pada box plot. Berikut adalah box plot yang dihasilkan dari data tinggi badan siswa laki-laki tersebut, kita tidak perlu melabelkan Q1, Q2, dan Q3: 160 165 170 175 180 185 190 195 Box plot menunjukkan bahwa data tinggi badan siswa laki-laki tersebut memiliki median 173 cm, kuartil pertama 169 cm, dan kuartil ketiga 177 cm. Rentang data normal/ IQR (Interquartile Range) adalah 8 cm. Terdapat data yang dianggap sebagai pencilan (outlier) dalam data ini yaitu 192 cm. E. Menginterpretasi box and whisker plot Box and whisker plot (atau diagram kotak-garis) adalah sebuah grafik statistik yang digunakan untuk menampilkan distribusi data numerikal secara visual. Interpretasi box and whisker plot dapat membantu memahami karakteristik data, termasuk rentang nilai, kecenderungan sentral, dan penyebaran data. Beberapa cara untuk menginterpretasi box plot sbb: 1. Melihat statistika lima serangkai Box plot and whisker plot menunjukkan statistika lima serangkai, kuartil pertama (Q1) , kuartil kedua (Q2), kuartil ketiga (Q3), nilai maksimal, dan nilai minimal dari data. Rentang nilai data yang paling umum terletak di dalam kotak, dan nilai median (nilai tengah) terletak di dalam kotak. 2. Memperhatikan titik pencilan / outlier Titik ini menunjukkan nilai-nilai yang sangat jauh dari rentang data utama. Outliers dapat diketahui apabila ada titik atau data yang berada di luar batas atas atau batas bawah. 3. Mengevaluasi kecenderungan sentral Box plot membantu untuk menentukan apakah data cenderung simetris atau miring (skew). Dengan melihat letak median, maka dapat diketahui kecenderungan tersebut. a. Jika median berada di tengah kotak, maka data cenderung simetris. Dalam kasus ini, data memiliki distribusi yang merata di sekitar median dan whisker bagian atas dan bawah akan memiliki panjang yang sama serta tidak terdapat nilai outlier ataupun nilai ekstrim. @dewiasiandaru – SMAN 2 Wonosari pg. 14
Source : https://idschool.net/wp-content/uploads/2022/06/2-Macam-Bentuk-Boxplot.jpg b. Jika median tidak berada di tengah box maka data tidak simetris (miring). Dalam kasus ini, data memiliki distribusi yang condong ke salah satu sisi dari median dan salah satu dari whisker lebih panjang dari yang lainnya. Kemiringan suatu data mewakili kecenderungan distribusi data yang ada. Dalam kasus ini, data memiliki distribusi yang condong ke salah satu sisi dari median. Source : https://idschool.net/wp-content/uploads/2022/06/Boxplot-dengan-Data-Tidak-Simetrik-atau- Miring.jpg a. Median sama dengan nilai minimum atau maksimum Pada kasus tertentu, posisi median dapat sama dengan nilai minimum atau maksimum, terutama pada data yang memiliki jumlah observasi yang sedikit dan tersebar relatif merata. - Jika data hanya terdiri dari satu atau dua nilai, maka median dapat sama dengan nilai minimum atau maksimum. Misalnya, jika data hanya memiliki nilai 5, maka median adalah 5 dan nilai minimum dan maksimum juga 5. - Jika semua nilai dalam data adalah sama, maka median, nilai minimum, dan maksimum semuanya akan sama. Misalnya, jika data hanya terdiri dari nilai 7, maka median, nilai minimum, dan maksimum semuanya adalah 7. Dalam kesimpulannya, posisi median dalam box plot dapat bervariasi tergantung pada kemiringan (skewness) atau kecenderungan data serta jumlah observasi yang ada dalam data. 4. Melihat penyebaran data Jarak antara batas atas dan batas bawah pada diagram menunjukkan seberapa tersebar data. a. Jika jaraknya pendek, maka data cenderung rapat atau terkonsentrasi di sekitar nilai median. b. Jika jaraknya lebar, maka data cenderung terdispersi atau tersebar. Dalam keseluruhan, box and whisker plot dapat memberikan informasi yang berguna tentang data numerikal. Interpretasi box and whisker plot membantu untuk memahami bagaimana data didistribusikan dan memungkinkan kita untuk membuat kesimpulan tentang kecenderungan dan penyebaran data. @dewiasiandaru – SMAN 2 Wonosari pg. 15
Contoh 1 : Perhatikan box plot usia siswa berikut ini! Beberapa interpretasi dari box plot di atas yaitu : - Usia semua siswa kurang dari 17 tahun yaitu antara 7 hingga 16 tahun. - Jangkauan Interkuartil (IQR) data di atas adalah 5. - Q1 = 10, Q2 (Median) = 13, dan Q3 = 15. - Data terendah adalah 7 dan data tertinggi adalah 16. - Data bersifat asimetri (miring ke kanan). - Distribusi data paling banyak ada di usia 10 hingga 15 tahun. - Tidak ada data pencilan (outlier). Contoh 2 : Perhatikan dua box plot berikut ini! Data di atas adalah data pendapatan (dalam ribuan) pedagang kaki lima di pasar A dan pasar B. Jumlah sampel masing-masing pasar sebanyak 11 pedagang. Perhatikan persamaan dan perbedaan dari kedua boxplot tersebut berikut ini! a. Pertama: garis tengah yang melewati box yang merupakan median dari data. Median adalah ukuran yang terkenal untuk lokasi variabel (nilai pusat atau rata- rata). Jika dibandingkan, kedua boxplot menunjukkan bahwa pendapatan pedagang di pasar A dan pasar B memiliki median yang sama. b. Kedua: Panjang box yang ditentukan oleh IQR (interquartile range) atau simpangan kuartil. IQR adalah ukuran yang terkenal untuk mengukur penyebaran data. Semakin tinggi (jika boxplot vertikal) atau semakin lebar (jika boxplot horizontal) bidang IQR ini maka menunjukkan data semakin menyebar. @dewiasiandaru – SMAN 2 Wonosari pg. 16
Berdasarkan hal tersebut terlihat bahwa pendapatan pedagang di pasar B yang menyebar (memiliki rentang yang lebih besar) dibandingkan pendapatan pedagang di pasar A. c. Ketiga: Perbandingan kesimetrisan data. Jika data simetris, garis median akan berada di tengah box dan whisker pada bagian atas dan bagian bawah akan memiliki panjang yang sama. Jika data tidak simetris (condong), median tidak akan berada di tengah box dan salah satu dari whisker lebih panjang dari yang lainnya. Berdasarkan hal tersebut terlihat bahwa data pendapatan pedagang di pasar A bersifat simetris, sedangkan data pendapatan pedagang di pasar B tidak simetris (condong). Jadi dapat disimpulkan bahwa : - Pendapatan pedagang di pasar A dan pasar B memiliki median yang sama. - Pendapatan pedagang di pasar B yang menyebar (memiliki rentang yang lebih besar) dibandingkan pendapatan pedagang di pasar A. - Data pendapatan pedagang di pasar A bersifat simetris, sedangkan data pendapatan pedagang di pasar B tidak simetris (condong). Contoh 3 : Box and whisker plot berikut menunjukkan data nilai hasil ujian matematika dan Biologi. Matematika Sains Nilai Bandingkan kedua box plot di atas! Jawab : - Median nilai ujian Matematika adalah 68 sedangkan median nilai ujian Sains adalah 52. Hal ini berarti rata-rata ujian matematika lebih tinggi dari pada ujian Sains. - Jangkauan interkuartil (IQR) Matematika adalah 78 – 54 = 24, sedangkan jangkauan interkuartil (IQR) Sains adalah 82 – 40 = 42. Hal ini berarti nilai Sains lebih terdispersi / menyebar dibanding nilai matematika. @dewiasiandaru – SMAN 2 Wonosari pg. 17
UJI KOMPETENSI 2 1. Untuk masing-masing box plot berikut, tentukan : - Nilai minimal dan nilai maksimal - Kuartil bawah - Median - Kuartil atas - Jangkauan interkuartil / Interquartile range (IQR) 2. Gambarkan box plot dari data berikut! a. Box plot A Nilai minimal 2 Kuartil bawah 7 Median 9 Kuartil atas 10 Nilai maksimal 13 b. Box plot B Nilai minimal 23 Kuartil bawah 30 Median 32 Kuartil atas 34 Nilai maksimal 45 c. Box plot C Nilai minimal 60 Kuartil bawah 85 Median 100 Kuartil atas 110 Nilai maksimal 170 3. Gambarkan box plot dari data berikut ini! a. 40, 80, 90, 90, 100, 120, 130 b. 8, 10, 13, 14, 14, 15, 15, 16, 18, 19, 21, 22, 24, 29, 35 @dewiasiandaru – SMAN 2 Wonosari pg. 18
4. Bandingkan box plot berikut ini! a. b. c. @dewiasiandaru – SMAN 2 Wonosari pg. 19
5. Andi berencana pergi berlibur di Pulau Bali. Box plot di bawah merupakan informasi tentang prakiraan hujan di bulan Mei dan Bulan Juni di Pulau Bali. Jawablah pertanyaan berikut ini! a. Berapakah median air hujan di bulan Mei? b. Berapakah curah hujan tertinggi di bulan Juni? c. Berapa persen hari dengan curah hujan lebih dari 2,5 mm di bulan Juni? d. Berapa persen hari dengan curah hujan lebih dari 2,5 mm di bulan Mei? e. Berapa persen hari dengan curah hujan dibawah 1,2 mm di bulan Mei? f. Bulan apa sebaiknya Andi pergi ke Bali? 6. Box plot berikut menunjukkan suhu harian di Gunungkidul selama bulan Mei. Berapa persen cuaca di Gunungkidul antara 22 hingga 24 derajat celcius? a. 25% b. 50% c. 75% d. 35% e. 70% 7. Perhatikan dua box plot berikut ini! Berdasarkan box plot di atas, manakah pernyataan yang tidak sesuai? pg. 20 a. Jangkauan keduanya sama b. Jangkauan interkuartil sama c. Median data set X lebih besar dari pada data set Y d. Median data set Y lebih besar dari pada data set X e. Kedua data simetris @dewiasiandaru – SMAN 2 Wonosari
8. Noah telah menghitung data berikut ini dari kumpulan data tentang usia para perenang pada hari Sabtu pagi di sebuah kolam renang: Nilai terendah: 7 Kuartil bawah: 10 Median: 15 Kuartil atas: 22 Nilai tertinggi: 31 Box plot yang sesuai adalah ... a. b. c. d. e. @dewiasiandaru – SMAN 2 Wonosari pg. 21
Referensi : Dicky Susanto, dkk, Buku Siswa Matematika Kelas X Revisi, Kemdikbud, 2022. EZBioCloude, Box Plot, 17 April 2023, https://help.ezbiocloud.net/box-plot/ (Diakses, 18 April 2023) Galuh Nurvinda K , Pelajari Jenis-Jenis Data Statistik dan Metode Pengolahan Data yang Digunakan, 2021, https://dqlab.id/pelajari-jenis-jenis-data-statistik-dan-metode- pengolahan-data-yang-digunakan (Diakses 11 April 2023) Khan Academy, Box Plor Review, https://www.khanacademy.org/math/statistics- probability/summarizing-quantitative-data/box-whisker-plots/a/box-plot- review#:~:text=A%20box%20and%20whisker%20plot%E2%80%94also%20called%20a %20box%20plot,the%20box%20at%20the%20median. (Diakses 11 April 2023) Kurnia Azizah, 8 Jenis Data Statistik dan Contohnya, Pahami Berdasarkan Modelnya, Rabu, 29 September 2021 08:02, https://www.merdeka.com/trending/8-jenis-data-statistik- dan-contohnya-pahami-berdasarkan-modelnya-kln.html?page=4 (Diakses 11 April 2023) LP2M, Data Kategorikal: Definisi, Jenis, Fitur dan Contoh, 28 Januari 2023, https://lp2m.uma.ac.id/2023/01/28/data-kategorikal-definisi-jenis-fitur-dan-contoh/ (Diakses 11 April 2023) Mohrosidi, Environmental Data Science : Visualisasi Distribusi Data, 1 Januari 2019, https://environmentallearning.wordpress.com/2019/01/01/visualisasi-distribusi-data/ (Diakses 11 April 2023) Yunita, ws. Ringkasan 5 angka. 16 Agustus 2021, 10.14. https://eksplorasidata.mipa .ugm.ac.id/2021/08/16/ringkasan-5-angka/(Diakses 5 Juli 2023) @dewiasiandaru – SMAN 2 Wonosari pg. 22
Search
Read the Text Version
- 1 - 22
Pages: