Thursday, April 14, 2011

ANALISIS STATISTIK INFERENSIAL
Oleh : Sawiyanto, S.PDI

A. PENDAHULUAN
Di dalam buku-buku Statistik diterangkan bahwa statistik berfungsi (fungsi pertama) untuk mendeskripsikan (dan karenanya dikenal dengan statistik deskriptif), statistik inferensial serta statistik regresi. Statistik deskriptif mempunyai fungsi untuk menggolong-golongkan atau mengelompokkan data yang masih belum teratur menjadi susunan yang teratur dan mudah diinterpretasikan. Di samping itu statistik deskriptif juga memberikan, memaparkan atau menyajikan informasi sedemikian rupa sehingga data yang dihasilkan dari penelitian dapat dimanfaatkan oleh orang lain
Berikut ini pemakalah akan menguraikan fungsi statistik yang kedua, yaitu statistik untuk menggeneralisasikan kesimpulan penelitian sampel untuk wilayah yang lebih luas cakupannya yaitu untuk sampel yang lebih besar ataupun populasi dengan harapan supaya kita dapat mengetahui perbedaan penggunaan statistik parametrik dengan statistik nonparametric, mengetahui persyaratan penggunaan statistik parametrik dan dapat menguji data dalam rangka memenuhi persyaratan analisis data dengan statistik parametric, mengetahui ketepatan penggunaan rumus-rumus statistik dalam hubungannya dengan banyaknya variabel, tujuan penelitian, dan jenis data yang akan diolah dan memahami teknik dan dapat menggunakian rumus-rumus statistik untuk menganalisis data penelitian.

A. PERTIMBANGAN DALAM PENGGUNAAN RUMUS STATISTIK
Sudah disebutkan bahwa statistik deskriptif berfungsi untuk mengelompokkan data, menggarap, menyimpulkan, memaparkan, serta menyajikan hasil olahan. Sesuai dengan fungsinya ini maka statistik fungsi pertama cocok sekali untuk penelitian yang tujuannya hanya mendeskripsikan, yaitu penelitian deskriptif. Statistik inferensial berfungsi untuk menggeneralisasikan hasil penelitian yang dilakukan pada sampel, bagi populasi. Sesuai dengan fungsi tersebut maka statistik inferensial cocok untuk penelitian sampel. Fungsi statistik ketiga, yaitu statistik regresi atau statistik prediksi berfungsi untuk menentukan nilai Y bagi benda, hal atau individu apabila telah diketahui nilai X dari benda, hal atau individu tersebut oleh karena dapat digunakan untuk menentukan itulah maka statistik ini dikenal dengan statistik prediksi. Gabungan antara fungsi kedua dan ketiga cocok untuk penelitian korelasi, komparasi dan sebagainya dalam rumus-rumus korelasi, uji-t, uji-F regresi, analisis jalur, dan lain-lain.
Ditinjau dari fungsinya, ada penelitian deskripsi, penelitian kolerasi, penelitian komparasi, penelitian eksperimen, dan sebagainya. Di dalam penelitian yang bukan deskriptif peneliti hampir pasti tentu mempunyai sekurang-kurangnya dua buah variabel. Dengan data tentang variabel-variabel tersebut peneliti mengkorelasikan, mengkomparasikan atau mencari perbedaan rerata. Jika penelitian dilakukan oleh peneliti terhadap sampel maka statistik inferensial membantu peneliti dalam memberikan informasi apakah hasil dari penelitian sampel tersebut dapat diberlakukan untuk populasi ataukah tidak. Inikah tugas statistik inferensial seperti disebutkan.
Sehubungan dengan fungsi statistik yang begitu penting yakni meramalkan keberlakuan hasil penelitian sampel bagi populasiyang subjeknya jauh lebih banyak, serta mengingat hal-hal lain yang berkenan dengan data maka sebelum menentukan pilihan teknik analisis data dengan menggunakan statistik, penelitian masih harus memperhatikan hal-hal lain. Banyak faktor yang harus dipertimbangkan oleh peneliti dalam menentukan pilihan, sekurang-kurangnya ada 5 (lima) hal yang dipertimbangkan dalam pemilihan teknik statistik untuk analisis data, yaitu:
1. Banyaknya subjek penelitian.
Ada rumus atau teknik tertentu yang menuntut minimalsubjek yang harus diolah karena jika subjeknya tidak cukup banyak tidak cukup berfungsi mengisi sel-sel dalam tabel. ANAVA merupakan contoh dalam pembicaraan ini.
2. Tersedianya kelengkapan atau sarana penunjang.
Pada waktu ini menganalisis data dengan memanfaatkan jasa komputer sudah bukan merupakan barang mewah. Namun demikian jika ditempatkan peneliti belum tersedia komputer, atau masih ada hambatan dalm penggunaan bahkan lebih cepat slesai penelitiannya jika dianalisis secara manual, maka pemanfaatan komputer perlu ditunda.rumus dan teknik statistik yang digunakan dengan prosedur analisis manual biasanya dipilihkan yang relatif sederhana, terutama jika subjek penelitiannya cukup banyak.
3. Keadaan atau penebaran data.
Apabila variabilitas data yang akan diolah kurang baik, dalam arti bahwa nilai dari data tidakcukup menyebar, maka tidak dibenarkan bagi peneliti untuk menggunakan statistik parametrik seperti : rumus kolerasi product moment, uji-t, uji-F, regresi, dan sebagainya. Mereka harus menggunakan antara lain Chi-kuadrat, mann-whitney atau wilcoxon test, kendall’s tau, dan sebagainya. Ada persyaratan yang harus dipenuhi oleh peneliti yang ingn mengnakan teknik statistik parametrik untuk menganalisis datanya. Salahsatu diantara persyaratan tersebut adalah bahwa data yang dianalisis harus berdistribusi normal. Tentang bagaimana cara menguji normalitas data akan disampaikan dalam bagian lain sekaligus membicarakan lengkapnya persyaratan lain bagi analisis data jika peneliti akan menggunakan statistik parametrik.
4. Banyaknya variabel yang dianalisis.
Masih banyak diantara paneliti yang beranggapan bahwa:”semakin banyak variabel yang diteliti maka penelitian-penelitian tersebut semakin bermutu”. Benarkah pendapat tersebut? Yah, ada sedikit benarnya tetapi tidak mutlak. Penelitian yang hanya melibatkan satu variabel atau dua variabel yang ditinjaunya terlalu dangkal (misalnya hanya bermaksud mengetahui hubungan yang bersifat statis), tentu sajamutunya diragukan. Bermutu tidaknya penelitian banyak ditentukan oleh kedalama dan kekuasaan tinjauan yang dilandasi oleh teori dan temuan penelitian sebelumnya melalui analisis yang cermat.
Kembali pada masalah yang sedang dibahas dalam bagian ini yaitu banyaknya variabel sehubungan dengan teknik analisis statistik. Penelitian yang hanya mengenai satu variabel saja biasanya dianalisis secara deskriptif dengan statistik sederhana yaitu frekuensi mutlak, frekuensi relatif, persentase, grafik, dan tabel. Jika penelitian mempunyai dua variabel atau lebih, belum dapat sekaligus menentukan teknik statistik apa yang tepat digunakan. Masiah ada hal lain yang perlu dipertimbangkan, sekurang-kurangnya jenis data yang akan dianalisis, yang baru akan disebutkan pada bagian berikut ini.
5. Jenis data yang akan diolah.
Bahwa telah dikemukakan analisis data nominal yang dicacahkan untuk menentukan frekuensi, frekuensi relatif, menyajikan dengan tabel dan grafik. Data ordinal dapat dianalisis dengan cara yang sama. Data interval dapat juga dianalisis dengan beraneka ragam cara, jauh lebih bervariasi dibandingkan dengan analisis data nomonal dan ordinal. Data rasio didalam analisisnya diperlakukan sama dengan data interval (sudah dikemukakan bahwa data interval berkedudukan lebih tinggi dari data ordinaldan nominal, dan selanjutnya data rasio juga lebih tinggi dari data interval).

B. PENGUJIAN DATA
Sebelum peneliti menemukan teknik statistik yang akan digunakan untuk menganalisis data, terlebih dahulu harus melakukan pengujian terhadap data yang dimiliki. Apabila data yang dianalisis berdistribusi normal maka peneliti boleh menggunakan teknik statistik parametrik. Sedangkan apabila data yang diolah tidak merupakan sebaran normal, peneliti harus menggunakan statistik nonparametrik. Perlu dipahami bahwa yang perlu diuji keadannya hanyalah data jenis interval saja, karenanya data jenis itulah yang variasinya cukup besar.
Tuntutan terhadap persyaratan data dalam analisis ini juga ditentukan oleh senioritas peneliti dan tingkat penelitian yang dilaksanakan. Bagi peneliti senior (menduduki tingkat kepegawaian yang tinggi) dan peneliti S-2 atau S-3, pengujian terhadap data sudah merupakan keharusan. Bagi peneliti muda atau mahasiswa penyusun sekripsi di S-1, kadang-kadang persyaratan demikian belum diajukan. Disamping tuntutan terhadap normalitas sebaran data masih ada lagi persyaratan lain, yaitu homogenitas dan linearitas.
Homogenitas sampel menunjukkan pada keadaan sampel yang sama. Jika peneliti mengambil beberapa kelompok subjek yang sama dan dimasukkan sebagai sampel penelitiannya maka kelompok-kelompok tersebut harus homogen dalam arti bahwa nilai yang dimiliki harus tidak banyak berbeda. Variansi dari nilai tersebut harus tidak besar. Mengapa demikian? Menurut pertimbangan, kelompok-kelompok yang merupakan sampel diambil dari populasi yang sama. Oleh karena itu variansinya harus kecil. Salah satu persyaratan pengambilan sampel adalah bahwa sampel tersebut harus representatif, artinya merupakan wakil yang baik dari populasi. Jika populasinya homogen maka dari manapun sampel diambil harus memiliki karakteristik yang sama, dengan kata lain harus tidak banyak terdapat perbedaan antara sampel yang satu dengan sampel yang lain.
Sehubungan dengan adanya persyaratan yang harus dipenuhi sebelum peneliti menentukan teknik statistik yang akan di gunakan untuk analisis data, berikut ini akan di sampaikan penjelasan dan contoh cara menguji normalitas dan homogenitas sampel.
1. Uji normalitas sampel
Yang dimaksud dengan uji normalitas sampel atau menguji normal tidaknya sampel, tidak lain sebenarnya adalah mengadakan pengujian terhadap normal tidaknya sebaran data yang akan dianalisis. Jika peneliti memiliki dua nilai dari variabel yang berbeda, misalnya nilai “kedisiplinan” dan nilai “prestasi matematika” maka pengujian normalitas juga harus dilakukan terhadap kedua variabel tersebut. Dekian juga apabil variabel yang diolah lebih dari dua buah, pengujian dilakukan banyak variabel yang akan diolah.
Banyak cara yang dapat digunakan untuk melakukan pengujian terhadap normal tidaknya penyebaran data. berikut ini akan dikemukakan dua buah cara menguji yaitu : (1) dengan kertas probabilitas normal dan (2) dengan rumus Chi-kuadrat.
a. Uji Normalitas dengan Kertas Probabilitas Normal
Seorang peneliti bermaksud menyelidiki apakah ketertiban siswa berpengaruh terhadap perstasi belajar matetamika atau tidak. Dalam hal ini variabel penelitiannya adalah “ketertiban siswa” dan “prestasi belajar matematika”.andai saja peneliti telah berhasil mengumpulkan data penelitiannya, yakni bahwa peneliti sudah mempunyai nilai keterlibatan dan nilai matematika, maka langkah berikutnya adalah menyiapkan analisis data tersebut dengan terbih dahulu menguji normalitasnya. Dalam hal ini yang diberikan contohnya adalah pengujian normalitas prestasi belajar matematika.
Caranya adalah :
1) Membuat daftar distribusi frekuensi.
2) Menentukan batas atas nyata untuk tiap-tiap kelas interval.
3) Mencari frekuensi kumulatif dan frekuensi kumulatif relatif (frekuensi dalamn persen). Perlu diketahui bahwa frekuensi kumulatif yang digunakan dalam pengujian normalitas data boleh memilih satu diantara “frekuensi kumulatif keatas” dan “frekuenssi kumulatif kebawah”.
Untuk memperjelas uraian berikut ini disajikan contoh distribusi frekuensi salahsatu nilai variabel penelitian yang akan diuji normalitasnya (lihat tabel 11). Dalam contoh ini digunakan frekuensi kumulatif keatas, artinya frekuen-frekuensi untuk setiap frekuensi pada kelas interval dijumlahkan keatas secara kumulatif. Beberapa orang ada kalanya mengatur distribusi interval dengan nilai kecil berada di atas. Hal ini menurut penulis dapat saja dibenarkan, tetapi yang lazim memang nilai yang besar diletakkan keatas dan berangsur-angsur mengecil kebawah.

Tabel -11
Distribusi frekuensi untuk
Pengujian normalitas










4) Peneliti membubuhkan angka-angka batas atas nyata pada abis kertas probabilitas normal yang telah disediakan. Titik-titik pada absisi merupakan tempat peneliti meletakkan batas-batas atas nyata, urut dari kiri kekanan mulai dari batas atas nyata yang paling kecil. Oleh karena lebar kertas tersebut terbatas, maka tentu saja peneliti disarankan untuk menambah sendiri garis-garis ordinat kekiti atau kekanan, sesuai dengan keperluan.
5) Pada tepi kiri dan kanan kertas, tertulis angka-angkan yang menunjukkan besarnya persentase. Berdasarkan atas angka-angka tersebut peneliti menempatkan besarnya persentase pada frekuensi kumulatif yang tertera pada tabel. Di dalam menempatkan titik-titik persentase tersebut peneliti harus mengikutu absis-absis yang ada, walaupun dalam hati mungkin merasakan adanya jarak garis yang tidak teratur. Jarak-jarak antara garis absis yang tidak teratur merupakan hasil perhitungan matetamika yang tidak dapat dilakukan oleh orang awam terhadap bidang tersebut,
6) Menghubungkan titik-titik yanh berada pada perpotongan antara garis absis dengan garis ordinat. Jika garis yang terbentuk dari hubungan titik-titik tersebut merupakan garis lurus atau hampir lurus maka dapat disimpulkan bahwa keadaan data merupakan distribusi normal.
Data merupakan sesuatu yang dimiliki oleh sampel maupun populasi. Dari informasi bahwa data berdistribusi normal ada dua hal yang dapat disimpulkan, yaitu :
a. Mengenai data itu sendiri.
Dikatakan bahwa data itu berdistribusi normal atau mendekati normal, atau dapat didekati dengan teknik-teknik untuk data berdistribusi normal.
b. mengenai populasi dari mana data sampel diambil.
Dikatakan bahwa populasi dari mana data sampel itu diambil ternyata berdistribusi normal atau hampir berdistribusi normal. Jika titik-titik diletakkan tidak menunjukkan garis lurus maka dapat disismpulkan bahwa data atau sampel yang diambil tidak berasal dari populasi normal (sudjana, 1973;149).
Menguji normalitas dengan menggunakan kertas probabilitas normal ini caranya lebih mudah sederhana dibandingkan dengan cara kedua. Sayang bahwa kertas untuk menguji tersebut tidak selalu tersedia di buku-buku statistik atau metodologi penelitian. Kertas tersebut berskala matematis sehingga tidak mudah dibuat sendiri oleh orang-orang yang tidak menguasai cara-caranya.
Untuk melengkapai pengetahuan para pembaca tentang pengujian normalitas data, berikut ini disajikan contoh gambar hasil penempatan titik-titik frekuensi kumulatif dalam peresen pada kertas probabilitas normal. Data diambil dari tabel distribusi frekuensi yang telah dikemukakan dari grafik berikut tampak bahwa titik-titik frekuensi kumulatif relatif terletak praktis pada garis lurus. Oleh karena data yang diolah berasal dari sampel, maka populasi dari mana data diambil dapat dikatakan berdistribusi normal.














1. Uji Normalitas dengan rumus Chi-kuadrat
Pengujian normalitas data dengan rumus chi-kuadrat dapat dilakukan oleh peneliti walaupun padanya tidak tersedia sarana yang harus dipersiapkan secara khusus. Cara kedua ini jalannya sedikit lebih panjang dibandingkan dengan cara pertama tetapi dapat dilakukan kapan saja.
Apabila data penelitian telah terkumpul (data yang diuji tersebut adalah data interval), maka langkah selanjutya adalah menyusun data tersebut menjadi sebuah distribusi frekuensi. Yang akan disampaikan sebagai contoh pengujian, adalah distribusi frekuensi yang sudah digunakan untuk menguji normalitas data dengan kertas probabilitas normal. Adapun langkah-langkah kerja pengujian dengan rumus chi-kuadrat adalah sebagai berikut :
1. Menyusun data menjadi sebuah distribusi frekuensi (sudah disajikan diatas)
2. Menentukan batas-batasa kelas interval, yaitu batas atas nyata yang sekaligus bagi kelas interval lainnya sudah merupakan batas bawah nyata. Sebagai contoh untuk batas atas nyata dan batas bawah nyata kelas interval pertama adalah 35,5 dan 32,5. Nilai yang menjadi batas bawah nyata untuk kelas interval tersebut sekaligus merupakan batas atas nyata untuk kelas interval bawahnya. Di dalam penulisannya, batas atas nyata maupun batas bawah nyata ini adalah pada baris antara, baris-baris yang digunakan untuk menuliskan kelas interval. Maksudnya adalah agar dapat dikeyahui dengan jelas bahwa bilangan-bilangan tersebut memang merupakan batas-batas untuk setiap kelas interval.
Demikian pula pada kolom berikutnya langsung dibubuhkan frekuensi untuk kelas-kelas interval yang bersangkutan. Agar pembaca dapat memahami penjelasan ini maka tabel yang sudah disajikan diatas akan disajikan lagi dengan melengkapi harga-harga bagi unsur yang dikehendaki. Mari kita perhatikan bagaimana meletakkan batas nyata yang tidak sebaris dengan kelas interval dan frekuensi tetapi sebaris dengan z-score untuk setiap batas nyata tersebut. Yang sebaris dengan batas nyata adalah z-score dan batas luas daerah,sedangkan yang sebaris dengan kelas interval adalah: titik tengah, frekuensi, dan lain-lain yang berhubunan dengan kelas interval yang bersangkutan. Contoh penulisan unsur-unsur dalam tabel pengujian normalitas ini disampaikan secara bertahap dengan maksud agar dapat diikuti dengan cermat. Pada contoh berikut hanya disajikan contoh bagaimana menuliskan batas nyata, titik tengah, dan frekuensi untuk memberikan perbandingan letak unsur-unsur tersebut. Penyajian yang harus dibuat oleh peneliti selengkapnya akan disajikan setelah uraian mengenai unsur-unsur tersebut selesai diberikan.
3. Untuk melangkah selanjutnya peneliti menghitung rerata dan setandar deviasi. Dalam hal peneliti dapat menggunakan titik tengah sebagai pengganti nilai-nilai mentah. Jika cara itu yang diambil maka peneliti mulai langkahnya dengan menghitung Fx, yaitu hasil kali perhitungan frekuensi dengan titik tengahnya. Berdasarkan jumlah Fx dapat dihitung rerata dan standar deviasi. Setelah dihitung, ditemukan bahwa: rerata (X) =24,7 dan SD =3,997 dibulatkan 4.

Tabel 12
Contoh cara menuliskan batas
Nyata kelas interval









4. Dengan menggunakan rerata dan standar deviasi yang telah diketahui maka langkah slanjutnya adalah menghitung angka standar atau z-score setiap batas nyata kelas interval.
Ingat bahwa rumus z-score adalah :
z-score =
Contoh menghitung z-score dapat diberikan sekaligus mencari z-score batas nyata untuk kelas interval paling atas. Data untuk mencari z-score batas nyata yang dalam hal ini disamakan dengan sekor mentah adalah sebagai berikut :


Maka z-score untuk batas nyata 35,5 adalah :

Harga-harga z-score dituliskan sejajar dengan letak batas nyata karena memang harga-harga tersebut menunjukkan harga dari batas nyata. Sudah dikemukakan diatas bahwa hasil perhitungan z-score untuk setiap batas nyata akan disajikan sekaligus dengan batas luas daerah.
5. Menetukan batas daerah dengan menggunaka tabel “luas daerah di bawah lengkung normal standar dari 0 ke z “. Pada bagian akhir dari buku-buku statistik atau buku tentang penelitian biasanya terdapa tabel-tabel untuk luas daerah ini. Kadang-kadang saja penyebutannya bukan seperti yang dituliskan diatas tetapi maksudnya sama.
Cara menggunakan tabel tersebut adalah mencari judul kolom pada baris pertama menunjuk pada angka kedua setelah koma, pada z-score. Bilangan empat angka yang terletak pada perpotongan kolom dengan baris adalah bilangan yang menunjukkan batas daerah. Barang kali para pembaca bertanya mengapa luas daerah tersebut dituliskan dengan empat angka, karena bilangan tersebut sebenarnya berasal dari perolehan perhitungan hasilnya adalah banyak angka di belakang koma. Untuk kesepakatan biasanya diambil empat angka sebagai hasil pembulatan terakhir.
Berikut ini di sampaikan cuplikan dari tabel yang dimaksudkan di atas sekaligus di sajikan contoh bagaimana menentukan luas daerah dari tabel tersebut.
Tabel 13
Cuplikan tabel luas daerah di bawah
Lengkungan normal stansar dari 0 ke Z





Contoh dan langkah untuk mencari batas luas daerah adalah sebagai berikut:
a. Menentukan z-score dari batas nyata kelas interval yang kemungkinan hasilnya mulai 0,0 sampai dengan 3,9.untuk batas atas nyata yang paling atas, yaitu 35,5 sudak di peroleh harga z-score 2,70.
b. Mencari titik perpotongan antara absis 2,7 dan ordinat 0 dan angkayang tertera ternyata angka (dalam kelompok empat angka ), 4965. Andaikata saja perhitungan z-score menghasilkan 2,74, maka kita tetap mengambil kolom 2,7 dengan kolom 4 adalah 4969.
Dari per hitungan z-score semua batas nyata dan pinilikan pada tabel luas daerah di bawah lingkungan kurva normal diperoleh hasil sebaga berikut:
Tabel 14
Daftar batas nyata z-score dan batas luas daerah





6. Dengan diketahui batas-batas luas daerah maka dapat dicari luas daerah untuk masing-masing kelas interval, yaitu selisih dari tiap-tiap kedua batasnya. Caranya adalah mengurangi bilangan yang atas dikurangi dengan bilangan di bawahnya. Untuk luas daerah tidak ada bilangan negatif. Oleh karena itu apabila dalam mengerjakan mengurangi diperoleh bilangan negatif, pengurangan harus dibalik, yaitu bilangan yang dibawah dikurangi dengan bilangan di atasnya. Mengapa dapat terjadi hal yang demikian? Untuk mendapat kejelasan tentang pengertian penting dalam kurva normal. Kalau ditribusi ini diterapkan pada kurva normal tersebut maka z-score yang lebih besar dikurangi dengan bilangan yang menunjukkan batas daerah di kanannya. Hal penting yang perlu diperhatikan adalah pada waktu menentukan luas daerah untuk kelas interval di tengah-tengah kurva. Bagian ini merupakan gabungan antara daerah z-score positif dengan z-score negatif sebagai dua nilai yang terletak di sebelah kanan dan kiri z-score nol. Oleh karena itu bilangan batas daerah tidak dikurangkan, tetapi ditambah.
Contoh:
a. Atas dikurangi bawah:
Untuk kelas interval (33-35), diketahui:
Batas atas nyata = 35,5
z-score = 2,70
……………………………………. Batas luar daerah = 4965
Untuk kelas interval ( 30-32), diketahui:
Batas atas nyata = 32,5*)
z-score = 1,95
……………………………………. Batas luas daerah = 4744
Jadi luas daerah kelas interval (33-35) = ____ _
4965 – 4744 = 221
Jika 221 tersebut dibagi 100 akan menunjukkan besarnya persentase banyaknya subjek dalam sampel ada 70 orang, maka frekuensi ideal ( frekuensi yang diharapkan ) dalam kelas interval:
221% dari 70 orang = 1,547 orang
Dibulatkan 2 orang
b. Atas dan bawah di jumlahkan:
Untuk kelas interval (24-26), diketahui:
- Batas atas nyata = 26,5
- Z-score = 0,45
………………………………. Batas luas daerah = 1739
Jadi luas daerah kelas interval (24-26)
1738 + 1174 = 2917
Dengan cara yang sama nomor a, banyaknya orang ideal dalam kelas interval (24-26) = 29,17% x 70 orang
= 20,429 orang, dibulatkan 20 orang
Untuk memperjelas uraian berikut ini disajikan visualisasi dari perhitungan luas daerah jika diketahui batas luas daerah dari setiap kelas interval.




Melalui penyajian gambar grafik diatas di harapkan para pembaca dapatlebih memahami bagaimana cara menentukan luas dibawah kurva normal, yang tidak lain adalah menentukan banyaknya orang yag berada di dalam suatu wilayah kurva normal yang tidak lain adalah frekuensi yang di harapkan dari setiap kelas interval dalam distribusi frekuensi. Yang tertera dalam tabel dengan nama “frekuensi” adalah frekuensi menurut kenyataan. Di dalam analisis chi-kudrat dikenal adanya dua macam frekuensi yaitu:
a. Frekuensi yang ada menurut kenyataan, disebut sebagai frekuensi yang diobservasi, diberi simbol fo singkatan dari frekuensi observasi.
b. Frekuensi yang merupakan hasil hitungan, sesuai dengan yang ideal atau yang sesuai dengan teoretiknya, disebut sebagai frekuensi harapan, diberi simbol fh, singkatan dari frekuensi yang diharapkan.
Mengapa disebut dengan istilah-istilah tersebut dan bagaimana kegunaan selanjutnya akan dibahas dalam perhitungan rumus chi-kuadrat yang akan datang.
Kembali kita pada perhitungan luas daerah dalam kelas interval. Di dalam contoh perhitungan di atas sudah diperoleh dua frekuensi yang diharapkan, yaitu untuk :
Kelas interval (33-35) -- fh = 2 orang
Kelas interval (24-26) -- fh = 15 orang
Kita dapat melanjutkan mencari selisih bilangan batas luas daerah dengan garis besar ketentuan :
a. Jika kedus z-score yang dicari selisih batas luas daerah memiliki tanda (+), maka bilangan yang atas dikurangi dengan yang bawah.
b. Jika z-score yang atas (+) dan yang bawah (-), maka bilangan batas luas daerah dijumlahkan.
c. Jika kedua z-score yang atas (-) dan yang bawah juga (-) maka bilangan batas luas daerah yang bawah dikurangi dengan yang atas.
Dengan mengikuti ketentuan-ketentuan tersebut maka dari tabel yang sudah disajikan z-score dan batas luas daerah diperoleh luas daerah dan frekuensi yang diharapkan untuk setiap kelas interval seluruhnya terjadi dalam tabel 15.
Jumlah frekuensi yang diharapkan adalah 70, sesuai dengan jumlah nilai subjek yang diuji normalitasnya. Bilangan-bilangan yang menunjuk pada frekuensi tersebut yang diperoleh dari mengalikan setiap persentase dengan bilangan 70. Angka dibelakang koma dibulatkan dengan aturan yang biasa dilakukan. Jadi kalau lebih dari 0,50 dibulatkan ke atas sedangkan jika kurang dari 0,50 dihilangkan. Ada satu keistimewaan didalam menghitung persentase untuk kelas interval (24-26) yakni 29,15 dari 70 sebetulnya hanya 20,419. Angka dibelakang koma masih kurang dari 0,50 tetapi dibulatkan keatas tidak dihilangkan. Hal ini dilakukan untuk memperoleh jumlah frekuensi 70. Di dalam proses pembulatan memang kadang-kadang kita harus mengambil satu atau dua langkah istimewa agar diperoleh bilangan tertentu seperti yang diharapkan.
Tabel 15
Daftar batas daerah, luas daerah, dan
Frekuensi yang diharapkan




Kini sudah diperoleh frekuensi yang diharapkan(fo) dan frekuensi yang diobservasi (fo). Langkah selanjutmya adalah menghitung apakah ada perbedaan yang signifikan antara kedua frekuensi tersebut. Jika tidak ada perbedaan secara signifikan, berarti bahwa frekuensi yang ada sudah tidak atau kurang menyimpang dari frekuensi teoretik, dan ini bahwa nilai-nilai sudah terbesar dalam kurva normal. Bagaimana mengujinya? Untuk menguji perbedaan frekuensi digunakan rumus chi-kuadrat yakni :





Tabel yang diperlukan dapat dipersiapkan seperti disajikan di bawah ini.
Tabel 16
Tabel persiapan perhitungan chi-kuadrat






Data yang diperlukan untuk rumus yang disajikan diatas sudah tersedia pada tabel. Segera kita masukan data-data tersebut kedalam rumus sebagai berikut :






Hasil tersebut dikonsultasikan dengan tabel harga chi-kuadrat dengan d.b.= (k-3). Dalam contoh ini banyaknya kelas interval adalah 7, dan itulah k. oleh karena itu k-3 adalah 4.
Dalam tabel dengan d.b.=3 tertera harga chi-kuadrat yang diharapkan 0,711 (5%) dan 0,297 (1%).
1,589>0,711
Oleh karena harga chi-kuadrat observasi lebih besar dari harga chi-kuadrat teoretik, maka kurva atau distribusi niali tidak menunjukkan kurva normal.
c. Uji kemencengan kurva (skewness)
Dua buah cara untuk menguji normalitas data telah disampaikan. Di dalam bagian terdahulu telah dikemukakan bahwa untuk sebuah kurva normal memiliki ciri-ciri khusus, salah satu diantaranya adalah bahwa : mean, mode, dan median pada tempat yang sama. Jika ketiga tendensi sentral tersebut tidak terletak pada satu tempat maka berarti bahwa kurva tersebut juling ke kiri atau ke kanan. Ukuran kemiringan puncak kurva ke kiri atau ke kanan tersebut di kenal dengan nama “kemiringan kurva atau kemencengan kurva” (skewness). Kemencengan suatu kurva distribusi data dapat bertanda positif (jika kurva juling ke kanan) atau bertanda negatif (jika kurva juling ke kiri).
Gambar contoh-contoh kurva ditinjau dari kemencengan dapat dilihat di bawah ini.




Pengukuran kemencengan suatu distribusi data dirumuskan oleh Karl Pearson dalam bentuk koefisien Pearson, yang jika dimodifikasikan ke dalam Bahasa Indonesia akan dapat dikemukakan sebagai berikut :



Sebuah kurva distribusi data dikatakan normal apabila hasil perhitungan dengan rumus diatas terletak antara (-1) dengan (+1). Jika lebih kecil atau lebih besar dari bilangan tersebut maka kurva distribusi data tersebut juling, dan tidak dibenarkan bagi peneliti menggunakan statistik parametrik ntuk mengolah datanya.
Contoh distribusi data yang dikemukakan di atas dapat dihitung berdasarkan atas data yang tersedia untuk rumus tersebut. Yang belum dicari adalah “Mo”. Di dalam distribusi frekuensi diketahui bahwa frekuensi (f mutlak) yang terbesar adalah 22, dan itu terletak pada kelas interval(24-26). Nilai-nilai untuk kelas interval tersebut diwakili oleh titik tengah, yaitu 25. Maka mode atau Mo distribusi frekuensi adalah 25. Data lain yang diperlukan sudah diketahui dan dengan demikian data selengkapnya adalah sebagai berikut :






Dapat disimpulkan bahwa data penelitian ini berdistribusi normal dan peneliti dapat menganalisis data tersebut dengan statistik parametrik.
d. Keruncingan kurva (kurtosis)
Kemencengan kurva menunjuk pada tegak lurus dan tidaknya badan kurva pada absis. Selain ditinjau dari ketegakkannya, badan kurva juga dapat ditinjau dari ketinggian dan kelebaran ini membentuk keruncingan kurva. Dengan demikian ada kurva yang runcing, yakni yang sempit dan tinggi yang disebug kurva atau distribusi yang leptokurtik (leptokurtic distribution), ada yang cukup, yakni kurva yang badannya tidak begitu tinggi dan tidak begitu luas yang disebut sebagai kurva atau distribusi mesokurtik (mesokurtic distribution) serta kurva yang puncaknya rendah dan badannya lebar yang disebut sebagai kurva atau distribusi platikurtik (platykurtic distribution). Gambar ketiga jenis kurva dapat dilihat pada contoh di bawah ini.




Salah satu ukuran kurtosis atau keruncingan adalah koefisien kurtosis, yang diberi simbol a4 ditentukan dengan rumus yang dikemukakan oleh Sudjana (1984;108) sebagai berikut :


Dengan ketentuan ukuran atau kriteria sebagai berikut :



Untuk mengetahui harga-harga m tersebut harus dilalui langkah yang menggunakan rumus sebagai berikut :




















Tabel 17
Tabel persiapan untuk menghitung koefisien kurtosis




















2. Uji Homogenitas Sampel
Disamping pengujian terhadap penyebaran nilai yang di analisis jika peneliti akan menggenerilisasikan hasil peneliti harus terlebih dahulu yakin bahwa kelompok-kelompok yang membentuk sampel berasal dari populasi yang sama. Kesamaan asal sampel ini antara lain dibuktika dengan adanya kesamaan variansi kelompok-kelompok yang membentuk sampel tersebut.jika ternyata tidak terdapat perbedaan variansi diantara kelompok sampel, dan ini mengandung arti bahwa kelompok-kelompok tersebut homogen, maka dapat dikatakan bahwa kelompok-kelompok sampel tersebut berasal dari populasi yang sama.
Ada bermacam-macam cara untuk mengadakan pengujian tentang homogenitas sampel, tetapi dalam buku ini hanya di sampingkan satu macam saja yaitu dengan tes Bartlett. Menurut sudjana (1975;263), beberapa satuan yang diperlukan untuk mengerjakan pengujian tes disusun sebuah daftar seperti yang disajikan dalam tabel berikut:

Tabel 18
Harga-harga yang Diperlukan Untuk Uji
Homogenitas kelompok sampel dengan tes bartiett




berikut ini disampaikan contoh perhitungan uji homogenitas kelompok sampel. Di dalam contohpeneliti mempunyai 1163 orang responden berasal dari 18 buah sekolah tentang nilai prestasi belajar ilmu pengetahuan alam. Apabila peneliti ingin menggunaka teknik analisis statistil deskriptif dalam menganalisis data, terlebih dahulu