Laman

Rabu, 06 Juni 2012

evaluasi



RELIABILITAS INSTRUMEN PENILAIAN

PENDAHULUAN
Persoalan alat ukur yang digunakan dalam melakukan pencarian data penilaian sering dihadapkan pada persoalan akurasi, konsisten dan stabilitas sehingga hasil pengukuran yang diperoleh bisa mengukur dengan akurat sesuatu yang sedang diukur. Instrumen ini memang harus memiliki akurasi ketika digunakan. Konsisten dan stabil dalam arti tidak mengalami perubahan dari waktu pengukuran satu ke pengukuran yang lain. pengajar akan berhadapan dengan cara bagaimana membuat alat ukur, atau instrumen itu memiliki reliabilitas agar bisa digunakan dalam memperoleh data. Karena data yang kurang memiliki dan reliabilitas, akan menghasilkan kesimpulan yang kurang lazim.  
Oleh karena itu dalam makalah kami kali ini akan kita bahas, apa itu reliabilitas??? berserta bagaimana cara-cara menghitung reliabilitas???.

PEMBAHASAN
A.     Pengertian Reliabilitas
Kata reliabilitas dalam bahasa Indonesia diambil dari kata reliability, dari bahasa Inggris berasal dari kata reliable yang artinya dapat dipercaya, keajegan, ketetapan, konsisten, keandalan, kestabilan. Suatu tes dapat dikatakan reliabel jika tes tersebut menunjukkan hasil yang ajeg dan tidak bertentangan.[1] Menurut Saifuddin Azwar, realibilitas tes-retest adalah seberapa besat derajat skor tes konsisten dari waktu ke waktu. Realibilitas diukur dengan menentukan hubungan antara skor hasil penyajian tes yang sama kepada kelompok yang sama, pada waktu yang berbeda.[2] Fraenkel (1990), menyatakan bahwa reliabilitas merujuk terhadap konsistensi skor ang diperoleh. Bagaimana konsistensi siswa dari setiap individu dari satu pengadministrasian ke pengadministrasian lainnya dan dari satu set item ke set lainnya. Sebagai contoh, suatu tes dikatakan reliabel, apabila seorang siswa memperoleh nilai tinggi pada tes yang pertama, maka akan memperoleh nilai yang tingi pula pada tes berikutnya. Skor tersebut mungkin saja tidak persis identik, akan tetapi nilai tersebut harus tidak jauh berbeda.
Reliabilitas adalah taraf dimana suatu tes mampu menunjukkan konsistensi hasil pengukurannya yang diperlihatkan dalam taraf ketepatan dan ketelitian hasil. Meskipun reliabilitas mempunyai berbagai nama lain seperti keajegan, keandalan, dapat dipercaya, kestabilan dan sebagainya namun inti dari reliabilitas adalah sejauh mana hasil suatu pengukuran dapat dipercaya jika dalam beberapa kali pengetesan atau pengukuran terhadap kelompok subyek yang sama diperoleh hasil yang relatif sama. Pengertian relatif menunjukkan bahwa ada toleransi terhadap perbedaan itu besar dari waktu ke waktu, maka hasil pengukuran itu tidak dapat dipercaya atau tidak reliabel. Ajeg atau tetap dalam evaluasi tidak selalu harus sama, tetapi mengikuti perubahan secara ajeg.  Jika keadaan X mula-mula lebih rendah daripada Y, maka jika diadakan pengukuran ulang X juga lebih rendah dari Y. Itulah yang dikatakan ajeg atau tetap, sama dalam kedudukan siswa diantara anggota kelompok lain. Tentu saja tidak dituntut semuanya tetap, besarnya ketetapan menunjukkkan tingginya reliabilitas suatu tes.[3]
B.     Usaha Penyususnan Tes yang Reliabel
Untuk mengusahakan agar tes yangkita susun terpercaya, hal-hal yang disarankan berikut perlu dip[erhatikan. Adapn hal-hal yang dimaksud adalah sebagai berikut
a)      Susun butir soal secukupnya
Jumlah butir tes yang relative banyak akan lebih baik daripada yang sedidkit karena keadaan itu akan lebih mencerminkan sampel penampilan (kompetensi dan ketrampilan) peserta didik. Jika jumlah butir soalnya hanya sedikit dan kebetulan peserta didik tidak dapat mengerjakannya, hal itu tidak saja menunjukan kegagalan peserta didik, melainkan juga kegagalan pembelajaran dan alat pengukur (tes) itu sendiri.
Pemahaman jumlah butir soal akanmeningkatkan kadar reliabilitas, semakin besar jumlah butir soal akan semakin besar pula kadar reliabilitasnya, akan tetapi, menambah butir soal sampai dengan butir tertentu tidak akan meningkatkan kadar reabilitas secara seimbang. Table berikut akan menjelaskan hal yang dimaksud.
Hubungan antara jumlah butir soal dan reabilitas
Hasil pengukuran
Jumlah butir soal
Realibitas
5
0,20
10
0,33
20
0,50
40
0,67
80
0,80
160
0,89
320
0,94
640
0,97

1,00
            Penambahan jumlah butir soal sampai dengan 80 buah masih menguntungkan karena peningkatan kadar reliabilitas cukup tinggi. Akan tetapi, penambahan selanjutnya tidak begitu menambah tingginya relibilitas. Hal itu tidak seimbang dengan banyaknya jumlah butir tes yang sebanyak itu.
b)      Pilih butir soal yang bertaraf kesulitan cukupan
Butir soal yang baik adalah butir yang tidak terlalu sulit dan sebaiknya tidak terlalu mudah. Butir tes terlalu sulit atau mudah tidak mencerminkan secara memadai kompetensi yang di ukur. Disamping juga tidak dapat membedakan antara peserta didik yang berprestasi dan yang tidak. Indeks kesulitan sebuah butir soal ditanya dengan koefisien 0,00 sampai dengan 1,00. Butir soal yang indeks kesulitannya semakin mendekati nol berarti sal itu semakin sulit, sebaliknya, semakin beasar indeks kesulitan berarti butir soal itu semakin mudah (bagaimana cara menentukan indeks tersebut akan dibicarakan dalam analisis butir soal pada bab selanjutnya).
c)      Pilih butir soal yang berdaya beda cukup
Butir sola yang baik adalah butir soal yang mampu membedakan antara peserta didik yang berprestasi dan yang tidak. Daya pembeda sebuah butir soal ditanyakan dengan indeks -1,00 sampai dengan 1,00. Indeks satu butir soal yang semakin tinggi mendekati 1,00 akan semakin baik karena semakin mampu membedakan antara kedua kelompok tinggi dan rendah tersebut. Sebaliknya, semakin kecil mendekati nol atau bahkan negative butir soal yang bersangkutan semakin tidak baik (bagaimana cara menentukannya akan dibicarakan dibelakang). Hal ituterutama berlaku untuk menafsirkan hasil ujian yang memergunakan pendekatan norma atau kelompok.
d)      Penjelas redaksi soal tes
Selain mempengaruhi validitas hasil pengukuran, kejelasan unsure bahasa juga mempegaruhi reliabilitas. Oleh karena itu, bahasa yang dipergunakan dalam tes harus jelas, mudah dipahami, dan tidak bersifat ambigu, serta tidak membingungkan. Kalimat yang tidak jelas akan mudah menimbulkan kesalahpaaman dan hal itu seharusnya sudah di temukan lewat telaah kuantitatif butir soal yhang sejawat
e)      Bersikap obyektif dalam menilai pekerjaan peserta didik, khususnya untuk soal uraian sangat diberlakukan. Sikap obyektif dalam penilaian akan meningkatakan kekonsistensinan hasil pengukuran sebuah tes. Dalam tes obyektif biasanya akan konskistensi dalam pennyekoran biasanya lebih terjamin karena antara jawaban yang slah dan benar sudah pasti dan terlihat jelas. Namun, tidak demikian dengan tes yang berbentuk uraian yang jawabannya bersifat subyektif. Demikian mhalnya dalam penilaian, untuk mengurangi adanya sikap subjekktifiktas dalam menilai tes uraian, hendaknya terlebih dahulu dibuat pedoman penilaian dengan membuat porsi-porsi tertentu dengan bobot yang tertentu pula, misalnya porsi isi, organisasi, kreatifitas, rasional, dan penyelasaian masalah. Hasil penilaian tjiap kategori itu
C.     Jenis-jenis Reliabilitas
Suatu tes dapat dikatakan tes yang reliable apabila tes tersebut menunjukkan hasil-hasil yang ajeg dan sesuai. Dalam fungsinya sebagai alat pengukur hasil belajar, tes hasil belajar dapat dibedakan menjadi dua bentuk tes yaitu: tes hasil belajar bentuk uraian yang dikenal dengan istilah essay test atau subyektif, dan tes hasil belajar bentuk obyektif yang dikenal dengan istilah obyektif test atau new type test.   
·         Teknik Pengujian Reliabilitas Tes Hasil Belajar bentuk Uraian
Dalam rangka menentukan apakah tes hasil belajar bentuk uraian yang disusun oleh seorang staf pengajar telah memiliki daya keajegan mengukur atau reliabilitas yang tinggi ataukah belum, pada umumnya orang menggunakan sebuah rumus yang dikenal dengan nama rumus alpha. Adapun rumus alpha yang dimaksud adalah:
dimana :
r11         : koefisien reliabilitas tes
 n         : banyaknya butir item yang dikeluarkan dalam tes
1          : bilangan konstan
∑ si2     : jumlah varianskor dari tiap-tiap butir item
St2          : varian total
Sedangkan untuk mengetahui Si2 dapat diperoleh dengan menggunakan rumus sebagai berikut:
Dalam pemberian interpretasi terhadap koefisien reliabilitas tes r11 pada umumnya digunakan patokan sebagai berikut:
-          Apabila r11 sama dengan atau lebih besar dari pada 0,70, maka berarti tes hasil belajar yang sedang diuji reliabilitasnya dinyatakan telah memiliki reliabilitas yang tinggi.
Apabila r11 lebih kecil daripada 0,70, maka berarti bahwa tes hasil belajar yang sedang diuji relibilitasnya dinyatakan belum memiliki reliabilitas yang tinggi.[4]

·         Teknik Pengujian Reliabilitas Tes Hasil Belajar Bentuk Obyektif 
Konsistensi tes hasil belajar bentuk obyektif dapat diukur antara lain dengan konsistensi eksternal dan internalnya.[5]
Pada dasarnya banyak sekali macam teknik pengujian reabilitas, namun dalam makalah ini, kami hanya menggunakan salah satu dari bentuk teknik penilaian relibitas, karna menurut hemat kami  dari berbagai hasil yang di hasilkan oleh teknik reliabilitas bahwa setiap teknik pada intinya memiliki hasil yang relative sama, jikalaupun ada perbedaan kemungkinan besar hanya  berbebda sedikit.
1.       Pengukuran Konsistensi Eksternal
Pengukuran konsistensi eksternal yaitu pengaturan yang diperlukan dua kali pengadministrasian instrumen atau soal. Dapat dilakukan dengan metode-metode sebagai berikut:
a)     Metode Test – Retest atau Metode Ulang
Metode ini melibatkan dua kali penggunaan tes yang sama terhadap kelompok yang sama dengan interval waktu tertentu. Suatu hal yang perlu diperhatikan adalah interval waktu untuk memberikan tes kedua (re-tes), sebaiknya jangan terlalu dekat sebab dihawatirkan siswa masih dapat mengingat soal yang diberikan pada tes pertama. Oleh karena itu pengajar hendaknya membuat soal yang tidak mudah diingat oleh siswa. Memang tidak ada patokan berapa lama interval waktu untuk melakukan tes dan re-tes, akan tetapi biasanya antara dua sampai empat minggu[6], akan tetapi dengan memperhatikan syarat-syarat sebagai berikut:
Pertama: dalam jangka waktu antara penyelengaraan tes pertama dengan penyelenggaraan tes kedua, guru sama sekali tidak boleh menyinggung-nyinggung atau memberikan “angin” atau semacam petujuk mengenai tes yang pertama.
Kedua: testing dilakukan dalam situasi dan kondisi yang sama[7].
Setelah diperoleh nilai tes yang dipandang sebagai nilai X dan re-tes yang dipandang sebagai nilai Y, selanjutnya koefisien reliabilitas dihitung denga menggunakan teknik korelasi product moment atau korelasi Pearson untuk menunjukkan korelasi (hubungan) antara dua set nilai yang diperoleh tersebut. Dapat dipergunakan teknik korelasi rank-order (teknik korelasi tata jenjang) dari spearman, dengan menggunakan rumus:
Di mana:
p (baca Rho)    : koefisien korelasi antara variabel I (skor-skor hasil tes I) dengan variabel II (skor-skor hasil tes II)
D         : difference (beda antara rank variabel I dengan rank variabel   II), atau D = RI – RII
6 dan 1 : bilangan konstan
N         : banyaknya subyek (testee)
Dalam rangka mengetahui reliabilitas sebuah tes, tidak hanya terbatas satu kali saja, melainkan dapat saja dilakukan lebih dari satu kali, sampai penyusun tes benar-benar merasa yakin bahwa tes hasil belajar yang disusunnya itu sudah dapat diandalkan sifat keajegan hasil pengukurannya.[8]

b)     Metode Paralel
Metode yang diberikan kepada sekelompok subyek yang menggunakan dua buah tes tanpa adanya tenggang waktu yakni dilakukan secara berbarengan), dengan ketentuan bahwa kedua tes tersebut harus sejenis, dalam arti: sekali pun butir-butir itemnya tidak sama, namun hendaknya butir-butir  item itu mengukur hal yang sama, baik dari segi isinya, proses mental yang diukur, derajat kesukaran maupun jumlah butir itemnya.
Hanya saja, untuk membuat tes bentuk ini bukanlah pekerjaan yang mudah. Hanya staf pengajar yang telah memiliki bekal pengalaman mengajar yang cukup lama dan memiliki bekal kemampuan dalam merancag tes sajalah yang akan mampu mewujudkannya.[9]
Setelah pelaksanaan pengujian reliabilitas tes dengan penggunakan metode ini, maka akan diperoleh nilai tes untuk instrumen pertama yang dipandang sbagai nilai X dan instrumen kedua yang dipandang sebagai nilai Y. Dari skor-skor yang diperoleh dari kedua seri tes tadi dicari korelasi. Apabila terdapat korelasi positif yang signifikan maka dapat dikatakan bahwa tes hasil belajar tersebut dapat dikatakan reliabel. Teknik korelasi yang dipergunakan bisa dipilih antara teknik korelasi product moment dari pearson atau teknik korelasi rank dari Spearman (khusus untuk N kurang dari 30).[10] Tinggi nilai koefisien korelasi yang diperoleh, menunjukkan bukti yang kuat mengenai reliabilitas bahwa kedua instrumen tersebut mengukur sesuatu yang sama. Koefisien reliabilitas yang tinggi akan menunjukkan bahwa dua bentuk instrumen tersebut tidak hanya mengukur dua jenis performance yang sama, akan tetapi juga memiliki konsistensi sepanjang waktu.[11]

2.      Pengukuran Konsistensi Internal (Singel Test – Singel Trial)
Pengukuran konsistensi internal yaitu pengukuran yang hanya dilakukan dengan satu kali pengadministrasian instrumen.[12] Yang mana penentuan reliabilitas tes tersebut dilakukan dengan jalan melakukan pengukuran terhadap satu kelompok subyek, pengukuran ini dilakukan dengan hanya menggunakan satu jenis alat pengukur, dan pelaksanaan pengukuran hanya dilakukan sebanyak satu kali saja. Dengan kata lain, pendekatan ini adalah merupakan pendekatan “serba singel”, yaitu satu kelompok subyek, satu jenis pengukur, dan satu kali pengukuran.[13] Jadi pada pengukuran konsistensi internal ini hanya diperlukan satu set soal. Ada beberapa cara pengukuran konsistensi internal di antaranya sebagai berikut:
·         Teknik Bagi – Dua (Split – Half Procedure)
pendekatan bagi dua ini meliputi penilaian terhadap satu set soal yang dibagi dua (biasanya soal dengan nomor ganjil dan nomor genap atau awal dan akhir) secara terpisah oleh setiap orang. Selanjutnya dihitung koefisien korelasi untuk kedua belahan soal tersebut. Koefisien korelasi yang diperoleh menunjukan derajat korelasi terhadap kedua kedua belahan soal, dan oleh karena itu menggambarkan konsistensi internal dari tes tersebut.[14]
Dengan teknik belah dua ganjil-genap peneliti harus mengelompokkan nilai butir bernomor ganjil sebagai belahan pertama (X) dan kelompok nilai butir bernomor genap sebagai belahan kedua (Y). Selanjutnya carilah rxy yaitu korelasi nilai skor belahan pertama dan kedua dengan menggunakan rumus Spesrman – Brown sebagai berikut:

Keterangan :
rxy            : Koefisien korelasi
N         : Jumlah item soal
X          : Jumlah nilai soal ganjil yang diperoleh setiap siswa
Y          : Jumlah nilai soal genap yang diperoleh setiap siswa
Oleh karena itu koefisien korelasi yang diperoleh baru memajukan hubungan antara kedua belahan instrumen, dan untuk memperoleh koefisien atau indeks reabilitas soal harus dihitung lagi denan mnggunakan rumus Spearman-Brown sebagai berikut:
Saatnya  memberi interpretasi terhadap r11. Jika r11 sama dengan atau lebih besar dari pada rxy, berarti tes hasil belajar yang sedang diuji realibilitasnya dinyatakan telah memiliki reliabilitas yang tinggi (=reliable). Sedangkan apabila r11 lebih kecil dari pada rxy  berarti tes hasil belajar yang sedang diuji reliabilitasnya dinyatakan belum memiliki reliabilitas yang tinggi (un-reliable).[15]
Teknik ini memiliki kelemahan dan keunggulan. Beberapa kelemahannya diantaranya adalah:
-          Spearman – Brown menghendaki agar belahan yang dicari belahannya – yaitu belahan gasal – genap dan belahan kiri –kanan haruslah sebanding. Maksudnya skor yang dimiliki oleh belahan I dan jumlah skor yang dimiliki oleh belahan II tes  harus seimbang, hampir sama, atau tidak terlalu jauh bedanya, suatu hal yang kerap kali sulit diwujudkan kecuali hanya karena kebetulan saja.
-          Teknik ini menuntut persyaratan, agar jumlah butuir-butir item yang akan diuji reliabilitasnya haruslah merupakan bilangan genap, jadi seandainya jumlah butir-butir item itu berupa bilangan gasal, maka teknik ini tidak mungkin untuk diterapkan.
-          Dengan model perhitungan tersebut (model gasal – genap dan model kiri – kanan), dapat terjadi bahwa koefisien reliabilitas tes menunjukkan bilangan yang tidak sama, sehingga dapat terjadi bahwa dengan menggunakan model gasal – gena tes dinyatakan reliabilitas (karena r11 menunjukan angka 0,70 atau lebih), akan tetapi dengan menggunakan model kiri kanan ternyata tes dinyatakan belum reliable (karena besarnya r11 di bawah 0,70)
Sehubungan dengan kelemahan-kelemahan yang telah dikemukakan di atas, maka penggunaan teknik ini juga memiliki kelebihan diantaranya adalah:
-          Disamping jumlah skor belahan I dan belahan II harus seimbang dan jumlah item harus berupa bilangan genap, jumlah item yang diajukan dalam tes tersebut hendaknya juga cukup banyak.
-          Jenis item yang dikemukakan dalam tes hendaknya berupa item-item yang mempunyai derajat kesukaran yang tinggi, artiya butir-butir item itu termasuk kategori item yang sukar.
-          Materi tes hendaknya bersifat komprehensif, sehingga memungkinkan bagi penyusun tes untuk satu permasalahan yang sama atau identik. Hal ini dimaksudkan agar persyaratan teknik belah dua itu semaksimal mungkin dapat dipenuhi sebaik-baiknya.

·         Teknik Kuder – Richardson
Metode ini metode yang paling sering digunakan untuk menetukan konsistensi internal. Berbeda dengan Spearman, yang menentukan reliabilitas tes berdasarkan atas separo belahan pertama dan separoh belahan kedua, namun Kuder – Richardson karena ke tidak puas terhadap cara-cara yang terdahulu, maka Kuder – Richrdson menetukan reliabilitas tes itu lebih tepat apabila dilakukan secara langsung terhadap butir-butir item tes yang bersangkutan.[16] Adapun rumus yang diajukan oleh Kuder – Richrdson ada dua buah yang masing-masing diberi kode: KR20 dan KR21.
Metode ini hanya memerlukan tiga buah informasi yaitu: jumlah item tes, rata-rata (mean), dan standar deviasi (SD). Akan tetapi sebagai catatan bahwa KR21 dapat digunakan, jika diasumsikan bahwa item-item memiliki tingkat kesulitan yang sama (are of equaldifficulty).[17] Sedangkan untuk rumus KR20 tidak memerlukan asumsi bahwa seluruh item emiliki tingkat kesulitan yang sama, akan tetapi rumus tersebut lebih sulit menghitungnya.[18] Di bawah ini adalah kedua rumus yang digunakan:
1)      Rumus KR20  : r11 =  
Di mana :
r11 : koefisien reliabilitas tes
n   : banyaknya butur item
1   : bilangan konstan
St2 : varian total
pi   : propersi testee yang menjawab dengan betul butir item yang bersangkutan
qi   : propersi testee yang jawabannya salah
karena St 2 belum diketahui,maka terlebih dahulu kita mencari (menghitung) St 2, dan dapat diperoleh dengan menggunakan rumus:
St 2 =  
Sedangkan untuk mengetahuai ∑xt 2 = 2

2)      Rumus KR21 : r11  =  
Di mana :
r11 : koefisien reliabilitas tes
n   : banyaknya butir item
1   : bilangan konstan
Mt : mean total (rata-rata hitung dari skor total)
St 2            : varian total
Karena Mt belum diketahu, maka dapat dihitung dengan menggunakan rumus[19] :
Dengan demikian untuk mengetahui apakah nilai tersebut baik atau jelak? Tinggi atau rendah? Ada dua hal yang dapat digunakan untuk menilai koefisien reliabiitas. Pertama, kita dapat membandingkan koefisien yang diperoleh dengan dua nilai ekstrim yang mungkin diperoleh, yaitu: koefisien 0,00 yang menunjukkan tidak adanya korelasi, oleh karena itu reliabilitas soal tersebut tidak ada sama sekali, sementara 1,00 koefisien maksimal yang mungkin dicapai. Kedua, kita dapat membandingkan koefisien reliabilitas yang diperoleh dengan jenis-jenis koefisien yang biasa diperoleh untuk mengukur jenis yang sama.[20]












KESIMPULAN
Suatu tes dapat dikatakan tes yang reliable apabila tes tersebut menunjukkan hasil-hasil yang ajeg dan sesuai. Dalam suatu penilaian, pengajar umumnya mengadakan pengukuran sebelum dan setelah perlakuan. Apabila hasil penilaiannya menunjukkan perbedaan, maka disimpulkan bahwa perbedaan tersebut benar-benar merupakan pengaruh variabel perlakuan, maka diperlukan instrumen yang reliabel sebagai syarat mutlak untuk menentukan pengaruh variabel yang satu terhadap variabel yang satu lagi. Selain reliabilitas instrumen juga merupakan  syarat bagi validitas. Tes yang tidak reliable dengan sendirinya tidak valid.

DAFTAR PUSTAKA
Sudijono, Anas, Pengantar Evaluasi Pendidikan, Jakarta: PT Raja Grafindo Persada, 2009
Nurkancana, Wayan dan PPN Sunartana, Evaluasi Hasil Belajar, Surabaya: usaha nasional, tt
Modul pdf








[4] Prof. Drs. Anas Sudijono, Pengantar Evaluasi Pendidikan, (Jakarta: PT Raja Grafindo Persada, 2009), hlm. 209
[5] Modul pdf, hlm. 12
[6] Drs. Wayan Nurkancana dan Drs. PPN Sunartana, Evaluasi Hasil Belajar, (Surabaya: usaha nasional), hlm. 145
[7] Prof. Drs. Anas Sudijono, Pengantar Evaluasi Pendidikan, (Jakarta: PT Raja Grafindo Persada, 2009), hlm. 268
[8] Prof. Drs. Anas Sudijono, Pengantar Evaluasi Pendidikan, (Jakarta: PT Raja Grafindo Persada, 2009), hlm. 272
[9] Prof. Drs. Anas Sudijono, Pengantar Evaluasi Pendidikan, (Jakarta: PT Raja Grafindo Persada, 2009), hlm. 273
[10] Prof. Drs. Anas Sudijono, Pengantar Evaluasi Pendidikan, (Jakarta: PT Raja Grafindo Persada, 2009), hlm. 273
[11] Modul pdf, hlm. 13
[12] Modul pdf, hlm. 13
[13] Prof. Drs. Anas Sudijono, Pengantar Evaluasi Pendidikan, (Jakarta: PT Raja Grafindo Persada, 2009), hlm. 214
[14] Modul pdf, hlm. 14
[15] Prof. Drs. Anas Sudijono, Pengantar Evaluasi Pendidikan, (Jakarta: PT Raja Grafindo Persada, 2009), hlm. 229
[16] Prof. Drs. Anas Sudijono



RELIABILITAS INSTRUMEN PENILAIAN
Oleh: Siti Muthmainnah & Siti Roihanah
PENDAHULUAN
Persoalan alat ukur yang digunakan dalam melakukan pencarian data penilaian sering dihadapkan pada persoalan akurasi, konsisten dan stabilitas sehingga hasil pengukuran yang diperoleh bisa mengukur dengan akurat sesuatu yang sedang diukur. Instrumen ini memang harus memiliki akurasi ketika digunakan. Konsisten dan stabil dalam arti tidak mengalami perubahan dari waktu pengukuran satu ke pengukuran yang lain. pengajar akan berhadapan dengan cara bagaimana membuat alat ukur, atau instrumen itu memiliki reliabilitas agar bisa digunakan dalam memperoleh data. Karena data yang kurang memiliki dan reliabilitas, akan menghasilkan kesimpulan yang kurang lazim.  
Oleh karena itu dalam makalah kami kali ini akan kita bahas, apa itu reliabilitas??? berserta bagaimana cara-cara menghitung reliabilitas???.

PEMBAHASAN
A.     Pengertian Reliabilitas
Kata reliabilitas dalam bahasa Indonesia diambil dari kata reliability, dari bahasa Inggris berasal dari kata reliable yang artinya dapat dipercaya, keajegan, ketetapan, konsisten, keandalan, kestabilan. Suatu tes dapat dikatakan reliabel jika tes tersebut menunjukkan hasil yang ajeg dan tidak bertentangan.[1] Menurut Saifuddin Azwar, realibilitas tes-retest adalah seberapa besat derajat skor tes konsisten dari waktu ke waktu. Realibilitas diukur dengan menentukan hubungan antara skor hasil penyajian tes yang sama kepada kelompok yang sama, pada waktu yang berbeda.[2] Fraenkel (1990), menyatakan bahwa reliabilitas merujuk terhadap konsistensi skor ang diperoleh. Bagaimana konsistensi siswa dari setiap individu dari satu pengadministrasian ke pengadministrasian lainnya dan dari satu set item ke set lainnya. Sebagai contoh, suatu tes dikatakan reliabel, apabila seorang siswa memperoleh nilai tinggi pada tes yang pertama, maka akan memperoleh nilai yang tingi pula pada tes berikutnya. Skor tersebut mungkin saja tidak persis identik, akan tetapi nilai tersebut harus tidak jauh berbeda.
Reliabilitas adalah taraf dimana suatu tes mampu menunjukkan konsistensi hasil pengukurannya yang diperlihatkan dalam taraf ketepatan dan ketelitian hasil. Meskipun reliabilitas mempunyai berbagai nama lain seperti keajegan, keandalan, dapat dipercaya, kestabilan dan sebagainya namun inti dari reliabilitas adalah sejauh mana hasil suatu pengukuran dapat dipercaya jika dalam beberapa kali pengetesan atau pengukuran terhadap kelompok subyek yang sama diperoleh hasil yang relatif sama. Pengertian relatif menunjukkan bahwa ada toleransi terhadap perbedaan itu besar dari waktu ke waktu, maka hasil pengukuran itu tidak dapat dipercaya atau tidak reliabel. Ajeg atau tetap dalam evaluasi tidak selalu harus sama, tetapi mengikuti perubahan secara ajeg.  Jika keadaan X mula-mula lebih rendah daripada Y, maka jika diadakan pengukuran ulang X juga lebih rendah dari Y. Itulah yang dikatakan ajeg atau tetap, sama dalam kedudukan siswa diantara anggota kelompok lain. Tentu saja tidak dituntut semuanya tetap, besarnya ketetapan menunjukkkan tingginya reliabilitas suatu tes.[3]
B.     Usaha Penyususnan Tes yang Reliabel
Untuk mengusahakan agar tes yangkita susun terpercaya, hal-hal yang disarankan berikut perlu dip[erhatikan. Adapn hal-hal yang dimaksud adalah sebagai berikut
a)      Susun butir soal secukupnya
Jumlah butir tes yang relative banyak akan lebih baik daripada yang sedidkit karena keadaan itu akan lebih mencerminkan sampel penampilan (kompetensi dan ketrampilan) peserta didik. Jika jumlah butir soalnya hanya sedikit dan kebetulan peserta didik tidak dapat mengerjakannya, hal itu tidak saja menunjukan kegagalan peserta didik, melainkan juga kegagalan pembelajaran dan alat pengukur (tes) itu sendiri.
Pemahaman jumlah butir soal akanmeningkatkan kadar reliabilitas, semakin besar jumlah butir soal akan semakin besar pula kadar reliabilitasnya, akan tetapi, menambah butir soal sampai dengan butir tertentu tidak akan meningkatkan kadar reabilitas secara seimbang. Table berikut akan menjelaskan hal yang dimaksud.
Hubungan antara jumlah butir soal dan reabilitas
Hasil pengukuran
Jumlah butir soal
Realibitas
5
0,20
10
0,33
20
0,50
40
0,67
80
0,80
160
0,89
320
0,94
640
0,97

1,00
            Penambahan jumlah butir soal sampai dengan 80 buah masih menguntungkan karena peningkatan kadar reliabilitas cukup tinggi. Akan tetapi, penambahan selanjutnya tidak begitu menambah tingginya relibilitas. Hal itu tidak seimbang dengan banyaknya jumlah butir tes yang sebanyak itu.
b)      Pilih butir soal yang bertaraf kesulitan cukupan
Butir soal yang baik adalah butir yang tidak terlalu sulit dan sebaiknya tidak terlalu mudah. Butir tes terlalu sulit atau mudah tidak mencerminkan secara memadai kompetensi yang di ukur. Disamping juga tidak dapat membedakan antara peserta didik yang berprestasi dan yang tidak. Indeks kesulitan sebuah butir soal ditanya dengan koefisien 0,00 sampai dengan 1,00. Butir soal yang indeks kesulitannya semakin mendekati nol berarti sal itu semakin sulit, sebaliknya, semakin beasar indeks kesulitan berarti butir soal itu semakin mudah (bagaimana cara menentukan indeks tersebut akan dibicarakan dalam analisis butir soal pada bab selanjutnya).
c)      Pilih butir soal yang berdaya beda cukup
Butir sola yang baik adalah butir soal yang mampu membedakan antara peserta didik yang berprestasi dan yang tidak. Daya pembeda sebuah butir soal ditanyakan dengan indeks -1,00 sampai dengan 1,00. Indeks satu butir soal yang semakin tinggi mendekati 1,00 akan semakin baik karena semakin mampu membedakan antara kedua kelompok tinggi dan rendah tersebut. Sebaliknya, semakin kecil mendekati nol atau bahkan negative butir soal yang bersangkutan semakin tidak baik (bagaimana cara menentukannya akan dibicarakan dibelakang). Hal ituterutama berlaku untuk menafsirkan hasil ujian yang memergunakan pendekatan norma atau kelompok.
d)      Penjelas redaksi soal tes
Selain mempengaruhi validitas hasil pengukuran, kejelasan unsure bahasa juga mempegaruhi reliabilitas. Oleh karena itu, bahasa yang dipergunakan dalam tes harus jelas, mudah dipahami, dan tidak bersifat ambigu, serta tidak membingungkan. Kalimat yang tidak jelas akan mudah menimbulkan kesalahpaaman dan hal itu seharusnya sudah di temukan lewat telaah kuantitatif butir soal yhang sejawat
e)      Bersikap obyektif dalam menilai pekerjaan peserta didik, khususnya untuk soal uraian sangat diberlakukan. Sikap obyektif dalam penilaian akan meningkatakan kekonsistensinan hasil pengukuran sebuah tes. Dalam tes obyektif biasanya akan konskistensi dalam pennyekoran biasanya lebih terjamin karena antara jawaban yang slah dan benar sudah pasti dan terlihat jelas. Namun, tidak demikian dengan tes yang berbentuk uraian yang jawabannya bersifat subyektif. Demikian mhalnya dalam penilaian, untuk mengurangi adanya sikap subjekktifiktas dalam menilai tes uraian, hendaknya terlebih dahulu dibuat pedoman penilaian dengan membuat porsi-porsi tertentu dengan bobot yang tertentu pula, misalnya porsi isi, organisasi, kreatifitas, rasional, dan penyelasaian masalah. Hasil penilaian tjiap kategori itu
C.     Jenis-jenis Reliabilitas
Suatu tes dapat dikatakan tes yang reliable apabila tes tersebut menunjukkan hasil-hasil yang ajeg dan sesuai. Dalam fungsinya sebagai alat pengukur hasil belajar, tes hasil belajar dapat dibedakan menjadi dua bentuk tes yaitu: tes hasil belajar bentuk uraian yang dikenal dengan istilah essay test atau subyektif, dan tes hasil belajar bentuk obyektif yang dikenal dengan istilah obyektif test atau new type test.   
·         Teknik Pengujian Reliabilitas Tes Hasil Belajar bentuk Uraian
Dalam rangka menentukan apakah tes hasil belajar bentuk uraian yang disusun oleh seorang staf pengajar telah memiliki daya keajegan mengukur atau reliabilitas yang tinggi ataukah belum, pada umumnya orang menggunakan sebuah rumus yang dikenal dengan nama rumus alpha. Adapun rumus alpha yang dimaksud adalah:
dimana :
r11         : koefisien reliabilitas tes
 n         : banyaknya butir item yang dikeluarkan dalam tes
1          : bilangan konstan
∑ si2     : jumlah varianskor dari tiap-tiap butir item
St2          : varian total
Sedangkan untuk mengetahui Si2 dapat diperoleh dengan menggunakan rumus sebagai berikut:
Dalam pemberian interpretasi terhadap koefisien reliabilitas tes r11 pada umumnya digunakan patokan sebagai berikut:
-          Apabila r11 sama dengan atau lebih besar dari pada 0,70, maka berarti tes hasil belajar yang sedang diuji reliabilitasnya dinyatakan telah memiliki reliabilitas yang tinggi.
Apabila r11 lebih kecil daripada 0,70, maka berarti bahwa tes hasil belajar yang sedang diuji relibilitasnya dinyatakan belum memiliki reliabilitas yang tinggi.[4]

·         Teknik Pengujian Reliabilitas Tes Hasil Belajar Bentuk Obyektif 
Konsistensi tes hasil belajar bentuk obyektif dapat diukur antara lain dengan konsistensi eksternal dan internalnya.[5]
Pada dasarnya banyak sekali macam teknik pengujian reabilitas, namun dalam makalah ini, kami hanya menggunakan salah satu dari bentuk teknik penilaian relibitas, karna menurut hemat kami  dari berbagai hasil yang di hasilkan oleh teknik reliabilitas bahwa setiap teknik pada intinya memiliki hasil yang relative sama, jikalaupun ada perbedaan kemungkinan besar hanya  berbebda sedikit.
1.       Pengukuran Konsistensi Eksternal
Pengukuran konsistensi eksternal yaitu pengaturan yang diperlukan dua kali pengadministrasian instrumen atau soal. Dapat dilakukan dengan metode-metode sebagai berikut:
a)     Metode Test – Retest atau Metode Ulang
Metode ini melibatkan dua kali penggunaan tes yang sama terhadap kelompok yang sama dengan interval waktu tertentu. Suatu hal yang perlu diperhatikan adalah interval waktu untuk memberikan tes kedua (re-tes), sebaiknya jangan terlalu dekat sebab dihawatirkan siswa masih dapat mengingat soal yang diberikan pada tes pertama. Oleh karena itu pengajar hendaknya membuat soal yang tidak mudah diingat oleh siswa. Memang tidak ada patokan berapa lama interval waktu untuk melakukan tes dan re-tes, akan tetapi biasanya antara dua sampai empat minggu[6], akan tetapi dengan memperhatikan syarat-syarat sebagai berikut:
Pertama: dalam jangka waktu antara penyelengaraan tes pertama dengan penyelenggaraan tes kedua, guru sama sekali tidak boleh menyinggung-nyinggung atau memberikan “angin” atau semacam petujuk mengenai tes yang pertama.
Kedua: testing dilakukan dalam situasi dan kondisi yang sama[7].
Setelah diperoleh nilai tes yang dipandang sebagai nilai X dan re-tes yang dipandang sebagai nilai Y, selanjutnya koefisien reliabilitas dihitung denga menggunakan teknik korelasi product moment atau korelasi Pearson untuk menunjukkan korelasi (hubungan) antara dua set nilai yang diperoleh tersebut. Dapat dipergunakan teknik korelasi rank-order (teknik korelasi tata jenjang) dari spearman, dengan menggunakan rumus:
Di mana:
p (baca Rho)    : koefisien korelasi antara variabel I (skor-skor hasil tes I) dengan variabel II (skor-skor hasil tes II)
D         : difference (beda antara rank variabel I dengan rank variabel   II), atau D = RI – RII
6 dan 1 : bilangan konstan
N         : banyaknya subyek (testee)
Dalam rangka mengetahui reliabilitas sebuah tes, tidak hanya terbatas satu kali saja, melainkan dapat saja dilakukan lebih dari satu kali, sampai penyusun tes benar-benar merasa yakin bahwa tes hasil belajar yang disusunnya itu sudah dapat diandalkan sifat keajegan hasil pengukurannya.[8]

b)     Metode Paralel
Metode yang diberikan kepada sekelompok subyek yang menggunakan dua buah tes tanpa adanya tenggang waktu yakni dilakukan secara berbarengan), dengan ketentuan bahwa kedua tes tersebut harus sejenis, dalam arti: sekali pun butir-butir itemnya tidak sama, namun hendaknya butir-butir  item itu mengukur hal yang sama, baik dari segi isinya, proses mental yang diukur, derajat kesukaran maupun jumlah butir itemnya.
Hanya saja, untuk membuat tes bentuk ini bukanlah pekerjaan yang mudah. Hanya staf pengajar yang telah memiliki bekal pengalaman mengajar yang cukup lama dan memiliki bekal kemampuan dalam merancag tes sajalah yang akan mampu mewujudkannya.[9]
Setelah pelaksanaan pengujian reliabilitas tes dengan penggunakan metode ini, maka akan diperoleh nilai tes untuk instrumen pertama yang dipandang sbagai nilai X dan instrumen kedua yang dipandang sebagai nilai Y. Dari skor-skor yang diperoleh dari kedua seri tes tadi dicari korelasi. Apabila terdapat korelasi positif yang signifikan maka dapat dikatakan bahwa tes hasil belajar tersebut dapat dikatakan reliabel. Teknik korelasi yang dipergunakan bisa dipilih antara teknik korelasi product moment dari pearson atau teknik korelasi rank dari Spearman (khusus untuk N kurang dari 30).[10] Tinggi nilai koefisien korelasi yang diperoleh, menunjukkan bukti yang kuat mengenai reliabilitas bahwa kedua instrumen tersebut mengukur sesuatu yang sama. Koefisien reliabilitas yang tinggi akan menunjukkan bahwa dua bentuk instrumen tersebut tidak hanya mengukur dua jenis performance yang sama, akan tetapi juga memiliki konsistensi sepanjang waktu.[11]

2.      Pengukuran Konsistensi Internal (Singel Test – Singel Trial)
Pengukuran konsistensi internal yaitu pengukuran yang hanya dilakukan dengan satu kali pengadministrasian instrumen.[12] Yang mana penentuan reliabilitas tes tersebut dilakukan dengan jalan melakukan pengukuran terhadap satu kelompok subyek, pengukuran ini dilakukan dengan hanya menggunakan satu jenis alat pengukur, dan pelaksanaan pengukuran hanya dilakukan sebanyak satu kali saja. Dengan kata lain, pendekatan ini adalah merupakan pendekatan “serba singel”, yaitu satu kelompok subyek, satu jenis pengukur, dan satu kali pengukuran.[13] Jadi pada pengukuran konsistensi internal ini hanya diperlukan satu set soal. Ada beberapa cara pengukuran konsistensi internal di antaranya sebagai berikut:
·         Teknik Bagi – Dua (Split – Half Procedure)
pendekatan bagi dua ini meliputi penilaian terhadap satu set soal yang dibagi dua (biasanya soal dengan nomor ganjil dan nomor genap atau awal dan akhir) secara terpisah oleh setiap orang. Selanjutnya dihitung koefisien korelasi untuk kedua belahan soal tersebut. Koefisien korelasi yang diperoleh menunjukan derajat korelasi terhadap kedua kedua belahan soal, dan oleh karena itu menggambarkan konsistensi internal dari tes tersebut.[14]
Dengan teknik belah dua ganjil-genap peneliti harus mengelompokkan nilai butir bernomor ganjil sebagai belahan pertama (X) dan kelompok nilai butir bernomor genap sebagai belahan kedua (Y). Selanjutnya carilah rxy yaitu korelasi nilai skor belahan pertama dan kedua dengan menggunakan rumus Spesrman – Brown sebagai berikut:

Keterangan :
rxy            : Koefisien korelasi
N         : Jumlah item soal
X          : Jumlah nilai soal ganjil yang diperoleh setiap siswa
Y          : Jumlah nilai soal genap yang diperoleh setiap siswa
Oleh karena itu koefisien korelasi yang diperoleh baru memajukan hubungan antara kedua belahan instrumen, dan untuk memperoleh koefisien atau indeks reabilitas soal harus dihitung lagi denan mnggunakan rumus Spearman-Brown sebagai berikut:
Saatnya  memberi interpretasi terhadap r11. Jika r11 sama dengan atau lebih besar dari pada rxy, berarti tes hasil belajar yang sedang diuji realibilitasnya dinyatakan telah memiliki reliabilitas yang tinggi (=reliable). Sedangkan apabila r11 lebih kecil dari pada rxy  berarti tes hasil belajar yang sedang diuji reliabilitasnya dinyatakan belum memiliki reliabilitas yang tinggi (un-reliable).[15]
Teknik ini memiliki kelemahan dan keunggulan. Beberapa kelemahannya diantaranya adalah:
-          Spearman – Brown menghendaki agar belahan yang dicari belahannya – yaitu belahan gasal – genap dan belahan kiri –kanan haruslah sebanding. Maksudnya skor yang dimiliki oleh belahan I dan jumlah skor yang dimiliki oleh belahan II tes  harus seimbang, hampir sama, atau tidak terlalu jauh bedanya, suatu hal yang kerap kali sulit diwujudkan kecuali hanya karena kebetulan saja.
-          Teknik ini menuntut persyaratan, agar jumlah butuir-butir item yang akan diuji reliabilitasnya haruslah merupakan bilangan genap, jadi seandainya jumlah butir-butir item itu berupa bilangan gasal, maka teknik ini tidak mungkin untuk diterapkan.
-          Dengan model perhitungan tersebut (model gasal – genap dan model kiri – kanan), dapat terjadi bahwa koefisien reliabilitas tes menunjukkan bilangan yang tidak sama, sehingga dapat terjadi bahwa dengan menggunakan model gasal – gena tes dinyatakan reliabilitas (karena r11 menunjukan angka 0,70 atau lebih), akan tetapi dengan menggunakan model kiri kanan ternyata tes dinyatakan belum reliable (karena besarnya r11 di bawah 0,70)
Sehubungan dengan kelemahan-kelemahan yang telah dikemukakan di atas, maka penggunaan teknik ini juga memiliki kelebihan diantaranya adalah:
-          Disamping jumlah skor belahan I dan belahan II harus seimbang dan jumlah item harus berupa bilangan genap, jumlah item yang diajukan dalam tes tersebut hendaknya juga cukup banyak.
-          Jenis item yang dikemukakan dalam tes hendaknya berupa item-item yang mempunyai derajat kesukaran yang tinggi, artiya butir-butir item itu termasuk kategori item yang sukar.
-          Materi tes hendaknya bersifat komprehensif, sehingga memungkinkan bagi penyusun tes untuk satu permasalahan yang sama atau identik. Hal ini dimaksudkan agar persyaratan teknik belah dua itu semaksimal mungkin dapat dipenuhi sebaik-baiknya.

·         Teknik Kuder – Richardson
Metode ini metode yang paling sering digunakan untuk menetukan konsistensi internal. Berbeda dengan Spearman, yang menentukan reliabilitas tes berdasarkan atas separo belahan pertama dan separoh belahan kedua, namun Kuder – Richardson karena ke tidak puas terhadap cara-cara yang terdahulu, maka Kuder – Richrdson menetukan reliabilitas tes itu lebih tepat apabila dilakukan secara langsung terhadap butir-butir item tes yang bersangkutan.[16] Adapun rumus yang diajukan oleh Kuder – Richrdson ada dua buah yang masing-masing diberi kode: KR20 dan KR21.
Metode ini hanya memerlukan tiga buah informasi yaitu: jumlah item tes, rata-rata (mean), dan standar deviasi (SD). Akan tetapi sebagai catatan bahwa KR21 dapat digunakan, jika diasumsikan bahwa item-item memiliki tingkat kesulitan yang sama (are of equaldifficulty).[17] Sedangkan untuk rumus KR20 tidak memerlukan asumsi bahwa seluruh item emiliki tingkat kesulitan yang sama, akan tetapi rumus tersebut lebih sulit menghitungnya.[18] Di bawah ini adalah kedua rumus yang digunakan:
1)      Rumus KR20  : r11 =  
Di mana :
r11 : koefisien reliabilitas tes
n   : banyaknya butur item
1   : bilangan konstan
St2 : varian total
pi   : propersi testee yang menjawab dengan betul butir item yang bersangkutan
qi   : propersi testee yang jawabannya salah
karena St 2 belum diketahui,maka terlebih dahulu kita mencari (menghitung) St 2, dan dapat diperoleh dengan menggunakan rumus:
St 2 =  
Sedangkan untuk mengetahuai ∑xt 2 = 2

2)      Rumus KR21 : r11  =  
Di mana :
r11 : koefisien reliabilitas tes
n   : banyaknya butir item
1   : bilangan konstan
Mt : mean total (rata-rata hitung dari skor total)
St 2            : varian total
Karena Mt belum diketahu, maka dapat dihitung dengan menggunakan rumus[19] :
Dengan demikian untuk mengetahui apakah nilai tersebut baik atau jelak? Tinggi atau rendah? Ada dua hal yang dapat digunakan untuk menilai koefisien reliabiitas. Pertama, kita dapat membandingkan koefisien yang diperoleh dengan dua nilai ekstrim yang mungkin diperoleh, yaitu: koefisien 0,00 yang menunjukkan tidak adanya korelasi, oleh karena itu reliabilitas soal tersebut tidak ada sama sekali, sementara 1,00 koefisien maksimal yang mungkin dicapai. Kedua, kita dapat membandingkan koefisien reliabilitas yang diperoleh dengan jenis-jenis koefisien yang biasa diperoleh untuk mengukur jenis yang sama.[20]












KESIMPULAN
Suatu tes dapat dikatakan tes yang reliable apabila tes tersebut menunjukkan hasil-hasil yang ajeg dan sesuai. Dalam suatu penilaian, pengajar umumnya mengadakan pengukuran sebelum dan setelah perlakuan. Apabila hasil penilaiannya menunjukkan perbedaan, maka disimpulkan bahwa perbedaan tersebut benar-benar merupakan pengaruh variabel perlakuan, maka diperlukan instrumen yang reliabel sebagai syarat mutlak untuk menentukan pengaruh variabel yang satu terhadap variabel yang satu lagi. Selain reliabilitas instrumen juga merupakan  syarat bagi validitas. Tes yang tidak reliable dengan sendirinya tidak valid.

DAFTAR PUSTAKA
Sudijono, Anas, Pengantar Evaluasi Pendidikan, Jakarta: PT Raja Grafindo Persada, 2009
Nurkancana, Wayan dan PPN Sunartana, Evaluasi Hasil Belajar, Surabaya: usaha nasional, tt
Modul pdf








[4] Prof. Drs. Anas Sudijono, Pengantar Evaluasi Pendidikan, (Jakarta: PT Raja Grafindo Persada, 2009), hlm. 209
[5] Modul pdf, hlm. 12
[6] Drs. Wayan Nurkancana dan Drs. PPN Sunartana, Evaluasi Hasil Belajar, (Surabaya: usaha nasional), hlm. 145
[7] Prof. Drs. Anas Sudijono, Pengantar Evaluasi Pendidikan, (Jakarta: PT Raja Grafindo Persada, 2009), hlm. 268
[8] Prof. Drs. Anas Sudijono, Pengantar Evaluasi Pendidikan, (Jakarta: PT Raja Grafindo Persada, 2009), hlm. 272
[9] Prof. Drs. Anas Sudijono, Pengantar Evaluasi Pendidikan, (Jakarta: PT Raja Grafindo Persada, 2009), hlm. 273
[10] Prof. Drs. Anas Sudijono, Pengantar Evaluasi Pendidikan, (Jakarta: PT Raja Grafindo Persada, 2009), hlm. 273
[11] Modul pdf, hlm. 13
[12] Modul pdf, hlm. 13
[13] Prof. Drs. Anas Sudijono, Pengantar Evaluasi Pendidikan, (Jakarta: PT Raja Grafindo Persada, 2009), hlm. 214
[14] Modul pdf, hlm. 14
[15] Prof. Drs. Anas Sudijono, Pengantar Evaluasi Pendidikan, (Jakarta: PT Raja Grafindo Persada, 2009), hlm. 229
[16] Prof. Drs. Anas Sudijono, Pengantar Evaluasi Pendidikan, (Jakarta: PT Raja Grafindo Persada, 2009), hlm. 252
[17] Modul pdf, hlm. 15
[18] Modul pdf, hlm. 16
[19] Prof. Drs. Anas Sudijono, Pengantar Evaluasi Pendidikan, (Jakarta: PT Raja Grafindo Persada, 2009), hlm. 258
[20] Modul pdf, hlm. 16
, Pengantar Evaluasi Pendidikan, (Jakarta: PT Raja Grafindo Persada, 2009), hlm. 252
[17] Modul pdf, hlm. 15
[18] Modul pdf, hlm. 16
[19] Prof. Drs. Anas Sudijono, Pengantar Evaluasi Pendidikan, (Jakarta: PT Raja Grafindo Persada, 2009), hlm. 258
[20] Modul pdf, hlm. 16

Tidak ada komentar: