Estimasi True Score  pada Second Order Unidimensional Data: Sebuah Studi Simulasi Monte Carlo Tentang Dampak Panjang Tes, Tingkat Kesukaran dan Daya Pembeda Item

Puti Febrayosi

doi:10.15408/jp3i.v1i4.10726

Authors

Puti Febrayosi Fakultas Psikologi UIN Jakarta

DOI:

https://doi.org/10.15408/jp3i.v1i4.10726

Keywords:

second order unidimensional, panjang tes, tingkat kesukaran, daya pembeda, dan monte carlo

Abstract

Tujuan penelitian ini adalah untuk mengetahui apakah terdapat perbedaan atau bias pada data unidimensional second order namun sering diperlakukan sebagai unidimensional hanya pada tingkat pertama atau first order, serta mengetahui sejauh mana pengaruh panjang tes, heterogenitas tingkat kesukaran dan daya pembeda apabila terdapat perbedaan atau bias terhadap kemampuan responden. Penelitian ini merupakan penelitian simulasi Monte Carlo dengan 27 model percobaan dan setiap model direplikasi sebanyak 50 kali. Model second order unidimensional yang dibangkitkan memiliki panjang tes 20, 40 dan 60 item, dengan heterogenitas tingkat kesukaran dan daya pembeda 0,025, 0,10 dan 0, 20. Software komputer yang digunakan adalah Mplus, dengan bantuan estimator Bayesian. Untuk mengetahui apakah terdapat perbedaan atau bias antara first order dan second order maka yang dilihat nilai mean yang dihasilkan lebih besar dari nol. Hasil penelitian ini menunjukan: (1) semua model unidimensional pada second order namun dianalisis sebagai unidimensional pada first order hasil yang diperoleh mengenai theta (q atau kemampuan responden) tidak memberikan gambaran yang sebenarnya, karena terdapat bias atau perbedaan dari nilai mean yang dihasilkan lebih besar dari nol; (2) bias atau perbedaan dari theta (q atau kemampuan responden) paling besar dihasilkan oleh panjang tes 20 item dengan daya pembeda 0.20 dan tingkat kesukaran 0,10 sedangkan bias atau perbedaan dari theta (q atau kemampuan responden) paling kecil dihasilkan oleh panjang tes 60 item dengan daya pembeda dan tingkat kesukaran 0,20; (3) disamping itu, berdasarkan hasil perhitungan diperoleh R square sebesar 0.130, hal ini berarti 13% bias responden dapat dijelaskan oleh bervariasinya panjang tes, heterogenitas tingkat kesukaran dan daya pembeda dengan indeks signifikansi sebesar 0.007 (p < 0.05). Dengan demikian apabila data unidimensional pada second order namun menganalisisnya hanya pada first order unidimensional menghasilkan bias serta tidak memberikan gambaran seutuhnya mengenai kemampuan responden. Kalaupun tetap memberlakukan first order pada data unidimensional second order, bias paling kecil diperoleh dengan panjang tes yang lebih besar. Dalam penelitian ini tes dengan panjang 60 item bias yang dihasilkan lebih rendah dibandingkan tes dengan panjang 20 item.

References

Crocker, L., & Algina, J. (1986). Introduction to classical and modern test theory. Florida: Harcourt Brace Jovanich Collage Publish. du Toit, ME. (2003). IRT from SSI: Bilog-MG, Multilog, Parscale, Testfact. Lincolnwood, IL: Scientific Software International.

Embretson, S.E., & Reise, S. P. (2000). Item response theory for psychology. London: Lawrence Erlbaum Associates, Publishers

Fung, C. (2002). Ability Estimation Under Different Item Parameterization And Scoring Models. Dissertation, University of North Texas.

Hambleton, R.K., & Swaminathan, H. (1985). Item response theory, principle and application.

Boston: Kluwer Nijhoff Publishing.

Hambleton, R.K., Swaminathan, H., & Rogers, J.H. (1991). Fundamentals of item response theory. California: SAGE Publications.

Joreskog, K.G., & Sorbom, Dag. (1996). Lisrel 8, User’s Reference Guide. Chicago: SSI, Inc (Scientific Software International).

Kaplan, R.M., & Saccuzo, D.P. (1993). Psychological Testing: Principles, Applications, and Issues.Third edition.California: Brooks/Cole Publishing.

Mislevy, R.J. & Bock, R.D. (1990). BILOG 3: Item analysis & test scoring with binary logistic models. Moorseville: Scientific Software, Inc.

Muthen, L.K., & Muthen, B.O. (2010). Mplus, statistical analysis with latent variables user’s guide. Los Angeles: StatModel.

Umar, J. (2012). Bahan kuliah psikometri: Analisis Faktor. Jakarta: Tidak dipublikasikan.

Umar, J. (2012). Mengenal lebih dekat konsep reliabilitas skor tes. Jurnal Pengukuran Psikologi dan Pendidikan Indonesia. 1: No. 2.

Zhang, B. (2008). Application of Unidimensional Item Response Models to Test With Item Sensitive to Secondary Dimension. The Journal of Experimental Education. 77(2), 147-166