افضلی، افشین (1393). مدلسازی تشخیصی شناختی ریاضیات پایه اول دبیرستان بر اساس روش سلسلهمراتبی صفات. رساله دکتری، دانشگاه علامه طباطبایی.
افضلی، افشین؛ دلاور، علی؛ فلسفینژاد، محمدرضا؛ فرخی، نورعلی؛ برجعلی، احمد (1393). کاربرد مدلهای تشخیصی شناختی در تعیین ماهیت تفاوت در عملکرد دانشآموزان دختر و پسر پایه اول دبیرستان در ریاضیات.مجلهدستآوردهایروانشناختی،4(2)، 89-104.
اکبری ورمزیار، شیرین (1393) برآورد پارامتر و شناسایی کنش افتراقی سؤالات آزمونهای سرنوشتساز با فرمت مختلط با استفاده از مدلهای کلاسیک و نظریههای جدید اندازهگیری. رساله دکتری، دانشگاه علامه طباطبایی، دانشکده روانشناسی و علوم تربیتی، گروه سنجش و اندازهگیری.
امبرستون، سوزان؛ رایس، استیو (1388). نظریات جدید روانسنجی برای روانشناسان؛ ترجمه حسن پاشا شریفی، ولیالله فرزاد، مجتبی حبیبی، بلال ایزانلو. انتشارات رشد.
امینی، فاطمه (1385). بررسیرابطهمهارتهایعمومیوفعالیتهایآموزشیمعلمانونمراتکسبشدهدانشآموزانسالچهارم ابتداییایراندرآزمونبینالمللیپیشرفتتحصیلیتیمز2007. پایاننامه کارشناسی ارشد.Tدانشگاه علامه طباطبایی، دانشکده روانشناسی و علوم تربیتی، گروه فناوری آموزشی.
رحیمینژاد، عباس؛ خداپناهی، محمدکریم (1385). رابطه انگیزش پیشرفت و خودپنداشت با پیشرفت تحصیلی دانشآموزان پایه هشتم در درس علوم بر اساس تحلیل نتایج «تیمز_ار». فصلنامه روانشناسان ایرانی، 20(7) 207-218.
شولتز، دوان؛ شولتز، سیدنی (2005). نظریههای شخصیت؛ ترجمه یحیی سیدمحمدی (1386). انتشارات ویرایش.
صادقی، مریم (1392). کارکرد افتراقی (DIF) سؤالهای آزمون ریاضی پایه چهارم و هشتم تیمز 2011 یا استفاده از مدلهای IRT و کلاسیک. پایاننامه کارشناسی ارشد، دانشگاه آزاد اسلامی واحد تهران مرکز.
غفاری، زهرا (1393). کارکرد افتراقی سؤالهای پایه هشتم آزمون ریاضی تیمز 2011 در بین دانشآموزان دختر و پیر با استفاده از رویکرد نظریه سؤال – پاسخ (IRT). پایاننامه کارشناسی ارشد، دانشگاه آزاد اسلامی، واحد تهران.
فتوحی، لیلا (1387). بررسی کارکرد افتراقی سؤال در سؤالات کنکور کارشناسی ارشد رشته روانشناسی سال 1384. پایاننامه کارشناسی ارشد، دانشگاه علامه طباطبایی.
کریمی، عبدالعظیم (1388). مجموعه سؤالهای علوم ریاضیات TIMSS. پژوهشگاه مطالعات آموزشوپرورش.
کریمی، عبدالعظیم (1389). مجموعه سؤالهای قابلانتشار فیزیک و ریاضیات تیمز بینالمللی پیشرفته 2008. مرکز ملی بینالمللی تیمز و پرلز، پژوهشگاه مطالعات آموزشوپرورش.
گرامیپور، مسعود (1393). ارزیابی توان آماری تحلیل رگرسیون لجستیک در آشکارسازی کنش افتراقی سؤالهای آزمون. فصلنامه مطالعات اندازهگیری و ارزشیابی آموزشی،4(8)، 187-211.
گرامیپور، مسعود؛ فلسفینژاد، محمدرضا؛ دلاور، علی؛ فرخی، نورعلی (1391). مقایسۀ روشهای تحلیل عاملی تأییدی (CFA) و نسبت درستنمایی مبتنی بر مدل پرسش – پاسخ (IRT) در ردگیری کنش افتراقی سؤالات آزمونهای سرنوشتساز.فصلنامۀاندازهگیری، 9(4)، 105- 122.
محسنپور، مریم؛ گویا، زهرا؛ شکوهی یکتا، محسن؛ کیامنش، علیرضا؛ بازرگان، عباس (1394).سنجشتشخیصی صلاحیتهای سواد ریاضی. فصلنامه نوآوریهای آموزشی، 14(4) 8-35.
ملاهادی، محسن (1388). ارزشیابی بهوسیله آزمونهای چندگزینهای. مجله راهبردهای آموزشی، 2(4) 182-205.
مینائی، اصغر (1391). مدل پردازیتشخیصیشناختی (CDM) سؤالهایریاضیاتتیمز2007دردانشآموزانپایههشتمایرانبا استفادهازمدلیکپارچهباپارامتر پردازیمجدد (RUM) ومقایسهمهارتهایریاضیدانشآموزاندختروپسر. پایاننامه منتشرنشده دکتری، دانشگاه علامه طباطبایی، دانشکده روانشناسی و علوم تربیتی.
مینائی، اصغر (1392). سنجش مقایسهپذیری سازه و تحلیل کارکرد افتراقی سؤالها (DIF) و بلوکهای(DTF) آزمون علوم پایه هشتم تیمز 2007 در بین دانشآموزان ایران و آمریکا. فصلنامهاندازهگیریتربیتی، 11(4) 110-146.
مینائی، اصغر؛ غفاری، زهرا (1394). کارکرد افتراقی سؤالهای پایه هشتم آزمون ریاضی تیمز 2011 در بین دانشآموزان دختر و پسر با استفاده از رویکرد نظریه سؤال – پاسخ (IRT). فصلنامهاندازهگیری، 21(6)، 22-39.
Birnbaum, A., Lord, F. M., & Novick, M. R. (1968). Statistical theories of mental test scores. Some latent trait models and their use in inferring an examinee’s ability. Addison-Wesley, Reading, MA.
Chiu, C. Y. (2013). Statistical Refinement of the Q-matrix in Cognitive Diagnosis. Applied Psychological Measurement, 37(8), 598-618.
Choi, K. M., Lee, Y. S., & Park, Y. S. (2015). What CDM Can Tell About What Students Have Learned: An Analysis of TIMSS Eighth Grade Mathematics. Eurasia Journal of Mathematics, Science & Technology Education, 11(6), 1563-1577.
Davier, M. (2005). A general diagnostic model applied to language testing data. British Journal of Mathematical & Statistical Psychology, 61(2), 287-307.
De La Torre, J. (2011). generalized DINA model framework. Psychometrika, 76(2) 79-199.
De la Torre, J., & Lee, Y. S. (2013). Evaluating the Wald test for item‐level comparison of saturated and reduced models in cognitive diagnosis. Journal of Educational Measurement, 50(4), 355-373.
Dindyal, J. (2008). An overview of the gender factor in mathematics in TIMSS-2003 for the Asia-Pacific region. ZDM, 40(6), 993-1005.
Embretson, S. E. & Reise, S. P. (2000). Item Response Theory for psychologists. Lawrence Erlbaum Associates.
Ercikan, K. & Koh, K. (2005). Examining the construct comparability of the English and French versions of TIMSS. International Journal of Testing, 5(1), 23-35.
Ercikan, K. & McCreith, T. (2002). Effects of adaptations on comparability of test items and test scores. In Secondary analysis of the TIMSS data (pp. 391-405)
Ercikan, K. (1998). Translation effects in international assessments. International Journal of Educational Research, 29(6), 543-553
George, A. C., & Robitzsch, A. (2014). Multiple group cognitive diagnosis models, with an emphasis on differential item functioning. Psychological Test & Assessment Modeling, 56(4), 405-432.
Haertel, E. H. (1989). Using restricted latent class models to map the skill structure of achievement items. Journal of Educational Measurement, 26(4), 301-321.
Hartz, S. M. (2002). A Bayesian framework for the unified model for assessing cognitive abilities: Blending theory with practicality.
Henson, R. A., Templin, J. L., & Willse, J. (2009). Defining a family of cognitive diagnosis models using log-linear models with latent variables. Psychometrika, 74(2), 191-210.
Horn, J., & McArdle. J. (1992). A practical and theoretical guide to measurement invariance in aging research. Experimental Aging Research, 18(3), 117-144.
Hou, L., De La Torre, J., & Nandakumar, R. (2014). Differential item functioning assessment in cognitive diagnostic modeling: Application of the Wald test to investigate DIF in the DINA model. Journal of Educational Measurement, 51(1) 98-125.
Huber, P. J. (2011). Robust statistics (pp. 1248-1251). Springer Berlin Heidelberg.
Junker, B. W., & Sijtsma, K. (2001). Cognitive assessment models with few assumptions, and connections with nonparametric item response theory. Applied Psychological Measurement, 25(3), 258-272.
Lee, Y. S., Park, Y. S., & Taylan, D. (2011). A cognitive diagnostic modeling of attribute mastery in Massachusetts, Minnesota, and the US national sample using the TIMSS 2007. International Journal of Testing, 11(2), 144-177.
Leighton, J. P., & Gierl, M. J. (2007). Verbal reports as data for cognitive diagnostic assessment. Cognitive diagnostic assessment for education: Theory and applications, 146-172.
Penfield, R. D., & Algina, J. (2003). Applying the Liu‐Agresti Estimator of the Cumulative Common Odds Ratio to DIF Detection in Polytomous Items. Journal of Educational Measurement, 40(4), 353-370.
Ravand, H., & Robitzsch, A. (2015). Cognitive Diagnostic Modeling Using R. Practical Assessment, Research, and Evaluation: Vol. 20 , Article 11.
Robitzsch, A., Kiefer, T., George, A. C., & Uenlue, A. (2016). CDM: Cognitive diagnosis modeling. R package version, 3
Rupp, A. A., Templin, J., & Henson, R. A. (2010). Diagnostic measurement: Theory, methods, and applications. NY: Guilford Press.
Su, Y., & Wang, W. (2005). Efficiency of the Mantel, generalized Mantel–Haenszel, and logistic discriminant function analysis methods in detecting differential item functioning for polytomous items. Applied Measurement in Education, 18(4) 313-350.
Tay, L., Meade, A. W., & Cao, M. (2015). An overview and practical guide to IRT measurement equivalence analysis. Organizational Research Methods, 18(1), 3-46.
Templin, J. L. (2004). Generalized linear mixed proficiency models. Unpublished doctoral dissertation, University of Illinois at Urbana-Champaign.
Teresi, J. A., Ocepek-Welikson, K., Kleinman, M., Cook, K. F., et al. (2007). Evaluation measurement equivalence using the item response theoryloglikelihood ratio (IRTLR) method to assess differential item functioning .Quality Life Research, 16(l1), 43-68.
Tatsuoka, K. K. Corter, J. E., & Tatsuoka, C. (2004). Patterns of diagnosed mathematical content and process skills in TIMSS-R across a sample of 20 countries. American Educational Research Journal, 41(4), 901-926.
Wu, A. D., Li, Z., & Zumbo, B. D. (2007). Decoding the meaning of factorial invariance and updating the practice of multi-group confirmatory factor analysis: A demonstration with TIMSS data. Practical Assessment, Research & Evaluation, 12(3), 1-26.
Zheng, Y., Chiu, C. Y., & Douglas, J. A. (2016). NPCD: Nonparametric methods for cognitive diagnosis. R package version 1.0-5.
Zumbo, B. D. (1999). A handbook on the theory and methods of differential item functioning (DIF). National Defense Headquarters.