جهانیفر، مجتبی؛ خدایی، ابراهیم؛ یونسی، جلیل و موسوی، امین (1396). نقش هموارسازی در تبدیل غیرخطی نمرههای خام به نمرههای مقیاس نرمال. فصلنامه مطالعات اندازهگیری و ارزشیابی آموزشی، 7 (20)، 103-132.
رضوانیفر، شیرین (1391). همترازسازی نمرات دروس ریاضی و فیزیک رشتۀ علوم تجربی آزمون کنکور سراسری سالهای 1388 و 1389 بر اساس نظریه کلاسیک و جدید اندازهگیری. پایاننامه کارشناسی ارشد، دانشگاه علامه طباطبایی.
سازمان سنجش آموزش کشور (1394). آشنایی با روش نمره کلسازی در آزمون سراسری سال 1394. هفتهنامه خبری و اطلاعرسانی سازمان سنجش آموزش کشور (ویژهنامه پیک سنجش)، 19-27.
سلیمی جهرمی، محمدحسین (1377). بررسی روشهای همترازسازی آزمونها در نظریه کلاسیک و IRT و کاربرد آنها در همترازسازی آزمونهای ورودی دانشگاههای کشور. پایاننامه کارشناسی ارشد، دانشگاه علامه طباطبایی.
فرجی، حیدر (1389). همترازسازی نمرههای فرم A و B آزمون هوش کتل (مقیاس 3) در دانشآموزان پیشدانشگاهی شهر سقز با استفاده از مدلهای کلاسیک و IRT. پایاننامه کارشناسی ارشد، دانشگاه علامه طباطبایی.
مقدمزاده، علی (1392). روش بهینه همترازسازی با توجه به ویژگیهای بومی آزمونهای ملی ایران: مورد مطالعه آزمون تولیمو و آزمونهای جامع کنکورهای آزمایشی سازمان سنجش آموزش کشور. رساله دکتری، دانشگاه علامه طباطبایی.
Angoff, W. H. (1971). Scales, norms, and equivalent scores. In R. L. Thorndike (Ed.),
Educational Measurement (2nd ed., pp. 508-600). Washington, DC: American Council Education.
Brennan, R. L. & Lee, W. C. (1999). Conditional scale-score standard errors of measurement under binomial and compound binomial assumptions. Educational & Psychological Measurement, 59 (1), 5-24.
Dorans, N. J. (2004). Equating, concordance and expectation. Applied Psychological Measurement, 28 (4), 227–246.
Dorans, N. J. & Holland, P. W. (2000). Population invariance and the Equatability of Tests: Basic Theory and the Linear Case. Journal of Educational Measurement, 37 (4), 281-306.
Dorans, N. J.; Lyu, C. F.; Pommerich, M. & Houston, W. M. (1997). Concordance between ACT Assessment and Recentered SAT I sum scores. College & University, 73 (2), 24–34.
Dorans, J. N. & Walker, M. E. (2007). Sizing Up Linkages. In N. J. Dorans, M. Pommerich, & P. W. Holland (Eds.), Linking and Aligning Scores and Scales (pp. 191-198). New York: Springer.
Holland, P. & Dorans, N. J. (2006). Linking and Equating. In R. L. Brennan (Ed.), Educational Measurement (4th e., pp. 187–220). Westport, CT: Praeger Publishers.
Kolen, M. J.; Hanson, B. A. & Brennan, R. L. (1992). Conditional standard errors of measurement for scale scores. Journal of Educational Measurement, 29 (4), 285-307.
Kolen, M. J. (2004). Linking Assessment: Concept and History. Journal of Applied Measurement, 28 (4), 219-226.
Kolen, M. J. & Brennan, R. L. (2004). Test Equating, Scaling, and Linking: Methods and Practices (3th Ed.). New York: Springer.
Linn, R. L. (1993). Linking results of distinct assessments. Applied Measurement in Education, 6 (1), 83-102.
Marco, G. L.; Abdel-fattah, A. A. & Baron, P. A. (1992). Methods used to establish score comparability on the enhanced ACT assessment and the SAT (College Board Rep. No. 92-3). New York: The College Board.
Mislevy, R. J. (1992). Linking educational assessments: Concepts, issues, methods, and prospects. Princeton, NJ: ETS Policy Information Center.
Petersen, N. S.; Kolen, M. J. & Hoover, H. D. (1989). Scaling, norming, and equating. In R. L. Linn (Ed.), Educational measurement (3rd ed. pp.221-262). New York: Macmillan.
Pommerich, M.; Hanson, D. J.; Harris, D. J. & Sconning, J. A. (2004). Issues in Conducting Linkages between Distinct tests. Applied Psychological Measurement, 28 (4), 247-273.
R Core Team (2016). R: A Language and Environment for Statistical Computing. R Foundation for Statistical Computing, Vienna, Austria. Retrieved from https://www.R-project.org
Yin, P.; Brennan, R. L. & Kolen, M. J. (2004). Concordance between ACT and ITED scores from different populations. Applied Psychological Measurement, 28 (4), 274–289.