دلاور، علی (1395). مقدمهای بر نظریههای اندازهگیری (روانسنجی). تهران: انتشارات سمت.
دلاور، علی .(1377). مقدمهای بر تحلیل عاملی. تهران: انتشارات دانشگاه آزاد اسلامی، واحد تهران مرکزی.
سرمد، زهره؛ بازرگان، عباس و حجازی، الهه (1395). روشهای تحقیق در علوم رفتاری. تهران: انتشارات آگاه.
طرح تفصیلی ارزشیابی صلاحیتهای حرفهای (اصلح) دانشآموختگان دانشگاه فرهنگیان (1394). معاونت نظارت، ارزیابی و تضمین کیفیت، مرکز سنجش شایستگیهای حرفهای، ویراست بیست و یکم، منتشر نشده.
کریمی، مسلم (1394). آموزشوپرورش محور شبکهی تضمین کیفیت در نظام آموزشی. مجموعه مقالات دومین کنفرانس ملی و نهمین همایش ارزیابی کیفیت نظامهای دانشگاهی. تهران، دانشگاه فرهنگیان، صص 74-63.
مگنوسون، داوید (1967). مبانی نظری آزمونهای روانی؛ ترجمه محمدتقی براهنی. تهران: انتشارات دانشگاه تهران.
مؤمنی، منصور و فعال قیومی، علی (1389). تحلیل آماری با استفاده از SPSS، ویرایش سوم. تهران: انتشارات مؤلف.
نادری، عزتالله؛ حاجیزاده، محمد؛ شریعتمداری، علی؛ و سیف نراقی، مریم (1389). بررسی و مقایسه مهارتهای حرفهای معلمان دروس علوم پایه و علوم انسانی دوره راهنمایی شهرستان بهشهر بهمنظور ارائه روشهای ارتقای کیفی این مهارتها. تحقیقات مدیریت آموزشی، 2 (2)، 75 – 96.
هومن، حیدرعلی (1385). تحلیل دادههای چندمتغیری در پژوهش رفتاری. تهران: نشر پیک فرهنگ.
Baldwin, P. (2015). Weighting Components of a Composite Score Using Naïve Expert Judgments about Their Relative Importance. Applied Psychological Measurement, 39 (7) 539–550.
Brennan, R. L. (2001). Generalizability theory. New York: Springer.
Brookhart, S. M.; & Loadman, W. E. (1992). Schooluniversity collaboration: Across cultures. Teaching Education, 4 (2), 53–68.
Chester, M. D. (2003). Multiple measures and highstakes decisions: A framework for combining measures. Educational Measurement: Issues and Practice, 22, 32–41.
Cronbach, L. J.; Linn, R. L.; Brennan, R. L & .Haertel, E. H. (1997). Generalizability analysis for performance assessments of student achievement or school effectiveness. Educational & Psychological Measurement, 57, 373–399.
Douglas, K. M.; & Mislevy, R. J. (2010). Estimating classification accuracy for complex decision rules based on multiple scores. Journal of Educational and Behavioral Statistics, 35, 1–27.
Glazerman, S.; Goldhaber, D.; Loeb, S.; Raudenbush, S.; Staiger, D. O.; & Whitehurst, G. J. (2011). Passing muster: Evaluating evaluation systems. Washington, DC: Brown Center on Education Policy at Brookings.
Goe, L.; & Croft, A. (2009). Methods of evaluating teacher effectiveness. Washington, DC: National Comprehensive Center for Teacher Quality.
Huberman, F.; & Boomhan, T. (2005). Applying TQM, philospphy to the teaching and learning process. Monash University, Malaysia.
Ingvarson, L. J.; Schwille, M. T. T.; Glenn R.; Ray P.; & Sharon L. S. (2013). An Analysis of Teacher Education Context, Structure, and QualityAssurance Arrangements inTEDS-M Countries, Findings from the IEA Teacher Education and Development Study in Mathematics (TEDS-M). Australian Council for Educational Research Michigan State University, Amsterdam, the Netherlands, www.iea.nl
Kane, M.; & Case, S. M. (2004). The reliability and validity of weighted composite scores. Applied Measurement in Education, 17, 221–240.
Martínez, J .F.; Schweig, J.; & Goldschmidt, P. (2016). Approaches for Combining Multiple Measures of Teacher Performance: Reliability, Validity, and Implications for Evaluation Policy. Educational Evaluation & Policy Analysis, 38 (4), 738–756.
Mehrens, W. (1989). Combining evaluation data from multiple sources. In J. Millman & L. DarlingHammond (Eds.), the new handbook of teacher evaluation: Assessment of elementary and secondary school teachers (pp. 322–336). Newbury Park, CA: SAGE.
Mihaly, K.; McCaffrey, D.; Staiger, D.; & Lockwood, J. R. (2013).
A composite estimator of effective teaching (MET Project). The RAND Corporation. Retrieved from
http:ll=//www.rand.org/pubs/ external_publications /EP50155.html
Moss, P. (1994). Can there be validity without reliability? Educational Researcher, 23 (2), 5–12.
Runder, L. (2001). Informed test component weighting, Educational Measurement: Issues and Practice, 0, pp. 16-19.
Taylor, E. S.; & Tyler, J. (2012). The effect of evaluation on teacher performance. American Economic Review, 102, 3628–3651.
villegas-Reimers, E. (2007). Teacher professional development: an international review of the literature. UNESCO; International Institute for Educational Planning
Wang, M. W.; & Stanley, J. C. (1970). Differential weighting: A review of methods and empirical studies. Review of Educational Research, 4, 663–704.