تعیین ضرایب خرده آزمون‌های ارزشیابی صلاحیت‌های حرفه‌ای (اصلح) دانش‌آموختگان دانشگاه فرهنگیان

نوع مقاله : مقاله پژوهشی

نویسندگان

1 دانشجوی دکتری سنجش و اندازه‌گیری دانشگاه علامه طباطبائی و مدرس دانشگاه فرهنگیان ایران، خراسان رضوی

2 استاد گروه سنجش و اندازه گیری، دانشگاه علامه طباطبائی

3 دانشیار گروه سنجش و اندازه گیری، دانشگاه علامه طباطبائی

4 استادیار گروه سنجش و اندازه گیری، دانشگاه علامه طباطبائی

5 دانشیار گروه زبان انگلیسی، دانشگاه تربیت مدرس

چکیده

این پژوهش با هدف تعیین ضرایب خرده آزمون‌های ارزشیابی صلاحیت‌های حرفه‌ای (اصلح) دانش‌آموختگان دانشگاه فرهنگیان اجرا شد. پژوهش از نظر هدف، کاربردی و از حیث روش، از نوع همبستگی است. جامعه پژوهش، همه مهارت‌آموزان ماده 28 سال تحصیلی 95-94 دانشگاه فرهنگیان به تعداد 2823 نفر بود. با توجه به پراکندگی جامعه در تمام استان‌های کشور، از نمونه در دسترس استفاده شد و مهارت‌آموزان استان خراسان رضوی به تعداد 190 نفر، به‌عنوان نمونه انتخاب شدند. قسمت اصلی داده‌های این پژوهش، نتایج حاصل از آزمون اصلح دانشگاه فرهنگیان بود که در شهریور 1395 برگزار شده است. برای بررسی موفقیت معلمان از منظر همکاران، از آزمون محقق‌ساخته استفاده شد که پایایی آن با استفاده از روش آلفای کرونباخ 89/0 به‌دست آمد و روایی آن با استفاده از تحلیل عاملی بررسی شد. بر اساس شیوه‌نامه آزمون اصلح دانشگاه فرهنگیان،‌ سهم خرده‌آزمون «فرهنگی»، «تدریس خرد»، «علمی» و «عملکردی» به ترتیب 20، 35، 20 و 25 درصد است که بر اساس نتایج این پژوهش برای افزایش روایی ملاکی پیش‌بین، پیشنهاد می‌شود که سهم خرده‌آزمون‌ها به ترتیب، 15، 11، 38 و 36 درصد باشد. همچنین نتایج نشان داد که طبقه‌بندی افراد به گروه‌های دارای صلاحیت دائمی، صلاحیت موقت و عدم احراز صلاحیت، با روش به‌کار رفته در آزمون و روش پیشنهادی این پژوهش، به نتایج نهایی متفاوتی خواهد انجامید.

کلیدواژه‌ها


دلاور، علی (1395). مقدمه‏ای بر نظریه‏های اندازه‏گیری (روان‌سنجی). تهران: انتشارات سمت.
دلاور، علی .(1377). مقدمهای بر تحلیل عاملی. تهران: انتشارات دانشگاه آزاد اسلامی، واحد تهران مرکزی.
سرمد، زهره؛ بازرگان، عباس و حجازی، الهه (1395). روشهای تحقیق در علوم رفتاری. تهران: انتشارات آگاه.
طرح تفصیلی ارزشیابی صلاحیت‌های حرفه‌ای (اصلح) دانش‌آموختگان دانشگاه فرهنگیان (1394). معاونت نظارت، ارزیابی و تضمین کیفیت، مرکز سنجش شایستگی­های حرفه­ای، ویراست بیست و یکم، منتشر نشده.
کریمی، مسلم (1394). آموزش‌و‌پرورش محور شبکه‌ی تضمین کیفیت در نظام آموزشی. مجموعه مقالات دومین کنفرانس ملی و نهمین همایش ارزیابی کیفیت نظام‌های دانشگاهی. تهران، دانشگاه فرهنگیان، صص 74-63.
مگنوسون، داوید (1967). مبانی نظری آزمون‌های روانی؛ ترجمه محمدتقی براهنی. تهران: انتشارات دانشگاه تهران.
مؤمنی، منصور و فعال قیومی، علی (1389). تحلیل آماری با استفاده از SPSS، ویرایش سوم. تهران: انتشارات مؤلف.
نادری، عزت‌الله؛ حاجی‌زاده، محمد؛ شریعتمداری، علی؛ و سیف نراقی، مریم (1389). بررسی و مقایسه مهارت‌های حرفه‌ای معلمان دروس علوم پایه و علوم انسانی دوره راهنمایی شهرستان بهشهر به‌منظور ارائه روش‌های ارتقای کیفی این مهارت‌ها. تحقیقات مدیریت آموزشی، 2 (2)، 75 – 96.
هومن، حیدرعلی (1385). تحلیل داده‌های چندمتغیری در پژوهش رفتاری. تهران: نشر پیک فرهنگ.
 
Baldwin, P. (2015). Weighting Components of a Composite Score Using Naïve Expert Judgments about Their Relative Importance. Applied Psychological Measurement, 39 (7) 539–550.
Brennan, R. L. (2001). Generalizability theory. New York: Springer.
Brookhart, S. M.; & Loadman, W. E. (1992). Schooluniversity collaboration: Across cultures. Teaching Education, 4 (2), 53–68.
Chester, M. D. (2003). Multiple measures and highstakes decisions: A framework for combining measures. Educational Measurement: Issues and Practice, 22, 32–41.
Cronbach, L. J.; Linn, R. L.; Brennan, R. L & .Haertel, E. H. (1997). Generalizability analysis for performance assessments of student achievement or school effectiveness. Educational & Psychological Measurement, 57, 373–399.
Douglas, K. M.; & Mislevy, R. J. (2010). Estimating classification accuracy for complex decision rules based on multiple scores. Journal of Educational and Behavioral Statistics, 35, 1–27.
Glazerman, S.; Goldhaber, D.; Loeb, S.; Raudenbush, S.; Staiger, D. O.; & Whitehurst, G. J. (2011). Passing muster: Evaluating evaluation systems. Washington, DC: Brown Center on Education Policy at Brookings.
Goe, L.; & Croft, A. (2009). Methods of evaluating teacher effectiveness. Washington, DC: National Comprehensive Center for Teacher Quality.
Huberman, F.; & Boomhan, T. (2005). Applying TQM, philospphy to the teaching and learning process. Monash University, Malaysia.
Ingvarson, L. J.; Schwille, M. T. T.; Glenn R.; Ray P.; & Sharon L. S. (2013). An Analysis of Teacher Education Context, Structure, and QualityAssurance Arrangements inTEDS-M Countries, Findings from the IEA Teacher Education and Development Study in Mathematics (TEDS-M). Australian Council for Educational Research Michigan State University, Amsterdam, the Netherlands, www.iea.nl
Kane, M.; & Case, S. M. (2004). The reliability and validity of weighted composite scores. Applied Measurement in Education, 17, 221–240.
Martínez, J .F.; Schweig, J.; & Goldschmidt, P. (2016). Approaches for Combining Multiple Measures of Teacher Performance: Reliability, Validity, and Implications for Evaluation Policy. Educational Evaluation & Policy Analysis, 38 (4), 738–756.
Mehrens, W. (1989). Combining evaluation data from multiple sources. In J. Millman & L. DarlingHammond (Eds.), the new handbook of teacher evaluation: Assessment of elementary and secondary school teachers (pp. 322–336). Newbury Park, CA: SAGE.
Mihaly, K.; McCaffrey, D.; Staiger, D.; & Lockwood, J. R. (2013). A composite estimator of effective teaching (MET Project). The RAND Corporation. Retrieved from http:ll=//www.rand.org/pubs/ external_publications /EP50155.html
Moss, P. (1994). Can there be validity without reliability? Educational Researcher, 23 (2), 5–12.
Runder, L. (2001). Informed test component weighting, Educational Measurement: Issues and Practice, 0, pp. 16-19.
Taylor, E. S.; & Tyler, J. (2012). The effect of evaluation on teacher performance. American Economic Review, 102, 3628–3651.
villegas-Reimers, E. (2007). Teacher professional development: an international review of the literature. UNESCO; International Institute for Educational Planning
Wang, M. W.; & Stanley, J. C. (1970). Differential weighting: A review of methods and empirical studies. Review of Educational Research, 4, 663–704.