2016年7月14日下午,美国波士顿学院(Boston College)研究生贾静同学为我院师生介绍了她在美国研究生项目——“教育研究、测量与评估(Educational Research, Measurement, and Evaluation)”,对所学的专业课程进行了介绍并分享了自己的学习体会。我院岑逾豪老师、博士生和硕士生参与此次报告会。
贾静同学在研一期间主要修学的课程包括项目评估、统计学、测试建构和大规模监测。她梳理了课程中的核心知识点,并与高教院的师生进行了学术交流。关于项目评估课程,她展示了价值论、本体论、知识论和方法论的理念演进,及在这些哲学理论的指导下衍生出的四种研究范式,即后实证主义、实用主义、建构主义和变革主义。贾静认为,评估者在评估过程中都会持有自己的价值观,从而选择相应的评估方法开展评估,没有唯一或绝对正确合理的评估方式。贾静还重点介绍了一种在美国常见的评估方法——基于理论的评估(Theory-Based Evaluation),这种评估方法是探寻项目过程中的逻辑链,从项目投入、项目产出和长远影响方面来评估该项目的实施情况。
关于统计课程,贾静回顾了统计学知识主干,讲述了假设检验、方差分析和回归模型等基本统计方法。关于测试建构课程,贾静认为试卷的有效性不仅在于试卷本身,而是在于试卷投入使用的实际过程中。她强调建构一个有效试卷需要考虑多元因素,除了题项本身难易程度,还需要注意测试环境、被测者信仰以及文化差异等。
接下来,贾静介绍了波士顿学院两项著名的大规模监测研究,包括国际数学和科学评测趋势(The Trends in International Mathematics and Science Study, 简称TIMSS)和国际阅读素养进步研究(Progress in International Reading Literacy Study, 简称PIRLS)。TIMSS主要测试四年级和八年级学生的数学与科学学业成绩。目前,中国大陆尚未参加项目测试。PIRLS是对四年级学生的阅读素养进行评价的比较研究。该大规模监测研究为贾静同学及其研究生项目的同学们深入了解测试数据提供了良好的平台,学生们能够亲身体验测试数据的严密性和趣味性。
最后,贾静介绍了如何运用项目反应理论(IRT)构建学生内在特质能力与学生对题项的反应之间的关系。与经典测验理论(CTT)不同,CTT是简单构建一个学生的观测分数和真分数之间的线性关系,而IRT从心理学角度考虑了更复杂的学习行为,更加接近现实。
会后,我院师生与贾静进行了深入学术探讨。博士生余天佐就“assessment”和“evaluation”二词的意义差异进行提问。贾静和岑老师分别阐述了各自观点,岑老师认为assessment强调测试评估的工具性与完整性,而evaluation具有更加宽泛的含义。贾静认为evaluator在评估中担任的角色比较多元丰富,而assessor扮演的角色更具专业性与技术性。