第六节测验效度
测验效度(validity)是指测验实际能测出所要测的特质或能力的程度,即测验的有效性。例如,要测量小学生的数学能力,而一个数学能力测验确实能测到小学生的数学能力,那么这个测验的效度较高。如果该份试题是用英文书写的,对中国学生来说,测验的效度就会大大降低,因为测到的首先是英语理解能力,许多人得分低不是因为数学能力低,而是因为看不懂题目。一、效度与信度
用人们熟知的例子容易说明效度的含义及其与信度的关系。设想要测量人的体重,如果测量工具是体重秤,则效度高;如果测量工具是米尺,则效度低。所以,一个测验的效度首先取决于测验的目的和测验工具的匹配程度。用米尺来测量体重,多次测量结果很一致,即信度很高,但效度却很低。设想用目测法来测量一棵树的高度,不同的人会有不同的结果,即信度低。这时,效度也一定低,因为目测到的高度可能离要测量的高度相差很远。所以,一个测验可以有很高的信度,而效度却很低;但如果信度低,则效度一定低。就是说,一个测验要有高的效度,首先要有高的信度。
即使是不知道效度概念的人,也不会用数学试题去考学生的物理。问题是,如何衡量一个测验的效度?根据测验的目的和种类,效度可以从不同的角度考虑。下面介绍学科测验中主要的两种:内容效度和效标关联效度。
展开