经典测验理论的局限性
经典测验理论(Classical Test Theory,CTT)以真分数理论为基础,建立了简单的数学模型。是目前技术成熟且应用广泛的心理测量学理论,其研究方向是正确的、科学的,也是需坚持的,但也有大量研究表明它存在许多不足与局限,简述如下:
1.真分数与观测分数为线性关系的假设不符合事实。经典测验理论假定观测分数 X、真分数 T 和测验误差分数 E 之间为线性关系,即能够用线性函数X=T+E 表示。但大量研究表明,事实更支持真分数与观测分数间存在的是非线性关系。
2.真分数与误差之间独立的假设难以满足。经典测验理论假定真分数与误差独立,但这与事实并不相符。能力低的被试在作答时猜测的程度一般会比能力高的被试大,所以其测验误差必然大于能力高的被试。
3.经典测验理论所定义的项目与测验性能指标(如项目难度、测验信度与效度等)严重依赖于样本。如将项目难度定义为被试组上的通过率,高水平样组通过率高,反之亦然,是项目难度并不确定。把测验信度与效度都定义为某种相关值,而相关系数的求取受样本数据取值全距范围大小的影响,因此也极其依赖于样本。故这些性能指标只能推广到类似的被试群体中,导致适应推广范围十分有限。
4.测验分数严重依赖于测验。每个测验包括了它独特的项目集,并且每一项目的性质也不相同,并且所谓的“平行试卷”在实际中并不存在,最终导致即使外部条件都以经标准化,测试相同能力的不同测验也可能有不同的分数。
5.测验信度及相应的测量标准误不精确。信度理论是经典真分数理论的主体部分,但其信度要由平行测验来得出,但严格的平行测验实际上并无法获得,从而求得的相关系数是不准确且偏差不明的。
6.项目难度与被试水平值定义在无关的两个量尺上。经典测验理论的项目难度是被试组的通过率,参照体系是某一被试样组;被试水平值是测验上的项目通过率,参照体系是某一项目样组。由于被试样组与项目样组是彼此无关的,不能针对某特定能力水平被试,去施测有恰当难度的项目,从而在测验编制工作中不能提供实际的指导与帮助。 |