|
参数估计算法
自适应测验评分方法有两类:极大似然估计方法以及贝叶斯方法。其中极大似然方法是较常用的线性或非线性方程组求解方法,贝叶斯方法是根据后验分布的信息确定能力估计值的。两类方法各有优缺点:
(1)极大似然法
极大似然估计值有以下的特性:极大似然估计值 是真值 θ的一致估计量,当样本容量增大时,极大似然估计值会趋于真值。极大似然估计法估计的能力 近似一个平均数为 θ,方差为 I(θ)-1的正态分布。测验信息函数就是能力极大似然估计值条件分布的近似抽样方差的倒数。极大似然估计法有两个缺点:
1) 当被试答对或者答错所有试题时,极大似然估计法是无法计算的。这种情况下,通常可以认定全对应答模式相对应的能力估计值为+3,全错应答模式相对应的能力估计值为-3。
2) 似然函数采用牛顿-拉夫逊迭代求解似然方程时,得到的可能是局部最大值甚至局部最小值。Lord发现在多种能力估计法中,极大似然估计法的能力估计值 对应的测验信息函数值是个上限。Thissen 和 Mislevy采用了模拟和实际的数据进行研究后认为,极大似然估计法得到的估计值作为能力估计最终结果是足够的,且它所得的估计标准误能对重复进行 CAT 测试时的发生变异作合理描述。
(2)贝叶斯能力参数估计
贝叶斯能力参数估计法需预先设定被试能力先验分布,再通过贝叶斯定理求取 θ 的后验分布,进而计算出被试得能力。贝叶斯参数估计方法对全对或全错情形可给出能力估计值,但是贝叶斯估计法的估计值都具有向先验分布平均数回归的趋势。
(3)极大似然估计法和贝叶斯能力参数估计之比较
查阅文献可发现已有许多研究者做过贝叶斯估计方法极及大似然估计方法的比较研究相关工作。总体来说,MLE 估计偏差很小,当有猜测存在时,在贝叶斯方法中,低能力被试者能力估计值偏差较大,但是在极大似然估计方法中并不存在。贝叶斯方法和极大似然方法相比效率较低,它需要更多试题以达到 CAT 结束规则,且在选择下一个满意试题方面所需时间也更长。
但对小样本而言,贝叶斯估计抽样误差比极大似然估计方法更小,这是因为贝叶斯方法估计值会向先验分布的平均数收缩,有些极端值被排除之缘故。
由于本项目针对人群可能是已踏上工作岗位的白领也有可能是大专院校的学生还有可能是社会上的闲散人员,所以一般很难准确地提前预估被试人群的分布,另一方面由于项目实时性要求比较高,出于算法效率考虑,最终决定采用极大似然方法。 |
|