|
a 分层选题策略存在的问题
作为分层选题策略中的新发展,a 分层方法要比传统的方法效果好,但是这仅仅是一个在测验中首先应该用低区分度项目的观点的粗略应用。这种方法还需要调整,并且需要进一步满足实际的需要。所以,分层选题策略本身也有一些亟待进一步研究和改进的地方,主要包括以下几个方面:
(1) 要确定层数 K 时,有几个因素应予以考虑。第一个因素是在一定水平内 a 值的变化。如果题库是由 a 值相近的题目组成,则分层的效果是最小的并且基本上不需要分层。然而,如果题库由不同 a 值的题目组成,一个比较大的分层数就很有必要了。第二个要考虑的因素是题库内容的丰富程度,在每一层内,题目的 b 值必须覆盖足够大的范围。内容较丰富的题库可以被分成更多层。第三个因素是测试长度的大小。
(2) 每一层的大小也需要定义。通常情况下,它应该是在每一层按照题目数的比例来进行管理,这确保了不同水平下题目的曝光率是相似的。一般来说,除了第一层以外其他所有层次的题目应用数应该是相等的。第一个层次必须足够大,以确保能力值的估计方程有适当的解决方案。因此,如果 L 是测试长度,在每层内管理的题目数应该近似于 L=K。内容平衡,虽然这里不谈论,是另一个确定层次大小的重要因素。
(3)以往的研究主要集中在固定长度的计算机自适应化测试,所以可变长度测试的分层方法应该进行研究。在这种测试中,能力估计值的精确度是终止标准,每层的题目数可以是一个变量依赖于那层达到的精度。
(4)采用分层选题策略时,当题库中项目的难度分布偏态的时候,怎么样来分区,这种分区对测验效率的影响也是值得研究的。
(5)尽管分层选题策略在能力估计的各个方面比传统选题策略表现出了一定的优势,但是并不是说,传统的选题策略应该退出历史舞台,它们已经完全处于下风。项目最大信息函数的方法是分层策略的理论基础之一,在分层选题策略中把项目最大信息函数的思想贯穿其中,把两种策略结合起来,能够最大效率发挥计算机自适应测验的作用。并且,把加权离差模型和分层选题策略结合起来,也可以是下一步对计算机自适应测验的选题策略进行研究的一个方向。
(6)猜测度对题目选择的影响应被测试。
(7)题目参数值的随机误差应该进行研究。 |
|