返回列表 发帖

[测验技术] 计算机自适应测试步骤与流程

本帖最后由 psyqin2 于 2013-2-27 11:01 编辑

计算机自适应测试
项目反应理论的及时出现以及计算机技术的高速发展,使得计算机自适应测验得以实施。如今在美国,自适应考试已在教育测试、职业测试、人事测评等领域中大显身手。如美国研究生入学考试(GRE),工商管理类研究生入学考试(GMAT),微软的 MCSE(微软认证系统工程师)及全美护士国家委员会资格考试(NNCLT)等都已采取了自适应考试方式。美国参加 Novell 自适应考试的人数已超过 1,000,000 人次。有消息表明自适应考试(Adaptive)是微软今后考试的主要类型。在我国有关自适应考试的计算机软件极为少见,汉语水平考试(HSK)将推出计算机化自适应性 HSK 考试。全 国大 学英 语四、六级考 试委 员会一直致力于项目反应理论和“计算机自适应测验”的研究和开发。上海交通大学国际教育学院的教师也在进行汉语水平机助自适应测验系统题库建设理论研究。

国内对自适应的考试系统还处于研究状态。目前项目反应理论已成功的用于 CET分数等值处理过程中。但受 IRT 理论模型的局限性和我国传统考试方式、教育模式等因素的影响,基于 IRT 理论模型的自适应测试系统在我国实际教学的应用仍处于探索阶段,目前还没有成品的自适应考试软件模型问世。由于国内目前尚未出现正式的大规模考试采用 CAT 考试,现有 CAT 中参数估计方法和选题策略的选用靠开发者的经验探索,有的科学性和合理性还有待理论证实和实践检验。
建立计算机自适应测试包括以下几个步骤:

(1)IRT 模型选择
(2)试题参数估计以及试题筛选(3)评分方法选择:极大似然方法,贝叶斯估计方法。
(4)选题策略制定
1)极大信息量法
Lord 提出极大信息量的选题方法,最常被用在 CAT 选题中。该方法的核心思想就是在被试者当前的能力估计值上能够提供最多信息量的试题被选出并向被试者施测。
计算机从题库剩余的试题中选出难度和被试者当前能力估计值最接近的试题向考生施测。在单参数和双参数的 Logistic 模型中,当试题难度等于被试者能力时,试题为区分考生所提供的信息量最大。
2)Sympson-Hetter 方法
Sympson 和 Hetter提出的控制试题曝光率的方法。该方法的原理是将试题的选择过程与试题的施测过程分开,并在这两个过程之间插入一个过滤器,以控制试题被施测的次数,从而控制试题的曝光率。
3)按 a 分层方法(a-stratified method)CHANG Hua-hua 等于 1999 年提出了按 a 分层选题法。其基本思想是:把题库按a 参数指标进行排序,排完序的若干个项目(n)分成若干个子题库(k),每个子题库包含 m= [n/k]个项目,然后分别在 k 个子题库中选取 a 值最小的项目重新组成第 1 个子题库(k个项目),次小的组成第 2 个子题库,依次类推,a 值最大的 n-(k-l)m 个项目重新组成第 m 个子题库。
4)按 b 分层方法(b-stratified method)
Chang,Qian&Ying 提出了 b 模块化 a 分层选题法(即按 b(试题难度)选题法)。按 b 分层选题法的基本思想是:先对题库按 b 排升序,依次将相邻几个试题构成一个模块,再对同模块中的试题按 a 排升序,所有模块中 a 值最小的构成第一层,a 值稍大的构成第二层,依次类推。按 b 分层选题法没解决测试内容均衡问题。
(5)测试结束规则设定
基于 IRT 的 CAT 按照测试结束规则来分,一般分为固定长度和可变长度。可变长度测试,当信息量达到一定阀值之后,测试结束。
分享到: QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友

返回列表