第二计算机化多阶段自适应测验设计（第1页）

天才一秒记住【梧桐文学】地址：https://www.wtwx.net

第二节计算机化多阶段自适应测验设计

banner"

MST设计涉及以下几个技术环节：阶段数的确定、每个阶段中模块数的确定、每个模块的项目长度、统计目标与定性规范约束、计分方法（能力估计）、自适应策略与过程、组卷等。

现对以上技术环节一一展开。

一、阶段数的确定

构建MST时，首先考虑需要构建多少个阶段。

大多数研究和应用中，通常使用3～4个阶段。

更多的阶段或每一阶段内更多样化的模块难度会使测验的自适应性和灵活性更佳。

但是增加阶段数会提升组卷的复杂性，却对测验最终的精度没有很大提升（Luegester，1998）。

当测验所含阶段数较少时也会出现问题。

例如，两阶段测验，仅有一个阶段一和一个阶段二。

由于只有一个自适应点，当被试得分处于划界分数附近时，就有更大的可能出现路径错误。

两阶段测验应考虑建立一个“恢复路径（RecoveryRoutine）”

，即被试从前一阶段到下一阶段出错时，应及时改正错误，减少下一阶段模块选择的错误。

使用更多的阶段可以减少出现这种错误的可能性。

Patsula和Hambleton（1999）比较了多种不同的MST设计，他们发现这些设计之间仅有很小的差别。

但是这些测验设计在测量精度和效能方面表现出较大的差别。

测验的阶段数越多就越接近于CAT。

因此构建测验时，测验开发者应选择合适的阶段数。

阶段数过少无法精确测量出被试能力。

阶段数过多不但无法提升测量精度还会加大组卷难度和题目浪费，并面临和CAT同样的问题，如路由出错、多自适应点增长测验时间等。

二、每个阶段中模块数的确定

大多数研究和应用是阶段一使用一个模块，在随后的阶段中增加模块数量。

通常情况，每一阶段的模块数不超过8个，平均值为5个。

随着阶段数的提升，增加更多难度的模块数，可使测验更具有自适应性和灵活性。

同样，增加模块数也增大了组卷复杂性，并对测验最终精度没有很大提升（Luegester，1998）。

一般情况下，每一阶段最多4个模块，并且每个模块3个平行水平，这样的组合比较合适（Armstrong，Jones，Koppel＆Pashley，2004）。

因此在构建测验时，测验开发者要合理制定每一阶段内的模块数。

有两种可选择的模块数：一种是随着阶段增加，阶段内的模块数也增加，以此提升能力估计精度；另一种是每一阶段的模块数都相同，这种情况主要用于一致题目曝光率MST的情况（图4-1-2）。

测验开发者可根据自己的需求进行选取。

三、每个模块的项目长度

已有的研究和应用中，模块的题目数为1～90个不等，大多为5个。

不同阶段中模块的长度可根据实际情况而定。

一些测验在阶段一中有较多题目，而随后阶段中题目数量较少。

增加阶段一中模块的长度对减小估计误差有显著效果（Kim＆Plake，1993）。

本章未完，请点击下一章继续阅读！若浏览器显示没有新章节了，请尝试点击右上角↗️或右下角↘️的菜单，退出阅读模式即可，谢谢！

第二 计算机化多阶段自适应测验设计（第1页）