天才一秒记住【梧桐文学】地址:https://www.wtwx.net
记P为答对的概率,Q为答错的概率,则可以给出每个被试在每个项目上的反应概率,即
第1位被试在4个项目的得分矩阵U1·=(1100),该被试在每题上作答反应概率为P1·=(P11,P12,Q13,Q14),那么被试具有U1·=(1100)这样一种观察得分联合概率(似然L)为多少呢?如果假设被试在不同题目上的反应概率间相互独立(P11,P12,Q13,Q14彼此独立),则联合概率为
L1·=P11×P12×Q13×Q14。
延伸可得被试i在m个项目上的得分似然为
同理,如果假设不同被试间的得分相互独立,即与不同被试在测验上的得分模式无关,则可得N个被试在第j个项目上得分的似然函数为
根据公式(2.1.16)及公式(2.1.17)可得,所有被试在所有项目上的得分的似然函数为
公式(2.1.18)即为IRT模型的似然函数,IRT模型的参数估计基本上都是建立在似然函数的基础之上,如最大似然估计方法(MaximumLikelihoodEstimation,MLE)是在令似然函数L最大的情况下来估计未知的被试能力参数与项目参数的。
综上,IRT模型对似然函数构建是建立在局部独立(Lodependence)的假设基础上,即在给定特定能力θ条件下:
·在给定被试i的能力条件下,被试i答对第j题与第j′(j≠j′)题的概率相互独立,即p(Xij=1|θi)与p(Xij′=1|θi)相互独立。
·被试i与被试i′(i≠i′)答对项目j的概率相互独立,即p(Xij=1|θi)与p(Xi′j=1|θi′)相互独立。
当然,在实际测量领域中,以上局部独立的假设有时难于满足,比如一道大题由几道小题构成,而若下一道小题的正确完成的前提是上一道小题也正确完成,那么这时被试答对这两道小题的概率就不再满足独立性假设;又比如英文阅读理解题,由于这些题共用一篇短文,而被试对短文材料越熟悉,那该被试在该短文中不同题目间的答对概率也难于满足独立性假设。
为了处理局部独立性假设违背的测量情境,学者们将有相依(Lo-dence,LD)的题目作为一个独立的题组,从而开发出可以处理项目相依的题组反应模型(TestletRespoRM),关于题组反应理论的介绍读者可参考相关文献。
独立性假设只是针对传统IRT模型,而对于题组反应模型则无须这条假设,因此读者同样需要辩证地看待IRT的这条假设。
(三)单调递增性假设
单调递增性假设是指随着被试能力的增加,被试答对项目的概率越大。
这一点可以从Logistic模型的项目特征曲线中反映出来(详见图2-1-1),这种假设在能力测验中比较普遍,如智力测验、学业成就测验中一般都满足这种假设。
这时,我们可以采用Logistic数学函数来解释或预测不同能力被试在项目上的答对概率。
但在非能力测验(如态度测验、人格测验等)中,单调递增性假设难于满足。
现以一个项目例子加以说明,有这样一道试题:
如果用θ代表被试的长相水平,θ越高代表被试长相越好,反之越差。
那么长相水平为θi的被试在这个项目上选择“是的”
选项的概率有大呢?如果采用类似图2-1-1中的Logistic模型来处理的话,则认为θi越高(长相水平越高)的人,选择“是的”
选项的概率越高,这种解释显然与实际不符。
我们知道,长相水平越高(θi越高)或长相越低(θi越低)的被试,选择“是的”
选项的概率都偏低,而只有长相水平一般(θi为中间值)的被试选择“是的”
选项的概率会比较高,参见图2-1-5。
显然,这时被试在项目上的反应概率违背了单调递增性假设。
针对这种情况,学者们开发了展开模型(UnfoldModel,UM),展开模型中其项目特征曲线(ICC)可以不是单调递增曲线,感兴趣的读者可参考相关文献。
图2-1-5ICC非单调性的例子
单调递增性假设只是针对传统IRT模型,而对于展开模型则无须这条假设,因此读者也需要辩证地看待IRT的这条假设。
本章未完,请点击下一章继续阅读!若浏览器显示没有新章节了,请尝试点击右上角↗️或右下角↘️的菜单,退出阅读模式即可,谢谢!