衡量测验质量的四个指标,即信度、效度、难度、区分度,在考试中通常以客观题的形式出现,具体来说主要包括概念反选、例子反选题或判断题。而一直以来由于知识内容有一定的相似性和关联度,考生们常常区分不清产生混淆。因此,为了帮助考生们解决这一问题,我们就一同来梳理一下该知识点。
信度是指测验结果的稳定性或可靠性,即某一测验在多次进行后所得到的分数的稳定、一致程度。它即包括在时间上的一致性,也包括内容和不同评分这之间的一致性。如,在不同时间测两次相同的试卷,如果成绩基本相当,那么我们就认为测验的信度较高。
效度是指测量的正确性,即一个测验能够策略出其索要测量的东西的程度,也就是我们常说的准确度。故而通常效度考虑的问题是:测验测量什么?测验对测量目标的策略精确性和真实性有多大?就一个测验的优劣而言,效度是一个比信度更为重要的指标。如,我想测量初一年级的数学成绩,但是给他们做了一套小学四年纪的数学试卷,此时不能测量出我原本想要测量的东西,我们认为测验的效度不高。
难度是指测验包含的试题难易程度。一般来说,难度可以用:“P(通过率)=通过人数/总人数”的公式来表示,可见P(通过率)值越低难度越大,两者间呈反比关系。
区分度是指测验对考生的不同水平能够区分的程度,即具有区分不同水平考生的能力。如,一次测验之后,能够明确分清不同学生的水平,我们就认为该测验的区分度较高。
在我们明确了这四个指标的含义之后,我们会发现这四个指标都是用来衡量测验质量高低的,那么它们之间有没有什么关系呢?那当然是有的,四个指标之间既有联系又有区别,考生们既要能够区分有得了解他们之间的相互影响关系:
首先是区别,重点在于信度与效度之间的区别,要明确信度是衡量测验的可信程度而非试题内容的质量,因而才会运用多次测验的方式;而效度是衡量测验的有效程度更加注重试题内容的有效性,是评价试题是否能达到预期效果。因此,我们认为在衡量测验本身质量时,效度是比
信度是指测验结果的稳定性或可靠性,即某一测验在多次进行后所得到的分数的稳定、一致程度。它即包括在时间上的一致性,也包括内容和不同评分这之间的一致性。如,在不同时间测两次相同的试卷,如果成绩基本相当,那么我们就认为测验的信度较高。
效度是指测量的正确性,即一个测验能够策略出其索要测量的东西的程度,也就是我们常说的准确度。故而通常效度考虑的问题是:测验测量什么?测验对测量目标的策略精确性和真实性有多大?就一个测验的优劣而言,效度是一个比信度更为重要的指标。如,我想测量初一年级的数学成绩,但是给他们做了一套小学四年纪的数学试卷,此时不能测量出我原本想要测量的东西,我们认为测验的效度不高。
难度是指测验包含的试题难易程度。一般来说,难度可以用:“P(通过率)=通过人数/总人数”的公式来表示,可见P(通过率)值越低难度越大,两者间呈反比关系。
区分度是指测验对考生的不同水平能够区分的程度,即具有区分不同水平考生的能力。如,一次测验之后,能够明确分清不同学生的水平,我们就认为该测验的区分度较高。
在我们明确了这四个指标的含义之后,我们会发现这四个指标都是用来衡量测验质量高低的,那么它们之间有没有什么关系呢?那当然是有的,四个指标之间既有联系又有区别,考生们既要能够区分有得了解他们之间的相互影响关系:
首先是区别,重点在于信度与效度之间的区别,要明确信度是衡量测验的可信程度而非试题内容的质量,因而才会运用多次测验的方式;而效度是衡量测验的有效程度更加注重试题内容的有效性,是评价试题是否能达到预期效果。因此,我们认为在衡量测验本身质量时,效度是比
