打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
教育测量的要素和种类
信度和效度是优良的测量工具所必具备的条件,如果对测量工具的信度和效度一无所知,则无法判断其获得的资料的可信性与有效程度。“工欲善其事,必先利其器”,在教育测量中要认真检查所使用的测量工具,考验其信度、效度以及难度和区分度,才能期望获得可靠与正确的资料。
一、教育测量的要素
(一)   单位
(二)   参照点
(三)   量表
二、教育测量的种类
以测量的对象来分类,教育测量有
(一)   学业成绩测验
(二)   智力测验
(三)   人格测验
(四)   特殊能力测验
以测量的目的来分类,教育测量有
(一)   安置测验
(二)   形成性测验
(三)   总结性测验
(四)   诊断性测验
(五)   难度测验
(六)   速度测验
以测量的方式来分类,教育测量有
(一)   个人测验
(二)   团体测验
以试题的形式来分类,教育测量有
(一)   客观性测验
(二)   论文式测验
(三)   投射测验
(四)   情景测验
三、教育测量的功能
(一)   教育测量是改进教学的良好工具
(二)   教育测量是教育管理的重要手段
(三)   教育测量是教育研究的重要方法
四、测量的评价
良好的测验应符合以下要求:
1、  试题的类型应与测量的目的相适应。
2、  试题应具有代表性
3、  试题应有适当的难度和区分度
4、  试题的表述要明晰、准确,不会引起被试者对试题的误解
5、  测验的结果要具有可靠性和有效性
6、  测验要宜于实施,易于评分,便于统计检验,在人力、物力和时间方面,符合经济性原则。
测验的质量评定
一、预备性知识:
1、标准差及其意义
计算公式是:
s=sqr(∑(x-X)2/N)
意义:标准差越大,表明数据的离散程度越大,即数据越参差不齐,分布范围越广;标准差越小,表明这组数据的;离散程度越小,即数据越集中,分布范围越小。问题:在教育研究中,标准差越大越好,还是越小越好?看情况、问题而定。成绩的标准差越大,就教学活动而言,难度越大;对选拔性测验而言,则表明测验质量很差。
例:计算原始数据83,87,86,81,88的标准差。
结果:s=sqr6.80=2.61
当两种单位不同或单位相同但平均数差异很大的资料,如何比较资料的差异?
相对差异系数CV!
计算公式:
CV=s/X*100%
CV就是以平均数为单位,以标准差占平均数的百分比的大小来衡量差异的程度.差异系数越大,表明离散程度越大;差异系数越小,表明离散程度越小.
例:比较1999年兰州市安宁区6岁男童体重与身高的离散程度.
平均数
标准差
体重
19.39kg
2.16kg
身高
115.87cm
4.86cm
体重CV=2.16/19.39*100%=11.14%
身高CV=4.86/115.87*100%=4.19%
根据经验, CV值一般在5%-35%之间。如果CV大于35%时,可怀疑平均数是否失去了意义;如果CV小于5%,可怀疑平均数与标准差的计算有误。
2、相关系数:
积差相关系数
r=∑(x-X)(y-Y)/nsxsy
其中,x(y)表示x(y)变量观测值,X表示x(y)变量观测值的算术平均数。sx和sy分别等于x变量和y变量的标准差。
例:计算并比较10个学生的语文、数学、化学成绩之间的相关系数。
序号
1
2
3
4
5
6
7
8
9
10
语文
74
71
72
68
76
73
67
70
65
74
化学
76
75
71
70
76
79
65
77
62
72
数学
62
58
79
80
64
77
50
69
55
56
计算可得语文标准差为3.317,平均数为71;化学标准差为5.178,平均数为72.3,语文和化学的相关系数r=.780
等级相关
斯皮尔曼等级相关:计算公式:rR=1-6∑D2/N(N2-1)
例:10名高中生学习潜在能力测验与自学能力测验成绩的相关程度如何?
序号
1
2
3
4
5
6
7
8
9
10
学能
1
2
3
5
5
5
7
8
9
10
自能
2
1
3
5
7
4
8
6
10
9
计算得rR=.891
肯德尔和谐系数rw=SSR/1/12k2(n3-n)
(k表示评定者的人数或同一评定者对同一组被评事物先后评定次数;n表示被评定事物的个数;R表示k个评定者对同一被评事物所给予的等级之和;SSR表示R的离差平方和,即SSR=∑R2-(∑R)2/n)
例:4位教师对6个学生的作文竞赛的名次排列如下,问评定的一致性如何?
学生
n=6
评定者 k=4
R
R2
1
2
3
4
1
3
4
2
1
10
102
2
4
3
1
3
11
112
3
2
1
3
4
10
102
4
6
5
6
5
22
222
5
1
2
4
2
9
92
6
5
6
5
6
22
222
总和
84
1370
SSR=194
Rw=.693
点二列相关
计算公式:rpb=(Xp-Xq)/S*sqr(pq)
例:18个5岁男女幼儿掷砂袋(150克)成绩如下表,问性别与投掷成绩相关情况如何?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
成绩
4.0
3.6
3.5
3.2
4.4
4.8
3.8
5.2
4.7
3.4
4.9
3.7
3.3
4.7
4.8
3.1
2.9
3.4
性别
1
0
0
0
1
1
0
1
1
0
1
0
0
1
1
0
0
0
rpb=.910
二、信度(reliability)
(一)   意义:测验的可靠性或可靠的程度
一个人站在测量体重的磅秤上,前后几次称出几个明显不同的重量,那么磅秤本身必定有问题,说明这架磅秤是不可靠的。在教育调查中,我们常采用问卷作为测量工具,如果我们所采用的问卷中的问题,原来打算测量某一概念,但由于设计不周密,问题或答案的范畴摸棱两可或有多种解释,以致被问者不能确定如何回答,从而使回答达不到一致性的要求,这就降低了测量的可靠性程度,那么它的信度就会成问题。
1.信度指实测值和真值相差的程度 X=T+E    绝对误差:E=X-T 相对误差=E/T*100%
2.信度是指一种测验对相同被试再次测验时引起同样反映的程度
(二)信度系数的计算
常用的信度系数有稳定性系数(coefficient of stability)、等值性系数(coefficient of equivalence)、内部一致性系数(coefficient of internal constancy)等。
使用稳定性系数时要注意的问题:(1)两次测验的时间间隔要适宜;(2)重测法适用于速度测验而不适用于难度测验。(3)要注意提高被试的积极性。
使用等值性系数时要注意的问题:(1)复份法的关键是两个量表必须等值。(2)两次测验的时间间隔要尽可能短。(3)如果两次测验紧接,应注意被试厌倦态度。(4)标准化测验一般有复份,若没有说明等值信度,或等值性系数较低,则使用复本时应慎重。
计算内部一致性系数的方法:(1)分半法(Split-half method)(2)Cronbach系数
(三)提高测验信度的方法(1)延长测验长度——新增加的题目与原有测验题目应有相同的统计性质,同时,不影响被试回答问题的方法。(2)难度要适当:r=1-SE2/SX2
经验表明,难度在.40-.70之间是合适的,也有人认为.25-075都有利于提高测验信度。(3)测验的内容应尽量同质;(4)测量时间要充分;(5)测量的程序应统一;(6)评分要客观。(7)加大应试者之间的差异
三、效度
所谓效度就是测验分数的正确性,意即“有多正确的程度”。在选择测量工具和设计问卷时,首先要考虑其效度。也就是说,要考虑“测量出来的东西是否真是研究者想要得到的东西”、“所测的结果是否能正确、有效的说明所要研究的现象”。
鉴别效度,必须确定测量的目的与范围,考虑所要测量的内容是什么,分析其性质和表现特征,进而核查测量的内容是否与测量的目的相符合,以此判断测量结果反映所要测量特征的程度。
假设某种测量的目的是衡量个体在某项属性(如工资收入)上的差异情况,则一群被调查者在该测量中得分的总变异量包括三个部分:一为个体在与该属性有关的共同属性上所造成的变异量,一为与该属性无关的其他个别特征(如奖金、补贴、亲友赠款等)所造成的变异量,其余为随机误差变异量。由此可以看出,效度就是在测量得分的总变异中,由所要测量的特质所造成的变异量所占的百分比。
本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
标准差
教育测量的基本方法
心理测量学基本概念和常考公式及其计算
研究数据的统计分析
心理与教育测量复习资料覃瑞
考试质量分析一般方法和要求
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服