




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第十四课 教育研究资料的整理一、常用统计数据二、常用统计量三、统计推断之总体参数估计四、统计推断之统计检验五、常用间断型数据统计分析一、常用统计数据教育研究资料通常由三部分组成:静态资料:年龄、性别、年级、班级、职称、学历、户籍、地区等行为资料:表明“是否”、“能否”、“有无”、“常否”、“做否”、“程度”等态度资料:表明满意度、赞同度、择优度等教育统计数据类型:连续型数据(数字资料)如分数、身高、体重等间断型数据(计数资料)表明类别、品质、等级等按品质分类人次、次数、性别等等行为资料态度资料5-24-1302112等级优良中及差满意度很满意满意一般不满意很不满意赞同度很赞同同意一般不同意很不
2、赞同 二、常用统计量(一)频数(f)某些数据呈现的次数例1某班级英语考试成绩频数分布 3人:45;48;49 7人:50;54;55;56;57;57;5913人:60;60;61;64;64;64;65;65;66;67;67;67;6815人:70;70;70;71;72;72;73;73;74;74;75;75;76;77;7911人:80;81;81;82;82;83;86;87;87;88;89 5人:90;92;93;94;99 354合计05 0-1001510-2002520-3003530-404540-5075550-60136560-70157570-80118580-9
3、059590-100频 数组中值组 距某班级英语成绩频数分布表347.545-50252.550-55557.555-60662.560-65767.565-7072.570-75577.575-80682.580-85587.585-90492.590-95197.595-100频数(f)组中值组 距某班级英语成绩频数分布表10频数分布表的编制1、求全距(R) R=最大值最小值=99-45=542、定组数(K)和组距(I) K=R/I=54/5113、定组限(上下限或组中值)4、登记频数(间断型数据的频数)问卷题目1:你对课的满意程度如何?55204030频数(f)12345很不满意不满意一
4、般满意非常满意 等级频数(二)集中量描述一组数据典型水平或集中趋势的统计量 问卷题目1:你对课的满意程度如何?算术平均数:例1加权算术平均数:例1(问卷) 3.85平均数 =38551060160150各级分值XW=10055204030频数(W) M =3.012345权重分(x)合 计很不满意不满意一般满意很满意等级(三)差异量描述一组数据的离散趋势的统计量 1、全距(R)=最大值最小值 2、方差(S2)和标准差(S) 例1问卷题目1:你对课的满意程度如何?20X4(1-3)220201很不满意20X1(2-3)240202不满意0 (3-3)260203一般20X1(4-3)280204
5、满意1.414220X4(5-3)23.0100205很满意地理10X4(1-3)210101很不满意20X1(2-3)240202不满意0 (3-3)2120403一般20X1(4-3)280204满意1.0951.210X4(5-3)23.050105很满意物理SS2均值M得分频数等级分满意度班级(四)相关量描述两列变量之间的相关程度的统计量 相关分正相关、负相关和零相关。相关程度用相关系数表示。相关系数介于1.00和+1.00之间相关系数绝对值越大,相关程度越高相关系数为1.00时,为完全负相关相关系数为 +1.00时,为完全正相关相关系数为 0时,为完全无关相关系数计算与适用范围:积差
6、相关(r)皮尔逊积差相关 适用范围:两列呈正态分布的连续变量之间的相关关系;对数大于30等级相关(rp)斯皮尔曼等级相关 适用范围:等级变量和非正态分布的变量之间的相关关系点二列相关(rpb) 适用范围:一列变量为连续变量,另一列变量为二分变量 1、积差相关(rxy)(1)用平均数与标准差计算积差相关公式(1)例2求10名学生政治与语文成绩的积差相关系数积差相关公式(2)rXY=04891801880719840837 756总计 272 40021188 4982068 742 602228 59252828975697292809289280918490091369108925622161
7、936883601619619657762562561787275317534303373316464494041414761616827581898289888480877471808576777768747412345678910 xi yiYi2 xi2 yi XiYiXiYiXi语文政治学生 10名学生政治与语文成绩的相关系数计算表(2)用原始数据计算积差相关公式()10名学生政治与语文成绩的相关系数计算表rXY=048633697024557352837 756总计606853256480656562326853677657125920643867245625656179216724
8、792177447056640075695476504164007225577659295929462454765476827581898289888480877471808576777768747412345678910i ii2i2语文Yi政治Xi学号2、等级相关( r )例求10名学生教育统计学与普通心理学成绩的等级相关系数=21.59n=1000.252.25900190000.51.5300130012.52.57468591012444678910939292708375667664619490868686706865626012345678910D2DRYRX普通心理学Yi教育统
9、计学Xi学号2Drp=0.8710名学生教育统计学与普通心理学成绩的相关系数计算表等级相关公式、点二列相关( rb )点二列相关公式例4求10名学生化学成绩与性别的相关系数rpb= 0.15相关系数n=10q=0.471.7591805660女P=0.6SX=12.7869.4=67.83677283746546男占总体比例总体平均数与标准差二列平均数成绩二分称名10名学生化学成绩与性别的相关系数计算表三、推断统计之总体参数估计描述统计:集中量、差异量、相关量由样本数据求得的描述性数量统计量推断统计:总体的描述性数量参数样本的平均数、标准差、相关系数分别符号 、S、r表示 可通过样本计算求得;
10、总体参数用、分别 代表处总体的平均数、标准差 和相关系数,总体参数不能通过直接计算求得,是通过对 样本统计量进行推断得出的。 总体参数估计(一)点估计 例:某市10000名高三学生语文会考平均成绩估计(抽500名,65分)(二)区间估计总体平均数区间估计总体百分数区间估计 例:某市高一学生数学平均成绩估计 估计为8086分之间;估计100次,95次在此区间。 则正确概率95%。估计正确的概率称为置信系数或置信度。置信系数一般为95%和99%两种。例5随机抽取某年高考100份作文试卷,平均数为26,标准差为1.5, 试估计其总体平均数 当置信系数为95%时,代入公式:得出 当置信系数为95%时,
11、代入公式:得出 结论:25.707,26.294,估计可靠性为95%;25.613,26.387,估计可靠性为99%95%的置信区间1.96(理论Z值) 99%的置信区间2.58(理论Z值)1、大样本(n30)总体平均数的估计 标准误()样本平均数的标准误(标准差) 当n30以S代替 2、小样本(n30)总体平均数的估计95%的置信区间95%的置信区间例6随机抽取某校二年级学生17名,测其平均身高为120cm,标准差为10 cm,估计该校二年级学生平均身高 当置信系数为95%时,查 t 值表,df=171=16, t(16)0.05= 2.11 代入公式: 114.725 125.725 当置
12、信系数为99%时,查 t 值表,df=171=16, t(16)0.01= 2.92 代入公式: 112.7 127.3 结论:在114.725,125.725区间时,这个估计的可靠性为95%, 在112.7 ,127.3 区间时,这个估计的可靠性为99%。n30时,标准误计算公式中 通常以(n1)代替n 3、总体百分数的区间估计公式:样本百分数标准差:例7某县调查学生流失率,以某校753名学生为样本,结果流 失18名学生,问该县学生流失率的置信区间(置信度95%)。 解: n=753;p=18/753=0.024; q=1-p=0.976 样本百分数标准差:SEp=0.00558 因此,置信
13、度为95%的总体比率的置信区间为: 0.0241.96X0.00558 0.024+1.96X0.00558,即1.3% 3.5%。 所以,该县学生流失率的置信区间为1.3%,3.5%。四、推断统计之统计假设检验统计假设检验既差异显著性检验统计检验的目的: 检验样本与总体之间或样本之间的差异是否显著,推断差异 产生原因是否是由抽样误差引起差异的显著性水平差异由随机误差所造成的概率的大小(a)a=0.05水平:P0.05,则差异不显著; P 0.05,则差异显著a=0.01水平:P0.01,则差异不显著; P 0.01,则差异显著统计检验类型根据检验的统计量平均数差异检验相关系数差异检验根据样本
14、容量大样本Z检验小样本 t 检验根据样本形式独立样本检验相关样本检验多样本F检验根据数据类型 连续性数据间断性数据x2检验(一)Z检验(大样本n30平均数差异的显著性检验)1、一个样本平均数与一个已知的总体平均数差异检验公式:例7高一五个班的物理期末平均成绩为50分,标准差为10分,张老师讲 授高一(3)班物理课程,该班49名学生,期末物理平均成绩47.5分。 学校认为张老师的教学效果低于学校平均水平,张老师不同意。 问(3)班成绩与学校平均水平有无显著性差异?学校评价是否科学?检验步骤:提出假设H0:两者无显著性差异(零假设)选择检验统计量并计算其值:Z=-1.75确定检验形式:因无资料表明
15、(3)班与全校平均水平的高低, 故采用双侧检验 统计推断:因Z= 1.750.05,在0.05显著性水平上保留 零假设,即(3)班成绩与学校平均水平无显著性差异,学校对张老师 的评价是不科学的。2、独立大样本Z检验独立样本:两个彼此独立的样本。两个样本不存在任何关系。例8高三学生英语测试成绩如下:男生180人,平均成绩75.6分,标准差 11.5分;女生160人,平均成绩77.2分,标准差10.5分。 问男女生英语成绩有无显著性差异?公式:检验步骤:提出假设H0:男女英语成绩无显著性差异(零假设)选择检验统计量并计算其值:Z=-1.424确定检验形式:因无资料表明其英语成绩的高低,故采用双侧检
16、验 统计推断:因Z= 1.4240.05,在0.05显著性水平上保留 零假设,即高三男女英语成绩无显著性差异3、相关大样本Z检验同一组被试在不同条件下形成的样本(实验前后分数或两次实验结果)两组被试在成对匹配的情况下形成的样本公式:例9抽取某小学二年级学生50名做实验,实验前测阅读平均成绩 为 76.5分, 标准差为8分;实验后测参加学生46人,平均成绩79.5分,标准差为7分, 两次测验的相关系数为0.6。问前后两次测验成绩有无显著性差异?检验步骤:提出假设H0 :实验前后两次测验成绩无显著性差异(零假设)选择检验统计量并计算其值:Z=3.09确定检验形式:采用双侧检验 统计推断:因Z= 3
17、.092.58,则P 2.093,则P2.567,则P3.25,则P8.02,则P0.01 所以,在0.01显著性水平上拒绝 零假设,即三组平均数之间至少 有一对存在显著性差异数学测验错误频数 =8 =22 = 24 =154 =42 =452114258471210812组3(无噪音)X3组2(中噪音)X2组1(强噪音)X1=(452+154+22) (42+24+8)2/12=171.67=(422/4+242/4+82/4) (42+24+8)2/12=144.6724.11MSW =3dfW =9SSW =27组内MSB =72.33dfB =2SSB =144.67组间dfT = 1
18、1SST =171.67总计F 值均 方自由度平方和变异来源方差分析表(四)相关系数差异的显著性检验例14某校122名高一学生的物理成绩与数学成绩的相关系数从总体来说, 高一学生的物理成绩和数学成绩是否存在相关公式:检验步骤:提出假设H0 :两个成绩之间不存在显著性相关(零假设)选择检验统计量并计算其值: Z=4.88确定检验形式:采用双侧检验 统计推断:Z=4.882.58,则P5例15问卷题目2(某师范大学教师素质调查问卷): 你认为教师最重要的能力是什么?(A.自学能力;B.教学能力;C. 科研能力) 回收54份问卷中选自学能力15人,选教学能力23人,选科研能力16人,问对 这三种能力
19、的看法有无显著性差异?检验步骤:提出假设H0 :对这三种能力的看法无显著性差异(零假设)选择检验统计量并计算其值: fe=54/3=18, x2=2.11确定检验形式:采用双侧检验 统计推断: df=3-1=2,查 x2(2)0.05=5.99 x2=2.115.99,则P0.05,在0.05显著性水平上接受零 假设,即对三种能力的看法无显著性差异。五、常用间断型数据(问卷资料)的统计分析(一)百分比统计法(二)得分率统计法(三)排序统计法(四)差异统计法(五)相关统计法(一)百分比统计法公式:P为反应项目的百分率n为对问卷某一反应项目的填答人数N为填答该问卷的总人数 选项问卷题目中国内地香港
20、美国其他你愿意在那个国家或地区生活?1883685百分率79.3%15.2%3.4%2.1%可用于总体百分数的区间估计(二 )得分率统计法公式:a为等级分值; an为最高等级分值n为选答某反应项目人数; N为参与填答问卷的总人数 等级问题全部理解大部分理解部分理解少部分理解得分率F均值M43211.独立大样本Z检验7610270.4651.862.独立小样本t检验2414840.793.163.相关大样本Z检验18121460.712.844.多样本F检验2018840.773.085.计数资料X2检验81212180.552.2N=50例16问卷题目3:你对以下问题的理解程度如何?请在表中每
21、个问题的右边 选择一项,并打“”(三 )排序统计法公式:a为排序等级的分值; 为排序的各等级分值的和n为选答某等级的人数; N为参与填答问卷的总人数例17问卷题目4:你认为目前师范生不重视教师教育公共课程的主要原因是 什么?根据你的看法,把下列原因选项代号,按其重要程度填在表中。 A.课程内容枯燥B.课程应用性差C. 教师水平不高D. 合班上课效果差N=50/结果:WCWAWBWDDCB2.762.202.962.080.2760.2200.2960.2088166201216101214101412168206A1234均值M排序指数(W)第四位第三位第二位第一位 排序等级原因可用于教育项目
22、权重的的计算(四 )差异检验法1、单组样本X2检验法公式:f0为观察次数;fe为理论次数例18问卷题目5:你对教师职业的满意程度如何? 1.很满意 2.满意 3. 不满意 4. 很不满意 分析:学生的态度有无显著性差异?选项 n满意度1234x2x2(df)0.01P很满意满意不满意很不满意观察频数f0261323X2 =23.09df=X2(3)0.01 =11.345P 0.01合 计N=44人2、多组样本X2检验法(列联表法:RL表)22列联表公式:NR为行的观察次数;NL为理论次数R为行的数量;L为列的数量例19问卷题目6:你是否喜欢听教育研究方法课? 1.喜欢 2.一般 3. 不喜欢 分析:两个专业学生的态度有无显著性差异?选项很喜欢一般不喜欢行总计NLX2dfx2(df)0.05P1中文专业34 ( )41( )25( )100X2=19.94df=x2(2)0.05 =5.991P 0.052历史专业64 ( )17( )19( )100列总计NR985844200合 计N=200(五 )相关分析法(类别与类别)22类别 相关分析公式:例20 基本信息部分:你的家庭住址:
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 水库进口段施工方案模板
- 矿产资源开发与区域经济发展-石墨滑石考核试卷
- 木结构防火施工方案
- 粮食批发商市场规范化管理与监管策略研究考核试卷
- 解答证券从业资格证考试疑难试题及答案
- 2023年中国铁路上海局集团有限公司招聘高等职业院校毕业生3163人(二)笔试参考题库附带答案详解
- 2024项目管理考试复习要点试题及答案
- 硫酸铜在金属腐蚀中的应用考核试卷
- 2023年中国能建陕西院智能配网公司招聘变电电气设计岗位工作人员笔试参考题库附带答案详解
- 2023年中国联合网络通信有限公司会昌分公司公开招聘工作人员笔试参考题库附带答案详解
- 第十五讲新时代与中华民族共同体建设2012- -中华民族共同体概论专家大讲堂课件
- 广东省深圳市名校联考2023-2024学年高一下学期数学期中考试试题(含答案)
- 中国革命战争的战略问题(全文)
- MSOP(测量标准作业规范)测量SOP
- 初中花城版八年级下册音乐4.狂欢之歌(15张)ppt课件
- 常用标准波导和法兰尺寸
- 盘扣式脚手架高支模专项施工方案(共26页)
- 不合格品控制流程图
- 电缆敷设及接线施工方案(完整版)
- 红领巾广播稿:书香伴我成长之好书推荐
- 汽车离合器设计毕业设计(论文)
评论
0/150
提交评论