版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
大二上·教育统计学教育统计学期末复习1.统计学分为数理统计学和应用统计学,教育统计学是运用数理统计的原理和方法研究教育问题的一门应用科学。描述性统计和推断性统计(估计和假设检验)2.随机现象的每一种结果叫做一个随机事件,能表示随机现象各种结果的变量称为随机变量,统计处理的变量都是随机变量。第二章数据的初步整理一、数据的来源、种类及其统计分类(一)来源1.经常性资料:文字记载的资料2.专题性资料①教育调查:在没有预定因子、不施行控制的条件下,对现成的教育方面有关客观事实所进行的观察和分析。分为:现情调查、回顾调查和追踪调查或全面调查和非全面调查②教育实验:在预定的控制因子影响下,对教育方面有关客观事实所进行的观察和分析。一般设立两种实验处理进行对照和比较:单组实验(看两种形式对结果的影响)、等组实验(甲乙两组基本条件相同的情况下,对之施行不同的实验处理)和轮组实验(在实验组和对照组分别进行两种实验处理,并且每种处理各重复一次:甲组实验先A后B,重复为先B后A;乙组实验先B后A,重复先A后B)(二)种类1.变量定类(称名)变量:如性别、专业定序(顺序)变量(无相等单位和绝对零点):1级、2级、三级定距(等距)变量(有相等单位无绝对零点):摄氏温度定比(比率)变量(有相等单位有绝对零点):身高、体重2.数据①点计:人数、物品个数。度量:用工具得到的数据②间断型随机变量数据(类别数据,人数、等级),连续型随机变量数据(数据可以用小数表示,连续区间)3.统计量与参数(统计量:在统计工作中,对一系列原始数据进行计算,得出的平均数,标准差)参数(由样本估计总体的水平)二、统计图表1.统计表一般由标题、表号、题目、线段、数字(暂缺或未记录…表示,无用—表示)、表注构成纵标目顶线纵标目顶线总标目表2.1某年级各班学生人数总标目横标目班别横标目一班二班总和人数4236底线78底线表2.838名学生6道选择题做对的频数分布做对题数0123456总和频2.11二年级80个学生身高的频数、累积频数、累积百分比分布表身高组中值频数累积频数累积百分比115-118-121-124-127-130-133-136-139-142-116.5119.5122.5125.5128.5131.5134.5137.5140.5143.5138102019124211412224261737779801.255.0015.0027.5052.5076.2591.2596.2598.75100.00总和80表2.12师大附小和云岭小学二年级学生身高的频数百分比分布表身高频数频数百分比师大附小云岭小学师大附小云岭小学112-115-1161.252.5015.00总和8040100.00100.002.统计图标题、图号、标目、图形、图注表示间断变量:直条图(纵条图和横条图)、圆形图表示连续变量:线形图、频数分布图(直方、多边、累积频数和累积百分比图)三、抽样为了使统计推断正确可靠,就应当使样本对于总体有较好的代表性,这就引伸出抽样的问题:抽样方法:单纯随机抽样:抽签,等概率,一般来说要放回,但无限总体放回与不放回不改变机械抽样:从总体中抽取样本时,按照时间或空间的等距间隔抽取,可与单纯随机抽样结合起来(前20人中选任一个,再从下一个20人中任选一个)分层抽样:分组后单纯随机抽样整群抽样:如要调查北京市五年级小学生患近视眼的情况,不是个别地抽取每个学生,而是按照学校来抽样,然后对抽取到的学校中的每个五年级小学生进行检查。组织便利容易抽取,缺点是样本单位在总体中的分布不均匀,代表性有限。样本容量:一般认为n<30为小样本,n≥30为大样本第三四章集中量和差异量集中量:用一个数据表示总体(或样本)某一方面的一般水平算术平均数(X)及加权平均数(Xw频数分布表计算法中,把X替换为fx(组中值)X频数中位数(Md)频数分布表计算法:类似四分位距计算法众数(Mo)皮尔逊经验法:Mo≈3Md-2X(四)算术平均数、中位数和众数的关系当频数分布呈正态时,算数平均数、中位数、众数三者重合为一点。中位数始终在中间,正负偏态看X二、差异量:一组数据离散程度(一)绝对差异量1.四分位距(QD):数量中间的50%Q1(累积频数为25%)Q3(累积频数为75%)QD=(1)原始数据求法(2)频数分布表求法(内插法)分数频数累积频数四分位距50-11Q3=85+36-2955-2360-3665-41070-51575-62180-82985-103990-54495-448总和48平均差(MD)各数与算术平均数或中数之绝对利差的平均数:3.方差(σx2)和标准差(σ(1).原始数据法σ(2).频数分布表法:把X换成组中值fx(二)相对差异量:两种单位不同,身高体重CV=CV大,表明离散程度大,CV小,表明离散程度小(三)偏态量和峰态量1.偏态量SK=0SK>0SK<02.峰态量α4=0正态峰α4>0高狭峰α4<0低阔峰第五章概率及概率分布一、概率(P(X))(一)分类:先验概率后验概率二、二项分布:1.二项展开式通式:P2.在n次二项试验中成功事件出现次数的平均数为:μ=np,标准差为σ=三、正态分布:标准差大的,正态分布形态低阔,标准差小的,正态分布形态高狭1.标准正态分布:Z=图形,面积的含义,整个曲线面积可大致分为6个部分2.确定录取分数线(将录取率200/1600=0.125作为正态分布上端的面积。然后根据0.5-0.125=0.375查表得P,进而得到Z)、确定等级评定的人数(可将正态分布基线上Z=-3至Z=+3之间6个标准差的距离分成相等的几份)★第六章抽样分布及总体平均数的推断通常以拉丁字母X、s、r、n表示样本的平均数、标准差、相关系数统计量,以希腊字母μ、σ一、抽样分布(一)概念:某一种统计量的概率分布(二)定理:1.从总体中随机抽出容量为n的一切可能样本的平均数之平均数等于总体的平均数EX=μ(E表示平均的符号,X表示样本的平均数,μ2.容量为n的平均数在抽样分布上的标准差等于总体标准差除以n的平方根:σX=σZ=S=nn推导为:S(三)t:t=df越大,曲线越高二、总体平均数估计(点估计·区间估计·双侧)实际研究工作中,除特殊情况外,把它假定为正态分布或接近正态分布。(一)σ已知95%置信区间:PX99%置信区间:P(二)σ未知大样本:同上小样本:95%置信区间:P99%置信区间:P三、假设检验显著性水平α:(一)σ已知Z提出假设:H0:μ=66H1:μ≠66选择检验统计量并计算其值:Z=确定检验形式:双侧/单侧统计决断:丨Z丨双侧(1.962.58)单侧(1.652.33)(二)σ未知tⅠ大样本Z=Ⅱ小样本提出假设选择检验统计量并计算其值:t=确定检验形式统计决断:tdf0.01★第七章平均数差异的显著性检验一、基本原理平均数之差:D=差的方差:σD相关样本平均数之差的标准误σ独立样本平均数之差的标准误二、显著性检验(一)相关样本1.配对组(1)提出假设H(2)选择检验统计量并计算其值t=(3)确定检验形式(4)统计决断2.同一组T换为Z(二)独立样(方差齐性用t检验,方差不齐性用t’检验)1.独立大样本S2.独立小样本(略)t=对两个总体的方差是否有显著性差异所进行的检验称为方差齐性检验,对两个独立样本方差是否齐性,要F检验第八章方差分析一、方差分析的基本原理:以F检验来推断几个平均数差异的显著性F=MMSSSb=n∑SSw=∑∑SSt=∑∑★第十章χ2检验(类别变量,不能有具体数值)考察比例,检验两个因素是否相关,根据样本的频数分布来推断总体的分布。自由分布的非参数检验。一、χ2χ二、χ2的抽样分布呈正偏态,右侧无限延伸,但永远不与基线相交。自由度越小,χ2分布偏斜度越大,自由度越大,分布形态趋于对称(一)单变量的χ2检验:单相表的自由度=组数-1按一定比率决定理论频数的χ2检验提出假设:H0:健康状况好中差的人数比率为1:2:1,H1:健康状况好中差的人数比率不为1:2:1计算χ2值χ2=((3)统计决断:自由度为3-1一个自由度的χ2检验各组f提出假设H0:喜欢与不喜欢体育的人数相等;H1:喜欢与不喜欢体育的人数不等计算χ2值统计决断频数分布正态性检验:将各组面积与频数相乘,求各组的理论频数(二)双变量的χ2检验(横行为r,纵行为)提出假设:H0:学生是否愿意报考师范大学的态度与家庭状况没有关系;H1:学生是否愿意报考师范大学的态度与家庭经济状况有关系计算χ2值fdf=(r-1)(c-1在双向表χ2检验中,如果是判断几次重复实验的结果是否相同,这种χ2检验叫做同质性检验。如果要进一步指导哪些组差异显著,哪些组差异不显著,还需进行四格表的χ2检验第十一章相关分析(画图,不考公式30以下的数据适合粗略等级相关)伪相关:实际上无关。中介相关:由中介变量导致相关(一)相关系数:r在-1到1之间,不等距。相关系数只能描述两个变量之间的变化方向及密切程度,并不能揭示两者之间的内在本质联系。(二)相关散布图简单相关系数又称皮尔逊相关系数或“皮尔逊积矩相关系数”,它描述了两个定距变量间联系的紧密程度二、分类(一)积差相关1.条件:两个变量都是正态连续变量,成对数据每组数据之间相互独立两者之间呈现线性关系(散布图),排除共变因素的影响,样本容量≥30。(例如,初中升高中入学考试生物与化学成绩均以百分制表示,若两者分别呈正态分布,它们之间呈线性关系,这时可用积差相关来表示他们的变化关系)2.积差相关系数就是两个变量标准分数乘积之和除以n所得之商(二)等级相关:1.斯皮尔曼等级相关:等级次数排列,总体不一定正态,不一定>30赋予等级-计算两个变量每对数据所赋予的等级数之差D,及差数的平方之和-代入公式2.肯德尔和谐系数:多个变量。常用来表示几个评定者对同一组学生学习成绩等级评定的一致性程度,或同一个评定者对同一组学生学习成绩用等级先后评定多次之间的一致性程度。(三)质与量的相关:一个为质,一个为量二列相关:都是正态连续性变量,其中一个变量被认为地划分为二分变量(及格不及格)点二列相关:其中一个是正态连续性变量,另一个是二分名义变量(男女)多系列相关:都是正态连续性变量,其中一个变量按不同质被认为地分为多种类别名义变量。(四)品质相关:两个都被化为类别统计学术语:频数分布(Frequencies)统计量(Descriptives):平均数(Mean)中位数(Median)众数(Mode)平方和(SumofSquares)方差(Variance,MeanSquare)平均数的标准误(Standarderrorofmean)全距(Range)标准差(Standarddeviation)四分位距(Quartiles)百分位距(Percentiles)圆形图(Piecharts)直条图(BarCharts)频数分布图(Histograms)偏态量(Kurtosis)峰态量(Skewness)行(Row)列(Column)自由度(Freedom)显著性(Significance)方差齐性(Equalvarianceisassumed)相关样本(Paired-samples)独立样本(Independent-samples)组间差异(Betweengroups)组内差异(withingroups)χ2检验(χ2test)回归分析(Regression)
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 员工调动与岗位变动管理制度
- 经营审计管理制度
- 病理与临床沟通制度与流程
- 小学教师家访心得体会
- 市政道路工程安全文明施工措施
- 协调及服务承诺措施
- 月度安全例会会议纪要范文
- 通信销售人员管理
- 桥梁照明亮化改造技术方案
- 纺织行业智能化生产线运营管理方案
- 昆明理工大学《自然语言处理》2022-2023学年第一学期期末试卷
- 陈义小学进城务工人员随迁子女入学工作制度和措施
- 部编版六年级道德与法治上册第9课《知法守法 依法维权》精美课件(第2课时)
- 小儿急腹症观察和护理
- 统编版七年级上学期期末考试语文试卷(含答案)
- 《长江电力财务分析》课件
- 2023年中国铁路武汉局集团有限公司招聘大专(高职)学历笔试真题
- 中考英语复习听说模拟训练(一)课件
- 公立医院创新管理薪酬激励方案
- 药品经营使用和质量监督管理办法2024年宣贯培训课件
- 旅社承包合同样本
评论
0/150
提交评论