版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第一页,共三十七页,2022年,8月28日学校教育统计的基本常识
总体上分为描述统计和推断统计
描述统计:
对观测数据的数量特征进行客观如实地描述和表达。统计表、统计图是呈现统计资料的主要形式。如平均成绩、优秀率、升学率等。推断统计:
研究由部分区说明整体的理论与方法,即根据局部的信息,利用统计的原理与方法,分析论证在一定可靠度下总体的数量特征或分布特征。它以描述统计为基础。包括假设检验和参数估计两大内容。第二页,共三十七页,2022年,8月28日学校教育统计的基本常识1.描述统计:分为以下三部分
集中趋势分析:主要靠平均数、中数、众数、正态分布等统计指标来表示数据的集中趋势。
离中趋势分析:主要靠全距、四分差、平均差、方差、标准差等统计指标来研究数据的离中趋势。
相关分析:探讨数据之间是否具有统计学上的关联性。第三页,共三十七页,2022年,8月28日
群体优良率频数分析:综合分析班级各分数段、最高分、最低分、平均分、标准分、T值、优良率等信息
第四页,共三十七页,2022年,8月28日
平均分分析:汇总多科各班级在各优率、良率、及格率、极差率、均分、名次等情况第五页,共三十七页,2022年,8月28日
教师质量分析:教师所教各班平均分以及所教班级总体平均分优良率、及格率和极差率,第六页,共三十七页,2022年,8月28日
总分频数分析:统计总分各分数段人数和所占比例,反映各班多科总分的学习水平结构第七页,共三十七页,2022年,8月28日
个体学生名次:通过统计出学生各科和多科总分的班级名次和年级名次,对学生各科成绩进行比较。同时生成生成多种形式的总分,为高中学生文科、理科选择及加试科目提供一定的参照依据第八页,共三十七页,2022年,8月28日
各班级单科或总分各档次的人数和百分比,有根据班级内部结构不同,制定不同的教学对策第九页,共三十七页,2022年,8月28日
统计各班不同学科在年级各名次段的人数和百分比,能够更清楚了解各班级内部结构状况。第十页,共三十七页,2022年,8月28日
以班级均分与年级均分的比值系数跟踪班级学习成绩的发展状况第十一页,共三十七页,2022年,8月28日
试卷的有效性:以试卷的效度、难度和区分度对试卷有效性进行分析第十二页,共三十七页,2022年,8月28日
班级平均分名次变化:各班级与以往一次考试各科以及总分平均分名次,分析发展变化情况。第十三页,共三十七页,2022年,8月28日学校教育统计的基本常识1.1集中趋势分析平均数:即算术平均数,是全部数据的算术平均,又称均值,符号为M(Mean)。包括简单算术平均数和加权算数平均数。算术平均数是最常用的集中量数,优点很多。算术平均数易受极端数据的影响使其真实性收到干扰。如:5、7、5、4、6、7、8、5、4、7、8、6、20,均值7.1,第十四页,共三十七页,2022年,8月28日学校教育统计的基本常识中数
把一组数据从左往右按照从小到大的次序依次排开,中间那个数就是中位数(Median)。中位数就是位于频数分布中间位置的那个数值。计算方法:如果数据总个数是奇数,那么就直接取中间那个数。比如35个数中第18个数。如果数据总个数是偶数,那么就取中间那两个数的平均数。比如36个数中第18个数和第19个数的平均数。中位数的优点是不易受低端值的影响,缺点是抽样稳定性差以及不能直接通过算术运算得到。第十五页,共三十七页,2022年,8月28日学校教育统计的基本常识众数
众数(Mode)是一组数据中出现次数最多的数值。众数的缺点是抽样稳定性差,无法通过算术计算得到。众数是唯一能够用于分类数据的集中量数。在数据是多峰分布时也应当使用众数。在实际使用中到底应该选择哪种集中量数,这取决于:变量的性质,频数分布的形状,使用的目的。(平均数使用最多、众数使用最少)第十六页,共三十七页,2022年,8月28日学校教育统计的基本常识.频数表与正态分布在观察值个数较多时,为了解一组同质观察值的分布规律和便于指标的计算,可编制频数分布表,简称频数表。(1)求全距(range):找出观察值中的最大值与最小值,其差值即为全距(或极差),用R表示。(2)确定组段和组距:根据样本含量的大小确定“组段”数,一般设8-15个组段,常用全距的1/10取整做组距,以便于汇总和计算。各组段的起点和终点分别称为下限和上限,某组段包含下限,但不包含上限,其组中值为该组段的(下限+上限)/2。相邻两组段的下限之差称为组距。(3)列表划记:确定组段界限,列成表,如下图:由频数表可看出频数分布的两个重要特征:集中趋势(centraltendency)和离散程度(dispersion)。对于数值变量资料,可从集中趋势和离散程度两个侧面去分析其规律性。第十七页,共三十七页,2022年,8月28日学校教育统计的基本常识第十八页,共三十七页,2022年,8月28日学校教育统计的基本常识根据频数表资料绘制的直方图,图1:高峰位于中部,左右两侧大致对称。如果组数增多,组段不断分细,直方图顶端的连线就会逐渐形成一条高峰位于中央(均数所在处),两侧逐渐降低且左右对称,不与横轴相交的光滑曲线图2。这条曲线称为频数曲线或频率曲线,近似于数学上的正态分布(normaldistribution)。由于频率的总和为100%或1,故该曲线下横轴上的面积为100%或1。第十九页,共三十七页,2022年,8月28日学校教育统计的基本常识频数分布有对称分布和偏态分布之分。对称分布是指多数频数集中在中央位置,两端的频数分布大致对称。偏态分布是指频数分布不对称,集中位置偏向一侧,若集中位置偏向数值小的一侧,称为正偏态分布;集中位置偏向数值大的一侧,称为负偏态分布。第二十页,共三十七页,2022年,8月28日学校教育统计的基本常识1.2离中趋势分析全距也称为极差,是一组总体数据中总体单位的最大标志值和最小标志值之间的距离,反应总体标志值之间的范围是一组数据变动范围大小的度量。平均差总体各单位标志对其算术平均数的离差绝对值的算术平均数。平均差越大,则表示标志变动度越大,反之则表示标志变动度越小。计算:在资料未分组的情况下,平均差的计算公式为:由于采用了离差的绝对值,不便运算不同总体的平均差计量不同,单位不同,不能直接对比。
第二十一页,共三十七页,2022年,8月28日学校教育统计的基本常识标准差.
总体各单位标志值(原始分数)与平均数离差平方的平均数的平方根,又称均方差。它反映标志值与平均数离差的平均水平,是测定标志变动度最常用的指标。以σ表示标准差,其计算公式如下:
(离差,也叫差量,是单项数值与平均值之间的差。)
第二十二页,共三十七页,2022年,8月28日学校教育统计的基本常识
标准差也具有抽样稳定性好和能够进行算术计算的优点,同时也具有易受极端值影响的缺点。标准差不适合于频数分布严重偏斜的数值数据,也不能用于分类数据。第二十三页,共三十七页,2022年,8月28日学校教育统计的基本常识1.3相关分析
如果所有的点都准确落在直线上,则相关系数准确地等于1或-1,不管是哪条直线。如果各点不落在直线上,则各点离直线靠得越近,所得相关系数就越大;离得越远,则相关系数就越小。极端情形下,如果点的分布构成一个圆面,则相关系数为0。总之,相关系数仅与点的分布形状有关,点的分布形状约接近于直线则相关系数越大。第二十四页,共三十七页,2022年,8月28日学校教育统计的基本常识相关系数用r表示,相关系数r是一个与测量单位无关(scalefree)的值,其值介于-1和1之间。正负号代表了相互关系的方向,若值为正则为正相关,反之为负相关,零为不相关。注意:• 相关系数只反映两个变量之间的线性相关性,并不反映其逻辑上的因果关系。• 相关系数并不意味着两个变量相关的比例。如果相关系数为0.6,并不意味着两个变量具有60%的相关。相关系数反映的是相关性的强度。• 相关系数多少算是相关性高,多少算是低,这没有统一的标准,要看使用的场合。比如对于再测信度来说,0.6算是很低的了;对于预测效度来说,0.6又算很高了。第二十五页,共三十七页,2022年,8月28日学校教育统计的基本常识1.4标准分.1.4.1原始分数的局限性(1)相同测验,分值的差异不等值物理物理物理物理90806050(2)不同测验的分值不等值语文外语物理数学90908080(3)可比性差、不同测验的分数不具有可加性第二十六页,共三十七页,2022年,8月28日学校教育统计的基本常识1.4标准分.1.4.2标准分含义
标准分是指通过原始分转化而得到的一种地位量数,它反映考生成绩在全体考生成绩中的位置。因此,无论试题难或易,无论整体原始分偏高或偏低,整体标准分都没有什么变化。标准分Z是原始分与平均分的离差以标准差为单位的分数,用公式表示为
为该次考试中全体考生的平均分;X为该次考试中考生个人所得的原始分;S为该次考试分数的标准差。标准分有如下性质:⑴平均值为0,标准差为1;⑵分数之间等距,可以作加减运算;第二十七页,共三十七页,2022年,8月28日学校教育统计的基本常识第二十八页,共三十七页,2022年,8月28日学校教育统计的基本常识第二十九页,共三十七页,2022年,8月28日学校教育统计的基本常识标准分的转换
标准分Z在一般情况下都带小数,而且会出现负值,实际使用时不太方便,所以还要对Z分数进行线性变换(T变换):T=50+10Z或者是:T=500+100Z这就是我们通常所说的标准分。
学科原始分数标准分(Z)
标准分(T)
班平均分班标准差甲乙甲乙甲乙数学80601-160507010物理9080116060855化学6090-1-150507515总分2302301-1170160第三十页,共三十七页,2022年,8月28日学校教育统计的基本常识标准分的优势
⑴单个标准分能够反映考生成绩在全体考生成绩中的位置,而单个原始分则不能。⑵不同学科的原始分不可比,而不同学科的标准分是可比的。不同的学科,由于试题的难易程度不同,各学科的分数价值也就不同。由于标准分代表了原始分在整体原始分中的位置,因此是可比的。⑶不同学科的原始分不可加,而不同学科的标准分之间具有可加性。既然不同学科的原始分不可比,那么也就不可加。而各学科的标准分的平均值以及标准差都基本相同,因此,各科的标准分是可加的。第三十一页,共三十七页,2022年,8月28日学校教育统计的基本常识2.推断统计
推断统计是研究如何利用样本数据来推断总体特征的统计方法。例如,要了解一个地区的人口特征,不可能对每个人的特征一一进行测量,对成品质量进行检验,往往是破坏性的,也不可能对每个产品进行检验。这就需要抽取样本个体进行测量,根据获得的数据对总体特征进行推断,这就是推统计既要解决的问题。第三十二页,共三十七页,2022年,8月28日学校教育统计的基本常识2.1Z检验
Z检验是一般用于大样本(即样本容量大于30)平均值差异性检验的方法。它是用标准正态分布的理论来推断差异发生的概率,从而比较两个平均数的差异是否显著。包括:(1)检验一个样本平均数与一个已知的总体平均数的差异是否显著。(2)检验来自两个的两组样本平均数的差异性,从而判断它们各自代表的总体的差异是否显著。第三十三页,共三十七页,2022年,8月28日学校教育统计的基本常识2.2T检验
T检验是是对两样本均数(mean)差别的显著性进行检验。一般样本容量小于于30。它是用T分布的理论来推断差异发生的概率。包括:
(1)单总体t检验:检验一个样本平均数与一个已知的总体平均数的差异是否显著。
(2)配对T检验:检验两个相关样本的平均数与其各自代表的总体的差异是否显著。配对样本是样本X1,X2,X3,X4,X5,X6……Xn与Y1,Y2,Y3,Y4,Y5,Y6……Yn,必须一一对应,不可颠倒顺序。
(3)独立样本T检验:检验两个独立样本的平均数与其各自代表的总体的差异是否显著。样本X1,X2,X3,X4,X5,X6……Xn与Y1,Y2,Y3,Y4,Y5,Y6……Yn,并不对应,可以颠倒顺序。常用于两组独立样本差异性检验。2.3方差分析:用于两个及两个以上样本均数差别的显著性
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 江苏省苏州立达中学2024-2025学年九年级上学期期中考试物理试题(解析版)
- 电商平台与快递企业2024年度合作发展战略协议3篇
- 二零二四年度航空航天器零部件制造合同
- 二零二四年度版权买卖合同标的物确认
- 茶叶包装设计及定制合同04
- 2024版二手房交易及按揭贷款合同
- 二零二四年云计算数据中心设计与施工合同
- 电费合同范本(2篇)
- 只搭伙不领证的老伴协议书(2篇)
- 房屋解除合同协议书
- 村级三务公开培训课件
- 口腔医学生涯规划报告总结
- 酶工程制药课件
- 《总装工艺培训资料》课件
- 《无土栽培技术》课件
- 城市更新前期调研报告
- 运输成本控制与燃油管理
- 2024年国药集团招聘笔试参考题库含答案解析
- 大象版科学(2017)六年级上册第三单元《浩瀚宇宙》单元测试卷及答案
- 盈亏问题完整
- 新院外急救课件
评论
0/150
提交评论