体育统计学 第5章 参数估计和假设检验_第1页
体育统计学 第5章 参数估计和假设检验_第2页
体育统计学 第5章 参数估计和假设检验_第3页
体育统计学 第5章 参数估计和假设检验_第4页
体育统计学 第5章 参数估计和假设检验_第5页
已阅读5页,还剩45页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、体育统计教程,第五章 参数估计和假设检验,第5章 参数估计和假设检验,5.1 抽样误差与标准误 5.2 参数估计 5.3 假设检验 5.4 均数的假设检验 5.5 方差的假设检验 5.6 检验,5.1 抽样误差与标准误,一、抽样误差与标准误 1、抽样误差 在进行抽样研究时,从同一总体中抽取含量相等的若干样本,每次求得的样本统计量与总体参数之间或样本统计量之间均存在差异,这种由抽样引起的差异,称为抽样误差。,属性: 在抽样过程中,抽样误差是不可避免的 ; 抽样误差大,则样本统计量代表总体参数的可靠性小,反之亦然; 抽样误差的大小是可以估计的。,2、标准误 可以用样本统计量(样本均数、样本率、样本

2、方差)的离散指标标准差作为抽样误差大小的指标。 样本统计量的标准差称为标准误差,简称标准误。 符号:,二、抽样误差的计算 1样本均数的抽样误差 公式: 5-1 或 5-2,例5-1: 从某市随机抽取100名16岁男生的身高为: 试估计抽样误差? 解:由于总体标准差未知,故采用公式5-2 即由抽样引起的样本均数与总体均数的误差估计值为0.485cm。,2均数的标准误与标准差的区别和联系 区别: 1)描述的内容不同 2)计算公式不同 3)变化的趋势不同 联系: 1)它们都是表示变异程度大小的指标。 2)标准误与标准差成正比。,三、影响抽样误差的因素,1)原总体中个体的分散性。 2)样本含量的大小。

3、 3)抽样方法和抽样的组织方式,5.2 参数估计,参数估计包括两个方面: 一是用样本统计量作为参数的估计值,这就是参数的点估计; 二是考虑抽样误差的存在,不同样本可能有不同的估计值,所以用一个范围来估计总体参数在此范围内的概率,这就是参数的区间估计。,一、参数的点估计,(一)点估计量的标准 1无偏性 2一致性 3有效性 当 时, 则称 比 更有效。 (二)平均数的点估计 样本均数 是总体均数 的一个最佳估计量,二、参数的区间估计,区间估计是根据抽样误差的大小,并给予一定的概率,来估计未知参数所在的可能范。 预先给定的概率称可信度或置信度,用符号表CI示,一般取95%或99%。 (一)区间估计量

4、的标准 1)置信度: 包含的概率 越大越好。 2)精确度: 的平均长度 越短越好。,(二)t分布 统计量: 自由度:,特点: 1)与df有关; 2)当n,与正态分布曲线重合,(三)总体均数的区间估计:当n100时,采用t分布,总体均数 的置信区间:,在实际工作中,常常估计总体均数的95%和99%的置信区间: 总体均数的95%置信区间为:,总体均数的99%置信区间为:,例5-2:从某市高一年级随机抽取32名男生的铅球成绩(单位:m),数据如下:,试估计其抽样误差和总体均数的95%置信区间?,解:抽样误差大小即标准误,由公式: 总体均数的95%置信区间为: 查表 2.04,将 代入上式 有总体均数

5、的95%置信区间为:(7.9581,8.2157)。,(2)当 时,采用u分布理论(正态分布) 总体均数的置信区间为: 总体均数的95%置信区间为:,总体均数的99%置信区间为:,例5-3: 以例5-1数据为例,试估计总体均数的99%置信区间? 解:抽样误差大小即标准误,由公式计算:,总体均数的99%置信区间为:,所以总体均数的99%置信区间为:(150.78,153.28)。,5.3 假设检验,一、假设检验的概念 先对推断的总体参数或分布提出某种假设,然后通过样本统计量信息去验证这个假设是否成立,这一过程称为假设检验,亦称显著性检验。 (一)引例 例5-4 随机抽测某体院田径专业和足球专业男

6、生100m跑(秒)成绩,统计结果为:田径专业,根据该资料能否认为不同专业男生的100m跑成绩有差异?,(二)假设检验的基本原理 首先假设样本所属总体参数相等,在此假设条件下,利用数理统计的方法,求出第一种原因(抽样误差)造成误差的可能性大小的概率P值。如果第一种可能性很小时(P0.05),由小概率事件原理,我们就可以拒绝第一种原因而接受第二种原因,可认为误差不是由抽样造成的,即总体参数不相等。,(三)假设检验的基本步骤 1建立假设和确定检验水准 建立两个假设: 原假设或无效假设,也称零假设,用H0表示。 备择假设或对立假设,用H1表示。 例: H0: H1:,2确定检验方法,计算检验统计量 常

7、用的检验方法: u检验、t检验、F检验和 检验等等。 3确定P值,作出推断结论 P值是指在H0所假设的总体中作随机抽样,由样本数据计算出相应检验统计量等于或大于现值的概率。 若 ,则 ,按所取的 拒绝H0,接受H1,若 ,则 ,按所取的 拒绝H1,接受H0,假设检验时,经常取 或,二、单双侧检验,作为备择假设往往是研究者希望达到的目的,而这个目的会有两种情况: 第一种目的为,单侧检验:第二种目的为,,,单侧检验与双侧检验的关系: 单侧检验比双侧检验更易得出差别有统计学意义的结论。,5.4 均数的假设检验,假设:总体方差未知。 一、单样本均数的t检验 简称为单样本t检验,是检验样本所代表的总体与

8、已知总体的均数是否有差别。 检验统计量: 临界值: t(df)单侧或t/2(df)双侧,例5-5:,已知我国女子篮球运动员的纵跳成绩服从正态分布,我国女子篮球运动员的纵跳平均成绩为60(cm),随机抽测某省队11名女篮运动员的纵跳成绩分别为:67、68、51、61、70、65、70、49、61、59、60(cm)。问该省队女篮运动员的纵跳成绩与我国女篮运动员的纵跳成绩有无差异? 解: 1.计算统计量:,3确定P值,作出统计结论。 |t|=0.8930.05,按所取的 检验水准,接受 H0,拒绝H1,差异无统计学意义,可认为该省女篮运动员与我国女篮运动员的纵跳平均成绩没有差异。,2.计算统计量:

9、,二、两独立样本均数的t检验,两独立样本均数的t检验简称两独立样本t检验,是检验两样本所在总体的均数是否相等。 (一) 时,两独立样本均数的t检验 检验统计量: 其中:,自由度:,例5-6以例5-4数据为例,且已知方差齐性,分析不同专业男生的100m跑成绩有无差异? 解: 1.检验假设 2.计算统计量: 3确定P值,作出统计结论。 因为|t|=3.336 =2.021,所以P0.05 接受拒绝 H0,接受H1 ,差别有统计学意义,可认 为不同专业男生的100m跑成绩有差异。,*(二) 时,两独立样本均数的t 检验(介绍) 检验统计量:,例5-7,“多吃谷物,将有助于减肥。”为了验证这个假设,随

10、机抽取了35人,询问他们早餐和午餐的通常食谱,根据他们的食谱,将其分为二类:一类为经常的谷类食用者(总体1),另一类为非经常谷类食用者(总体2)。然后测量每人午餐的大卡摄取量(假设资料呈正态,方差不等)。经过一段时间的实验,得到结果: 样本1:568、675、712、607、430、458、540、539、480、562、487、550、596、700、584; 样本2:650、569、622、630、596、637、628、652、617、624、563、580、690、530、688、684、651、702、670、632。,解: 1.检验假设 2.计算统计量: 3.确定P值,作出统计结论

11、。 因为|t|=2.695 =1.692,所以P0.05 按所取的 检验水准,拒绝 H0,接受H1, 差别有统计学意义,可认为该假设成立。即“多吃谷物,将有助于减肥”。,三、配对样本均数的t检验,配对样本均数t检验简称配对样本t检验,是检验两个相关(匹配或配对)样本所代表的总体均数之间是否有差别,一般有三种设计: 两种同质受试对象分别接受两种不同的处理; 同一受试对象分别接受两种不同的处理; 同一受试对象处理前后的结果进行比较 。 检验统计量为:,为各对数据差值的平均数, 为各对数据差值的标准差, 为各对数据差值的标准误,n是配对的对数。,例5-8某研究所为研究长时间持续运动对血尿酸浓度(mg

12、%)的影响,让10名男青年在自行车功力计上持续运动两小时(负荷为100w/分),测得运动前后的血尿酸浓度数据为: 运动前:5.4,4.8,3.6,3.4,5.7,5.5,3.6,3.8,5.2,4.5 运动后:6.6,4.8,5.4,6.0,6.3,5.5,4.8,5.0,6.5,5.8 问长时间持续运动对人体血尿酸浓度有无影响。(假设血尿酸浓度服从正态分布),解: 1.检验假设 2.计算统计量: 3.确定P值。 因为 |t|=4.524 =2.821,所以P0.01 按所取 的检验水准,拒绝 H0, 接受H1, 差别有统计学意义,可认为长时间持续运动对人体血尿酸浓度有影响。,t 检验的注意事

13、项: 1、注意样本的可比性。 2、注意两差别是否有实际意义。 3、正确选择检验的方法。 4、假设检验的两类错误。 第I类错误: “弃真” 第II类错误:“取伪” 5、结论不能绝对化。,5.5 方差的假设检验,假设的基本条件: 随机变量 即 分别抽取样本方差 由数理统计知,随机变量 服从自由度分别为 的分布。 若假设 成立,则: 检验统计量为: 通常取,单侧检验,双侧检验,例5-9利用例5- 4数据,分析不同专业男生100m跑成绩的方差是否不同? 解: 1检验假设 2计算统计量: 确定P值。 因为 F=1.077 =2.42,所以,,P0.05,接受H0,拒绝H1,差别无统计学意义,可认为不同专

14、业男生的100m跑成绩方差相同,即方差齐性。,5.6 检验,检验用途较广,可用于方差的检验,或样本率或构成比之间的检验,也可用于资料类型的检验。 本节 检验是利用列联表的形式,以检验实际频数和理论频数的差别是否是由抽样误差所引起的基本思想,达到由样本率来推断总体率。 所谓列联表是指由两个以上的变量进行交叉分类的频数分布表。横向变量(行)视为R,纵向变量(列)视为C,每一个具体的列联表称为称为R C列联表。,统计量为: 式中:A是位于R行C列交叉处的实际频数, T是位于R行C列交叉处的理论频数。,不同容量样本的卡方分布,df=(R-1)(C-1),例5-10对于某体院的三个专业的学生,通过心理训

15、练后再练习时进行观察,其反应情况分为好、无变化和差三种,如下表,问该心理训练对不同专业学生的效果是否不同?,解: 1检验假设 2计算统计量: =100( ) =4.536 3确定P值。 =4.5360.05,按所取=0.05 的检验水准,接受H0,拒绝H1,差别无统计学意义,认为该心理训练对不同专业学生的效果是一致的。,行列表的 检验的注意事项: 1)如果有1/5以上的格子的理论数小于5,或有一个格子的理论数小于1时,需并组并要考虑其合理性。 2)当 时,说明被比较的几个样本率之间有统计意义, 但不能据此作出任何两组间差别都有统计意义。,练习题,一、填空题 抽取样本时,要遵守_原则,使所有个体被抽中的机会_。 参数估计的方法有_和_。 对总体参数提出的假设可分为原假设和_。 当原假设正确而被拒绝时,所犯的错误为_;当备择假设正确而被接受时,所犯的错误为_。 5. 假设检验所依据的基本原理是_。 三、应用题 测得四川省205名13岁城市女生的身高平均数为149.2cm,标准差为7.05cm。求该省13岁城市女生身高总体均数的95%和99%可信区间。 已知某省12岁男孩平均身高为145.2厘米,现测得某市100名男孩的身高=144.3厘米,标准差S=5.82厘米,问该市12岁男孩身高与全省的平均身高有无显著性差异?

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论