版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第六章统计推断统计研究的根本目的在于由样本特征推断总体情况。基本任务有两点:1.用样本统计量来估计总体参数,即参数估计。例:随机抽测某市150名12岁男孩身高,已知
=143.10cm,=0.52cm,试求该市男孩身高均数的95%置信区间?例:随机抽测篮球和排球运动员各10名,他们纵跳成绩的数据见表,试分析不同项目运动员的纵跳水平是否存在差异?编号12345678910平均数标准差篮球6762686170657059636665.13.78排球6469706358716468626765.64.092.通过样本的统计指标来判定总体参数是否相等的问题,即假设检验。第一节参数估计
第二节假设检验的基本思想及步骤
第三节几种常用的检验方法第四节假设检验方法在体育中的应用第一节参数估计参数估计:由样本统计量来估计总体参数。参数估计的几个概念:误差:测得值与真值之差,以及样本指标与总体指标之差。常见的误差包括随机误差、系统误差、抽样误差以及过失误差四种。统计分析中所关心的主要是系统误差和抽样误差。标准误:衡量抽样误差的大小的统计量。不同的统计量,标准误的表示方法不同,如均数的标准误用S表示,率的标准误用SP表示,回归系数的标准误用Sb表示等等。表1: 均数的标准差与标准误的区别符号描述对象意义用途标准差
S各个体值反映个体值间的变异反映观察值的离散程度标准误
S样本均值反映均数的抽样误差大小样本均数在估计时的可靠程度标准差的意义标准误的意义均数的标准误的计算:
若用总体均数µ代替,则公式为:均数的标准误与总体标准差以及样本含量n的关系有下式表示:
在实际应用中,常用S代替总体
,则上式可写成:点估计和区间估计点估计:当总体参数不清楚时,用一个特定值,一般用样本统计量进行估计,即点估计。
区间估计:以变量的概率分布规律来确定未知参数值的可能范围的方法。区间估计是用数轴上的一段距离来表示未知参数可能落入的范围,虽不能指出总体参数等于什么,但能指出它落入某一区间的概率有多大。
按预先给定的概率确定包含未知参数的可能范围,该范围称为参数的置信区间。预先选定的概率称为置信概率或置信水平(符号为1-a)常取值为99%或95%。置信区间是以置信限CL(L1,L2)为界的区间,建立置信区间常用到标准误。总体均数的区间估计:
大样本含量(n≥45),依据正态分布原理,按表2进行计算,小样本含量时,依据t分布原理,按表3计算。表2:大样本含量总体均数置信区间的估计与表达置信概率(1-a)置信限(CL)置信区间(L1,L2)0.950.99
±1.96S±2.58S(-1.96S,+1.96S)(-2.58S,+2.58S)表3:小样本含量总体均数置信区间的估计与表达总体率的区间估计原理同均数的区间估计原理。表4:总体率置信区间的估计与表达置信概率
(1-a)置信限(CL)置信区间(L1,L2)0.950.99
±t0.05/2(n’)S±t0.01/2(n’)S(-t0.05/2(n’)S,+t0.05/2(n’)S)(-t0.01/2(n’)S,+t0.01/2(n’)S)置信概率
(1-a)置信限(CL)置信区间(L1,L2)0.950.99p±1.96spp±2.58sp
(p-1.96sp,p+1.96sp)(p-2.58sp,p+2.58sp)例1:取10名运动员的每分钟脉搏资料:n=10,x=68次/分钟,s=6次/分钟,计算平均数的标准误。解:S=6/=6/3.162=1.897例2:某校抽样调查228名男生立定跳远平均成绩为240cm,标准差为13cm,求该校男生立定跳远总平均成绩95%的置信区间?解:由于228>45,可按正态分布原理下的公式计算。下限:均值-1.96*标准误=240-1.96(13/)=238.31
上限:均值+1.96*标准误=240-1.96(13/)=241.69
该校男生立定跳远总平均成绩的95%置信区间为(238.31,341.69)。第二节假设检验的基本思想及步骤参数检验(已知变量的分布形式)和非参数检验(用于分布函数的检验)假设检验的基本思想
基本思想:带有概率性质的反证法思想。主要依据:小概率事件原理。即在一定实际条件下,若某事件出现的概率很小(p≤0.05),则可以认为在一次实验中,该事件是不会发生的。统计学中的假设检验的原理是应用反证法:即,先建立一种假设理论,然后将此假设与实际观测数据的结果相印证.若观测结果与理论不符,则需拒绝假设;否则,可断定该假设的理论为正确或无充分证据显示假设错误。假设检验的步骤:提出假设:根据实际问题的要求,提出原假设H0。在检验假设的前提下,选择和计算统计量。根据实际情况,确定显著性水平a,一般取a=0.05或a=0.01,并根据a查出相应的临界值。判断结果。将检验统计量与临界值比较,若检验统计量≥临界值,即落入拒绝域,p≤a,差异显著,因此拒绝H0;如果检验统计量<临界值,p>a,则差异不显著,接受H0。双侧检验和单侧检验:双侧检验:只强调差异而不强调方向性的检验。否定域分布于曲线的两侧,如图1所示,两侧曲线下的面积各为a/2,合起来为a。常应用于问题的方向性不明确时,如甲、乙两校学生体育达标成绩是否存在差异?单侧检验:强调某一方向的检验。否定域位于曲线的某一端,如图2A和图2B所示。通常适用于检验某一参数是否“大于”或“优于”、“快于”及“小于”、“劣于”、“慢于”另一参数等一类问题。如:新的训练方法是否优于旧的训练方法?假设检验中的两类错误:错否定。即原假设H0实际上是正确的,而检验结论是否定H0,此时犯下弃真错误,统计上称为第Ⅰ类错误,用a表示。错接受。即原假设H0实际上是不正确的,而检验结论是接受H0,此时犯了取伪错误,统计上称为第Ⅱ类错误,用ß表示。两类错误的关系(见图3)。a与ß是在两个前提下的概率(H0为真和H0为假);当其他条件不变时,两者不可能同时减小或增大。小结:误差:随机误差,系统误差,抽样误差,过失误差参数估计:点估计,区间估计假设检验:假设检验基本思想,假设检验步骤,单、双侧检验,假设检验中的两类错误。第三节几种常用的检验方法样本均数与总体均数的t检验
t检验两样本均数的差异显著性检验配对实验数据的差异显著性检验U检验:样本率与总体率、两样本率的显著性检验检验:两个或多个样本率的检验一、t检验t分布
t统计量为:
从正态总体由样本均数及标准误经t转换就成了服从自由度为n-1的t分布。
t分布在形态上与正态分布相似,自由度越大,t分布越逼近于正态分布(见图4)。图4t分布tt′′′02.样本均数与总体均数的t检验例1:某省体质调研资料表明,全省18岁女生的立定跳远成绩均数为170.1cm,已知某市18岁女生86人的立定跳远成绩均数为172.84cm,标准差为16.15cm,问该市18岁女生立定跳远成绩与全省同年龄学生的成绩是否存在差异?(a=0.05)a1解:1)H0:m=m02)计算检验统计量t值:
3)查t值表(教材的第370面)根据给定的显著性水平0.05,自由度查t值表(双侧),得到:4)比较:t=1.57<t0.05/2=1.99,p>0.05。差异不显著,接受原假设。结论:该市18岁女生立定跳远成绩与全省同年龄学生的成绩差异不显著。例2:已知男少年某年龄组游泳运动员的最大耗氧量均数为52.31毫升/公斤/分钟,今从某运动学校同年龄组男游泳运动员中随机抽100名运动员,测得最大耗氧量均数为50.94毫升/公斤/分钟,标准差S为6.95,问该校游泳运动员的最大耗氧量与总体的最大耗氧量是否存在差异?3.两样本均数的差异显著性检验两样本均数的检验在大样本和小样本情况下,需采用不同的检验方法。大样本情况(一般n≥30)
当两样本相互独立时,两样本均数和的方差可等于两均数方差的和:所以其标准误为:故t检验统计量计算式为:例:为研究文理科学生1500m成绩是否存在差异,随机抽取两科学生各50名,得出样本统计量为:问文理两科学生的1500米跑水平是否相同?分析:总体正态分布,样本含量各为50,可看作是大样本情况,总体方差未知,用t检验。两样本相互独立,因此可用两样本方差的和作为两变量和的方差。问是否存在差异,用双侧检验,零假设为:假设两科学生的1500m跑水平是一样的。解:1)H0:m1=m22)计算检验统计量t值:3)查t值表,a=0.05,n′=50+50-2=98,
t0.05/2(98)=1.9844)比较:t=0.3853<t0.05/2(98)=1.984,p>0.05。所以接受原假设。结论:文理科学生的1500m跑水平无显著性差异。小样本情况当样本含量较小,一般小于30认为是小样本。若总体方差经检验(可采用c2检验)相等,则可求联合方差。当样本独立时,变量和的方差等于变量方差的和,即:因此联合标准误为:因此,在小样本、样本独立且两样本方差相等时,需要先求联合方差以计算检验统计量t。例:若方差不等,则应采用校正t′检验进行判断,校正t′检验的检验统计量计算公式为:校正检验的临界值计算公式为:例:为了比较独生子女与非独生子女在社会性方面的差异,随机抽取独生子女25人,非独生子女31人,进行社会认知测验,结果独生子女和非独生子女的得分情况分别为:试问独生子女和非独生子女的社会认知能力是否存在显著性差异?分析:此例属小样本情况,经检验总体方差不等,要判断是否存在差异,因此应采用双侧校正
t′检验。原假设为他们的社会认知能力相同。求解过程见教材119面。4.配对实验数据的差异显著性检验配对资料假设检验的方法
例:
分析:t0.05/2=2.306,t0.01/2=3.355,二、u检验样本率与总体率的显著性检验检验统计量为:两个样本率的显著性假设检验例:某篮球队训练投篮,训练前全队12人每人罚球240次,240次共投中96次,经3个月训练后12人共罚240次,中120次,请检验训练后发球命中率是否提高?(a=0.05)分析:本例是对同一研究对象在实验前后的样本率的显著性检验,采用u检验;而要求是是否提高,故用单侧检验(右侧检验)。解:提出假设:H0:2≤1
计算:p1=96/240=0.4p2=120/240=0.5p合=(96+120)/(240+240)=0.45
比较:u=2.20>u0.05=1.645,p<0.05,所以拒绝H0,即认为训练后投球命中率提高了。三、检验1、分布(见图5)图5分布′′′定义:设随机变量相互独立,服从正态分布,则随机变量
服从参数为n的分布。2.两样本率的检验检验的基本公式为:例:比较新旧两种教法对“达标”的影响,设立实验班和对照班,实验班采用新教法,对照班采用旧教法,经过一学期的实验后,测试达标的人数情况如下:试比较新旧两种教法对达标的影响是否有显著差异?(a=0.05)达标人数未达标人数合计实验组对照组169(a)111(c)37(b)98(d)206209合计2801354151)提出假设H0:p
1=p2在此前提下,两种教学方法应有相同的总体达标率,其理论预计值为:280/415=0.675,根据该总体达标率,可以分别计算出不同教法的理论达标人数:新教法的理论达标人数:206×0.675=139新教法的理论未达标人数:206-139=67旧教法的理论达标人数:209×0.675=141旧教法的理论未达标人数:209-141=682)计算c2值:列R×C联表计算,见下表:达标人数A(T)未达标人数A(T)合计实验组对照组169(139)111(141)37(67)98(68)206209合计2801354153)查表:a=0.05,自由度=(行-1)×(列-1)故n′=(2-1)×(2-1)=1c20.05(1)=3.844)比较:c2=39.52>c20.05(1)=3.84,P<0.05差异显著,否定原假设。结论:新旧两种教法对达标的影响有显著差异。3.四表格的校正c2检验。在四表格中如果有理论数小于5,样本含量大于40时应采用校正c2检验。校正c2检验的公式为:例:甲乙两队篮球比赛时罚球情况如下,试问两队失误率是否一样?队别失误成功和甲31720乙71522解:先计算各格的理论数其中有一理论数小于5,且总和大于40,所以用校正卡方检验方法。队别失误成功和甲3(4.76)17(15.24)20乙7(5.24)15(16.67)22和1032421)原假设:p1=p22)3)n′=1,c20.05(1)=3.844)比较:c2=0.84<c20.05(1)=3.84结论:差异不显著,接受原假设,认为两队失误率相同。3.对于多个率的c2检验它只是将两个率的2×2联表的原理扩大,对于任意行列的情况均可计算。4.c2拟合优度(正态性)检验正态性检验可采用卡方检验的方法,c2计算公式为:正态性检验的原假设为:某变量服从正态分布。将计算的卡方值与查表的卡方值进行比较,若大于等于临界值,则否定原假设;反之,接受原假设(例子见教材129面)。正态性c2检验的步骤:1.建立原假设,认为变量服从正态分布;2.把样本观察范围从负无穷到正无穷分为
r个组3.求各组的频数fi4.求均值和标准差5.对原区间组限标准化变换(p76公式)6.求各组段的概率7.求各理论频数npi。8.计算检验统计量9.查表10.比较第四节假设检验方法在体育中的应用假设检验方法在儿童若干心理指标比较研究中应用假设检验方法在不同教学方法比较研究中应用假设检验方法在排球落点比较研究中的应用一、假设检验方法在儿童若干心理指标比较研究中应用例:比较有训练组和无训练组儿童的视反应速度和听反映速度是否存在差异,统计数据见表5。表5有、无训练组儿童的视、听反应数据
单位:ms指标有训练(灵)有训练(稳)无训练(灵)无训练(稳)
S
S
S
S视听216.7919.76191.3514.85240.0221.48240.0211.46285.1339.10221.3223.79292.0635.12231.6022.59先进行方差齐性检验,若齐性,则采用t检验,若不齐,则采用校正t′检验。结果见表6。表6检验表单位:ms组别视反应速度听反映速度有(灵)-无(灵)有(稳)-无(稳)有(灵)-有(稳)t′=11.23p<0.01t′=9.08p<0.01t=5.27p<0.01t′=7.66p<0.01t′=7.09p<0.01t=5.41p<0.01二、假设检验方法在不同教学方法比较研究中应用例:将30名被试分成实验组和对照组,每组15人,实验组采用新教学方法,对照组采用传统教学方法,要比较新教学方法是否优于传统教学方法。实验前对两组被试的身体素质的基本指标进行了t检验,两组之间不存在显著差异(表6.16)。实验后对两组学生技评成绩进行了配对实验数据的t检验,结果见表7。表7两组学生成绩的t检验单位:s实验组对照组差P技评最高成绩最低成绩平均成绩927882.873.773867379.534.173+6+5+3.34<0.05成绩最高成绩最低成绩平均成绩15.5617.4116.760.47316.1418.8917.450.85-0.58-0.48-0.69<0.05三、假设检验方法在排球落点比较研究中的应用例:比较两次比赛各区域发球落点是否存在差异?(率的比较,采用u检验)表8发球落点检验表区域123456网前88年%81年%9.0113.412.671329.3415.911.69.910.2911.126.935.60.191.1u4.770.329.61.70.96.14.8P<0.01>0.05<0.01>0.05<0.05<0.01<0.01常用检验方法的spss操作方法一、单样本T检验单样本T检验是对一个来自正态总体的样本的均数与总体均数比较的T检验。样本均数与总体均数比较的目的是推断样本所代表的未知总体均数与已知的总体均数是否相等。例1:根据大量调查,甲地成年男子脉搏均数72次/分,在乙地随机调查了20名健康成年男子,测得其脉搏值(pusle.sav),请据此推断乙地成年男子的脉搏均数是否与甲地成年男子有所不同?例2:已知湖北省乒乓球运动员的简单反应时180毫秒,在湖北省随机抽取部分乒乓球运动员对简单反应时进行了测试(pingpang.sav),问所测成绩与全省成绩有无差异?二、两样本均数的差异显著(Independent-SamplesTTest,独立样本T检验)独立样本T检验是对来自两个正态总体的相互独立的样本均值的T检验。例:随机抽测篮球和排球运动员各10名,他们纵跳成绩的数据见下表,试分析不同项目运动员的纵跳水平是否存在差异?(a=0.05)(zongtiao.sav)编号12345678910篮球67626861706570596366排球64697063587164686267三、配对实验数据的差异显著性检验(Pairde-SamplesTTest过程)配对计量资料具有个体之间可以相比的特点,如:(1)同一观察单位前后两次测定结果的比较。(2)两个观察单位配成一对,分别给予不同处理,然后观察某一测量数据的高低。配对样本T检验也是通过对样本均值的比较来检验两个正态总体均值之间的差异是否显著。与独立样本T检验不同的是配对样本T检验所检验的来自两个总体的样本不是相互独立的,它们相互关联的,搭配成对。这种检验方法可突出研究因素的影响,避免其他因素的干扰。例1:将30名学生按身素质、技术水平和运动成绩等因素对等的原则,配成对子。然后随机分为两组,分别进行同内容,不同手段的训练,经三个月后,测出他们的成绩(xunlian.sav),问不同手段的训练效果是否相同?例2:有10名高血压患者,用一种特殊的体育疗法进行治疗,测出了治疗前后的血压(舒张压)测量值(gaoxueya.sav),要求判断体育疗法是否治疗高血压有效。四、Chi-Square过程(卡方检验或差方检验)卡方检验有两个特点:
1.它能够同时检测两个或两个以上的数据是否与某种理论次数分配相接近,并且具有可加性特点,因此,卡方检验是比较实得次数分配与理论次数分配之间差异的最有效的方法。
2.卡方检验适用于计数资料。计数资料的特点是缺乏连续性,其理论次数分配是二项分配,卡方检验是对这种计数资料进行检验的最适用的方法之一。也应是说,卡方检验既适用于参数检验,也适用于非参数检验。主要用于检验样本观察值的频数与期望次数是否有显著差异。卡方检验时有两点需要注意以下两点:1.如果有1/5以上的单元(一个观测值或期望值是一个单元)的理论数小于5、或者一个理论数小于1时,则应使理论数小于5的单元(分组)与邻近单元(邻近组)合并,以增加单元的理论数。因为当观测频数较少时易受随机误差的影响,否则易导出错误的结论。但合并时要注意是否合理,不同质的资料不可合并,只能增加观测例数,再作统计分析。2.即使显著性水平Sig.<=0.05,拒绝虚无假设,只能说明观测值与期望值有显著性差异,还不能说明每一对观测值与期望值显著性差异。每一对观测值与期望值之间的差异还须用其他方法另作检查。
例1:比较新教学法和原教学法对达标的影响。设立实验班和对照班,实验班采用新教学方法,对照班采用原教学方法,经过一学期教学实验后,测试达标的人数:(dabiao.rav)
问两种教学方法对达标影响是否存在差异?达标人数未达标人数合计实验组16937206对照组11198209合计280135415注意:
1.当n≥40且所有T≥5时,用普通有卡方检验。但若所得P≈a,改用确切概率法(即教材中125面公式6.12进行计算)。
2.当n≥40且但有1≤T<5时,用校正的卡方检验。
3.当n<40或有T<1时,不能用卡方检验,改用确切概率法。例2:现统计甲、乙两个排球队在5局的比赛中各队发球、拦网和扣球得分的情况如下表。问甲、乙两队各种得分的构成比是否具有显著性差别?(defen.doc)队别发球得分拦网得分扣球得分合计甲队10253570
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年生物科技研发普通合伙合同范本3篇
- 2025年度电子商务平台运营策略咨询合同3篇
- 2024年苹果产业链科技创新与应用推广合同3篇
- 二零二五年度住房公积金贷款担保合同样本集6篇
- 2024年电子政务平台建设与维护合同
- 组合机床缸体课程设计
- 2025年度特许经营合同的特许经营范围和经营条件3篇
- 课程设计工作报告模板
- 自然培训课程设计
- 2024年私人房产抵押贷款合同
- DLT 265-2012 变压器有载分接开关现场试验导则
- 手术室护理年终总结
- SYT 6276-2014 石油天然气工业健康、安全与环境管理体系
- 职业生涯规划班会课教案设计
- 微观经济学(对外经济贸易大学)智慧树知到期末考试答案2024年
- (正式版)HGT 6277-2024 甲醇制烯烃(MTO)级甲醇
- 注射用更昔洛韦的临床疗效研究
- 2023年1月广东省自考00634广告策划试题及答案含解析
- 小学三年级上册竖式计算题
- 机场亮化工程
- 2024年青海西部机场集团青海机场有限公司招聘笔试参考题库含答案解析
评论
0/150
提交评论