第四章正态分布体育统计学_第1页
第四章正态分布体育统计学_第2页
第四章正态分布体育统计学_第3页
第四章正态分布体育统计学_第4页
第四章正态分布体育统计学_第5页
已阅读5页,还剩10页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、1(-oo X -KO) )(4 1)第四章正态分布如果将第二章中的(表2 - 1)中的数据绘制成直方图,把每 个方条顶部中点联结起来,就得到一个图形,它称为频数多边形。(图 4 1)当分组数很多,组距很小时,频数多边形就趋于类似(图4 -2)所示的平滑的曲线。这种曲线呈现岀两侧近似对称的钟形。随 机变量的类似这种分布,在自然界是相当普遍的其中最有代表性的是 正态分布。下面就来介绍正态分布及其在体育中的几个应用。第一节正态分布曲线的形式如果随机变量X的概率密度函数为图41 频数多边形图则称随机变量X是服从正态分布的由上式绘出的图形叫做正态曲线。 (图4 2) X的变动范围在-00至+0C间。图

2、4 2正态分布曲线正态分布曲线中有两个参数:均值卩及方差bS为了应用方 便,对式(4 1)中的随机变量经过一个称为标准化的变换,即令 u来代替原式中的 匕上,寻这时的随机变量u的概率密度函数成 为:y=vke-T (4-2)按照(4 2)式绘岀的图形,称作标准正态曲线。(图4 3)图4 3标准正态分布曲线第二节正态分布曲线的特征正态分布曲线有许多特点,它们对实际工作有很大的帮助。它的 主要特点有以下几个方面:一,正态分布的形式是对称的(但对称的分布不一定是正态分 布)。在正态分布中均值与中位数相重合。二,从中央最高点逐渐向两侧降低,降低的速度是先慢后快,以 后又再次减慢,最后接近横轴,但终究不

3、能与横轴相交。三,从中央向两侧逐渐下降,它的方向是先向内弯,达到离均值 左右各一个标准差时又改向外弯,是以“lb的点为曲线从内弯转 向外弯的转折点,即正态曲线中标准差与曲线有固定的关系。四,因为正态曲线是对称的,在曲线下不仅平均数的两侧面积相 等,各相当距离间的而积相等,而且各相当距离间的曲线高度也相等, 正态曲线下(与横轴间)的总面积为1. 00o五,正态曲线可以有不同形式,它们的均值和标准差可以不相同, 均值不同表明曲线在横轴上所处位置不同,标准差不同表明曲线的形 态不同。标准差小则曲线高、且窄;标准差大则曲线低、且宽。(图 4 4)由式(4 1)和(4 2)知,标准止态曲线的“ =0,

4、7=1,即标准正态曲线是关于纵轴对称;它在/二0时,有最大 值,它近似等于0. 4,如(图4 - 3)所示。Y/图4 一 4三种不同形式的正态分布曲线第三节正态分布表从某市17岁男生中随机抽出205人测量身高,由这个样木计算 得到168. 40厘米,S = 6. 13厘米。假定该市17岁男生身高 服从正态分布,试估计身高在16. 40 - 172. 40厘米之间的人数。求解这类问题的一般方法是:求从正态总体中随机选取一个个体 的测量值落在区间(a, b)上的概率。这个概率在标准正态曲线下就 是曲线、X轴、直线X = a和X b所I韦I成的而积。(图4 5) 当概率P求得后,要求的人数约等于总人

5、数乘以P值。图4 5随机变量X在区间(a, b)内取值的概率示意图表的左边第1列这横轴上的位置,它是指横轴上某一点与平均 值的距离,以标准差为单位来表示,通常记为u,即a表上边的第1行为u值的第2位小数。表的主体部分是各u值与均 数(u二0)之间所对应的单侧面积(或概率)。一、知U值求对应的面积例4 1 求u值为一 1至+2之间对应的面积。解:由于标准正态曲线是关于x二u对称的均数处的u值为零, 所以u值在一1至0这间对应的面积与它在0至+1之间的对应面 积相等。查书后附表1得u值在一 1至0的对应面积是34. 13%; u 值在0至+2之间的面积是47. 72%o前者在均值的左边,后者在均

6、值的右边,因此这两块面积之和便是所求面积。(图4 6)即:图46例4 - 2本节开始提出的问题,即试估计身高在160. 40 - 172. 40厘米之间的人数。解:首先要求出身高为160. 40厘米和172. 40厘米的u值,按 式(4 3)有(当u和o未知时,可用乂和S近似代替):=160.40 168.406A31. 3117240 168.406.130. 65查书后附表1求5、U2所对应的面积。U! = -1. 31所对应的面积 是40. 49%, u2 = 0. 65所对应的面积是24. 22%。u值一 1. 31至 0. 65 所对应的面积为 40. 49% + 24. 22% =

7、 64. 71%,见(图 4 7)所示,于是身高在160. 40 172. 40厘米之间的人数约为205图4一7估计身高在160. 40-172. 40厘米间的人数百分数二、已知面积求对应的U值例4 3 试求从+1Q向右到什么位置对应的而积为14. 15%解:设从+lcr向右到+kcr对应的面积为14. 15%o查标准# 态分布表知+1”对应的面积是34. 13%o24. 13%+14. 15% = 48. 28%,就是u值从0到+k之间对应的而积。查书后附表1和K二2. 11, 即从+lo-向右到+2. 11a之间对应的面积为14. 15%o (图4 8)从标准正态分布表中,可以找出标准正态

8、曲线下面的分布规律。 在下表中列出的五个分布位置与其对应的概率是统计中电子学用到 的,应该熟记。UiX64. 71%表4 1正态曲线下的概率分布/UC7该范围具有的概率“ Id68. 26%“1. 96 cr95. 00%“2(795. 44%“2. 58cr99. 00%99. 73%第四节 统计资料的正态性检验正态分布的理论适用于正态或近似正态分布的资料。对样本要想 用正态分布理论进行分析,首先要检验样本是否为正态分布。检验的 方法有多种,简单而实用的方法是“概率格纸绘图法”。这种方法使 用的概率纸是正态概率纸,它的横轴是普通的刻度,纵轴是按正态分布的规律刻划的。使用时,先根据样木数据求出

9、累计频率,然后根据 累计频率和组限,将其点绘在正态概率纸上,如果样木资料是呈正态 分布的则所有点几乎在一条直线上。例4 4 广州市某中学初中生800米跑的抽样测验成绩的累 计频率如下表所示,试检验该资料是否近似正态分布组限频 数累计频数累计频率(%)237-110. 8244-675. 62,51-152217. 62,58”-204233. 6305-276955. 2312-259475. 2319-2111592. 03,26-612196. 8333-212398. 4340-2125100. 0由样本计算得:X= 3932 ,S = 12*4然后根据每组的下限值和相应的累计频率,将它

10、们分别标在图上。根 据点的分布趋势画一直线,观察这些点的分布是否接近一条直线。在 画直线时应以靠近中部的点为主,两端的点为辅,因为中部的点的组 频数大,所以占比重也大。由(图4 9)可见,所有的点几乎都 在一条直线上,故该样本资料接近于正态分布。图49当样本资料符合正态分布时,籍助正态概率纸做图,还可以对|1 和a作出近似地估计。从正态分布理论知道累积频率为50%的位置 应在中点,即接近均数位置。从纵轴50%的位置画横线与讲线交于a 点,由不得a点向横轴做垂线交于n点,其值为3028 ,即为估 计均数,它与计算值3022仅相差05。又知均数减一个标准差位 置的面积为34. 13%,故在纵轴上的

11、应是50% 34. 13% = 15. 87% (b点),以此划横线交于斜线上c点,向横灿做垂线交于250”9 处,此点距均数的长度应为b,故估计标准差的值为: 302”8-2509 = 119。计算值为124,仅相差05。只要图做得 准确,这些估计值也还是比较精确的。第五节可疑数据的舍取在实际工作中,往往能够发现样木资料中具有个别突出的数值(特大或特小的数值)。按样本数据系列大小顺序来看,发现这些突 出的数值和其他数值之间有明显脱节现象。这种现象使人们怀疑这些 特别数值是否属于研究的总体,于是把这些数据称为可疑数据。人们 把来自非同一总体的极端值,称为异常数据。样木中的异常数据应当 及时剔除

12、,否则会影响样木均数和标准差等统计量及计算结果的准确 性。如何判断可疑数据是否为异常数据,方法不少,下而介绍适用于 正态分布,且数据个数不多时,比较常用而有效的戈罗伯斯(Grubbs) 检验法。设Xl, X2 , X n来自正态分布的总体,将它们按大小重新排列, 记为XWxW . Wx(n)。首先计算出可疑数据的g 值,其公式为:式中X表示可疑数据值,若计算得g n值大于(表4 2)中的 临界值弘,则认为X是异常数据,应舍弃。若小于临界值,则X 为正常数据,应保留。表4 2 戈罗伯斯检验临界值 仏)表a = 0. 05nannannnann31. 15122. 29212. 58302. 96

13、402.8741. 46132. 33222. 60313. 03502.9651. 67142. 37232. 62323. 09603.0361. 82152.41242.64333. 14703.0971. 94162. 44252. 64343. 18803.1482. 03172. 47262. 75353. 21903.1892. 11182. 50272. 82363. 231003.21102. 18192. 53282. 87373. 241103.23112. 23202. 56292. 92383. 251203.24例4-5 为了解一般高中学生跳高水平,由随机样本计算得

14、 到统计量如下:n = 100 人 x = 1. 31 米 s = 0. 09 米假定这些学生跳高成绩的分布呈正态分布。其中有一名学生的成绩是1.65米,这个成绩超出平均水平三个标准差以上,是个可疑数据。 试检验它是否为异常数据。按公式(4 4)计算耳= 3 ?8s0.09查(表4 2) n = 100对应的an值是3. 21,现计算 值是3. 78,大于临界值,故1. 65米是异常数据应舍弃。据了解,该学生是少体校学生,受过专项训练,不属于一般高中学生跳高水平研究的总体。第六节 正态分布理论在体育中的两个应用一、制定测验标准制定测验标准是体育教学和训练中的一项重要工作,一般是根据 学生原有的

15、基础和不同阶段教学目的与要求,事先规定达到各标准的 人数比例,并将这个比例数看作正态分布曲线下的面积,然后利用标 准下正态分布表去推算相应标准的具体成绩。例4 - 6 某学校某年级在进行跳高教学之前,从该年级随机 抽出一部分学生测验其跳高成绩。现由样本计算得到统计量为:x = 1. 40 米,S = 0. 10 米学校方而根据学生在跳高上的基础水平和教学的要求,规定就目前状 况达到优秀的人数比例为10%,良好的人数比例为20%,有15%的人 不能及格,试用统计方法求出以上三个标准的具体成绩。图4-10跳高测验标准的确定计算过程如下:人数比例查标准正态分布表的面积U值标准(x + u-s)10

16、% (优)(米)50% 10% 二 40%1. 281. 40+1. 28X0. 10二 1. 5320% (良)50% 10% 20% 二 20%0. 521. 40+0. 52X0. 10=1. 45 (米)15% (不及格)50%-15%=35%-1. 401. 40-1. 04X0. 10=1. 30(米)综上所述,优秀标准的成绩是1. 53米;良好标准的成绩是1. 45米;及格标准的成绩是1. 30米。二、估计达标人数以上阐述的是己知达标人数比例,求出这一标准的具体成绩,下 面是叙述先定出具体的成绩标准,而后要求估计出达到标准的人数百 分比。这实际上是己知u值求对应正态分布曲线下面积

17、的问题。例4 7 某学校对某年级男生的跳远教学测验成绩作出如下 规定:成绩为5. 60米以上者得5分;5. 40米以上者得4分;4. 60 米以上者得3分。教师从该年级男生中随机抽出部分学生进行测验, 得到】二5. 00米,S = 0. 40米,试估计该年级男生得各分值的 人数比例。计算结果如下:综上所述,该年级男生跳远得5分的人数比例是6. 7%;得4分的人 数比例是9. 2%;得3分的人数比例是68. 26%o如果用该年级男生 的总人数乘以各人数比例,便可估计达到各标准的人数。习题四1.什么是正态分布、标准正态分布正态分布的特点是什么如何使用标准11 /古分值成绩u 1M(X-X)S而积(

18、A)5分米以上(5 60- /= %50%-% 二 %4分米以上一 / 二%50%-%-% =%3分米以上/ =% %+% = %达标人数比例正态分布表2. 在正态分布表中,下列范围包括的面积占总而积的百分之几(1)pl.lb;(2)p2.58b;(3)p-1.2c 一 p +1.4b间。3. 在正态分布中,己知卩土 kb间包括的面积是34 % ,求K值为 若干4. 某年级有216名学生,随机抽出部分学生测验跳远成绩得到样本 统计量为x = 4. 40米,S二0. 42米。如规定2. 80米是及格 标准,试估计该年级可能有多少人不及格5. 用正态概率纸检验第二章第七节所列出的31名大学生简单视反应 数据资料是否服从

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论