体育统计数据特征_第1页
体育统计数据特征_第2页
体育统计数据特征_第3页
体育统计数据特征_第4页
体育统计数据特征_第5页
已阅读5页,还剩50页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

体育统计数据特征第一页,共五十五页,2022年,8月28日一、集中量数由频数分布表可看出频数分布的两个重要特征:集中趋势和离散程度。如:例2.2,身高有高有矮,但中等身高居多,此为集中趋势;由中等身高到较矮或较高的频数分布逐渐减少,反映了离散程度。对于数值变量资料,可从集中趋势和离散程度两个侧面去分析其规律性。第二页,共五十五页,2022年,8月28日集中趋势:在一组数据中变量值集中的位置(数据分布最密集的位置)。集中量数:反映集中趋势的统计量称为集中量数。常用的集中量数有:(1)算术平均数(2)中位数(3)众数第三页,共五十五页,2022年,8月28日1、算术平均数定义:所有观察值之和除以总频数,简称均数。样本均数:总体均数:含义:反映同质研究对象观察值的平均水平与集中趋势的统计量。

第四页,共五十五页,2022年,8月28日算术平均数的计算方法(1)直接法:由观察值直接计算,用于样本含量较少时,其公式为:式中,希腊字母Σ表示求和;

X1,X2,…,Xn为各观察值;

n为样本含量,即观察值的个数。第五页,共五十五页,2022年,8月28日例1:某少年组运动员10人,立定跳远成绩(单位:米)如下表试求其均值。(p26例3.1)解:返回编号12345678910成绩2.722.682.782.832.622.813.093.002.942.89第六页,共五十五页,2022年,8月28日(2)加权法:当资料中出现相同观察值时,可将相同观察值的个数(即频数)与该观察值X的乘积代替相同观察值逐个相加,即

X1

,X2,……

,Xkf1

,f2,……

,fk其公式为:第七页,共五十五页,2022年,8月28日例2:某人50发射击成绩如下表,试求其均数。(p16例2.1)解:环数

5

6

8

9

10频数

4

3

18

22

3第八页,共五十五页,2022年,8月28日(3)简捷法:主要是针对连续型频数分布表,是加权法的一种变形形式。其公式为:式中::所在组的组下限

f:该组的频数

i:组距第九页,共五十五页,2022年,8月28日身高频数115~1118~3121~8124~10127~20130~19133~12136~4139~2142~1451总和80例3:80名上海市小学二年男生身高数据如下表:求其均值。(p16例2.2)解:第十页,共五十五页,2022年,8月28日算术平均数的适应范围及优缺点优点:(1)均数作为反映变量的集中量数,既考虑到频次的多少,又考虑到每一个变量值的大小,故它是可靠的、灵敏的,也是对资料提供信息运用最充分的。(2)均数适合代数运算,计算方便,因此是一个用途最广、效果最好的集中量数。第十一页,共五十五页,2022年,8月28日缺点:(1)均数易受少数极端数据的影响而大大改变其数值,从而相对削弱它作为集中量数的代表性。适应范围:数据严重偏态分布时,一般不用均数反映它的集中趋势。一般应用于正态或近似正态的数据。第十二页,共五十五页,2022年,8月28日给定一组数据资料,如何判断是否适合选用算术均数来表达其平均水平呢?(1)如果是小样本,可用目测法:如果数据相差不太悬殊,将数据由小到大排列后,较小和较大的数据个数基本相等,且关于最中间的数据基本对称即可。(2)如果大样本,将其按一定组距分组,若居中的组段内频数最大,而且在该组前后的组段内的频数逐渐减少且基本对称,也适合用算术均数。第十三页,共五十五页,2022年,8月28日关于集中趋势的讨论集中趋势反映的是位置,不能比较大小。

例:甲班体育统计平均成绩乙班体育统计平均成绩上式反映的是:乙班的成绩比甲班好(平均水平),而不能说乙班的集中趋势比甲班大。第十四页,共五十五页,2022年,8月28日2、中位数定义:是把各个变量值按大小顺序排列后,位于序列中间的数,称为中位数,是一种位置指标,反映数据集中趋势的一个统计量。记为:含义:反映一组观察值在位置上的平均水平。第十五页,共五十五页,2022年,8月28日中位数的计算离散型数据(1)数据个数为奇数个时:(2)数据个数为偶数个时:连续型数据(略)第十六页,共五十五页,2022年,8月28日例4:求下列两组数的中位数(1)14,2,17,9,22,13,1,7,11(2)1,26,11,9,14,13,7,17,22,2解:先排序(1)1,2,7,9,11,13,14,17,22

该组的中位数为:11

(2)1,2,7,9,11,13,14,17,22,26

该组的中位数为:第十七页,共五十五页,2022年,8月28日优缺点及适用条件优缺点:(1)由于中位数只受居中变量值的影响,故它不够灵敏、充分。(2)不会受到极端数据的影响。适用条件:适用于任何分布资料,特别是偏态分布、分布不明、分布末端无确定值。第十八页,共五十五页,2022年,8月28日极端数据对均数和中位数影响的举例例5:分别求下列两组数的均数和中位数。(1)1,2,7,9,11,13,14,17,22

(2)1,2,7,9,11,13,14,17,100解:(1)中位数为:11均数为:10.67

(1)中位数为:11均数为:19.33第十九页,共五十五页,2022年,8月28日3、众数定义:在一次实验中出现次数(频数)最多的观察值;在频数分布表中对应于数据最集中所在位置的观察值。记作:适应条件:适用于大样本;较粗糙。第二十页,共五十五页,2022年,8月28日例6:某班体育考试成绩如下表:该组数据的众数:分数7071727374757677787980频数2461411975431第二十一页,共五十五页,2022年,8月28日4、均数、中位数、众数三者关系正态分布时:均数=中位数=众数右偏态分布时:均数>中位数>众数左偏态分布时:均数<中位数<众数第二十二页,共五十五页,2022年,8月28日常用集中趋势指标及应用条件集中趋指标应用场合算术均数适用于对称分布,特别是正态分布众数大样本,较粗糙。中位数适用于任何分布资料,特别是偏态分布、分布不明、分布末端无确定值第二十三页,共五十五页,2022年,8月28日二、离散量数例7:两组学生的引体向上成绩如下:甲组:3,5,5,5,5,6,6

乙组:1,2,4,5,6,8,9

从该上述资料中两组数据我们可以看出:(1)甲组和乙组的平均成绩都是5。(2)这两组数据的分布特征不尽相同,各组的7个数据间参差不齐的程度是不一样的。(3)根据常识:我们会认为甲组的成绩比乙组好。第二十四页,共五十五页,2022年,8月28日离散程度(变异程度):反映数据分布的密集程度。离散量数:反映数据离散程度的指标称为离散量数。常用的离散量数:

1、全距

2、方差、标准差

3、变异系数第二十五页,共五十五页,2022年,8月28日1、全距(极差)定义:该组数据的最大值与最小值的差。计算方法:R=max-min

例7中:因为:所以:甲组成绩的离散程度(变异程度)小于乙组成绩。第二十六页,共五十五页,2022年,8月28日优缺点:(1)计算简单方便。(2)只反映出该组数据资料中最大值与最小值的信息,其他数据信息反映不充分。(3)只能比较数据数目相同的同质数据。适用条件:样本含量较小时,数据分布相对比较均匀的数据。第二十七页,共五十五页,2022年,8月28日2、离均差平方和

表示所有数到均数差的代数和。第二十八页,共五十五页,2022年,8月28日的几何解释:表示各点到均数距离的和。由于该值为零,无法反映数据的离散程度,但是对我们找一个合适的指标来反映离散程度有一定启发意义。第二十九页,共五十五页,2022年,8月28日表示所有数到均数差的绝对值的和。的几何解释:表示各点到均数路程的和。如果这个值越小则离散程度就越小,反之亦然。优点:反映的信息充分。缺点:(1)只能比较数据数目相同的同质数据。(2)式中包含绝对值符号。第三十页,共五十五页,2022年,8月28日:离均差平方和,表示所有数和均数差的平方的代数和。离均差平方和的含义:表示所有数据的总变异即总的离散程度。优点:充分、灵敏、严密确定。缺点:只能比较数据数目相同的同质数据。第三十一页,共五十五页,2022年,8月28日为什么我们一般不使用离均差平方和来反映数据的离散程度(变异程度)?例:现在有两个班同时在学习《体育统计》,甲班有45人,乙班有40人,考试结束后,比较两个班的《体育统计》成绩?是分别比较两个班的总分还是平均分?

结果是显而易见的:比较平均分,因为两个班的人数不相等。

离均差平方和就相当于这里的总分。第三十二页,共五十五页,2022年,8月28日3、方差定义:离均差平方和除以该组数据的总频数。其公式为:

n-1:自由度总体方差:样本方差:第三十三页,共五十五页,2022年,8月28日含义:表示每个观察值的平均离散程度,方差越大,说明数据的离散程度越大。优点:(1)灵敏性、严密确定、充分性。(2)可以比较不同数目同质数据的各组数据资料。缺点:(1)容易受到极端数据影响。(2)它的单位与观察值的单位不同,是观察值单位的平方,这给我们解释实际问题造成了一些麻烦。

第三十四页,共五十五页,2022年,8月28日4、标准差定义:方差的平方根。其公式为:

式中,n-1:自由度含义:反映每个数据的平均离散程度,标准差越大,说明数据的离散程度越大。总体标准差:样本标准差:第三十五页,共五十五页,2022年,8月28日标准差的优缺点及适用条件优缺点:(1)灵敏性、严密确定、充分性。(2)标准差能对平均数的代表性作出补充说明。标准差越大,表明这组数据的离散程度越大,平均数的代表性越差;标准差越小,表明这组数据的离散程度越小,平均数的代表性越好。(3)与方差相比,标准差更容易解释实际问题。(4)易受极端数据的影响。适用条件:(1)数据分布相对比较均匀,正态或近似正态的数据。第三十六页,共五十五页,2022年,8月28日标准差的计算方法(1)直接法:用于样本量较小的资料。其公式为:其中:第三十七页,共五十五页,2022年,8月28日例8:某少年组运动员10人,立定跳远成绩(单位:米)如下表试求其标准差。(p26例3.1)解:

编号12345678910成绩2.722.682.782.832.622.813.093.002.942.89第三十八页,共五十五页,2022年,8月28日(2)加权法:用于样本量较大的离散型频数表资料。其公式:其中,第三十九页,共五十五页,2022年,8月28日例9:某人50发射击成绩如下表,试求其标准差。(p16例2.1)解:环数

5

6

8

9

10频数

4

3

18

22

3第四十页,共五十五页,2022年,8月28日(3)简捷法:是加权法的另一种变形形式,主要用于连续型频数分布表。其公式为::组下限f:该组的频数其中:第四十一页,共五十五页,2022年,8月28日身高频数115~1118~3121~8124~10127~20130~19133~12136~4139~2142~1451总和80例10:80名上海市小学二年男生身高数据如下表:求其均值。(p16例2.2)解:第四十二页,共五十五页,2022年,8月28日5、变异系数定义:同组数据的标准差与平均数的百分比。含义:表示数据的相对变异程度,变异系数越小,变异程度就越小;变异系数越大,变异程度就越大。适用条件:①比较单位相同但均数相差较大数据。②比较单位不同的数据。第四十三页,共五十五页,2022年,8月28日例11:测100名男生100米跑成绩;立定跳远,,是比较两项成绩哪一项整齐。解:所以:100米跑成绩更整齐。第四十四页,共五十五页,2022年,8月28日6、标准差(方差)与变异系数的区别标准差反映数据的绝对离散程度(变异程度);变异系数反映数据相对的变异程度。标准差(方差、全距)只能比较同质的数据;变异系数可以比较不同质的数据。变异系数只能比较大小,不能进行代数运算。例:上式无任何实际意义!!!第四十五页,共五十五页,2022年,8月28日集中趋势离散趋势应用场合算术均数标准差适用于对称分布,特别是正态分布中位数全距变异系数适用于任何分布资料,特别是偏态分布、分布不明、分布末端无确定值适用于均数相差悬殊或度量衡单位不同的资料各种样本特征数的适应条件第四十六页,共五十五页,2022年,8月28日本章重点内容明确均数、中位数、标准差和变异系数的优缺点及其适用条件。均数、中位数、标准差和变异系数的含义。均数、中位数、标准差和变异系数的计算。第四十七页,共五十五页,2022年,8月28日自由度:

在统计学中,n个数据如不受任何条件的限制,则n个数据可取任意值,称为有n个自由度。若受到k个条件的限制,就只有(n-k)个自由度了。计算标准差时,n个变量值本身有n个自由度。但受到样本均数的限制,任何一个“离均差”均可以用另外的(n-1)个“离均差”表示,所以只有(n-1)个独立的“离均差”。因此只有(n-1)个自由度。

返回第四十八页,共五十五页,2022年,8月28日身高频数累计频数频率累计频率115~111.25%1.25%118~343.75%5.00%121~81210%15.00%124~102212.5%27.50%127~204225%52.5%130~196123.75%76.25%133~127315%91.25%136~4775%96.25%139~2792.50%98.75%142~1451801.25%100%总和80返回第四十九页,共五十五页,2022年,8月28日计算器用法

MODEMODE1“SD”

★SHIFTCLR1EXE(=)“清除数据”

X1M+“输入数据”

X2M+﹡﹡﹡﹡﹡﹡XnM+SHIFT21EXE(=)“算术平均数”

SHIFT23EXE(=)“标准差”

第五十页,共五十五页,2022年,8月28日

MODEMODE1“SD”

★SHIFTCLR1EXE(=)“清除数据”

2.72M+“输入数据”

2.68M+2.78M+﹡﹡﹡﹡﹡﹡2.89M+SHIFT21EXE(=)“2.836”SHIFT23EXE(=)“0.147”

第五十一页,共五十五页,2022年,8月28日

MODEMODE1“SD”

★SHIFTCLR1EXE(=)“清除数据”X1SHIFT,f1M+“输入数据”X2SHIFT,f2M+﹡﹡﹡﹡﹡﹡XnSHIFT,fnM+SHIFT21EXE(=)“算术平均数”SHIFT23EXE(=)“标准差”

其中:fn表示Xn对应的频数。第五十二页,共五十五页,2022年,8月28日

MODEMODE1“SD”

★SHIFTCLR1EXE(=)“清除数据”115SHIFT,1M+118SHIFT,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论