版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第 3 章平均数、标准差与变异系数 数据有两种变化趋势:集中趋势和离散趋势。 表示数据集中趋势的指标有多个,如平均数(算术平均数、几何平均数)、中位数、众数,使用最多的是算术平均数。 表示数据离散趋势的指标有多个,如极差、平均离差、方差与标准差,使用最多的是方差与标准差。 资料中各观察值的总和除以观察值的个数所得的商,称为算术平均数算术平均数,简称为平均平均数或均数。数或均数。用符号 表示。 平均数的意义:平均数的意义: 平均数用来描述资料的集中性,即指出资料中数据集中较多的中心位置,常用于同类性质资料间的相互比较。x一、集中趋势计算方法计算方法1. 直接法直接法 适用于样本含量较小的非频数资
2、料 如果一个含量为n的样本,其n个观察值分别用x1、x2xn表示,则它们的平均数为 其中,(Sigma)为总和符号, 表示从第一个观察值x1累加到第n个观察值xn,若在意义上已明确时,简记为x。121ninixxxxxnnniix1常数的总和等于该常数的n倍,即代数和的总和等于总和的代数和,即总和符号内的常数因子可以提取到总和符号之外,即其中C为常数(a为常数)ninCC1iiiiiizyxzyx)(njkiijkinjijxx1111iixaaxkkkfffxfxfxfx2122112. 加权法加权法 如果样本中有n1个x1,有n2个x2,那么,n1+n2个数的平均数是加权平均数。 同理:
3、各组的次数 fi 是权衡各组中值 xi在资料中所占比重大小的数量,因此f被称为是x的“权”,加权法也由此而得名。212211nnxnxnxffxfxfkiikiii11 在计算离散型频数资料的平均数时, 式中x为组值,f为频数,N为总频数(f),k为组数。Nfxxkii1)( 表表3-13-15050只小鸡出壳天数的频数分布表只小鸡出壳天数的频数分布表10915021.82fxxf 在计算连续型频数资料的平均数时, 式中m为组中值,f、N和k同上式。Nfmxkii1)(组 别组中值m频数(f)fm44.2545.029045.7546.529347.2548.01048048.7549.512
4、59450.2551.026132651.7552.544231053.2554.043232254.7555.5291609.556.2557.01162757.7558.515877.559.2560.0212060.7561.54246合计20010695表3-2 某纯系蛋鸡200枚蛋重的频数分布表 =10695/200 =53.475x平均数有以下几个基本特性: (1)平均数的计算与样本内每个值都有关,它的大小受每个值的影响。 (2)若每个xi都乘以相同的数k,则平均数亦应乘以k。 (3)若每个xi都加上(或减去)相同的数A,则平均数亦应加上(或减去) A。 将资料中所有观察值从小到大
5、依次排列,处于中间位置的数。以Md表示。 适用条件适用条件 资料呈偏态分布偏态分布或频数分布类频数分布类型不明型不明,以及一端或两端无确定数值一端或两端无确定数值,这种资料用中位数作为代表值比用算术平均数为好。 非频数资料,先将各观察值由小到大排资料,先将各观察值由小到大排列,列,当n为奇数时,第(n+1)/2位置的观察值即为中位数,即: Md =x (n+1)/2其中:L中位数所在组的下限;i组距;f中位数所在组的频数;n总频数;c小于中数所在组的累积频数。/2 1n 2 / n2) 12 /(2 /nndxxM)2(cnfiLMd当n为偶数时, 和 位置的两个观察值之和的二分之一即为中位数
6、,即: 若资料已分组,并编制成了频数分布表,可利用频数若资料已分组,并编制成了频数分布表,可利用频数分布表计算中数。分布表计算中数。潜伏期(小时)潜伏期(小时)病例数病例数f 累计例数累计例数02525125883244012336231464812158605163721164)(8 .23)252164(581212)2(25,58,12,164,12小时此例cnfiLMCfLnid例某地区有164人因沙门氏菌食物中毒,其潜伏期资料经整理如下表,试计算中位数。 资料中出现次数最多的那个数或频数最多一组的组中值,记为Mo。 fmax=24, Mo=22 50 50只小鸡出壳天数的频数分布表只
7、小鸡出壳天数的频数分布表10915021.82fxxfMd=22组 别组中值m频数(f)fx44.2545.029045.7546.529347.2548.01048048.7549.51259450.2551.026132651.7552.544231053.2554.043232254.7555.5291609.556.2557.01162757.7558.515877.559.2560.0212060.7561.54246合计20010695表3-2 某纯系蛋鸡200枚蛋重的频数分布表 =10695/200 =53.475xfmax=44, Mo=52.5Md=53.35 定义定义 指n
8、个观察值乘积的n次方根。即 适用条件适用条件 主要应用于数据呈倍数关系呈倍数关系或不对称分布不对称分布的资料,算术平均数对这类资料的代表性差算术平均数对这类资料的代表性差。如抗体效价(1:10,1:100,1:1000,1:10000)、增长率或生长率、动态发展速度等。nnnnxxxxxxG1).(.2121计算计算1 1、应用公式计算(实际应用时常取对数)、应用公式计算(实际应用时常取对数)nnxxxG.21niinxnxxxnG121lg1lglglg1lgniixnG11lg1lg 例 海虾养殖试验,各旬的生长速度3.0,1.5 1.3,1.2,1.2,1.1,1.1,求海虾的旬平均生长
9、速度。 解: 即海虾平均生长速度为1.38。 其算术平均数为14. 01 . 1lg22 . 1lg25 . 1lg3lg71lgG38. 114. 0lg1G121.48nxxxxn 当资料编成频数分布表时当资料编成频数分布表时, 各组组中值; 各组次数;)lg(lg1fxfGiixif 资料的另一方面的特征是变异程度。如: A 组资料: 3 、 4 、 5 、 6 、 7 平均数为: 5 B 组资料: 1 、 3 、 5 、 7 、 9 平均数为: 5 这里的平均数 5 对于 A 组资料的代表性好?还是对于 B 组资料的代 表性好?可见,只表明了数据的集中程度是远远不够的,还需要进一步说明
10、数据的变异程度。只有通过变异程度的描述,才知道代表值的代表性。表示数据变异特征的数值叫变异数变异数。常用的变异数有:极差、平均离差、方 差、标准差、变异系数等。 极差(全距)极差(全距) 极差 = 最大值 - 最小值 只利用了资料中最大值和最小值,不能准确表达资料中各个观察值的变异程度。 平均离差平均离差 1xxdn它不能表示整个资料中所有观察值的总偏离程度使用不方便,在统计学中未被采用消除离均差的负号离均差的平方之和(简称平方和平方和,记为SS)称为均方均方(缩写为MS),又称为样本样本方差方差,记为S2标准差标准差S S)(xx0)(xxxx)(xx2)(xx2)(xx) 1/()(2nx
11、x) 1/()(2nxxS离均差离均差 首先求出离均差,即每个数与它们的平均数之间的离差;然后将所有的离均差平方,再相加,得出离均差平方和;最后用n-1除离均差平方和(按照统计学理论,不要用样本含量n去除),所得的商称为样本方差,用符号s2表示。 方差s2是离均差平方的平均数。虽然方差在实际应用中用得最广泛,但因它的单位是原始数据单位的平方,所以它不能直接地指出某个数x与平均数之间的偏离究竟达到什么程度。为此,采用标准差s做标准,衡量x与平均数之间的离散程度。 自由度 (degree of freedom) :统计学借此来反映一批变量的约束条件。 例如一个有 5 个观察值的样本,因为受到统计数
12、的约束,在5个离均差中,只有4个数值可以在一定范围内自由变动取值,而第五个离均差必须满足这一限制条件。 自由度记作 DF , 一般样本自由度等于观察值个数 ( n ) 减去约束条件的个数 ( k ) ,即 DF n k 。 1)(122nxxsnii1)(12nxxsnii样本方差样本标准差 为了方便计算,将离均差平方和转化为另一种形式,同时略去下标,上式可表示为:1)(22nnxxs 在计算离散型频数资料的标准差时, 式中x为组值,f为频数,N为总频数(f),k为组数。1)(22NNfxfxs 在计算连续型频数资料的标准差时, 式中m为组中值,f、N和k同上式。1)(22NNfmfms标准差的特性标准差的特性(一)标准差的大小受资料中各观察值的影响,观察值间变异大的标准差也大,反之则小;(二)计算标准差时,各观测值加上或减去一个常计算标准差时,各观测值加上或减去一个常数,标准差的值不变数,标准差的值不变; (三)当每个观察值都乘以一个常数a时,所得的标准差是原来标准差的a倍样本的方差为总体的方差为 资料的单位不同或平均数相差很大时,直接利用标准差比较资料间变异程度是不妥的,需用变异系数。 变异系数同标准差一样是衡量资料变异程度的统计量。变异系数消除了不同单位和平均数的影响,可以用来比较不同资料的相对变异程度。 变异系数是标准差与平均数
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025版土地使用权出让居间合同规范文本-城市综合体开发3篇
- 二零二五版住宅小区车位产权转移及使用权购买合同3篇
- 2025版住宅小区消防设备设施定期检查与维护合同范本2篇
- 2025年度木门行业环保认证与推广合同3篇
- 2025年度国际物流合作解约及责任分担协议书
- 二零二五年度美容店转让合同包括美容院品牌授权及区域代理权
- 2025年度二零二五年度大型活动临时工人搬运服务承包协议
- 2025年度私人承包厂房租赁合同安全责任追究协议
- 二零二五板材行业数据分析与市场预测合同3篇
- 二零二五年度铲车清雪作业安全责任保险合同
- 中考模拟考试化学试卷与答案解析(共三套)
- 新人教版五年级小学数学全册奥数(含答案)
- 风电场升压站培训课件
- 收纳盒注塑模具设计(论文-任务书-开题报告-图纸)
- 博弈论全套课件
- CONSORT2010流程图(FlowDiagram)【模板】文档
- 脑电信号处理与特征提取
- 高中数学知识点全总结(电子版)
- GB/T 10322.7-2004铁矿石粒度分布的筛分测定
- 2023新译林版新教材高中英语必修一重点词组归纳总结
- 苏教版四年级数学下册第3单元第2课时“常见的数量关系”教案
评论
0/150
提交评论