




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第三节 统计量及其分布,一、统计量与抽样分布,二、样本均值及其抽样分布,三、样本方差与样本标准差,四、样本矩及其函数,五、次序统计量及其分布,六、样本分位数与样本中位数,七、五数概括与箱线图,1. 统计量的定义,一、统计量与抽样分布,按照这一定义,若x1,x2,xn为样本,则 以及Fn (x)都是统计量。 必须指出的是:尽管统计量不依赖于未知参数,但是它的分布一般是依赖于未知参数的。,是,不是,实例1,例2,设为来自总体 的一个样本,,问下列随机变量中哪些是统计量?,定义 设 为取自某总体的样本,其算术平均值称为样本均值,一般用表示,即,在分组样本场合,样本均值的近似公式为,其中k为组数,xi
2、为第i组中值,fi为第i组的频数。,样本均值及其抽样分布,例 某单位收集到20名青年人的某月的娱乐支出费用数据: 79 84 84 88 92 93 94 97 98 99 100 101 101 102 102 108 110 113 118 125 则该月这20名青年的平均娱乐支出为,将这20个数据分组可得到如下频数频率分布:,对上表的分组样本,使用公式进行计算可得:,两种计算结果不同。 事实上,由于未用到真实的样本观测数据, 因而给出的是近似结果。,定理 若把样本中的数据与样本均值之差称为偏差,则样本所用偏差之和为0,即 证明 从均值的计算公式看,它使用了所有的数据,而且每一个数据在计算
3、公式中处于平等的地位。所以数据与样本中心的误差被相互抵消,从而样本的所有偏差之和必为零。,证明 :对任意给定的常数c,定理 数据观察值与均值的偏差平方和最小, 即在形如 的函数中, 最小, 其中c为任意给定常数。,设x1,x2,xn为来自某个总体的样本, 为样本均值。,则n较大时 的渐近分布为 ,常记为 这里渐近分布是指n较大时的近似分布。,(1)若总体分布为 则 的精确分布为 ;,(2)若总体分布未知或不是正态分布,但,(2)由中心极限定理, 这表明n较大时 的渐近分布为,证明:(1)利用卷积公式,可得知, 由此可知 。,例1 设总体分布为均匀分布 ,该总体的均值 和方差分别为3和4/3。,
4、若从该总体抽取容量为30的样本,则其样本均值的渐近分布为,例2 设总体分布为倒三角分布,其密度函数为 该总体的均值和方差分别为3和2,若从该总体抽取容量为30的样本,则样本其均值的渐近分布为,例3 设总体分布为指数分布 ,该总体的均值和方差均等于1,若从该总体抽取容量为30的样本,则其样本均值的渐近分布为,例4 在总体 中,随机抽取一个容量 为36的样本,求样本均值 落在50.8到53.8 之间的概率。,解,故,例2,样本方差与样本标准差,定义 设x1,x2,xn为取自某总体的样本,则它关于样本均值的平均偏差平方和 称为样本方差。其算术根称为样本标准差。相当样本方差而言,样本标准差通常更有实际
5、意义,因为它与样本均值具有相同的度量单位。,在n不大时,常用 作为样本方差(也称无偏方差),其算术根也称为样本标准差。在实际中,后者比前者更常用。,样本偏差平方和的不同表达式,分组样本场合下,样本方差的近似计算公式:,例1 某单位收集到20名青年人的某月的娱乐支出费用数据: 79 84 84 88 92 93 94 97 98 99 100 101 101 102 102 108 110 113 118 125,将这20个数据分组可得到如下频数频率分布:,对上表的分组样本,可得:,x 1,x2,xn为从该总体得到的样本, 和s2分别是样本均值和样本方差,则 .,定理 设总体X具有二阶矩,即,此
6、定理表明,样本均值的均值与总体均值相同,而样本均值的方差是总体方差的1/n。,证明,注意到,,而,于是,两边各除以n-1,即得第二个结论。,近似,(3),由中心极限定理,(2),例3 设总体X 的概率密度函数为,为总体的样本,求,(1),的数学期望与方差;,(2),(3),解 (1),例3,定义 样本 k 阶(原点)矩,样本 k 阶中心矩,例1 从一批机器零件毛坯中随机地抽取10件, 测得其重量为(单位: 公斤): 210, 243, 185, 240, 215, 228, 196, 235, 200, 199 求这组样本值的均值、方差、二阶原点矩与二阶中心矩。,解,令,例1,则,样本偏度 样
7、本峰度,例 下表是两个班(每班50名同学)的英语课程的 考试成绩。,下面分别计算两个班级的平均成绩、标准差、 样本偏度及样本峰度。 下表分别给出甲班和乙班的计算过程。,x f甲 x f甲,x f乙 x f乙,可算得两个班的平均成绩、标准差、 偏态系数、峰态系数分别为:,由此可见,两个班级的平均成绩相同,标准差也几乎相同,样本偏度分别为:-0.16和0.068,显示两个班的成绩都是基本对称的。但两个班的样本峰度明显不同。乙班的成绩分布比较平坦,而甲班则稍显尖顶。,次序统计量及其分布,设x1,x2,xn ,是取自总体X的样本,x(i) 称为该样本的第i个次序统计量,它的取值是将样本观测值由小到大排
8、列后得到的第i个观测值。其中 x(1) =minx1,x2,xn称为该样本的最小次序统计量 x (n) =max x1,x2,xn 称为该样本的最大次序统计量。,x 0 1 2 p 1/3 1/ 3 1/3,例 设总体X的分布为仅取0,1,2的离散均匀分布,即分布列为,现从中抽取容量为3的样本,其一切可能取值有33=27种,现将它们列于下表左侧,其右侧是相应的次序统计量观测值。,由于样本取上述每一组观测值的概率相同,都为1/27,由此可给出x(1) ,x(2),x(3) 的分布列如下:,我们可以看到这三个次序统计量的分布是不同的。进 一步,我们可以给出两个次序统计量的联合分布,如x(1)和x(
9、2)的联合分布列。,因为P(x(1) =0) P(x(2) =0)=,而P(x(1) =0,x(2) =0)=7/27,两者不等, 因此可看出x(1)和x(2) 是不独立的。,单个次序统计量的分布 定理 设总体X的密度函数为p (x),分布函数为 F (x),x1,x2,x n 为样本,则第k个次序统计量 x (k) 的密度函数为,特别,令k=1和k=n即得到最小次序统计量x(1)和最大次序统计量x (n)的密度函数分别为:,例 设总体密度函数为p (x)=3x2 ,0x1,现从该 总体抽得一个容量为5的样本,试计算P(x(2) 1/2)。,解 首先应求出x(2)的分布。 由总体密度函数不难求
10、出总体分布函数为,于是P(x(2) 1/2),由公式可以得到x(2)的密度函数为,例 设总体分布为U(0,1),x1,x2,x n 为样本,则 其第k个次序统计量的密度函数为,这就是前面介绍的Be(k,n-k+1),多个次序统计量的联合分布 定理 次序统计量(x (i) , x (j) (ij)的联合分布 的 密度函数为,在实际问题中会用到一些次序统计量的函数。 如:R n= x (n) x (1) 称为样本极差, 它是一个常用的统计量。,例 设总体分布为U(0,1),x1,x2,x n为样本,则(x(1) ,x (n)的联合密度函数为,令R n= x (n) - x(1),由R0可以推出 0
11、 x(1) = x (n) R,则,这正是参数为(n-1,2)的贝塔分布。,样本分位数与样本中位数 样本中位数也是一个很常用的统计量,它也是次序统计量的函数,通常如下定义。 设x(1),x (n)是有序样本,则样本中位数m0.5定义为,更一般的,样本p分位数,mp可如下定义:,定理 设总体密度函数为p(x),xp为其p分位数, p(x)在xp处连续且p (x p)0,则当 时, 样本p分位数mp的渐近分布为,例 设总体为柯西分布,密度函数为,其分布函数为,设x(1),x (n)是来自该总体的样本,当样本量n较大时,样本中位数m0.5的渐近分布为,次序统计量的应用之一是五数概括与箱线图。在得到有序样本后,容易计算如下五个值: 最小观测值x min=x (1) ;中位数m0.5;第一4分位数Q1= m0.25 ;第三4分位数Q3=m0.75 ; 最大观测值x max=x (n) , 所谓五数概括就是指用这五个数: x min ,Q1 ,m0.5 ,Q3,x max 来大致描述一批数据的轮廓。,五数概括与箱线图,下表是某厂160名销售人员某月的销售数据的有序样本,由该批数据可计算得: xmin=45,xmax =319,m0.5 =181,Q1 =144, Q3 =212
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 江苏理工学院《基础俄语二》2023-2024学年第二学期期末试卷
- 淮阴师范学院《魏晋玄学》2023-2024学年第二学期期末试卷
- 四川音乐学院《城市建设与工程地质》2023-2024学年第二学期期末试卷
- 医疗器械销售服务合同书
- 快递公司授权合同
- 合作投资经营合同
- 出口贸易交易磋商订立合同阶段
- 设备借用合同
- 主持人劳务协议合同
- 代工生产合作合同协议
- 2024年许昌职业技术学院单招职业技能测试题库及答案解析
- 中国能源建设集团投资有限公司社会招聘考试试题及答案
- 【地理】2023-2024学年人教版地理七年级下册 期中区域复习课件
- 向世界介绍悠久灿烂的中华传统文化-统编三下第三单元整体设计教案
- 人教版七年级数学下册 第七章 平面直角坐标系小结与复习(课件)
- WizdomCloudUrban-EP-RM-013-市政综合监管平台用户操作手册
- 安琪酵母生产工艺
- 2024近零碳园区建设路径研究报告
- 眼科护理中的患者安全与风险评估
- 22 陈涉世家 公开课一等奖创新教学设计
- 心肌梗死诊疗指南
评论
0/150
提交评论