版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第6章统计量及其抽样分布6.1统计量6.2关于分布的几个概念6.3由正态分布导出的几个重要分布
6.4样本均值的分布与中心极限定理6.5样本比例的抽样分布6.6两个样本平均值之差的分布6.7关于样本方差的分布
6.1
统计量6.1.1统计量的概念6.1.2常用统计量6.1.3次序统计量
6.1.4充分统计量
6.1.1统计量的概念(statistic)设X1,X2,…,Xn是从总体X中抽取的容量为n的一个样本,假如由此样本构造一个函数T(X1,X2,…,Xn),不依靠于任何未知参数,则称函数T(X1,X2,…,Xn)是一个统计量样本均值、样本比例、样本方差等都是统计量统计量是样本的一个函数统计量是统计推断的基础6.1.2常用统计量样本均值样本方差样本变异系数样本k阶矩样本k阶中心矩样本偏度样本峰度驾驭一般了解6.1.3次序统计量一组样本观测值X1,X2,…,Xn由小到大的排序
X(1)≤X(2)≤…≤X(i)≤…≤X(n)后,称X(1),X(2),…,X(n)为次序统计量中位数、分位数、四分位数等都是次序统计量6.1.4充分统计量统计量加工过程中一点信息都不损失的统计量称为充分统计量。当X=(X1,X2,…,Xn)是来自正态分布总体N(m,s2)的一个样本时,若m已知,则是s2
的充分统计量;若s2已知,则是m
的充分统计量。方差均值6.2
关于分布的几个概念6.2.1抽样分布6.2.2渐进分布6.2.3随机模拟获得的近似分布
为什么要抽样? 为了收集必要的资料,对所探讨对象(总体)的全部元素逐一进行观测,往往不很现实。抽样缘由元素多,搜集数据费时、费用大,不刚好而使所得的数据无意义总体浩大,难以对总体的全部元素进行探讨检查具有破坏性炮弹、灯管、砖等关于总体,知道得很少全部数据何种分布+样本数据已知总体特征总体特征想知道描述性统计,计算参数统计推断为什么能抽样?中国成语:“一叶知秋”出自《淮南子·说山训》:“以小明大,见一叶落而知岁之将暮,睹瓶中之冰而知天下之寒。”谚语:“你不必吃完整头牛,才知道肉是老的”从检查一部分得知全体。复习抽样方法简单随机抽样分层抽样整群抽样系统抽样多阶段抽样概率抽样方便抽样判断抽样自愿样本滚雪球抽样配额抽样非概率抽样抽样方式样本统计量的概率分布,是一种理论分布在重复选取容量为n的样本时,由该统计量的全部可能取值形成的相对频数分布随机变量是样本统计量样本均值,样本比例,样本方差等结果来自容量相同的全部可能样本供应了样本统计量长远而稳定的信息,是进行推断的理论基础,也是抽样推断科学性的重要依据 6.2.1抽样分布(samplingdistribution)抽样分布的形成过程(samplingdistribution)总体计算样本统计量如:样本均值、比例、方差样本当样本量n无限增大时,计算统计量T(X1,X2,…,Xn)的极限分布,把极限分布作为抽样分布的一种近似,这种极限分布就被称为渐近分布。6.2.2渐近分布6.2.3随机模拟获得的近似分布
随机模拟:大样本时,样本均值听从正态分布吗?提示:EXCEL——数据分析——随机数发生器思索几种概率分布正态分布分布
F分布
t分布6.3由正态分布导出的几个重要分布6.3.12分布(2
distribution)设随机变量X1,X2,…,Xn相互独立,且,则听从自由度为n的2分布。当总体,从中抽取容量为n的样本,则由阿贝(Abbe)
于1863年首先给出,后来由海尔墨特(Hermert)和卡·皮尔逊(K·Pearson)
分别于1875年和1900年推导出来。&&6.3.12分布(2
distribution)2分布的概率密度函数分布的变量值始终为正分布的形态取决于其自由度n的大小,通常为不对称的正偏分布,但随着自由度的增大渐渐趋于对称期望为:E(2)=n,方差为:D(2)=2n(n为自由度)可加性:若U和V为两个独立的2分布随机变量,U~2(n1),V~2(n2),则U+V这一随机变量听从自由度为n1+n2的2分布n→∞时,2分布的极限分布是正态分布。2分布(性质和特点)c2分布(图示)不同容量样本的抽样分布c2n=1n=4n=10n=20例题设随机变量,求中的。解:,查表:即临界值6.3.2t分布(t
distribution)高塞特(W.S.Gosset)于1908年在一篇以“Student”(学生)为笔名的论文中首次提出。设随机变量,,且X与Y独立,则,称为t分布,记为t(n),n为自由度。6.3.2
t分布(t
distribution)t分布的概率密度函数t分布数学期望与方差n≥2时,t分布期望为:E(t)=0,n≥3时,t分布方差为:D(t)=n/n-2(n为自由度)
t分布图示xt
分布与标准正态分布的比较t分布标准正态分布t不同自由度的t分布标准正态分布t(df=13)t(df=5)zt分布是类似正态分布的一种对称分布,它通常要比正态分布平坦和分散一个特定的分布依靠于称之为自由度的参数。随着自由度的增大,分布也渐渐趋于正态分布例题由统计学家费希尔(R.A.Fisher)提出的,以其姓氏的第一个字母来命名设若U为听从自由度为n1的2分布,即U~2(n1),V为听从自由度为n2的2分布,即V~2(n2),且U和V相互独立,则称F为听从自由度n1和n2的F分布,记为6.3.3
F分布(F
distribution)F分布的概率密度函数为:6.3.3
F分布(F
distribution)X~F(m,n),则
n>2时,期望为:E(X)=n/n-2
n>4时,方差为:F分布(图示)
不同自由度的F分布F(1,10)(5,10)(10,10)6.3.3
F分布(F
distribution)F分布与t分布关系假如随机变量X~t(n),,则X2~F(1,n)。例题6.4样本均值的分布与中心极限定理样本均值的抽样分布在重复选取容量为n的样本时,由样本均值的全部可能取值形成的相对频数分布一种理论概率分布推断总体均值的理论基础 样本均值的抽样分布(例题分析)【例】设一个总体含有4个个体,分别为X1=1、X2=2、X3=3、X4=4。总体的均值、方差及分布如下。总体均值和方差总体的频数分布14230.1.2.3样本均值的抽样分布现从总体中抽取n=2的简洁随机样本,在重复抽样条件下,共有42=16个样本。全部样本的结果如下表.3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二个观察值第一个观察值所有可能的n
=2的样本(共16个)样本均值的抽样分布
各样本的均值如下表,并给出样本均值的抽样分布x样本均值的抽样分布1.00.1.2.3P(x)1.53.04.03.52.02.53.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二个观察值第一个观察值16个样本的均值(x)全部样本均值的均值和方差1.样本均值的均值(数学期望)等于总体均值2.样本均值的方差等于总体方差的1/nM为样本数目样本均值的抽样分布与总体分布的比较=2.5σ2=1.25总体分布14230.1.2.3抽样分布样本均值的抽样分布1.00.1.2.3P(x)1.53.04.03.52.02.5构造样本统计量抽样分布的步骤1、从容量为N的有限总体中随机选取容量为n的全部可能样本;2、计算出每个样本的统计量值;3、将来自不同样本的不同统计量值分组排列,把对应于每个数值的相对出现频数排成另一列,由此,全部可能的样本统计量值形成了一个概率分布,这个分布就是我们想要得到的抽样分布。样本均值的抽样分布
与中心极限定理=50
=10X总体分布n=4抽样分布xn=16当总体听从正态分布N(μ,σ2)时,来自该总体的全部容量为n的样本的均值x也听从正态分布,x的数学期望为μ,方差为σ2/n。即x~N(μ,σ2/n)抽样分布的特征与总体分布的均值和方差有关。例:设从一个均值为10、标准差为0.6的总体中随机选取容量为36的样本。假定该总体不是很偏的,要求:(1)计算样本均值小于9.9的近似概率。(2)计算样本均值超过9.9的近似概率。(3)计算样本均值在总体均值10旁边0.1范围内的近似概率。中心极限定理(centrallimittheorem)当样本容量足够大时(n
30),样本均值的抽样分布逐渐趋于正态分布从均值为,方差为2的一个随意总体中抽取容量为n的样本,当n充分大时,样本均值的抽样分布近似听从均值为μ、方差为σ2/n的正态分布一个任意分布的总体x中心极限定理
(centrallimittheorem)x的分布趋于正态分布的过程样本均值的抽样分布与总体分布的关系总体分布正态分布非正态分布大样本小样本正态分布正态分布非正态分布总体(或样本)中具有某种属性的单位与全部单位总数之比不同性别的人与全部人数之比合格品(或不合格品)与全部产品总数之比总体比例可表示为样本比例可表示为
6.5样本比例(proportion)的抽样分布在重复选取容量为n的样本时,由样本比例的全部可能取值形成的相对频数分布一种理论概率分布当样本容量很大时,样本比例的抽样分布可用正态分布近似推断总体比例的理论基础 样本比例的抽样分布样本比例的数学期望样本比例的方差重复抽样不重复抽样样本比例的抽样分布
(数学期望与方差)有限总体校正系数
FinitePopulationCorrectionFactor留意:不重复抽样时样本均值的方差等于重复抽样时的方差乘以有限总体校正系数:
当n/N<0.05时可以忽视有限总体校正系数。数学期望和方差的主要数学性质假如X是一随机变量,C是一常数,则CX与X有相同的分布形态。设E(X)=m,D(X)=s2,则若C是一常数,则E(CX)=CE(X)=Cm,D(CX)=C2s2。补充:对于随意两个随机变量X、Y,有E(X+Y)=E(X)+E(Y)若两个随机变量X、Y相互独立,则E(XY)=E(X)E(Y)若两个随机变量X、Y相互独立,则D(X+Y)=D(X)+D(Y)例题例:设X~N(9,4),试描述10X的抽样分布。解:E(10X)=10E(X)=90D(10X)=102s2=400所以,10X~N(90,400)。例:假定某统计人员在其填写的报表中有2%至少会有一处错误,假如我们检查了一个由600份报表组成的随机样本,其中至少有一处错误的报表所占的比例在0.025~0.070之间的概率有多大?6.7关于样本方差的分布6.7.1样本方差的分布
6.7.1样本方差的分布在重复选取容量为n的样本时,由样本方差的全部可能取值形成的相对频数分布对于来自正态总体的简洁随机样本,则比值的抽样分布听从自由度为(n-1)的2分布,即例题调整一个装瓶机使其对每个瓶子的灌装量均值为m盎司,通过视察这台装瓶机对每个瓶子的灌装量听从标准差s=1盎司的正态分布。随机抽取由这台机器灌装的10个瓶子形成一个样本,并测定每个瓶子的灌装量,计算出样本方差,试确定一个合适范围,使得样本方差落入其中的概率为90%。第6章小结统计量及其分布由正态分布导出的几个重要分布样本均值的分布与中心极限定理样本比例的抽样分布关于样本方差的分布第6章课堂练习1.抽样调查的主要目的是()。
A.用样本统计量来推断总体参数B.对调查单位作深化探讨C.计算和限制抽样误差D.广泛运用数学方法
2.抽样分布是指()。A.一个样本各观测值的分布B.总体中各观测值的分布C.样本统计量的分布D.样本数量的分布AC3.从听从正态分布的无限总体中分别抽取容量为4,16,36的样本,当样本容量增大时,样本均值的标准差()。A.保持不变B.增加C.减小D.无法确定4.假设总体比例为0.55,从今总体中抽取容量为100的样
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 酒店技工培训
- 棋类社团比赛活动安排计划
- 班级荣誉感的培养途径计划
- 西南林业大学《文学概论》2021-2022学年第一学期期末试卷
- 西南交通大学《微机与接口技术》2021-2022学年第一学期期末试卷
- 西京学院《中国历代文学作品》2021-2022学年第一学期期末试卷
- 妊娠期糖尿病的管理
- 2024年01月11044合同法期末试题答案
- 西北大学《外国美术史》2021-2022学年第一学期期末试卷
- 西华大学《开源硬件与编程》2021-2022学年第一学期期末试卷
- 2024年黑龙江省齐齐哈尔市中考数学试题
- 天津市和平区天津益中学校2021-2022学年七年级上学期期末数学试题
- 计算机图形学智慧树知到期末考试答案章节答案2024年北京理工大学
- 漆画技法教程智慧树知到期末考试答案章节答案2024年哈尔滨师范大学
- 保险公司农险部述职报告
- 西昌古诗文品读智慧树知到期末考试答案2024年
- 2024年加油站项目申请报告
- 人工智能中的因果驱动智慧树知到期末考试答案2024年
- 医疗新技术新项目汇报
- 大学生视觉传达设计职业规划
- 机械创新设计方案报告
评论
0/150
提交评论