版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
为什么要进行抽样?如何进行简单随机抽样?正态分布、分布、F分布、t分布的定义、图形分布形态如何?中心极限定理的含义如何?
1/55为什么要进行抽样?1/554.1关于抽样的基本概念
为什么要抽样? 为了收集必要的资料,对所研究对象(总体)的全部元素逐一进行观测,往往不很现实。抽样原因元素多,搜集数据费时、费用大,不及时而使所得的数据无意义总体庞大,难以对总体的全部元素进行研究检查具有破坏性炮弹、灯管、砖等24.1关于抽样的基本概念为什么要抽样?抽元素多,搜集数据简单随机抽样(x1,x2,……,xn): 简单随机抽样是指从总体中抽取样本容量为n的样本时,x1,x2,……,xn这n个随机变量必须具备以下两个条件:这n个随机变量与总体X具有相同的概率分布;它们之间相互独立。4.1关于抽样的基本概念
3简单随机抽样(x1,x2,……,xn):4.1关于抽
甲乙丙丁四个生产商,其产品质量如下表所示: 如果仅从甲乙两个生产商的产品中进行抽样,抽样质量就偏高;如果仅从丙丁两个生产商的产品中进行抽样,抽样质量就偏低; 因此采用简单随机抽样保证随机样本与总体具有相同的概率分布。甲乙丙丁质量高高低低表4-14.1关于抽样的基本概念
4 甲乙丙丁四个生产商,其产品质量如下表所示:甲乙丙丁质量高高样本统计量与抽样分布: 在简单随机抽样中,样本具有随机性,样本的参数,s2等也会随着样本不同而不同,故它们是样本的函数,记为g(x1,x2,…,xn),称为样本统计量。
统计量的概率分布称为抽样分布(Sample distribution)
4.1关于抽样的基本概念
5样本统计量与抽样分布:4.1关于抽样的基本概念5统计量定义:设为来自总体X的一个样本,为一个函数,如果中不包含任何未知参数,则称为样本的一个统计量。样本均值样本方差K阶样本矩常见的统计量练习证明:K阶中心矩6统计量定义:设为来自总体几种概率分布正态分布分布
F分布
t分布4.2几种与正态分布有关的概率分布7几正态分布分布F分布t分布4.若随机变量X的概率密度函数记为(1)正态分布8记为(1)正态分布8图4-1一般正态分布(1)正态分布9图4-1一般正态分布(1)正态分布9标准正态分布:
当时, 记为U∽N(0,1)图4-2标准正态分布(1)正态分布10标准正态分布:图4-2标准正态分布(1)正态分布10非标准正态分布向标准正态分布的转化
若
标准化因子
则U∽N(0,1)(1)正态分布11非标准正态分布向标准正态分布的转化(1)正态分布11 查表 当u大于零时,可查正态分布表 但如果u<0时,则可由式求出(1)正态分布12 查表(1)正态分布121313线性性质: 如果,且相互独立。对于常数,有下式成立:(1)正态分布14线性性质:(1)正态分布14 相互独立且均为服从N(0,1)分布的随机变量,则称随机变量所服从的分布是自由度为n的分布,且记。定义(2)分布15定义(2)分布15自由度是指独立随机变量的个数,分布的密度函数为——分布16自由度是指独立随机变量的个数,分布的密度函数为——分图4-3χ2分布密度函数图形(2)分布01357911131517x0.50.40.30.20.1n=1n=4n=10图4-3f(x)其图形随自由度的不同而有所改变.17图4-3χ2分布密度函数图形(2)分布013查表:对于给定的α,0<α<1,可在分布表中查得,即 例如
即指(2)分布18查表:(2)分布18满足的数为
2分布的上分位数或上侧临界值,其几何意义见右图所示.其中f(x)是
2-分布的概率密度.f(x)x0图4-4显然,在自由度n取定以后,的值只与有关.例如,当n=21,=0.05时,由附表4(P207)可查得,32.67即2分布的上分位数19满足的数为2分布的其几何意性质:如果,则;设,且相互独立,则若,已知相互独 立,,则(2)分布20性质:(2)分布20总体,是X的一个样本,为样本的平均数,
为样本的方差。 则: a.相互独立
b.(2)分布21(2)分布21(b)式的自由度为什么是n-1?从表面上看,是n个正态随机变量的平方和,但实际上它们不是独立的,它们之间有一种线性约束关系:=0这表明,当这个n个正态随机变量中有n-1个取值给定时,剩下的一个的取值就跟着唯一确定了,故在这n项平方和中只有n-1项是独立的.所以(b)式的自由度是n-1.22(b)式的自由度为什么是n-1?从表面上看,是n个正态随机变232324242525 设相互独立的随机变量V和W分别服从自由度为n1,n2的分布,即, 则随机变量服从F分布。n1,n2分别是它的第一自由度和第二自由度,且通常记为定义(3)F分布26定义(3)F分布26图4-5F分布图F(3)F分布27图4-5F分布图F(3)F分布27查表性质(3)F分布(请自行给出证明)28查表(3)F分布(请自行给出证明)28 设随机变量U服从标准正态分布,随机变量W服从自由度为n的分布,且U与W相互独立, 则称随机变量服从自由度为n的t分布,记为T~t(n)。定义(4)t分布(Students分布)29定义(4)t分布(Students分布)29图4-6n=∞正态分布n=10n=1t分布图(4)t分布(Students分布)30图4-6n=∞正态分布t分布图(4)t分布(Student查表或性质: 当n很大时, 此时,tα/2≈uα/2,t分布近似标准正态分布。
(4)t分布(Students分布)31查表(4)t分布(Students分布)31定理设(X1,X2,…,Xn)为来自正态总体
X~N(
,
2)的样本,则统计量证由于与S
2相互独立,且由定义得32定理设(X1,X2,…,Xn)为来自正态总体证由于与S2相无限总体: 设总体X~N(μ,σ2),X1,X2,…,Xn是总体X的随机样本,样本平均数,则4.3样本平均数的抽样分布33无限总体:4.3样本平均数的抽样分布33有限总体 有限总体若采取有放回抽样,则与无限总体等价。有限总体容量为N而采取无放回抽样,且n/N≤0.1,仍可视为无限总体,而当n/N>0.1时则称式为有限总体的修正系数。4.3样本平均数的抽样分布证明可以见<抽样调查的方法和原理>梁小筠p42一些复杂的展开,无技术含量(一网友留言)344.3样本平均数的抽样分布证明可以见<抽样调查的方法和原理
从总体中抽取样本容量为n的简单随机样本,当样 本容量n≥30时,样本均值的抽样分布可用正态 概率分布近似。4.4中心极限定理354.4中心极限定理35图4-64.4中心极限定理36图4-64.4中心极限定理36独立同分布的中心极限定理37独立同分布的中心极限定理37德莫佛——拉普拉斯定理38德莫佛——拉普拉斯定理38德莫佛——拉普拉斯定理的证明39德莫佛——拉普拉斯定理的证明39中心极限定理的意义我们知道,正态分布是现实生活中使用最多、最广泛、最重要的一种分布。许多随机变量本身并不属于正态分布,但它们的极限分布是正态分布。中心极限定理阐明了在什么条件下,原来不属于正态分布的一些随机变量其总和分布渐近地服从正态分布。为我们利用正态分布来解决这类随机变量的问题提供了理论依据。40中心极限定理的意义我们知道,正态分布是现实生活中使用最例1解41例1解41例2解42例2解424343例3解44例3解44例445例445解46解46五、课堂练习47五、课堂练习47解148解148解249解249例4
设总体X~N(0,1),X1,X2,…,Xn为简单随机样本,试问下列统计量各服从什么分布?解(1)因为Xi~N(0,1),i=1,2,…,n.所以X1-X2~N(0,2),故~t(2).50例4设总体X~N(0,1),X1,X例4
设总体X~N(0,1),X1,X2,…,Xn为简单随机样本,试问下列统计量各服从什么分布?续解(2)因为X1~N(0,1),故~t(n-1).51例4设总体X~N(0,1),X1,X例4
设总体X~N(0,1),X1,X2,…,Xn为简单随机样本,试问下列统计量各服从什么分布?续解(3)因为所以~F(3,n-3).52例4设总体X~N(0,1),X1,X例5
若T~t(n),问T2服从什么分布?解因为T~t(n),可以认为其中U~N(0,1),V~2(n),U2~2(1),~F(1,n).53例5若T~t(n),问T2服从什么分布?解因为T~t(例6设总体X~N(
,42),X1,X2,…,X10是n=10简单随机样本,S2为样本方差,已知P{S2>}=0.1,求
.解因为n=10,n-1=9,
2=42,所以~2(9).又P{S2>}==0.1,所以≈查表14.684.故
≈14.684x≈26.10554例6设总体X~N(,42),X1,X2,…,X1例7设(X1,X2,…,Xn)为来自正态总体
X~N(
,
2)的样本,则统计量证由于与S
2相互独立,且由定义得55例7设(X1,X2,…,Xn)为来自正态总体证由于与S2为什么要进行抽样?如何进行简单随机抽样?正态分布、分布、F分布、t分布的定义、图形分布形态如何?中心极限定理的含义如何?
56/55为什么要进行抽样?1/554.1关于抽样的基本概念
为什么要抽样? 为了收集必要的资料,对所研究对象(总体)的全部元素逐一进行观测,往往不很现实。抽样原因元素多,搜集数据费时、费用大,不及时而使所得的数据无意义总体庞大,难以对总体的全部元素进行研究检查具有破坏性炮弹、灯管、砖等574.1关于抽样的基本概念为什么要抽样?抽元素多,搜集数据简单随机抽样(x1,x2,……,xn): 简单随机抽样是指从总体中抽取样本容量为n的样本时,x1,x2,……,xn这n个随机变量必须具备以下两个条件:这n个随机变量与总体X具有相同的概率分布;它们之间相互独立。4.1关于抽样的基本概念
58简单随机抽样(x1,x2,……,xn):4.1关于抽
甲乙丙丁四个生产商,其产品质量如下表所示: 如果仅从甲乙两个生产商的产品中进行抽样,抽样质量就偏高;如果仅从丙丁两个生产商的产品中进行抽样,抽样质量就偏低; 因此采用简单随机抽样保证随机样本与总体具有相同的概率分布。甲乙丙丁质量高高低低表4-14.1关于抽样的基本概念
59 甲乙丙丁四个生产商,其产品质量如下表所示:甲乙丙丁质量高高样本统计量与抽样分布: 在简单随机抽样中,样本具有随机性,样本的参数,s2等也会随着样本不同而不同,故它们是样本的函数,记为g(x1,x2,…,xn),称为样本统计量。
统计量的概率分布称为抽样分布(Sample distribution)
4.1关于抽样的基本概念
60样本统计量与抽样分布:4.1关于抽样的基本概念5统计量定义:设为来自总体X的一个样本,为一个函数,如果中不包含任何未知参数,则称为样本的一个统计量。样本均值样本方差K阶样本矩常见的统计量练习证明:K阶中心矩61统计量定义:设为来自总体几种概率分布正态分布分布
F分布
t分布4.2几种与正态分布有关的概率分布62几正态分布分布F分布t分布4.若随机变量X的概率密度函数记为(1)正态分布63记为(1)正态分布8图4-1一般正态分布(1)正态分布64图4-1一般正态分布(1)正态分布9标准正态分布:
当时, 记为U∽N(0,1)图4-2标准正态分布(1)正态分布65标准正态分布:图4-2标准正态分布(1)正态分布10非标准正态分布向标准正态分布的转化
若
标准化因子
则U∽N(0,1)(1)正态分布66非标准正态分布向标准正态分布的转化(1)正态分布11 查表 当u大于零时,可查正态分布表 但如果u<0时,则可由式求出(1)正态分布67 查表(1)正态分布126813线性性质: 如果,且相互独立。对于常数,有下式成立:(1)正态分布69线性性质:(1)正态分布14 相互独立且均为服从N(0,1)分布的随机变量,则称随机变量所服从的分布是自由度为n的分布,且记。定义(2)分布70定义(2)分布15自由度是指独立随机变量的个数,分布的密度函数为——分布71自由度是指独立随机变量的个数,分布的密度函数为——分图4-3χ2分布密度函数图形(2)分布01357911131517x0.50.40.30.20.1n=1n=4n=10图4-3f(x)其图形随自由度的不同而有所改变.72图4-3χ2分布密度函数图形(2)分布013查表:对于给定的α,0<α<1,可在分布表中查得,即 例如
即指(2)分布73查表:(2)分布18满足的数为
2分布的上分位数或上侧临界值,其几何意义见右图所示.其中f(x)是
2-分布的概率密度.f(x)x0图4-4显然,在自由度n取定以后,的值只与有关.例如,当n=21,=0.05时,由附表4(P207)可查得,32.67即2分布的上分位数74满足的数为2分布的其几何意性质:如果,则;设,且相互独立,则若,已知相互独 立,,则(2)分布75性质:(2)分布20总体,是X的一个样本,为样本的平均数,
为样本的方差。 则: a.相互独立
b.(2)分布76(2)分布21(b)式的自由度为什么是n-1?从表面上看,是n个正态随机变量的平方和,但实际上它们不是独立的,它们之间有一种线性约束关系:=0这表明,当这个n个正态随机变量中有n-1个取值给定时,剩下的一个的取值就跟着唯一确定了,故在这n项平方和中只有n-1项是独立的.所以(b)式的自由度是n-1.77(b)式的自由度为什么是n-1?从表面上看,是n个正态随机变782379248025 设相互独立的随机变量V和W分别服从自由度为n1,n2的分布,即, 则随机变量服从F分布。n1,n2分别是它的第一自由度和第二自由度,且通常记为定义(3)F分布81定义(3)F分布26图4-5F分布图F(3)F分布82图4-5F分布图F(3)F分布27查表性质(3)F分布(请自行给出证明)83查表(3)F分布(请自行给出证明)28 设随机变量U服从标准正态分布,随机变量W服从自由度为n的分布,且U与W相互独立, 则称随机变量服从自由度为n的t分布,记为T~t(n)。定义(4)t分布(Students分布)84定义(4)t分布(Students分布)29图4-6n=∞正态分布n=10n=1t分布图(4)t分布(Students分布)85图4-6n=∞正态分布t分布图(4)t分布(Student查表或性质: 当n很大时, 此时,tα/2≈uα/2,t分布近似标准正态分布。
(4)t分布(Students分布)86查表(4)t分布(Students分布)31定理设(X1,X2,…,Xn)为来自正态总体
X~N(
,
2)的样本,则统计量证由于与S
2相互独立,且由定义得87定理设(X1,X2,…,Xn)为来自正态总体证由于与S2相无限总体: 设总体X~N(μ,σ2),X1,X2,…,Xn是总体X的随机样本,样本平均数,则4.3样本平均数的抽样分布88无限总体:4.3样本平均数的抽样分布33有限总体 有限总体若采取有放回抽样,则与无限总体等价。有限总体容量为N而采取无放回抽样,且n/N≤0.1,仍可视为无限总体,而当n/N>0.1时则称式为有限总体的修正系数。4.3样本平均数的抽样分布证明可以见<抽样调查的方法和原理>梁小筠p42一些复杂的展开,无技术含量(一网友留言)894.3样本平均数的抽样分布证明可以见<抽样调查的方法和原理
从总体中抽取样本容量为n的简单随机样本,当样 本容量n≥30时,样本均值的抽样分布可用正态 概率分布近似。4.4中心极限定理904.4中心极限定理35图4-64.4中心极限定理91图4-64.4中心极限定理36独立同分布的中心极限定理92独立同分布的中心极限定理37德莫佛——拉普拉斯定理93德莫佛——拉普拉斯定理38德莫佛——拉普拉斯定理的证明94德莫佛——拉普拉斯定理的证明39中心极限定理的意义我们知道,正态分布是现实生活中使用最多、最广泛、最重要的一种分布。许多随机变量本身并不属于正态分布,但它们的极限分布是正态分布。中心极限定理阐明了在什么条件下,原来不属于正态分布的一些随机变量其总和分布渐近地服从正态分布。为我们利用正态分布来解决这类随机变量的问题提供了理论依据。95中心极限定理的意义我们知道,正态分布是现实生活中使用最例1解96例1解41例2解97例2解429843例3解99例3解44例4100例445解101解46五、课
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- GB/T 44844-2024工业通风机公差、换算及技术参数表示方法
- 爱久见人心歌词「梁静茹」
- 老师毕业寄语幼儿园大班简短
- 寒露唯美诗词
- 保育员辞职信范文
- 《餐厅消防培训资料》课件
- 大学生创新创业基础第三章 掌握创新方法
- 《现场定置管理培训》课件
- 孔雀东南飞课件教学
- 《K线技术培训》课件
- 油烟清洗报告【范本模板】
- 不负卿春-大学生职业生涯规划2059024-知到答案、智慧树答案
- 高等教育论文:论数字法学课程实验教学体系的构建
- 计算机应用基础(Windows 10+Office 2019)(第4版)课件 单元3 2019的应用
- 2024年商业地产行业展望:强基固本 向新而生-德勤
- 2024年版《安全生产法》
- 最完整的数据结构1800题含答案
- 家庭成员我照顾(第一课时) 劳动技术七年级下册
- 消防工程消防器材供应方案
- 就业指导课件(全)-就业形势
- 配电线路巡视培训课件
评论
0/150
提交评论