版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
数据分析
(方法与案例)
作者贾俊平统计学统
计
学
Statisticsyyyy-M-数学定律不能百分之百确切地用在现实生活里;能百分之百确切地用数学定律描述的,就不是现实生活
——AlberEinstein统计名言第4
章概率分布4.1度量事件发生的可能性3.2随机变量概率分布3.3由正态分布导出的几个重要分布3.4样本统计量的概率分布probabilityyyyy-M-学习目标度量事件发生的可能性—概率离散型概率分布二项分布,泊松分布,超几何分布连续型概率分布正态分布由正态分布导出的几个重要分布c2-分布,t-分布,F-分布样本统计量的概率分布yyyy-M-神州七号飞船遭遇空间碎片的概率有多大?2008年9月25日21:10分,搭载着神舟七号载人飞船的长征二号F型运载火箭,在酒泉卫星发射中心成功发射升空,并在完成中国航天员首次太空行走和各项科学试验任务后,于2008年9月28日17时38分安全返回
太空中充斥着难以计数的空间碎片,随时会给飞船带来致命的冲击。据中国科学院空间环境研究预报中心预测,神州七号载人航天飞船在飞行期间遭遇空间碎片的概率在百万分之一以下yyyy-M-神州七号飞船遭遇空间碎片的概率有多大?空间碎片是人类空间活动的产物,包括完成任务的火箭箭体和卫星本体、火箭的喷射物、航天员的抛弃物、空间物体之间碰撞产生的碎块等,是空间环境的主要污染源。空间碎片的飞行速度平均每秒10公里,最高时速达每秒16公里。在这样的速度下,一个1厘米的碎片就可以把拥有各种防护功能的飞船打穿一个洞。航天员的舱外航天服更经不起碰撞据中国科学院空间环境研究预报中心预测专家说,世界各国联合起来对10厘米至30厘米的大块碎片进行监测,是能够发现它的轨迹的。但对于较小的碎片,人类的观测设备没有办法观测得到,因此还没有办法较为准确地掌握它的运行轨迹,只能通过它碰撞、破碎的演化规律来尽可能多地了解它的运行yyyy-M-神州七号飞船遭遇空间碎片的概率有多大?目前可被地面观测设备观测并测定其轨道的空间物体超过9000个,其中只有6%是仍在工作的航天器,其余为空间碎片在神舟七号载人航天飞行期间,预计将有10个左右的危险时段可能会遭遇空间碎片的碰撞,只要避开这些危险时段,碰撞的概率都是在百万分之一以下。即使是在那几个危险的时段,飞船或航天员与空间碎片碰撞的概率也在万分之一以下
据中国科学院空间环境研究预报中心专家称,这种小概率事件意味着我们几乎可以保证飞船不会与空间碎片相撞4.1度量事件发生的可能性概率是什么?怎样获得概率?怎样理解概率?第4章概率分布yyyy-M-什么是概率?
(probability)概率是对事件发生的可能性大小的度量明天降水的概率是80%。这里的80%就是对降水这一事件发生的可能性大小的一种数值度量你购买一只股票明天上涨的可能性是30%,这也是一个概率一个介于0和1之间的一个值,事件A的概率记为P(A)yyyy-M-怎样获得概率?重复试验(要求事件发生是独立的、等概率的)当试验的次数很多时,概率P(A)可以由所观察到的事件A发生次数(频数)的比例来逼近在相同条件下,重复进行n次试验,事件A发生了m次,则事件A发生的概率可以写为
用类似的比例来逼近一家餐馆将生存5年的概率,可以用已经生存了5年的类似餐馆所占的比例作为所求概率一个近似值主观概率yyyy-M-怎样理解概率?
投掷一枚硬币,出现正面和反面的频率,随着投掷次数n的增大,出现正面和反面的频率稳定在1/2左右(注意:抛掷完成后,其结果就是一个数据,要么一定是正面,要么一定是反面,就不是概率问题了)试验的次数正面/试验次数1.000.000.250.500.7502550751001254.2随机变量的概率分布
4.2.1随机变量及其概括性度量
4.2.2离散型概率分布
4.2.3连续型概率分布第4章概率分布4.2.1随机变量及其概括性度量4.2随机变量的概率分布yyyy-M-随机变量
(randomvariables)从样本空间映射到实数的函数称为随机变量(例:摸有颜色的球)样本空间:随机试验中出现的所有可能的结果的集合,记为S={e}。为研究随机现象,需要对随机试验的结果进行赋值,记为X=X(e)随机变量一般用X,Y,Z来表示,随机变量的取值用x,y,z表示。随机变量X取值为x的概率记为yyyy-M-离散型随机变量
(discreterandomvariables)随机变量X
取有限个值或所有取值都可以逐个列举出来x1,x2,…以确定的概率取这些不同的值离散型随机变量的一些例子试验随机变量可能的取值抽查100个产品一家餐馆营业一天电脑公司一个月的销售销售一辆汽车取到次品的个数顾客数销售量顾客性别0,1,2,…,1000,1,2,…0,1,2,…男性为0,女性为1yyyy-M-累积分布函数
(cumulativedistributionfunction)考虑随机变量X落在某个区间(x1,x2)的概率,
(餐馆一天的顾客在100-200的概率)累积分布函数(cdf)
yyyy-M-连续型随机变量
(continuousrandomvariables)可以取一个或多个区间中任何值所有可能取值不可以逐个列举出来,而是取数轴上某一区间内的任意点概率密度函数(probabilitydensityfunction)yyyy-M-连续型随机变量的概率概率是曲线下的面积!abxf(x)yyyy-M-连续型随机变量
(continuousrandomvariables)连续型随机变量的一些例子试验随机变量可能的取值抽查一批电子元件新建一座住宅楼测量一个产品的长度使用寿命(小时)半年后完工的百分比测量误差(cm)X
00
X100X
0yyyy-M-离散型随机变量的期望值
(expectedvalue)描述离散型随机变量取值的集中程度离散型随机变量X的所有可能取值xi与其取相对应的概率pi乘积之和记为
或E(X),计算公式为yyyy-M-离散型随机变量的方差
(variance)随机变量X的每一个取值与期望值的离差平方的数学期望,记为
2
或D(X),描述离散型随机变量取值的分散程度计算公式为方差的平方根称为标准差,记为
或
D(X)yyyy-M-离散型数学期望和方差
(例题分析)
【例4-1】一家电脑配件供应商声称,他所提供的配件100个中拥有次品的个数及概率如下表。求该供应商次品数的数学期望和标准差次品数X=xi0123概率P(X=xi)
pi0.750.120.080.05yyyy-M-连续型随机变量的期望和方差连续型随机变量的期望值方差yyyy-M-连续型随机变量的期望和方差随机变量的期望不一定存在
柯西随机变量,概率密度函数为
期望不存在。期望不存在,方差也就不存在。
方差不存在,期望可能存在,也可能不存在。
yyyy-M-随机变量的期望与方差的关系
(variance)数据的均值、方差与随机变量的期望、方差的区别
随机变量
独立的定义
证明
4.2.2离散型概率分布4.2随机变量的概率分布yyyy-M-离散型随机变量的概率分布列出离散型随机变量X的所有可能取值列出随机变量取这些值的概率通常用下面的表格来表示X=xix1,x2
,…
,xnP(X=xi)=pip1,p2
,…
,pn
P(X=xi)=pi称为离散型随机变量的概率函数pi0;常用的有二项分布、泊松分布、超几何分布等yyyy-M-二项试验
(Bernoulli试验)
二项分布建立在Bernoulli试验基础上贝努里试验满足下列条件(例:抛硬币)一次试验只有两个可能结果,即
“成功”和“失败”“成功”是指我们感兴趣的某种特征一次试验“成功”的概率为p,失败的概率为q=1-p,且概率p对每次试验都是相同的
试验是相互独立的,并可以重复进行n次
在n次试验中,“成功”的次数对应一个离散型随机变量X
yyyy-M-二项分布
(Binomialdistribution)重复进行
n
次试验,出现“成功”的次数的概率分布是二项分布,记为X~B(n,p)相互独立的n个事件都发生的概率是每个事件发生的概率的乘积(例,掷2个硬币都为正面的概率)。n重伯努利试验都是独立的,其中x次试验成功的概率是,n-x试验失败的概率是
,所以,n重伯努利试验出现x次成功的概率是yyyy-M-二项分布
(Binomialdistribution)只考虑出现次数,不考虑排序,这种结果共有次。所以,n次重复试验中成功次数为x
的概率yyyy-M-二项分布
(期望值和方差)期望值
1次伯努利试验的期望
n次独立的伯努利试验的期望:方差
1次伯努利试验的方差
n次独立的伯努利试验的方差:
yyyy-M-二项分布
(例题分析)
【例4-2】已知一批产品的次品率为4%,从中任意有放回地抽取5个。求5个产品中
(1)没有次品的概率是多少?
(2)恰好有1个次品的概率是多少?
(3)有3个以下次品的概率是多少?yyyy-M-二项分布
(用Excel计算概率)第1步:在Excel表格界面,直接点击【fx】(插入函数)命令
第2步:在【选择类别】中点击【统计】,并在【选择函数】
中点击【BINOMDIST】,然后单击【确定】第3步:在【Number_s】后填入试验成功次数(本例为1)
在【Trials】后填入总试验次数(本例为5)
在【Probability_s】后填入试验的成功概率(本例为
0.04)
在【Cumulative】后填入0(或FALSE),表示计算成功次数恰好等于指定数值的概率(填入1或TRUE表示计算成功次数小于或等于指定数值的累积概率值)计算二项分布的概率Excelyyyy-M-泊松分布
(Poissondistribution)1837年法国数学家泊松(D.Poisson,1781—1840)首次提出用于描述在一指定时间范围内或在一定的长度、面积、体积之内每一事件出现次数的分布泊松分布的例子一定时间段内,某航空公司接到的订票电话数一定时间内,到车站等候公共汽车的人数一定路段内,路面出现大损坏的次数一定时间段内,放射性物质放射的粒子数一匹布上发现的疵点个数一定页数的书刊上出现的错别字个数
yyyy-M-泊松分布
(概率分布函数)
—给定的时间间隔、长度、面积、体积内“成功”的强度参数e=2.71828x—给定的时间间隔、长度、面积、体积内“成功”的次数yyyy-M-泊松分布
(期望值和方差)期望值
E(X)=
方差
D(X)=
0.00.20.40.6012345XP(X)0.00.20.40.60246810XP(X)l
=6l
=0.5yyyy-M-泊松分布
(期望值和方差)
yyyy-M-泊松分布
(期望值和方差)
yyyy-M-泊松分布
(期望值和方差)
yyyy-M-泊松分布
(例题分析)【例4-3】假定某航空公司预订票处平均每小时接到42次订票电话,那么10分钟内恰好接到6次电话的概率是多少?解:设X=10分钟内航空公司预订票处接到的电话次数
yyyy-M-泊松分布
(用Excel计算概率)第1步:在Excel表格界面,直接点击【fx】(插入函数)命令
第2步:在【选择类别】中点击【统计】,并在【选择函数】
中点击【POISSON
】,然后单击【确定】第3步:在【X】后填入事件出现的次数(本例为6)
在【Means】后填入泊松分布的均值
(本例为7)
在【Cumulative】后填入0(或FALSE),表示计算成功次数恰好等于指定数值的概率(填入1或TRUE表示计算成功次数小于或等于指定数值的累积概率值)计算泊松分布的概率Excelyyyy-M-超几何分布
(hypergeometricdistribution)采用不重复抽样,各次试验并不独立,成功的概率也互不相等总体元素的数目N很小,或样本容量n相对于N来说较大时,样本中“成功”的次数则服从超几何概率分布,以摸双色球解释:
盒子里N个球,其中M个红球,N-M个黑球,摸出n个球,其中红球个数为x的概率服从超几何分布。yyyy-M-超几何分布
(hypergeometricdistribution)概率分布函数为yyyy-M-超几何分布
(例题分析)【例4-4】假定有10支股票,其中有3支购买后可以获利,另外7支购买后将会亏损。如果你打算从10支股票中选择4支购买,但你并不知道哪3支是获利的,哪7支是亏损的。求
(1)有3支能获利的股票都被你选中的概率有多大?
(2)3支可获利的股票中有2支被你选中的概率有多大?解:设N=10,M=3,n=4yyyy-M-超几何分布
(用Excel计算概率)第1步:在Excel表格界面,直接点击【fx】(插入函数)命令
第2步:在【选择类别】中点击【统计】,并在【选择函数】
中点击【HYPGEOMDIST】,然后单击【确定】第3步:在【Sample_s】后填入样本中成功的次数x(本例为3)
在【Number_sample】后填入样本容量n(本例为4)
在【Population_s】后填入总体中成功的次数M(本例为3)
在【Number_pop】后填入总体中的个体总数N
(本例为10)计算超几何分布的概率Excel4.2.3连续型概率分布4.2随机变量的概率分布yyyy-M-连续型随机变量的概率分布连续型随机变量可以取某一区间或整个实数轴上的任意一个值它取任何一个特定的值的概率都等于0不能列出每一个值及其相应的概率通常研究它取某一区间值的概率用概率密度函数的形式和分布函数的形式来描述yyyy-M-常用连续型概率分布yyyy-M-正态分布
(normaldistribution)由C.F.高斯(CarlFriedrichGauss,1777—1855)作为描述误差相对频数分布的模型而提出描述连续型随机变量的最重要的分布许多现象都可以由正态分布来描述可用于近似离散型随机变量的分布例如:二项分布经典统计推断的基础xf(x)yyyy-M-概率密度函数f(x)=随机变量X的频数
=正态随机变量X的均值
=正态随机变量X的方差
=3.1415926;e=2.71828x=随机变量的取值(-
<x<+
)yyyy-M-正态分布函数的性质图形是关于x=
对称钟形曲线,且峰值在x=
处均值
和标准差
一旦确定,分布的具体形式也惟一确定,不同参数正态分布构成一个完整的“正态分布族”均值
可取实数轴上的任意数值,决定正态曲线的具体位置;标准差决定曲线的“陡峭”或“扁平”程度。
越大,正态曲线扁平;
越小,正态曲线越高陡峭当X的取值向横轴左右两个方向无限延伸时,曲线的两个尾端也无限渐近横轴,理论上永远不会与之相交正态随机变量在特定区间上的取值概率由正态曲线下的面积给出,而且其曲线下的总面积等于1
yyyy-M-
和
对正态曲线的影响xf(x)CAB
=1/2
1
2
=1yyyy-M-正态分布的概率概率是曲线下的面积!abxf(x)yyyy-M-标准正态分布
(standardizenormaldistribution)
标准正态分布的概率密度函数随机变量具有均值为0,标准差为1的正态分布任何一个一般的正态分布,可通过下面的线性变换转化为标准正态分布
标准正态分布的分布函数yyyy-M-正态分布
(用Excel计算正态分布的概率)第1步:在Excel表格界面中,点击“fx
”(插入函数)命令第2步:在【选择类别】中点击【统计】,并在【选择函数】
中点击【NORMDIST】,然后单击【确定】第3步:在【X】后输入正态分布函数计算的区间点(即x值)
在【Mean】后输入正态分布的均值在【Standard_dev】后输入正态分布的标准差在【Cumulative】后输入1(或TRUE)表示计算事件出现次数小于或等于指定数值的累概率单击【确定】yyyy-M-正态分布
(计算标准正态分布的概率和反函数值)第1步:在Excel表格界面中,点击“fx
”(插入函数)命令第2步:在【选择类别】中点击【统计】,并在【选择函数】中点击
【NORMSDIST】,单击【确定】第3步:在【Z】后输入Z的值。单击【确定】第1步:在Excel表格界面中,点击“fx
”(插入函数)命令第2步:在【选择类别】中点击【统计】,并在【选择函数】中点击
【NORMSINV】,然后单击【确定】第3步:在【Probability】后输入给定的概率值。单击【确定】计算概率计算z值yyyy-M-正态分布
(例题分析)【例4-5】计算以下概率
(1)
X~N(50,102),求和
(2)
Z~N(0,1),求和
(3)正态分布概率为0.05时,求标准正态累积分布函数的反函数值z
(4)X~N(50,102),求
=1-正态分布的计算概率
Excelyyyy-M-正态分布经验法则:
正态随机变量
落入期望加减1个标准差的概率是68.27%
落入期望加减2个标准差的概率是95.45%
落入期望加减3个标准差的概率是99.73%yyyy-M-数据正态性的评估对数据画出频数分布的直方图或茎叶图若数据近似服从正态分布,则图形的形状与上面给出的正态曲线应该相似绘制正态概率图。有时也称为分位数—分位数图或称Q-Q图或称为P-P图用于考察观测数据是否符合某一理论分布,如正态分布、指数分布、t分布等等P-P图是根据观测数据的累积概率与理论分布(如正态分布)的累积概率的符合程度绘制的Q-Q图则是根据观测值的实际分位数与理论分布(如正态分布)的分位数绘制的使用非参数检验中的Kolmogorov-Smirnov检验(K-S检验)yyyy-M-用SPSS绘制正态概率图
第1步:选择【Graphs】下拉菜单,并选择【P-P】
或【Q-Q】选项进入主对话框第2步:在主对话框中将变量选入【Variables】
,点击【OK】绘制正态概率图SPSSyyyy-M-正态概率图的绘制
(例题分析)P-P图Q-Q图
【例4-6】第2章中电脑销售额的正态概率图yyyy-M-正态概率图的分析
(normalprobabilityplots)实际应用中,只有样本数据较多时正态概率图的效果才比较好。当然也可以用于小样本,但此时可能会出现与正态性有较大偏差的情况在分析正态概率图时,最好不要用严格的标准去衡量数据点是否在一条直线上,只要近似在一条直线上即可对于样本点中数值最大或最小的点也可以不用太关注,除非这些点偏离直线特别远,因为这些点通常会与直线有偏离。如果某个点偏离直线特别远,而其他点又基本上在直线上时,这个点可能是离群点,可不必考虑4.3由正态分布导出的几个重要分布
4.3.1t
分布
4.3.2
2
分布
4.3.3F
分布第4章概率分布4.3.2
2
分布4.3由正态分布导出的几个重要分布yyyy-M-由阿贝(Abbe)
于1863年首先给出,后来由海尔墨特(Hermert)和卡·皮尔逊(K·Pearson)
分别于1875年和1900年推导出来随机变量,则随机变量
相互独立,且,则c2-分布
(
2-distribution)yyyy-M-分布的变量值始终为正分布的形状取决于其自由度n的大小,通常为不对称的正偏分布,但随着自由度的增大逐渐趋于对称,
时,
2
分布趋于正态分布。期望为:E(
2)=n,方差为:D(
2)=2n(n为自由度)可加性:若U和V为两个独立的
2分布随机变量,U~
2(n1),V~
2(n2),则U+V这一随机变量服从自由度为n1+n2的
2分布c2-分布
(性质和特点)yyyy-M-不同自由度的c2-分布c2n=1n=4n=10n=20yyyy-M-c2-分布
(用Excel计算c2分布的概率)利用Excel提供的【CHIDIST】统计函数,计算c2分布右单尾的概率值语法:CHIDIST(x,degrees_freedom)
,其中df为自由度,x,是随机变量的取值利用【CHIINV】函数则可以计算给定右尾概率和自由度时相应的反函数值语法:CHIINV(probability,degrees_freedom)
计算c2
分布的概率Excel4.3.1t
分布4.3由正态分布导出的几个重要分布yyyy-M-t-分布
(t-distribution)提出者是WilliamGosset,也被称为学生分布(student’st)
随机变量
,且XY相互独立,
则
的分布称为t分布,记为t(n),n为自由度。n=1,分布为柯西分布,无期望,无方差。
n=2,E(t)=0,无方差。
n>=3,E(t)=0,D(t)=n/(n-2)。yyyy-M-t-分布
(t-distribution)t
分布是类似正态分布的一种对称分布,通常要比正态分布平坦和分散,尾部比正态分布厚。一个特定的t分布依赖于称之为自由度的参数。随着自由度的增大,分布也逐渐趋于正态分布xt
分布与标准正态分布的比较t分布标准正态分布t不同自由度的t分布标准正态分布t(df=13)t(df=5)zyyyy-M-t-分布
(t-distribution)t
分布的一个重要应用
X1X2……Xn是来自于正态总体
的样本,则
yyyy-M-t-分布
(用Excel计算t分布的概率和临界值)利用Excel中的【TDIST】统计函数,可以计算给定值和自由度时分布的概率值语法:TDIST(x,degrees_freedom,tails)
利用【TINV】函数则可以计算给定概率和自由度时的相应
语法:TINV(probability,degrees_freedom)计算t分布的临界值Excel4.3.3F
分布4.3由正态分布导出的几个重要分布yyyy-M-为纪念统计学家费希尔(R.A.Fisher)
以其姓氏的第一个字母来命名则设若U为服从自由度为n1的
2分布,即U~
2(n1),V为服从自由度为n2的
2分布,即V~
2(n2),且U和V相互独立,则称F为服从自由度n1和n2的F分布,记为F-分布
(F
distribution)yyyy-M-不同自由度的F分布F(1,10)(5,10)(10,10)yyyy-M-F分布的期望和方差
设
,则
F分布与t分布的关系
F-分布的性质
(F
distribution)yyyy-M-F-分布
(用Excel计算F分布的概率和临街值)利用Excel提供的【FDIST】统计函数,计算分布右单尾的概率值语法:FDIST(x,degrees_freedom1,degrees_freedom2)利用【FINV】函数则可以计算给定单尾概率和自由度时的相应
语法:
FINV(probability,degrees_freedom1,degrees_freedom2)
计算F分布的概率Excel4.4样本统计量的概率分布
4.4.1统计量及其分布
4.4.2样本均值的分布
4.4.3其他统计量的分布
4.4.4统计量的标准误差第4章概率分布4.4.1统计量及其分布4.4样本统计量的概率分布yyyy-M-参数和统计量参数(parameter)描述总体特征的概括性数字度量,是研究者想要了解的总体的某种特征值一个总体的参数:总体均值(
)、标准差(
)、总体比例(
);两个总体参数:(
1-2)、(
1-2)、(
1/2)总体参数通常用希腊字母表示统计量(statistic)用来描述样本特征的概括性数字度量,它是根据样本数据计算出来的一些量,是样本的函数一个总体参数推断时的统计量:样本均值(
x)、样本标准差(s)、样本比例(p)等;两个总体参数推断时的统计量:(
x1-
x2)、(p1-p2)、(s1/s2)样本统计量通常用小写英文字母来表示yyyy-M-样本统计量是随机变量,样本统计量的概率分布—抽样分布,是一种理论分布在重复选取容量为n的样本时,由该统计量的所有可能取值形成的相对频数分布统计量的抽样分布可以度量用统计量推断总体参数的可靠性,构成了统计推断的理论基础。 抽样分布
(samplingdistribution)yyyy-M-抽样分布的形成过程
(samplingdistribution)总体样本计算样本统计量如:样本均值、比例、方差4.4.2样本均值的分布4.4样本统计量的概率分布yyyy-M-在重复选取容量为n的样本时,由样本均值的所有可能取值形成的相对频数分布总体为N,重复抽样,可能的样本数为Nn
,不重复抽样为,不可能全部抽出,
所以是一种理论分布。推断总体均值
的理论基础 样本均值的分布yyyy-M-样本均值的分布
(例题分析)【例4-10】设一个总体,含有4个元素(个体)
,即总体单位数N=4。4
个个体分别为x1=1,x2=2,x3=3,x4=4
。总体的均值、方差及分布如下总体分布14230.1.2.3均值和方差yyyy-M-样本均值的分布
(例题分析)
现从总体中抽取n=2的简单随机样本,在重复抽样条件下,共有42=16个样本。所有样本的结果为3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二个观察值第一个观察值所有可能的n=2的样本(共16个)yyyy-M-样本均值的分布
(例题分析)
计算出各样本的均值,如下表。并给出样本均值的抽样分布3.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二个观察值第一个观察值16个样本的均值(x)x样本均值的抽样分布1.000.10.20.3P
(x)1.53.04.03.52.02.5yyyy-M-样本均值的分布与总体分布的比较
(例题分析)
=2.5σ2=1.25总体分布样本均值分布yyyy-M-样本均值的分布样本均值的期望值和方差样本均值的分布
(数学期望与方差)
yyyy-M-证明
随机样本X1、X2、……,Xn取自
总体
,则样本均值的分布的证明yyyy-M-
样本均值的分布的证明yyyy-M-
样本均值的分布的证明yyyy-M-样本均值的分布
与中心极限定理
=50
=10X总体分布n=4抽样分布xn=16当总体服从正态分布N(μ,σ2)时,来自该总体的所有容量为n的样本的均值
x也服从正态分布,
x
的期望值为μ,方差为σ2/n。即
x~N(μ,σ2/n)yyyy-M-中心极限定理
(centrallimittheorem)当样本容量足够大时(n
30),样本均值的抽样分布逐渐趋于正态分布从均值为
,方差为
2的一个任意总体中抽取容量为n的样本,当n充分大时,样本均值的抽样分布近似服从均值为μ、方差为σ2/n的正态分布一个任意分布的总体xyyyy-M-中心极限定理
(centrallimittheorem)严格的表述:林德伯格-列维(Lindeberg-Levy)中心极限定理
设随机变量X1,X2,...,Xn独立同分布,且具有有限的数学期望和方差E(Xi)=µ,D(Xi)=σ²≠0(i=1,2,...n)。则:
其中Φ(z)是标准正态分布的
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 生物(四川)-【八省联考】河南、山西、陕西、内蒙古、四川、云南、宁夏、青海八省2025年高考综合改革适应性演练联考试题和答案
- 小学一年级20以内口算练习题
- 小学数学一年级以内加减法口算
- 湖南省株洲市2025届高三上学期教学质量统一检测语文答案
- 幼儿园年度伙委会会议
- 高考新课标语文模拟试卷系列之70
- 《组织结构设计报告》课件
- 污水处理行业客服工作思考
- 公务员工作总结服务群众恪尽务
- 包包设计师设计款式新颖的时尚包包
- 2024新一代变电站集中监控系统系列规范第2部分:设计规范
- 财富管理课程设计
- 快乐寒假安全先行寒假安全教育主题班会课件
- 燃烧仿真.燃烧仿真软件:OpenFOAM:湍流燃烧仿真原理
- 2024-2025学年七年级语文上册第一学期 期末综合模拟测试卷(人教版)
- 浙江省台金七校2023-2024学年高一下学期4月期中考试英语试题
- 蓝色卡通风胃肠减压护理
- 小学单位换算-体积
- 叉车自行检查记录表
- 2024新安全生产法知识考试题库及答案大全
- 专题5 书面表达-2023-2024学年译林版五年级上册英语期末专题复习
评论
0/150
提交评论