




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
理学常用统计分布第1页/共58页本章重点:1、二项分布2、正态分布3、常用抽样分布本章难点:1、正态分布2、常用抽样分布3、中心极限定理第2页/共58页第一节
二项分布
第3页/共58页二项分布是一种重要的离散型随机变量概率分布,它是从著名的贝努里试验(二项试验)中推导而来。贝努里试验,是指只有两种可能结果的随机试验。(FJ7-1)第4页/共58页一、二项分布的定义若离散型随机变量X的分布为………(7.1)
则称X服从参数为n,p的二项分布,记为X~B(n,p)。式中,q=1-p(0≤p≤1),n为正整数。n和p为二项分布的两个重要参数。
第5页/共58页例如,二项试验是将一枚硬币重复做8次抛掷,假设这枚硬币是无偏的,即p=q=0.5,那么恰好得到5次面朝上的概率是:
注意:当x为0时,0!=1,此外,掌握这种对称性,将有助于简化运算。(FJ7-2)第6页/共58页二、二项分布的性质X012…
n合计P(X)…(1)二项分布为离散型随机变量的分布。每当试验做的是在相同的条件下n次重复的贝努里试验时,随机变量X共有n+1个取值。二项分布可以用分布律(见上表)和折线图(见右图)来表示。
(2)当P=0.5时二项分
布的图形是对称的。第7页/共58页⑶二项分布的数学期望E(X)=μ=np,变异数D(X)=σ²=npq。⑷二项分布还可以简写作B(x;n,p)。⑸二项分布的概率值除了根据公式直接计算外,还可查表求得。二项分布表的编制方法有两种:一种依据概率分布律P(x)编制(见附表2);另一种依据分布函数F(x)编制(见附表3)。其中:………(7.2)
例1(见P101或125)第8页/共58页第二节正态分布
第9页/共58页正态分布是最重要的概率分布,这是因为:
(1)许多自然现象和社会现象,都可用正态分布加以叙述;
(2)当样本足够大时,都可用正态近似法解决变量的概率分布问题;
(3)许多统计量的抽样分布呈正态分布
。
第10页/共58页一、正态分布的定义和性质(一)正态分布的定义正态分布又称常态分布或高斯分布,是一种非常重要的连续型随机变量的概率分布。
其定义:若连续型随机变量X的概率密度函数为:
(-∞﹤x﹤+∞)…………(7.2)
则称X服从于参数为µ,σ²的正态分布,记为X~N(µ,σ²)。第11页/共58页式中,µ和σ为正态分布的参数(µ为总体均值,σ为总体标准差),π和е都是常数,分别近似等于3.1416和2.71828。
从正态分布的定义可以看出,当总体均值和方差确定后,正态分布曲线的精确形式也就确定了。正态分布是一个分布族,对应于不同的参数μ和σ,会产生不同的正态分布。
第12页/共58页正态分布的重要特征值为:⑴期望值:E(X)=μ,且μ=Me=Mo;
⑵方差(变异数):D(x)=σ2;⑶偏态系数:α=0;
⑷峰态系数:β=3。
第13页/共58页服从正态分布的随机变量的概率密度函数图形见下:图7.2
二维正态分布密度函数示意图第14页/共58页第15页/共58页第16页/共58页(二)正态分布的重要性质(1)对称性。正态曲线以x=μ呈钟型对称,故其均值=中位数=众数,左右二部分面积相等,各为二分之一。(2)在x=μ处,概率密度φ(x)最大;当区间离μ越远,x落在这个区间的概率越小。
(3)正态分布曲线有两个拐点,分别在x=μ±σ处;左右两尾与横轴(x轴)渐近,但不与横轴相交,即-∞﹤x﹤+∞。
(4)正态分布曲线的位置是由μ决定的,外形由σ值确定。(FJ7-3)(5)正态分布曲线下的面积(区间概率)是固定的,且正态分布曲线与x轴所围成的面积恒等于1。
第17页/共58页表7-3
正态分布x的取值区间及概率表x的取值区间概率p(x)(%)概率密度(x)μ±σμ±1.645σμ±1.96σμ±2σμ±2.326σμ±2.567σμ±3σ68.2690.0095.0095.4598.0099.0099.731.0001.6451.9602.0002.3262.5673.000第18页/共58页图7.5正态分布x的取值区间及概率图示第19页/共58页由上可以看出,服从正态分布N(μ,σ2)的随机变量X,落在(μ-3σ,μ+3σ)内的概率为99.73%,几乎是必然事件;而落在(μ-3σ,μ+3σ)之外的概率很小,几乎是不可能事件。服从正态分布的随机变量X的这个重要性质,称为“3σ”原则。第20页/共58页二、标准正态分布Z代表以标准差σ为单位表示的变量值与均值μ的离差,经常被称为变量X的标准分,或称
Z分数,也被称为标准正态随机变量,即:用Z分数表达的标准正态分布,其概率密度为:(-∞﹤z﹤+∞)……(7.3)
第21页/共58页标准正态分布φ(z)是指参数μ=0,σ²=1的正态分布,简记作N(0,1)。很明显,标准正态分布只是正态分布的一个特例。第22页/共58页标准正态分布重要的特征值如下:
(2)期望值:E(Z)=0;
(3)方差(变异数):D(Z)=1;
(5)在(-∞,0)内严格上升,在(0,+∞)内严格下降;(4)φ(-z)=φ(z);(6)当z→±∞时,φ(z)→0。可见,曲线与横轴不相交,其两尾向两边无限延伸。第23页/共58页随机变量X的取值在某区间上的概率就可用下式求得:标准正态分布的分布函数为:………(7.4)
第24页/共58页利用标准正态分布表(也叫Z分布表)就可以求出任何正态随机变量X的取值区间的概率。即:………(7.5)
第25页/共58页解已知μ=168,σ=12,那么:例3,设随机变量X服从正态分布N(168,12²),试求P(X≤143)。
对于负的z值,可由F(-z)=0.5-F(z)得到。
因此P(X≤143)可以由下面计算求得:
P(X≤143)=0.5-P(0≤z≤2.08)
=0.5-0.4812
=1.88%
第26页/共58页图7.6
第27页/共58页当n很大时,只要p或q不近于零,我们就可以用正态近似来解决二项分布的计算问题。
三、二项分布的正态近似法
即以np=μ、npq=σ²,将B(x;n,p)视为N(np,npq)进行计算。在社会统计中,当n≥30,np、nq均不小于5时,对二项分布作正态近似是可靠的。
第28页/共58页第三节
抽样分布和中心极限定理第29页/共58页一、抽样分布一旦统计的学习进入到推断统计,我们就必须同时与三种不同的分布概念打交道,即总体分布、样本分布、抽样分布。为了不产生混淆,视分布不同,将统计指标的符号加以区别是完全必要的。
表7-4
三种分布的均值和标准差(或方差)的符号表均值标准差总体分布样本分布抽样分布μ
μ
σs第30页/共58页●已知一总体分布,可求得它的特征值。●已知一样本分布,可求得它的特征值。
根据总体各个单位标志值计算的统计指标,在推断统计中称为总体参数,简称参数。总体均值和总体标准差(或方差)是反映总体分布特征最重要的两个参数,习惯上分别记作μ和σ(或σ²)。根据样本各个单位标志值计算的统计指标,在推断统计中称为样本统计量,简称统计量。样本均值和样本标准差(或方差)是反映样本分布特征最重要的两个统计量,习惯上分别记作
第31页/共58页将总体均值和总体标准差与样本均值和样本标准差加以区别是很必要的。
因为参数和统计量之间存在着重要区别。
参数是有关总体的固定值,一般都是未知的。
在同一总体中,当从一个样本换为另一个样本,统计量很可能不同。
参数统计量抽样分布特指样本统计量作为随机变量的概率分布。
第32页/共58页用数学语言来说,抽样分布是运用数理统计的方法,把具体概率赋予样本的所有可能结果的一种理论分布。
换句话说,从同一总体中抽出容量相同的所有可能样本后,计算每个样本统计量的取值和与之相应的概率,就组成样本统计量的概率分布,简称抽样分布。
在假设检验的实际工作中常用到χ²分布、F分布和t分布。
第33页/共58页(一)χ²分布(卡方分布)
χ²分布是一种连续型随机变量的概率分布。
1、χ²分布的数学形式
χ²是表示标准正态分布随机变量Z的平方和。
设随机变量X1,X2,…,Xk为k个相互独立的随机变量,来自同一正态分布总体N(μ,σ²),则统计量χ²为:
我们把统计量χ²的概率分布称为服从自由度为k的χ²分布,记为χ²~χ²(k)。
第34页/共58页图7.7χ²分布图(概率密度曲线)第35页/共58页χ²分布的分布函数为:χ²分布的自由度k表示定义式中独立变量的个数。特别当k=1时,………(7.7)随机变量χ²的临界值(参见图7.8)
第36页/共58页图7.8χ²检验的否定域
第37页/共58页查χ²分布概率表时,按自由度及相应的概率去找到对应的χ²值。如上图所示的单侧概率χ²0.99(7)=1.24的查表方法就是,在第一列找到自由度7这一行,在第一行中找到概率0.99这一列,行列的交叉处即是1.24。
第38页/共58页2、χ²分布的性质(1)随机变量χ²的分布不是正态分布,χ²恒为正值,且χ²分布密度曲线下总面积为1。
(2)期望值E(χ²
)=k,方差V(χ²
)=2k。
(3)χ²分布是一个连续的非对称分布,当k﹤2时,χ²分布呈L形;k→∞,χ²分布趋于正态分布。
(4)χ²分布具有可加性。(FJ7-5)(5)利用χ²分布可以推出样本方差S²分布,即:第39页/共58页(二)F分布
F分布是连续型随机变量的一种重要的小样本分布。
1、F分布的数学形式F分布是由两个χ²分布之比组成的。设随机变量X与Y相互独立,而且X、Y分别服从自由度为K1、K2的χ²分布,则称随机变量
服从第一自由度为K1,第二自由度为K2的F分布,记为F~F(K1,K2)。第40页/共58页图7.9
F分布图(概率密度曲线)
第41页/共58页2、F分布的性质(1)随机变量F和随机变量χ²一样恒取正值,F分布密度曲线下总面积也为1。(2)F分布也是一个连续的非对称分布。
(3)F分布具有一定程度的反对称性,
第42页/共58页(4)F分布的期望值和方差(变异数)分别为:(5)F统计量的实用公式为:第43页/共58页(三)t分布
t分布是连续型随机变量的一种重要的小样本分布。
t分布最初是由戈塞特(1876-1937)用笔名“Student”(学生)发表,故又称学生分布。
第44页/共58页1、t分布的数学形式
设随机变量X与Y相互独立,而且X服从标准正态分布,Y服从自由度为n的χ²分布,
则称随机变量服从自由度为n的t分布,记为t(n)。
第45页/共58页图7.10t分布图(概率密度曲线)
第46页/共58页若样本X1,X2,…,Xn来自于正态总体N(μ,σ²),可以证明,随机变量:通过下式可以编制出t分布表(见附表5):
第47页/共58页随机变量t的临界值。
具体来说,在假设检验中,它表示在显著性水平α上t分布随机变量t的临界值。
第48页/共58页2、t分布的性质
n=1时,期望值、方差都不存在。
第49页/共58页(2)t分布密度曲线对称于直线t=0(但不是正态分布),故有
第50页/共58页二、中心极限定理
概率论中用来阐明大量随机现象平均结果的稳定性的定理,是著名的大数定理。
其具体内容是:频率稳定于概率,平均值稳定于期望值。
中心极限定理表述为:设随机变量X的均值为μ,方差为σ²,X1,X2,…,Xn为X的样本,那么,当n充分大时(n≥30),样本均值近似地服从数学期望为μ,方差为σ²/n的正态分布,
第51页/共58页中心极限定理也可以表述为:设随机变量X的均值为μ,方差为σ²,X1,X2,…,Xn为X的样本,那么,
Z分布近似地服从数学期望为0,方差为1的标准正态分布,第52页/共58页例6,某市职工家庭人均年收入的总体分布未知,但已知该市职工家庭人均年收入μ=4800元,标准差σ=800元,当抽取64户进行调查,求样本平均数居于4600~5000元之间的概率。解:由题意可知μ=4
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 焊接工程师考试知识架构试题及答案
- 焊接中的应力与变形试题及答案
- 二年级道德与法治上册 第一单元 2《暑假的一次外出》教学设计1 浙教版
- 专题02 细胞的能量利用与供应(分层练)(原卷版)
- 2024年纺织机械操作趋势试题及答案
- 商务礼仪师的职业环保试题及答案
- 专题02 平行线中的拐点模型之铅笔头模型(原卷版)
- 商务礼仪师考试复习建议试题及答案
- 2025年中国假发辅料市场调查研究报告
- 2024年焊接工程师证书考试复习技巧试题及答案
- 广东省2025年深圳市高三年级第二次调研考试语文试题及答案(深圳二模)
- 人教版必修二地理-4.1区域发展对交通运输布局的影响(以川藏线为例)(教学设计)
- 2025届湖北省高考冲刺物理模拟试题含解析
- 湖北省2025届高三(4月)调研模拟考试物理试题及答案
- 安徽省宿州市泗县2024-2025学年部编版八年级下学期期中历史试卷(含答案)
- 慢性病管理与公共卫生试题及答案
- 基础摄影考试题目及答案
- 2025江苏无锡江阴公用事业集团限公司招聘1人易考易错模拟试题(共500题)试卷后附参考答案
- 2025年4月23日世界读书日主题班会
- 医院培训课件:《老年认知功能障碍》
- 二零二五版用工单位与劳务派遣公司合同
评论
0/150
提交评论