统计学第五章_第1页
统计学第五章_第2页
统计学第五章_第3页
统计学第五章_第4页
统计学第五章_第5页
已阅读5页,还剩39页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第五章 抽样与抽样分布 q随机变量及其概率分布概述随机变量及其概率分布概述 q抽样方法与抽样组织形式抽样方法与抽样组织形式 q抽样分布抽样分布 学习目标 v1 1、了解概率、随机变量、概率分布的概念。、了解概率、随机变量、概率分布的概念。 v2 2、熟悉常见离散型、连续型随机变量的概、熟悉常见离散型、连续型随机变量的概 率分布率分布 v 的定义及特征。的定义及特征。 v3 3、熟悉抽样方法和基本的抽样组织形式。、熟悉抽样方法和基本的抽样组织形式。 v4 4、掌握抽样分布的概念和常用统计量的抽、掌握抽样分布的概念和常用统计量的抽 样分布。样分布。 第五章 抽样与抽样分布 q随机变量及其概率分布概

2、述随机变量及其概率分布概述 q抽样方法与抽样组织形式抽样方法与抽样组织形式 q抽样分布抽样分布 随机变量及其概率分布概述 一、随机变量及其概率分布的概念一、随机变量及其概率分布的概念 (一)随机现象、随机试验及其随机事件(一)随机现象、随机试验及其随机事件 随机现象:具有不确定性或偶然性的现象称为 随机现象或偶然现象。 随机试验:为研究随机现象的规律性,在一定 条件下对随机现象进行观察、测量或试验,记 录所出现的结果,称之为随机试验。 随机事件:随机试验中可能出现或可能不出现 的结果,简称事件。 随机事件中不能再被分割的事件称为基本事件 ; 由若干个基本事件组合而成的事件称为复合事 件; v

3、每次试验必然发生的事件称为必然事件;每次试验必然发生的事件称为必然事件; v 每次试验必然不发生的事件称为不可能每次试验必然不发生的事件称为不可能 事件。事件。 样本空间:在一项试验中,所有基本事件的集样本空间:在一项试验中,所有基本事件的集 合称为样本空间,记为合称为样本空间,记为。 v 样本空间中每一个基本事件,称为样本样本空间中每一个基本事件,称为样本 点。点。 v(二)随机事件的概率(二)随机事件的概率 v用来度量随机事件在随机试验中出现的可用来度量随机事件在随机试验中出现的可 能性大小的数值称为随机事件的概率,记作能性大小的数值称为随机事件的概率,记作 P P( (A A) )。 v

4、1 1、古典概率:、古典概率: n mA A 数样本空间中基本事件总 包含的基本事件个数事件 n m pA 3、主观概率。 2、统计概率: (三)随机变量的概念 随机实验结果的变量;随机实验结果的变量; 一个取值对应随机试验的一个可能结果;一个取值对应随机试验的一个可能结果; 随着试验结果不同而变化;随着试验结果不同而变化; 一般用一般用大写字母如大写字母如X、Y、Z.来表示。来表示。 按其取值情况可以把随机变量分为两类:按其取值情况可以把随机变量分为两类: 离散型随机变量:有限个或无限可列个值。离散型随机变量:有限个或无限可列个值。 连续型随机变量:一定区间内任一数值。连续型随机变量:一定区

5、间内任一数值。 (四)随机变量概率分布的概念(四)随机变量概率分布的概念 随机选择30个喝饮料的人,判定喜欢喝无糖饮料的人数; 100件产品中的次品数; 某超市5分钟内前来光临的顾客人数; 某高速公路收费站30秒通过的车辆数。 测量一批零件加工尺寸的偏差; 测量不同时间某起重机上货物的重量; 测量一批电子产品的使用寿命; 测量新款轿车的长度。 m离散型随机变量的概率分布离散型随机变量的概率分布 设离散型随机变量设离散型随机变量 X X 所有可能取的值为所有可能取的值为 x xk k( (i i=1,2,=1,2,) ),X X 取各个可能值的概率,即事取各个可能值的概率,即事 件件 X X =

6、 =x xi i 发生的概率为发生的概率为 : : P PX X=x xi i=p pi i,i =1,2,=1,2, 那么那么X X的所有可能取值与其概率之间的对的所有可能取值与其概率之间的对 应关系称为离散型随机变量应关系称为离散型随机变量X X 的概率分布,即的概率分布,即 下表所示:下表所示: Xx1x2xn pip1p2pn 离散性随机变量的概 率分布 离散型随机变量概率分布具有如 下性质: p i0,i =1,2,. ; 1 1 i i p m连续型随机变量的概率分布连续型随机变量的概率分布 dxxfxXpxF x )()()( 用来表示连续型随机变量概率分布的函数f (x)称为概

7、 率密度函数,简称为概率密度。概率密度具有如下性质: 0)(xf 1)( dxxf b a dxxfbXaP)( 分布函数: (五)随机变量的数字特征(五)随机变量的数字特征 1.1.随机变量的数学期望随机变量的数学期望 离散型随机变量的数学期望记为:离散型随机变量的数学期望记为: n i ii pxXE 1 )( v连续型随机变量的数学期望记为:连续型随机变量的数学期望记为: v2 2、随机变量的方差和标准差、随机变量的方差和标准差 v离散型随机变量的方差记为:离散型随机变量的方差记为: dxxxfXE)()( i n i i pxXD 2 1 )( dxxfxXD)()()( 2 连续型随

8、机变量的方差记为: 方差的平方根就是标准差,记为 或)(XD v二、常见离散型随机变量的概率分布二、常见离散型随机变量的概率分布 v常用的离散型概率分布包括二项分布常用的离散型概率分布包括二项分布、 泊松分布。泊松分布。 二项分布 质量不 合格 质量 合格 只有两种可能结果的随机试验,称之为 伯努利试验。比如检查产品是否合格、调查 上市公司是否承担社会责任、调查消费者是 否满意手机售后服务、调查员工是否因为薪 酬不公而辞职等。 n重伯努利试验重伯努利试验 一次试验只有两种可能结果,即“成功”和“失败 ”; 一次试验“成功”的概率为p ,“失败”的概率为q =1 -p,而且概率p对每次试验都是相

9、同的; 试验是独立重复地进行了n次; 在n次试验中,“成功”的次数对应一个离散型随机 变量,用X 来表示。 v在在n重贝努里试验中,重贝努里试验中,“成功成功”的次数的次数X 服从参数为服从参数为n、p 的二项分布,记为的二项分布,记为 X B( (n , , p) )。 v二项分布的概率函数:二项分布的概率函数: ).,2 , 1 , 0()1 ()( xppCxXp xnxx n 二项分布的数学期 望和方差为:)1()(,)(pnpXDnpXE v将伯努利试验次数定义为一次,它的概率分布就是两将伯努利试验次数定义为一次,它的概率分布就是两 点分布,也称点分布,也称0-1分布。分布。 v它的

10、概率分布为:它的概率分布为: xx ppxXP 1 )1 ()( 如表所示: X1 10 0 pxp p1-p1-p 两点分布的数学期望和方差为: )1 ()(,)(ppXDpXE p是指一 次伯努利 试验中成 功地可能 性大小 泊松分布泊松分布 X 服从泊松分布,记为服从泊松分布,记为XP( (): : 泊松分布的概率函数为:泊松分布的概率函数为: e ! )( x xXP x 泊松分布的数学期望 和方差为: )(,)(XDXE 描述某一时间或空间段某一时间出现的 次数。如10分钟内到达某汽车加油站的 红色轿车数;1分钟内某企业售后服务电 话接到的呼叫次数;一版报纸中错别字 的个数等。 (一

11、)正态分布 密度函 数为: xexf x , 2 1 )( 2 2 2 )( 期望和 方差为: 2 )(,)(XDXE 三、常见连续型随机变量的概率分布 v(二)标准正态分布(二)标准正态分布 密度函 数为: xex x , 2 1 2 2 标准正态分布具有 以下性质: )(1)(ZZ )()(abbZaP 1)(2)(aazp 若若XN( ( , 2) ) ,则随机变量,则随机变量 服从标准服从标准 正态分布,即正态分布,即ZN(0,1)(0,1) X Z (三)“3”原则 |X|3 的概率很小,因此可认为正态随机 变量的取值几乎全部集中在 3, +3 区间内 。 一般正态分布与标准正态 分

12、布的关系 第五章 抽样与抽样分布 q随机变量及其概率分布概述随机变量及其概率分布概述 q抽样方法与抽样组织形式抽样方法与抽样组织形式 q抽样分布抽样分布 抽样方法与抽样组织形式 v一、抽样方法一、抽样方法 v v v 抽样方法 概率抽样 非概率抽样 重复抽样 不重复抽样 v二、抽样组织形式二、抽样组织形式 v (一)简单随机抽样(一)简单随机抽样 v 它是严格按随机原则,不对总体做任何它是严格按随机原则,不对总体做任何 处理,直接从总体处理,直接从总体N N个单位中抽取个单位中抽取n n个单位作个单位作 为样本,保证总体中每个单位在抽选时都有为样本,保证总体中每个单位在抽选时都有 相同的机会(

13、概率)被抽中。相同的机会(概率)被抽中。 v (二)分层抽样(二)分层抽样 v 它是先将总体中的单位划分为若干层它是先将总体中的单位划分为若干层 (类),然(类),然 v 后从每个层中抽取一定数量的单位,将其后从每个层中抽取一定数量的单位,将其 组合成一个样本。组合成一个样本。 v (三)系统抽样(三)系统抽样 v 它是先将总体各单位按某一标志依顺序它是先将总体各单位按某一标志依顺序 排列,并按某种规则确定一个随机起点,然排列,并按某种规则确定一个随机起点,然 后每隔一定的间隔抽取一个单位,直至抽取后每隔一定的间隔抽取一个单位,直至抽取n n 个单位构成一个样本。个单位构成一个样本。 v (四

14、)整群抽样(四)整群抽样 v 它是将总体全部单位划分为若干个群,它是将总体全部单位划分为若干个群, 然后以群然后以群 v 作为调查单位,从中抽出一部分群,并对作为调查单位,从中抽出一部分群,并对 抽中的各个群中所包含的所以单位进行调查抽中的各个群中所包含的所以单位进行调查 或观察。或观察。 第五章 抽样与抽样分布 q随机变量及其概率分布概述随机变量及其概率分布概述 q抽样方法与抽样组织形式抽样方法与抽样组织形式 q抽样分布抽样分布 抽样分布 v一、抽样分布的概念一、抽样分布的概念 v 样本统计量因样本的不同有若干可能取样本统计量因样本的不同有若干可能取 值,每个值,每个 v可能取值都有一定可能

15、性大小(概率),从可能取值都有一定可能性大小(概率),从 而形成它而形成它 v的概率分布,统计上称为抽样分布。即抽样的概率分布,统计上称为抽样分布。即抽样 分布是样分布是样 v本统计量取值的概率分布本统计量取值的概率分布 v二、抽样分布的基本类型二、抽样分布的基本类型 c 2分布 22 2 2 1 2 . n XXXc 概率密度 为: 0, 0 0,)( ) 2 (2 1 2 2 2 1 2 2 2 2 x xx x e n n n 期望和 方差为: nDnE2)(,)( 22 cc t 分布分布 nY X t / 概率密度 为: 2 12 )1 ( ) 2 ( ) 2 1 ( )( n n

16、t n n n tf 当n足够大时,t 分布近似于标准正态分布N(0,1)。 F分布分布 2 1 / / nY nX F 概率密度 为: 0,0 0)1 ()( ) 2 () 2 ( ) 2 ( 2 2 1 1)2/(2/ 2 1 21 21 21 11 F FF n n F n n nn nn nn nn v三、常用统计量的抽样分布三、常用统计量的抽样分布 1、样本均值的抽样分布 m 大样本:样本均值 的概率分布趋近于期望为,方差 为2/n的正态分布,即 x ),( 2 n Nx 将样本均值这一随机变量标准化,得到一个数学期望为0 且方差为1的标准正态变量,即此标准正态变量为z,则有: )1

17、 ,0( / N n x z v 小样本:总体为正态分布,且总体方差已知,样本均值小样本:总体为正态分布,且总体方差已知,样本均值 服从正态分布;若总体方差未知,用样本方差代替总体方差,服从正态分布;若总体方差未知,用样本方差代替总体方差, 样本均值服从自由度为(样本均值服从自由度为(n-1)n-1)的的 t t分布,即:分布,即: ) 1( nt n s x t 数学期望和方差为: n x xE 2 2 ,)( 2、样本比率的抽样分布、样本比率的抽样分布 大样本条件下样本比率大样本条件下样本比率p p近似地服从均值为总体成数近似地服从均值为总体成数P P, 方差为方差为P P(1-(1-P

18、P)/)/n n的正态分布,即:的正态分布,即: ) )1 ( ,( n PP PNp 样本比率进行标准化变换后,得到一个数学期望为0且 方差为1的标准正态变量,即此标准正态变量为z,则有: ) 1 , 0( / )1 ( N nPP Pp z v 数学期望和方差数学期望和方差 为:为: n PP p PpE )1( )( 2 3 3、样本方差的抽样分布、样本方差的抽样分布 v如果观测的总体服从正态分布,则来自正如果观测的总体服从正态分布,则来自正 态总体的一个容量为态总体的一个容量为n n的简单随机样本,其样的简单随机样本,其样 本方差与总体方差的比值的本方差与总体方差的比值的n n-1-1

19、倍,服从自由倍,服从自由 度为度为n n -1-1的的x x2 2分布,即有:分布,即有: )1( )1( 2 2 2 n sn c 样本统计 量 样本均 值 样本 比率 样本 方差 正态总体或 非正态总体 (大样本) 非正态总体 (小样本) 大样本 正态 分布 t分 布 正态 分布 分 布 c 2 v 4 4、两个样本统计量的抽样分布、两个样本统计量的抽样分布 v 两个样本均值之差的抽样分布两个样本均值之差的抽样分布 v 设设X X1 1、X X2 2是两个相互独立的正态总体,是两个相互独立的正态总体, 现从两个总体中分别抽取容量为现从两个总体中分别抽取容量为n n1 1和和n n2 2的两个的两个 简单随机本,则两个样本均值之差简单随机本,则两个样本均值之差 的抽的抽 样分布仍然服从正态分布样分布仍然服从正态分布 21xx 数学期望: 21 21 xxE 在实际研究中,有时 考虑的是两个总体的 对比,如两种牙膏的 功效是否有区别,两 种品牌轿车的安全性 是否相同,两个地区 女性消费者比率的差 异等,相应的需要研 究两个样本统计量的 抽样分布 方差 为: 2 2 2 1 2 1 21 nn xxD 如果X1、X2是两个相互独立的非正态总体,只 要样本容量足够大(n1,n230),两个样本均值之差 的抽样分布近似服从正态分布

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论