



下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第六章 样本及抽样分布授课对象】理工类本科二年级授课时数】4 学时授课方法】课堂讲授与提问相结合基本要求】1、理解总体、个体和样本的概念;2、了解经验分布函数和直方图的作法, 知道格林汶科定理;3、理解样本均值、样本方差和样本矩的概念并会计算; 4、理解统计量的概念,掌握几种常用统计量的分布及其结论; 5、理解分位数的概念,会计算几种重要分布的分位数。本章重点】 样本均值、样本方差和样本矩的计算;抽样分布2分布, t 分布,F 分布;分位数的理解和计算。本章难点】 对样本、统计量及分位数概念的理解;样本矩的计算。 授课内容及学时分配】6. 0 前 言前面五章我们研究了概率论的基本内容,从中得知
2、:概率论是研究随机现象统计规律性 的一门数学分支。它是从一个数学模型出发(比如随机变量的分布)去研究它的性质和统计 规律性;而我们下面将要研究的数理统计,也是研究大量随机现象的统计规律性,并且是应 用十分广泛的一门数学分支。所不同的是数理统计是以概率论为理论基础,利用观测随机现 象所得到的数据来选择、构造数学模型(即研究随机现象) 。其研究方法是归纳法(部分到整 体)。对研究对象的客观规律性做出种种合理性的估计、判断和预测,为决策者和决策行动提 供理论依据和建议。数理统计的内容很丰富,这里我们主要介绍数理统计的基本概念,重点 研究参数估计和假设检验。6.1 随机样本、总体与样本1.总体、个体在
3、数理统计学中,我们把所研究的全部元素组成的集合称为总体;而把组成总体的每个 元素称为个体。例如:在研究某批灯泡的平均寿命时,该批灯泡的全体就组成了总体,而其中每个灯泡 就是个体;在研究我校男大学生的身高和体重的分布情况时,该校的全体男大学生组成了总 体,而每个男大学生就是个体。但对于具体问题,由于我们关心的不是每个个体的种种具体特性,而仅仅是它的某一项或几项数量指标X(可以是向量)和该数量指标X在总体的分布情况。在上述例子中X是表示 灯泡的寿命或男大学生的身高和体重。在试验中,抽取了若干个个体就观察到了X的这样或那样的数值,因而这个数量指标 X是一个随机变量(或向量),而X的分布就完全描写了总
4、 体中我们所关心的那个数量指标的分布状况。由于我们关心的正是这个数量指标,因此我们 以后就把总体和 数量指标X可能取值的全体组成的集合 等同起来。定义1 :把研究对象的全体(通常为数量指标 X可能取值的全体组成的集合)称为总体;总体中的每个元素称为个体。我们对总体的研究,就是对相应的随机变量 X的分布的研究,所谓总体的分布也就是数 量指标X的分布,因此,X的分布函数和数字特征分别称为总体的分布函数和数字特征。今 后将不区分总体与相应的随机变量,笼统称为总体 X。根据总体中所包括个体的总数,将总 体分为:有限总体和无限总体。例1:考察一块试验田中小麦穗的重量:=所有小麦穗重量的全体(无限总体);
5、个体一一每个麦穗重X对应的分布:F(x) Px总麦穗数重量 x的麦穗数2)0 x例2:考察一位射手的射击情况:=此射手反复地无限次射下去所有射击结果全体;每次射击结果都是一个个体(对应于靶上的一点)个体数量化x1射中0未中1在总体中的比例p为命中率0在总体中的比例1 p为非命中率总体由无数个0, 1构成,其分布为两点分布B(1,p) PX 1p, PX 0 1 p2.样本与样本空间为了对总体的分布进行各种研究,就必需对总体进行抽样观察。抽样一一从总体中按照一定的规则抽出一部分个体的行动。一般地,我们都是从总体中抽取一部分个体进行观察,然后根据观察所得数据来推断总 体的性质。按照一定规则从总体中
6、抽取的一组个体(Xi,X2,,Xn)称为总体的一个样本,显然,样本为一随机向量。为了能更多更好的得到总体的信息,需要进行多次重复、独立的抽样观察(一般进行n次),若对抽样要求代表性:每个个体被抽到的机会一样,保证了 X1,X2, , Xn的分布相同, 与总体一样。独立性:X1,X2, ,Xn相互独立。那么,符合“代表性”和“独立性”要求 的样本(X1,X2, ,Xn)称为简单随机样本。易知,对有限总体而言,有放回的随机样本为简 单随机样本,无放回的抽样不能保证 X1,X2, ,Xn的独立性;但对无限总体而言,无放回随 机抽样也得到简单随机样本,我们本书则主要研究简单随机样本。对每一次观察都得到
7、一组数据(X1,X2, ,Xn),由于抽样是随机的,所以观察值(X1,X2, Xn )也是随机的。为此,给出如下定义:定义2:设总体X的分布函数为F(x),若X1,X2, ,Xn是具有同一分布函数F(x)的相互独立 的随机变量,则称(X1,X2, ,Xn)为从总体X中得到的容量为n的简单随机样本,简称样 本。把它们的观察值(X1,X2, ,Xn )称为样本值。定义3:把样本(X1, X2, , Xn)的所有可能取值构成的集合称为 样本空间,显然一个样本值(X1,X2, Xn)是样本空间的一个点。二、样本的分布:设总体X的分布函数为F(x),( X1, X2, ,Xn )是X的一个样本,则其联合
8、分布函数为:nF*( X1,X2, ,Xn )= F(Xi)。i 1例3:设总体X B(1, p), (X1,X2, Xn)为其一个简单随机样本,则样本空间(X1,X2, ,Xn)Xi 0,1 ; i 1,2, ,n,因为 PX x pX (1 p)1 X,x 0,1所以样本的联合分布列为:PX1X1,X2X2 丄,XnXnPX1X1 P X 2X2 LPXnXnXi / / 1X1X2 / / 1X2Xn/ 1Xnc A/ cp (1 p) .p (1 p) p (1 p)Xi0,1 I 1,2, ,n 6.2分布函数与概率密度函数的近似解在概率论中,我们介绍了几种常用的分布函数以及它们的性
9、质,当时我们总假定它们都 是先给定的,而在实际中,所遇到的用于描述随机现象的随机变量,事先并不知道其分布函 数,甚至连其分布类型也一无所知,那么,怎么样才能确定它的分布函数 F (x)呢?一般地,利用样本及样本值,建立一定的概率模型,用由此获得的概率统计信息来对总 体X的F(x)进行估计和推断,这就是:一、经验分布函数1.定义:设(X1,X2, ,Xn)是来自总体X的样本,用S(X)表示:X R,X1,X2,L ,Xn 中不大于X的随机变量的个数,定义经验分布函数为1Fn(x)S(x) X R。n设(X1,X2, , Xn)是样本的一个观察值,令这n个数值由小到大的顺序排列后为:X; X; *
10、 *X3 30时,t分布与N(0,1)非常接近。V、当n较小时,t分布与N(0,1)有较大的差异,且对t。P |T | t0 P | X | t0 ,其中 X N(0,1)。即t分布的尾部比N(0,1)的尾部具有更大的概率。VI、若 T t(n),则 n 1 时,E(T )0; n 2时,D (T )3) 结论:I)设(X1,X2, ,Xn)是来自总体X N( , 2)的一个样本,则统计量1),2X N(0,1),又(n 12)S2(n 1),且X与S2相互独立,则Xn与(n 21) S2相互独立,由t分布的定义,所以x n(X), n t(n 1)T(n 1)S221 n 1II)设(Xi,
11、X2,Xm)是来自总体X N( 1, 12)的一个样本,(第上,,Yn)是来自总;)的一个样本,且X与Y相互独立,当122时,则统计量(X Y) ( 11)Sm2 )(n 1)Snmn(m n 2) t(m m n2),其中,X1mXim i 1smm(Xi X)2m 1 i 1(YiY)2事实上,N(21,)mN(2,2),且x与Y相互独立, n所以:X Y N(2-),即:n(XY)(12)N(0,1);2又(m 1)Sm2(m1),2(n 1)Sn2(n 1),且它们相互独立,由2分布的可加性,则2(m 1)Sm22(n 1)Sn(X Y) ( 12)1n(m 1居(n 1)sf2 4、
12、F -分布1)定义:设X 2(m)(m, n)的F分布,记作:(m n(X2)Y)J(m 1应由t分布的定义:(1 2)(n 1)S:2(n),F F(m,n),mn(m n 2)t(m m n且X与Y相互独立,则称统计量n 2)F宁服从自由度为n其中:m为第一自由度,n为第二自由度。由定义,若 T t( n ),则 T2 F(1, n)。F(m, n)的概率密度函数为:(m2n)m)m2nn ,/m、/m 1 m 、()(X)(1 X)f(x;m, n) (;)(;) n八 n)0说明:先求出(X,Y)的联合密度函数f (x, y),再令U X Y,V X m,求出(U ,V )的联合f (
13、u,v),注意到U ,V独立,所以V的边缘密度函数,也即F的密度函数。2) F分布的性质(特点)I.密度曲线不对称(偏态)II.若 FF(m,n),则 rF(n,m)III.当n 2时,Ef当n 4时,Efn2(m 2),Df(n 2)(n4)n2(2m 2n 4) m(n 2)2 *(n 4)注:(利用 (1) ( 1)3) 结论:设(X1,X2, ,Xm)是来自总体X N (2 )的一个样本,(丫1,丫2, ,丫n)是来自总体F(m 1,n 1) o1sYN( 2,;)的一个样本,且X与丫相互独立,则F事实上,(m 1)S2(m 1),(n 用2(n 1),由F分布的定义,可得讣/(m 1
14、)1咋/(n21)2s22S1专1 2F(m 1,n1),2(Yi Y)设随机变量X的分布函数为F(x),对于给定的正数(01),若有x满足F(x ) PX x ,则称x为X的(下侧) 分位数(或 分位点)。2.表示方法:.N(0,1)的分位数 满足:1 弓e dx 。由标准正态分布的对称性可知:.2(n)分布的 分位数2(n)满足:2 (n)2(x,n)dx,由附表6查其值:当 n 45时,2 (n)丄(u . 2n 1)2或 n . 2n u 。2t (n) .t(n)分布的 分位数t(n)满足: t(x,n)dx ,由附表5可查出其值。由于n 30时,t(n)分布接近于N(0,1),所以当n 45时,可查N(0,1)分布分位数表。由t分布的对称性可知:t X 0.F(m, n)分布的分位数F(m,n)满足:F (m,n)0f (x; m, n)dx,由 F (m, n)分布性质,1有:F (m, n)=F1 (n,m)事实上,PF (m, n)P1 111P21 1F ( m,n )F ( m,n )1P- t (n,m)1 o.分位数的其它表示法。1)若 使pX ,则 称为X的上侧 分位数,显然:为原分布的1
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025版智慧社区综合管理服务合同
- 2025年环保科技公司办公场所装修与节能技术应用合同
- 2025年度新材料研发保密与竞业禁止合作协议
- 2025版绿色建筑认证项目设计与施工管理合同
- 二零二五版环保节能技术购销合作合同范本
- 二零二五年度有机肥生产与销售合同范本
- 2025年城市绿化项目苗木供应与养护服务合同
- 二零二五版环保产业园土建施工与污染治理合同范本
- 2025年度个人农业担保合同标准模板
- 二零二五年电子展厅租赁服务及新产品发布合同
- 实验室上岗证样本
- 动脉采血操作并发症及处理
- 糖尿病并发症筛查
- 职业技能大赛:电子商务师(四级)理论知识鉴定要素细目表(征求意见稿)
- 基于PLC的恒压供水系统设计(有梯形程序图)
- 微机原理与接口技术(清华大学课件,全套)
- LY/T 2622-2016天麻林下栽培技术规程
- JJG 814-2015自动电位滴定仪
- FZ/T 07019-2021针织印染面料单位产品能源消耗限额
- D类 干粉灭火系统说明书
- 乡镇医院合理用药课件
评论
0/150
提交评论