![概率论与数理统计 6_第1页](http://file4.renrendoc.com/view/0c6d2a51f26070524008aa01091242a4/0c6d2a51f26070524008aa01091242a41.gif)
![概率论与数理统计 6_第2页](http://file4.renrendoc.com/view/0c6d2a51f26070524008aa01091242a4/0c6d2a51f26070524008aa01091242a42.gif)
![概率论与数理统计 6_第3页](http://file4.renrendoc.com/view/0c6d2a51f26070524008aa01091242a4/0c6d2a51f26070524008aa01091242a43.gif)
![概率论与数理统计 6_第4页](http://file4.renrendoc.com/view/0c6d2a51f26070524008aa01091242a4/0c6d2a51f26070524008aa01091242a44.gif)
![概率论与数理统计 6_第5页](http://file4.renrendoc.com/view/0c6d2a51f26070524008aa01091242a4/0c6d2a51f26070524008aa01091242a45.gif)
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第六章数理统计的基本概念从历史的典籍中,人们不难发现许多关于钱粮、户口、地震、水灾等的记载,这说明人们很早就开始了统计的工作.但是当时的统计,只是对有关事实的简单记录和整理,而没有在一定理论的指导下,做出超越这些数据范围之外的推断。到了19世纪末20世纪初,随着近代数学和概率论的发展,才真正诞生了数理统计学这门学科。计算机的诞生与发展,为数据处理提供了强有力的技术支持,这就决定了数理统计与计算机结合的必然发展趋势。目前国内外著名的统计软件包SAS,SPSS,STAT等,都提供了快速、简便地进行数据处理和分析的方法与工具。序言数理统计以概率论为理论基础,但其研究重点与概率论不同。例如,从口袋中摸彩球的试验,概率论关心的是在彩球情况已知的条件下,摸出某种颜色的彩球的概率是多大;而数理统计研究的是在彩球情况部分已知或全部未知的条件下摸出的彩球样本,通过观察分析样本,估计或检验口袋中彩球的颜色分布。可以说,数理统计研究的对象是带有随机性的数据。序言数理统计学是一门应用性很强的学科,其任务是研究怎样以有效的方式收集、整理和分析所获得的有限资料,以便对所考察的问题尽可能地做出精确而可靠的推断和预测,直至为采取一定的决策和行动提供依据和建议.可以看出,数理统计方法具有“部分推断整体”的特征。在数理统计中必然要用到概率论的理论和方法。因为随机抽样的结果带有随机性,不能不把它当作随机现象来处理。所以,概率论是数理统计的基础,而数理统计是概率论的重要应用;但它们是并列的两个学科,并无从属关系。序言01总体与随机样本概率论中所研究和讨论的随机变量,它的分布都是已知的,在这一前提下去研究它的性质、特点和规律性;而数理统计中所研究和讨论的随机变量,它的分布是未知的或部分未知的,于是就必须通过对所研究和讨论的随机变量进行重复独立的观察和试验,得到所需的观察值(数据),对这些数据进行分析后才能对其分布做出种种判断.得到这些数据最常用的方法是“随机抽样法”,它是一种从局部推断整体的方法.从所研究的随机变量的某个集合中抽取一部分元素,对这部分元素的某些数量指标进行试验和观察,根据试验与观察获得的数据来推断集合中全体元素数量指标的分布情况或数字特征。定义1研究对象数量指标值的全体称为总体(母体);总体中的每个元素称为个体。一、总体和个体例如,我们要研究某大学学生的身高情况,则该大学全体学生的身高构成问题的总体,而每一个学生的身高即是一个个体;又如,研究某批灯泡的质量,则该批灯泡寿命的全体构成了问题的总体,而每个灯泡的寿命就是个体。如此看来,若不考虑问题的实际背景,总体就是一堆数,这堆数中有大有小,有的出现的机会多,有的出现的机会少.因此用一个概率分布去描述和归纳总体是恰当的。从这个意义上看,总体就是一个概率分布,而其数量指标就是服从这个分布的随机变量。所以今后说“从总体中抽样”和“从某分布中抽样”是同一个意思。总体中的每一个个体是随机试验的一个观察值,因此它是某一随机变量X的值,从而一个整体对应于一个随机变量。由此可见,对总体的研究就是对一个随机变量X的研究,随机变量X的分布函数和数字特征就可作为总体的分布函数和数字特征,所以今后将不再区分总体和相应的随机变量,统称为总体X或总体F(X)。总体依其包含的个体总数可分为有限总体(个体的个数是有限的)和无限总体(个体的个数是无限的)。但当有限总体所含有个体的个数很大时,也可视其为无限总体。例1要考察某厂的产品质量,现将该厂的产品只分为合格品和不合格品两类,并以0记为合格品,以1记为不合格品,则总体={该厂生产的全部合格品与不合格品}={由0与1组成的一堆数}.若以p表示这堆数中的比例(不合格品率),则该总体X可由一个两点分布来表示,如表所示。X01P1-pp不同的p反映了总体间的差异.譬如,两个生产同类产品的工厂的产品总体分布分别如表所示。X01P0.9830.017X01P0.9150.085显然,第一个工厂的产品质量优于第二个工厂。实际中,分布中的不合格品率是未知的,如何对它进行估计正是数理统计要研究的问题。定义2为推断总体分布及各种特征,按一定规则从总体中抽取若干个体进行试验观察,以获得有关总体的信息,这一抽取过程称为抽样,所抽取的部分个体称为样本,样本中所包含的个体数目称为样本容量。二、抽样和样本例2某饮料厂生产的瓶装可乐规定净含量为750g,由于具有随机性,事实上在生产过程中不可能使得所有的瓶装可乐净含量均为750g.现从该厂生产的可乐中随机抽取10瓶测定其净含量,得到结果如下:751745750747752748756753749750这是一个容量为10的样本的观测值,对应的总体为该厂生产的瓶装可乐的净含量。从总体中抽取样本可以有不同的抽法,为了能由样本对总体做出较可靠的推断,就希望所抽取的样本能很好地代表总体。这就需要对抽取方法提出要求,最常用的是简单随机抽样,它有如下两点要求:第一,样本具有随机性,即要求总体中每一个个体都有同等机会被选入样本,这就意味着每一样品Xi与总体X有相同的分布.第二,样本具有独立性,即要求样本中每一样品的取值不影响其他样品的取值,这就意味着X1,X2,…,Xn相互独立.基于上述简单随机抽样,我们可以知道,从总体中抽取一个个体就是对总体X进行一次观察(试验)并记录其结果.若在相同的条件下对总体X进行n次重复的独立观察,其观察的结果记为X1,X2,…,Xn,则可认为X1,X2,…,Xn相互独立,并与总体X具有同的分布.一般称其为来自总体X的一个简单随机样本。对于有限总体和无限总体,都可以通过不放回抽样的方式得到简单随机样本。定义3设X是具有分布函数F的随机变量,若X1,X2,…,Xn是具有同一分布函数F的、相互独立的随机变量,则称X1,X2,…,Xn为从总体X中得到的容量为n的简单随机样本,简称样本。它们的观察值x1,x2,…,xn为样本值,又称为X的n个独立观察值。样本是随机变量,但它具有二重性.样本的二重性表现为:一方面,由于样本是从总体中随机抽取的,抽取前无法预知它们的数值,因此,样本是随机变量,一般用大写字母X1,X2,…,Xn来表示;另一方面,样本在抽取以后经观测就有确定的观测值,因此,样本又是一组数值,一般用小写字母x1,x2,…,xn来表示。提示定义3可得,若X1,X2,…,Xn是总体X的一个样本,X的分布函数为F(X),概率密度函数为f(X),则随机变量(X1,X2,…,Xn)的联合分布函数为
(6-1)随机变量(X1,X2,…,Xn)的联合概率密度函数为
(6-2)02统计量与样本函数
在上节所介绍内容中已经知道:样本是进行统计推断的依据,它含有总体各方面的信息,但这些信息常常较为分散,通常不能够直接用于解决我们所要研究的问题。所以在实际应用中,人们若需要从样本获得对总体更深入的认识,往往不是直接使用样本本身,而是需要对样本进行加工和计算,把样本中所包含的信息集中起来,针对不同问题构造出样本的适当函数,利用这些样本函数进行统计推断。定义1设X1,X2,…,Xn是总体X的样本,样本函数g(X1,X2,…,Xn)是样本的实体函数,且不含有任何未知参数,则称这类样本函数g(X1,X2,…,Xn)为统计量。由于样本具有二重性,统计量作为样本的函数也具有二重性,即对一次具体的观测或试验,它们都是具体的数值,但当脱离开具体的某次观测或试验,样本是随机变量,因此统计量也是随机变量。一、统计量设X1,X2,…,Xn是总体X的样本,则可定义以下统计量:(1)样本均值
(6-3)它的观测值记为
。(2)样本方差
(6-4)它的观测值记为
。(3)样本标准差
(6-5)它的观测值记为
。(4)样本k阶原点矩
(6-6)它的观测值记为
。(5)样本k阶中心矩
(6-6)它的观测值记为
。对于任何实数x,Fn(x)等于样本的n个观察值中不超过x的个数除以样本容量n.由频率与概率的关系知道,Fn(x)可作为未知分布函数F(x)的一个近似,n越大,Fn(x)越接近F(x),称Fn(x)为样本分布函数(或经验分布函数)。二、样本分布函数设x1,x2,…,xn是总体X的样本观察值,将它们按大小顺序排列,即
,令
(6-8)Fn(x)的图形就是累积频率曲线,它是跳跃式上升的一条阶梯形曲线.若所有观测值都不相等,则每一跨度为
;若某个观察值有m次相等情形,则在该值处跳跃上升
。总体就是一个随机变量X,对总体分布的描述可以利用容量为n的样本构造样本分布函数Fn(x)来近似描述总体X的分布函数,并随着样本容量的增大,使所构造的样本分布函数越来越逼近总体的分布函数,从而达到研究总体的目的.提示解因为
例1设随机变量
分布,求D(X)。所以又所以,解将样本的观察值由小到大排列为例1设总体服从泊松分布,容量为10的样本观察值如下:2143564843试构造样本的分布函数F10(x)。所以样本的频率分布如表所示X1234568fn0.10.10.20.30.10.10.1因此样本分布函数Fn(x)为例1设总体服从泊松分布,容量为10的样本观察值如下:2143564843试构造样本的分布函数F10(x)。03抽样分布在使用统计量进行统计推断时,常需要知道它的分布.当总体的分布函数已知时,抽样分布是确定的,然而要求出统计量的精确分布,一般是比较困难的。本节介绍三个常用的重要统计量,它们是以标准正态变量为基石而构造的,加上正态分布本身,它们就构成了数理统计中的“四大抽样分布”,这四大分布在实际中有着广泛的应用,这是因为这四个统计量不仅有明确背景,而且其抽样分布的密度函数有明确表达式。今后,我们将看到这些分布在数理统计中有重要的应用。序言一、三个重要分布1.
2分布定义1设X1,X2,…,Xn为独立同分布的随机变量,且都服从N(0,1),则称统计量
(6-9)服从自由度为n的
2分布,记为
。定义1中的自由度是指
2中所包含的独立变量的个数.
2(n)分布的概率密度为
(6-10)定义1中的自由度是指
2中所包含的独立变量的个数.
2(n)分布的概率密度为
(6-10)其中,伽玛函数
。
2分布的密度函数图形是一个只取非负值的偏态分布,如图所示。证(1)令
2分布是由正态分布派生出来的一种分布,其数学期望与方差如下:若
~2
2(n),则有事实上,因Xi~N(0,1),故因此又于是一、三个重要分布2.t分布定义2设X~N(0,1),Y~
2(n),且X,Y独立,则称随机变量
(6-12)服从自由度为n的t分布,记为
。t(n)分布的概率密度函数为
(6-13)t分布的密度函数是一个关于y轴对称的分布图,它与标准正态分布的密度函数图形非常类似,只是峰比标准正态分布的密度函数低一些,尾部的概率比标准正态分布大一些,如图所示。需要指出的是,当n充分大时,t分布可以近似看作是标准正态分布,即有但当n较小时,t分布与正态分布的差异是不能忽略的。若t~t(n),则当n=1时,t分布即为标准柯西分布,其均值不存在;当n>1时,t分布的数学期望存在,且E(t)=0;当n>2时,t分布的方差存在,且D(t)=n/(n-2)。一、三个重要分布3.F分布定义3
设X~
2(n1),Y~
2(n2),且X,Y独立,则称随机变量
(6-13)服从自由度为(n1,n2)的F分布,记为
。F(n1,n2)分布的概率密度函数为
(6-13)F分布的密度函数图形与
2分布的密度函数图形类似,是一个只取非负值的偏态分布,如图所示。显然,由定义可知,若F~F(n1,n2),则1/F~F(n1,n2)F。二、抽样分布的分位点1.标准正态分布的上
分位点定义4
设X~N(0,1),对于任意给定的
(0<
<1),如果u
满足条件
(6-16)则称u
为标准正态分布的上
分位点(或分位数),如图所示。由上
分位点定义可知所以2.
2分布的上
分位点定义5
对于给定的
(0<
<1),若
满足条件:
(6-18)则称点
为
2分布的上
分位点,如图所示。对于不同的
与n,上
分布点的值可以通过查表得到。3.t分布的上
分位点定义6
对于给定的
(0<
<1),若点t
(n)满足条件:
(6-19)则称点t
(n)为t分布的上
分位点,如图所示。由图6-7及t分布的上
分位点定义,可得到t分布的对称性:
(6-20)对于不同的
与n,上
分位点t
(n)的值可以通过
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年全球及中国丙二醛行业头部企业市场占有率及排名调研报告
- 2025年全球及中国头发护理用神经酰胺行业头部企业市场占有率及排名调研报告
- 2025年全球及中国DHA微囊粉行业头部企业市场占有率及排名调研报告
- 2025年全球及中国三维足底扫描系统行业头部企业市场占有率及排名调研报告
- 2025-2030全球电动跨式堆垛机行业调研及趋势分析报告
- 2025年全球及中国介孔二氧化硅微球行业头部企业市场占有率及排名调研报告
- 2025年全球及中国多相真空萃取机行业头部企业市场占有率及排名调研报告
- 2025年全球及中国铜制电积锌用阴极板行业头部企业市场占有率及排名调研报告
- 广告业务外包合同
- 服饰店铺转让合同
- 2025年春季学期学校德育工作计划安排表(完整版)
- 2025年有机肥行业发展趋势分析报告
- 2023-2024年员工三级安全培训考试题及参考答案(综合题)
- 【渞法】学会自我保护教学设计 七年级道德与法治下册(统编版2024)
- 2025-2030年中国融雪剂行业运行动态及发展前景预测报告
- 对口升学语文模拟试卷(6)-江西省(解析版)
- 2025保安部年度工作计划
- 2024年江苏经贸职业技术学院单招职业适应性测试题库
- 人居环境综合治理项目项目背景及必要性分析
- 招标采购基础知识培训
- 电力系统分布式模型预测控制方法综述与展望
评论
0/150
提交评论