




免费预览已结束,剩余70页可下载查看
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
定义:数理统计是以概率论为基础,研究社会和自然界中大量随机现象数量变化基本规律的一种方法。其主要内容有:参数估计、假设检验、相关分析、试验设计、非参数统计、过程统计等。,特点:,它以随机现象的观察试验取得资料作为出发点,以概率论为理论基础来研究随机现象.根据资料为随机现象选择数学模型,且利用数学资料来验证数学模型是否合适,在合适的基础上再研究它的特点,性质和规律性.,起源与发展:,古典时期(19世纪以前):这是描述性的统计学形成和发展阶段,是数理统计的萌芽时期。瑞土数学家贝努里(1654-1795年)较早地系统论证了大数定律。1763年,英国数学家贝叶斯提出了一种归纳推理的理论,后被发展为一种统计推断方法贝叶斯方法,开创了数理统计的先河。法国数学家棣莫佛(1667-1754)于1733年首次发现了正态分布的密度函数,并计算出该曲线在各种不同区间内的概率,为整个大样本理论奠定了基础。1809年,德国数学家高斯(1777-1855)和法国数学家勒让德(1752-1833)各自独立地发现了最小二乘法,并应用于观测数据的误差分析,在数理统计的理论与应用方面都作出了重要贡献。,近代时期(19世纪末至1845年):数理统计的主要分支建立,是数理统计的形成时期。1889年,英国数学家皮尔逊(1857-1936)提出了矩估计法,次年又提出了频率曲线的理论,并于1900年在德国数学家赫尔梅特在发现卡方分布的基础上提出了卡方检验,这是数理统计发展史上出现的第一个小样本分布。1908年,英国的统计学家戈塞特(1876-1937)创立了小样本检验代替了大样本检验的理论和方法(即t分布和t法),这为数理统计的另一分支多元分析奠定理论基础。1912年,英国统计学家费歇(1890-1962)推广了t检验法,同时发展了显著性检验及估计和方差分析等数理统计新分支。这样,数理统计的一些重要分支如假设检验、回归分析、方差分析、正交设计等有了其决定其面貌的内容和理论.数理统计成为应用广泛、方法独特的一门数学学科。,现代时期(1945年以后):美籍罗马尼亚数理统计学家瓦你德(1902-1950)致力于用数学方法使统计学精确化、严密化,取得了很多重要成果,他发展了决策理论,提出了一般的判别问题,创立了序贯分析理论,提出著名的序贯概率比检法。瓦尔德的两本著作序贯分析和统计决策函数论,被认为是数理发展史上的经典之作。由于计算机的应用,推动了数理统计在理论研究和应用方面不断地向纵深发展,并产生一些新的分支和边缘性的新学科,如最优设计和非参数统计推断等。当前,数理统计的应用范围愈来愈广泛,已渗透到许多科学领域,应用到国民经济各个部门,成为科学研究不可缺少的工具。,第四章抽样分布,4.1.基本概念4.2.抽样分布4.3.三种分布,抽样调查:通过调查群体中的一部分个体来了解整个群体.概率论的任务:对不同的抽样结果出现的可能性大小进行讨论,为根据样本情况推断总体情况提供理论依据.数理统计的任务:根据样本情况推断总体情况.,4.1基本概念,一、总体与个体:,总体:某一个问题的研究对象的全体.个体:组成总体每个基本单元.,把研究对象的某项数量指标的全体看作总体;把每个数值看作个体,一般地,我们把所研究的总体,即研究对象的某项数量指标记作X,它的取值在客观上有一定的分布,X也是一个随机变量,总体,R.V.X,有限总体,无限总体,例.研究一批灯泡的平均寿命.该批灯泡的全体:总体,其中每个灯泡:个体.,二、抽样与样本,抽样:为了推断总体的性态而从总体中抽取部分个体的过程称为抽样.样本:设从总体X中随机抽取或观察n个个体X1,X2Xn,所得的这一组个体(X1,X2Xn)称为总体X的一个样本.其中个体的数目n称为样本容量.,注意:,在抽取或观察每个个体之前,X1,X2Xn都是未知的,因而它们都是随机变量,(X1,X2Xn)为n维随机变量当n次抽取或观察一经完成,我们就得到一组实数(x1,x2,xn),称其为样本观察值或样本值,三、简单随机抽样,定义:如果X1,Xn是相互独立并且与X同分布的随机变量,则称X1,Xn为来自总体X的容量为n的简单随机样本,简称样本.,注:有限总体时,采用放回抽样所得的样本才是简单随机样本,今后只讨论简单随机样本,简单随机样本满足的三个条件:(1).随机性:抽样或观察应随机地进行,每个个体被抽或被观察的机会均等;(2).独立性:每次抽取或观察独立进行,其结果不受其它抽取或观察结果的影响,(3).代表性:即从总体中抽出的一组样本,它在所关注的指标上可以代表该群体.,在上述三个条件之下,X1,X2Xn是相互独立的,且与X有相同的分布,四、统计量,定义2:设X1,X2,Xn为总体X的一个容量为n的样本,g(X1,X2,Xn)为一个连续函数,如果g()中不包含未知参数,则称:g(X1,X2,Xn)为关于总体X的统计量.,统计量即不包含未知参数的样本函数,例.设X1,X2,Xn为来自总体N(,2)的样本.其中已知,2未知,则,哪些是统计量?,注:几种重要的统计量,4.2抽样分布,注意:统计量是独立同分布随机变量X1,X2Xn的函数,因而它也是一个随机变量,从而也就有了统计量的分布。,一、和的分布,定理1:设X1,X2是两个独立随机变量,其密度函数分别是fx1(x1),fx2(x2),如果X=X1+X2,则X的密度函数是,分析:,证明:,例:设X1,X2独立同分布于N(,2),求X1+X2的分布.,故X1+X2N(2,22),解:由,知,类似地X1-X2N(0,22),例:设X1和X2独立,分别服从二项分布B(n1,p)和B(n2,p).求Y=X1+X2的分布.,解:,二、样本均数的分布,定理2:设总体XN(,2),X1,X2,Xn为其容量为n的样本,则,一般结果:随机变量XN(,2),则它的线性函数Y=aX+b仍然服从正态分布,并且YN(a+b,a22)这里a,b为常数.,更一般结果:X1,X2,Xn相互独立,并且i=1,2,n,则其线性组合:仍然服从正态分布,并且这里ci为不全为零的常数.,三、一个重要定理,设X1,X2,Xn是取自总体N(,2)的一个样本,则,一、2分布,定义1:设X1,X2,Xn独立同分布于N(0,1),则称服从自由度为n的分布,记,4.3三种分布,注:,2(n)分布的概率密度函数为:,这里:,1、数字特征:,2、可加性:,3、上侧分位数:,性质,二、t分布,定义2:设XN(0,1)与Y2(n)独立,则称服从自由度为n的t分布,记tt(n).,1).图形关于t=0对称;即有E(X)=02).t分布的的极限是标准正态分布,即:事实上,当n30时,两者就非常接近了.,t分布的几个简单性质:,3).对于给定的01,称满足件的点t(n)为t分布的上侧分位点。,定理:,这里:XN(1,2),YN(2,2),且,从而由t分布的定义得:,证明:,且,例题:某克山病区测得11例急性克山病患者以及13名健康人的血膦值如表,问该地克山病患者与健康人的血膦值是否不同?现假设两组数据的方差是相同的,则这个题目实际是问两组数据的均值是否相同?,我们现在的问题就是判断EX是否等于EY,那我们自然选择统计量作为我们的判定对象,也即当时我们即可判定:EXEY!由于数据本身是随机的,因此必定在一定范围内波动,因此我们只能利用的概率分布来判定!但是的分布是含有参数的,故我们选择:作为我们的判定标准。,关于判别标准的几个问题:(1).什么样的事件才足以使我们作出判决?由于事件发生的随机性,只有某个事件的发生有足够的信息量才能作出判决。(2).概率上的小概率事件必然发生和统计中的判别准则有什么不同?(3).事件发生的合理性准则,即小概率事件不该发生。,统计过程:假设总体服从一定的分布,那么我们得到的样本就应该是“合理的”!从而统计量的取值(样本观察值)就应该是合理的,即不应该是一个小概率事件。这就是样本和样本观察值之间的关系,也是概率和统计之间的关系。,三、F分布,定义3:设随机变量并且与相互独立,则称随机变量服从自由度为(n1,n2)的F分布,记FF(n1,n2).,证明:,F分布的上侧临界值(上分位点):,满足上式(01)的点F(n1,n2)为F分布的上分位点.,例题:某克山病区测得11例急性克山病患者以及13名健康人的血膦值如表,问该地克山病患者与健康人的血膦值是否有相同的方差?也即这两批数据是否有足够的代表性?,我们现在的问题就是判断是否等于,那我们自然选择统计量作为我们的判定对象,也即当时我们即可判定:!由于数据本身是随机的,因此必定在一定范围内波动,因此我们只能利用的概率分布来判定!我们的假定是,故我们选择:作为我们的判定标准。,例:设总体X服从正态分布N(,2),从中抽取容量为16的样本,试在:1)已知2=252)2未知,但已知样本方差S2=20.8的情况下,求样本均值与总体均值之差的绝对值小于2的概率.,解:1).由于统计量,2).由于2未知,但S2=20.8,这时统计量:,4.4.样本分布图,随机变量的概率密度或分布函数,可以通过函数图来直观刻画总体的规律。对于样本,我们也可以做出反映样本频率分布密度的直方图和反映样本累积频率的经验分布图。,1。直方图,例:给定某次考试成绩,现考察各个分数段的分布情况。通常先分组,了解大致趋势,最后再给出总体分布;,Histogram,例:在散剂分装过程中,随机抽取100袋称重,结果如下.画出袋装散剂重量X的频率直方图.,2。作图步骤,4.确定组距h5.计算各组的上、下边界值6.计算各组的组中值xi7.统计落入各组的数据个数,整理成频数表8.作直方图,Histogramwith10pointrange,Histogramwith5pointrange,思考题:1).组间距的大小对于直方图的图示有什么影响?2).什么样的数据有更大的代表性?怎么衡量数据本身对总体的代表性呢?3).能否解释统计中为什么要采用随机抽样!,3。经验分布函数,定义:如果总体X的n个独立观察值,其累积频率:称Fn(x)为样本分布函数或经验分布函数.,例.随机地观测总体X得8个数据:2.5,3,2.5,3.5,3,2.7,2.5,2,求X的经验分布函数.22.5=2.5=2.52.73=33.5,例:设有150名学生进行英语测验,试完成下表:,例:根据已知数据列表如下,于是得频率直方图为,而积累频率的直方图为,4。理论分布函
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 三年级信息技术上册 第十二课 我做小玩具教学设计 华中师大版
- 七年级生物上册 第一单元 第1章 第1节 生物的特征教学设计 (新版)新人教版
- 人教版六年级音乐下册 第四单元唱歌《爱我中华》教学设计
- 妇幼保健院医疗保健技术培训
- 七年级地理下册 第四章 第二节 土地资源与农业教学设计 中图版
- 冀教版(2024)七年级上册(2024)5.3 解一元一次方程教学设计
- 七年级数学下册 第六章 实数6.2 立方根教学设计 (新版)新人教版
- 人教2011课标版地理七年级下:6.2 亚洲的自然环境 教学设计
- 人教版 (新课标)七年级下册第四单元 生物圈中的人第一章 人的由来第一节 人的起源和发展教案配套
- 初中政治思品人教部编版七年级上册(道德与法治)享受学习教案设计
- 2024年新疆财经大学招聘事业编制人员真题
- 2025年山东交运怡亚通供应链管理有限公司招聘笔试参考题库含答案解析
- 自主招生常考试题及答案
- 私人水源转让协议合同
- 2025年中国坡莫合金磁芯行业市场发展现状及投资战略咨询报告
- 教育培训公司的成本控制
- 四川成都历年中考作文题与审题指导(2005-2024)
- 北京市网球运动管理中心2024年下半年公开招聘工作人员笔试历年典型考题及考点剖析附带答案详解
- 电视台采编岗试题及答案
- 2025-2030中国全自动洗鞋机行业市场现状供需分析及市场深度研究发展前景及规划可行性分析研究报告
- 期货交易基础知识单选题100道及答案
评论
0/150
提交评论