




已阅读5页,还剩85页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
数理统计,讲授:,河海大学数学系列基础课程CAI,第六章 样本及抽样分布,随机样本 抽样分布,从本章开始,我们将学习数理统计部分,前面五章的 内容属于概率论范畴。数理统计实际上是概率论的具体应 用。它的研究范围分成两个方面,一个是统计推断,另一 个是抽样理论与试验设计。本课程仅研究第一个方面的内 容。统计推断主要研究抽样分布、参数估计、假设检验等 本章的主要内容如下:,6.1 随机样本 一、总体与样本,1、总体:研究对象的全体。通常指研究对象的某项 数量指标,可记为X、Y、Z、等,它是随机变量。 2、个体:组成总体的单元。通常也指与总体对应的 某项数量指标,可用X1,X2, 等表示,它们也是随机变量。 3、样本:来自总体的部分个体X1, ,Xn 。n称为样本容量。若是按随机抽样原则得到的,则称其是“简单随机样本”或简称为“随机样本”或“样本”。,按随机抽样原则得到的样本满足以下两个条件: (1)独立性: X1, ,Xn 相互独立; (2)同分布性: X1, ,Xn与总体同分布。 来自总体X的随机样本X1, ,Xn可记为,其中f(x)是X的概率函数。 样本观测值:对样本X1, ,Xn进行观测,即 可得一组观测值x1, ,xn,二、经验分布函数,1、构造 将样本观测值: x1, ,xn从小到大排列得,为总体X的一个经验分布函数。,其中N(A)表示A中元素个数。,2、经验分布函数的性质 (1)经验分布函数是分布函数; (2)K.Glivenko(格涅汶科)证明:,其中F(x)=PXx为总体X的分布函数。,三、统计量,样本X1, ,Xn的函数g(X1, ,Xn)称为是总体X的 一个统计量,若g(X1, ,Xn)与任何未知参数无关。,4、极大、极小统计量 极大统计量:X(n)=maxX1, ,Xn, 其观测值: x(n)=maxx1, ,xn 极小统计量:X(1)=minX1, ,Xn, 其观测值: x(1)=minx1, ,xn,6.2 抽样分布,一、 2分布,统计量的分布称为抽样分布。数理统计中主要研究 如下四个分布: U分布、 2分布、 t 分布和F分布。,其密度为,1.构造,f(y) 2(n),2.再生性 若1 2(n1),2 2(n2 ), 1, 2独立,则 1 + 2 2(n1+n2 )。 3.期望与方差 若 2(n),则E= n,D=2n。 4.分位点 设 2(n),若对于:01, 存在,费歇尔(R.A.Fisher)曾经证明:当n充分大时,近似 地有,其中 2(n),从而当n充分大时(一般地45),近似地有,其中z为N(0,1)的上侧分位点。,二、t分布,1.构造 若N(0, 1), 2(n), 与独立,则,t(n)称为自由度为n的t分布。 其密度函数为,密度函数f(t)的图形与N(0, 1)的密度函数的图形 很象,只是 t(n)的图形两端尾巴厚一些,腰瘦一些。,2.基本性质: (1) f(t)关于t=0(纵轴)对称。事实上,f(-t)=f(t)。 (2) f(t)的极限为N(0,1)的密度函数,即,3.分位点 设Tt(n),若对:00, 满足 PTt(n)=,则称t(n)为t(n)的上侧分位点;存在 t/2(n)0, 满足 P|T|t/2(n)=,则称t/2(n)为t(n) 的双侧分位点.,三、F分布,1.构造 若1 2(n1), 22(n2),1, 2独立,则,F(n1, n2)称为第一自由度为n1 ,第二自由度为n2的 F分布。其密度为,2. F分布的分位点 对于:00,满足 PTf(n1, n2)=, 则称f(n1, n2)为F(n1, n2)的上侧 分位点;类似地,称f1- (n1, n2)为F(n1, n2)的下侧分 位点。 可以证明:,四、正态总体的抽样分布,这里分布N(0, 1)也称为U分布。,例,例,例,本章小结 1、总体与样本 2、经验分布函数 3、统计量概念与几个常用的统计量 4、数理统计中的几个常用分布(关键是构造) 5、正态总体的抽样分布定理,第七章 参数估计,点估计 点估计的评价标准 区间估计 正态总体参数的区间估计 区间估计的大样本法,7.1 点估计 一、参数估计的概念,定义 设X1, , Xn是总体X的一个样本,其概率函 数为f(x; ), 。其中为未知参数, 为参数空间, f(x;)可表示分布律或密度函数. 若统计量g(X1, , Xn)可 作为的一个估计,则称其为的一个估计量,记为,若x1, , xn是样本的一个观测值。,由于g(x1, , xn) 是实数域上的一个点,现用它 来估计, 故称这种估计为点估计。 点估计的经典方法是矩估计法与极大似然估计法。,二、矩估计法(简称“矩法”),定义 用样本矩作为总体同阶矩的估计,从而解出未 知参数的方法称为矩估计法或矩法。 的矩估计可记为,应满足方程:,k的取值取决于f(x; )中未知参数的维数。若维数为1,即 仅有一个参数,则可在第一个方程中让k取1;若维数为2, 则可让k取1和2,解联立方程即可得,或,余类推。,矩估计,三、极大似然估计法,1、极大似然思想 你从河海大学去火车站赶火车,25分钟后列车就要开 了,你是坐公共汽车去还是坐出租车去?答案是坐出租车 去。这是因为坐出租车在25分钟内赶到火车站的把握大 。 一般说,事件A与参数有关,取值不同,则P(A) 也不同。若A发生了,则认为此时的值就是的估计值。 这就是极大似然思想。,例5 设袋中装有许多黑、白球,不同颜色球的数量比 为3:1,试设计一种方法,估计任取一球为黑球的概率p。 解 易知p的值无非是1/4或3/4。现从袋中有放回地任取 3只球,用X表示其中的黑球数,则Xb(3, p),要估计p 的值。 对P的不同取值,X取k=0, 1, 2, 3的概率可列表如下:,X 0 1 2 3 (p=1/4) 27/64 27/64 9/64 1/64 (p=3/4) 1/64 9/64 27/64 27/64,故根据极大似然思想即知,2、似然函数与极大似然估计,为该总体的似然函数。,它实际上代表样本,取其观测值,时的概率。,定义,3、极大似然估计的推求,(1) 解似然方程法,称为未知参数的似然方程。若该方程有解,则其解就是,(2) 直接法 由似然方程解不出的似然估计时,可由定义通过分 析直接推求。,注解:若概率函数中含有多个未知参数,比如,则可解方程组,若碰到某些个参数用似然方程解不出,则可用直 接法推求。,例 设总体X的分布函数为,例,7.2 估计量的评选标准 一、无偏性,易知,样本均值和样本方差分别是总体均值和总体 方差的无偏估计。事实上,,二、有效性,易知,样本X1, , Xn的加权平均值,都是EX的无偏估计。但当i=1/n时,其方差最小。,事实上,由柯西不等式可知,的无偏估计类中有一个下界,这由如下的罗克 拉美(Rao-Cramer)不等式给出:,三、一致性,7.3 区间估计 一、概念,i=1,2,为两个统计量,给定:01,若有 p12 =1, 则称1 为置信度,(1,2)为的置信区间,1 为置信下 限,2为置信上限。(1,2)也称为的区间估计。,i=i(X1, , Xn),二、置信区间,100组观测值对应100个置信区间,每一个置信区间 可能包含 的真值,也可能不包含 的真值。若给定 =0.05,则表示100个这样的区间里,大约有95个包含 的真值。,对样本X1, , Xn的每一组观测值,比如说,我们均可由给定的置信度1,求得一个置信区间,用置信度为1的置信区间(1, 2)去估计未知参数 ,显然1是越大越好,它反映区间估计的可靠性,而 21, 则是越小越好,它反映区间估计的精度。 本课程主要讨论正态总体参数的区间估计,即置信 区间问题。,7.4 正态总体参数的区间估计,一、单正态总体均值的置信区间,1、2已知,注:在推求的置性区间的过程中,我们发现的置性区间是不唯一的,事实上,由,(1-),1-,查表计算即得的置信度为1的置信区间,也可解得 的置信区间。(置信度为1),是的长度最短的置性区间。以后,在各种情况下, 推求置性区间的思路与这里类似。,其中01。由于标准正态分布N(0,1)的密度是 单峰偶函数。,2、2未知,二、单正态总体方差的置信区间,1、未知,查表计算,即得2的置信度为1- 的置信区间,同时,也可得到的置信度为1- 的置信区间,注:这样求得的置信区间不一定是最佳的,但其 长度与最佳的置信区间的长度相差不大,使用较为方 便,故实际应用时,都是用这种方法求2(或)的置信 区间。,则可类似地解得2与的置信度为1的置信区间为,2、已知,推求正态总体参数置信区间的解题步骤: (1)根据实际问题构造随机变量,要求仅含待估参数且分布已知; (2)令该随机变量落在由分位点确定的区间里的概率为给定的置信度1,要求区间按几何对称或概率对称; (3)解不等式得随机的置信区间; (4)由观测值及值查表计算得所求置信区间。,三、双正态总体均值差的置信区间,可得1- 2的置信区间,可解得1- 2 的置信区间,四、双正态总体方差比的置信区间,1、1,2未知,2、 1,2 已知,五、正态分布参数的单侧置信限,在实际工作中,求解单侧置信限的问题经常碰到,且 具有实际意义。现把单正态总体参数的单侧置信限列表如 下:(双正态总体均值差、方差比的单侧置信限可类似求出,这里不再写出)。,7.5 区间估计的大样本法,一、双正态总体均值差的置信区间,二、(0,1)分布总体参数的置信区间,说明:对于其它非正态分布总体,也可利用中心极限 定理在大样本情形下,求出未知参数的近似置信区间 (指数分布总体除外)。,第八章 假设检验,假设检验的基本思想和概念 正态总体均值的假设检验 正态总体方差的假设检验,8.1假设检验的基本概念和思想 一、基本概念,(一) 两类问题 1、参数假设检验,总体分布已知,参数未知, 由观测值x1,xn检验假设H0:=0;H1:0,2、非参数假设检验,总体分布未知,由观测值x1,xn 检验假设H0:F(x)=F0(x;); H1: F(x)F0(x;),本课程主要讨论参数假设检验; 说明: (1)假设也称为统计假设; (2)H0称为原假设;H1称为备择假设; (3)做假设检验的最终目的是作出推断:是接受 原假设,还是拒绝原假设而接受备择假设。 (二)简单假设与复合假设 如果一个统计假设完全确定总体的分布,则称该 假设为简单假设,否则就称为复合假设。,(三) 检验法则与拒绝域 以样本(X1,Xn)出发制定一个法则,一旦观 测值(x1,xn)确定后,我们由这个法则就可作出 判断:是拒绝H0还是接受H0. 这种法则称为H0对H1的 一个检验法则,简称检验法。 样本观测值的全体组成样本空间S,把S分成两 个互不相交的子集C和C*,即S=CC*,CC*=, 假设当(x1,xn) C时,我们就拒绝H0;当 (x1,xn) C*时,我们就接受H0。子集C S就 称为检验的拒绝域(或临界域 )。,(四) 检验的两类错误 我们给出了H0对H1的某个检验法则,即给出了S 的两个划分C与C*,由于样本的随机性,在进行判断 时,还可能犯错误。 拒绝H0| H0真=(x1,xn) C | H0真 第一类错误或“弃真” 接受H0| H0假=(x1,xn) C*| H0假 第二类错误或“取伪” 这两个事件都是小概率事件,常记p拒绝H0| H0真=, p 接受H0| H0假= , ,在01之间,通常不超过0.1。,(五) 显著性检验 对于给定的一对H0和H1,总可找出许多临界域, 人们自然希望找到这种临界域C,使得犯两类错误的 概率和都很小。但在样本容量n一定时,这又是做 不到的,除非容量 n无限增大。 奈曼皮尔逊 (NeymanPearson)提出了一个 原则:在控制犯第一类错误的概率的条件下,尽量 使犯第二类错误 小,这是最优检验 (MPT) ,但是有 时MPT法则很难找到,甚至不存在。在这种情况下, 我们不得不降低要求,另提一些原则。应用上常采纳 的原则是“只对加以限制,而不考虑 的大小”。,二、显著性检验法则的构造,构造统计量t =t(X1,Xn), x1,xn为样本观测值, 令 T=t =t (x1,xn)满足某条件: (x1,xn) C 于是 pt T|H0真 =p(x1,xn) C| H0真 = ; t T通常用一个不等式来表示,这样就得到了一个检验法 则。现在,我们已经把S的划分转化为统计量 t 的值域空间的 划分,这是一个把n维的问题转化为一维的问题。,按这种法则做出的检验称为“显著性检验”,此时称为显著性水平或检验水平。,例:设某厂生产一种灯管,其寿命X N(,40000), 由以往经验知平均寿命 =1500小时,现采用新工艺 后,在所生产的灯管中抽取25只,测得平均寿命1675 小时,问采用新工艺后,灯管寿命是否有显著提高。,故观测值(x1,xn) C,可作出结论拒绝 H0 而接受 H1: 1500,即认为采用新工艺后,灯管寿命有了显著提高。,显著性检验的思想和步骤: (1)根据实际问题作出假设H0与H1; (2)构造统计量,在H0真时其分布已知; (3)给定水平的值(一般为0.05,0.025,0.01,0.005等), 求出H0对H1的拒绝域C; (4)查表、计算得分位点和统计量的值; (5)比较统计量与分位点值的大小,得出结论,依据是 小概率原理。,8.2 单正态总体参数的假设检验,一、单总体均值的假设检验,1、2已知的情形,对于假设H0:=0;H1:0,构造,查表,计算,比较大小,即得结论:,说明:(1) H0:=0;H1:u0称为双边HT问题;而 H0:=0;H1: 0(或0 或H0:0;H1:0 也称为单边HT问题,不过这是一个完备的HT问题。 (3)完
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025标准中介版房屋租赁合同
- 电风扇购销合同范本
- 代办开票合同范本模板
- 2024年云浮市新兴县招聘教育人才真题
- 2025水电安装合同
- 2025家庭房屋室内设计合同范本
- 2024年隆昌市市属事业单位考试真题
- 物业规划咨询合同范本
- 家政育婴合同(2025年版)
- 杭州 车位出租 合同范本
- 食 品 工 程 原 理 课 件 第七章 传质原理及应用
- 21张农业生产高清思维导图(珍藏)
- GB/T 15098-2008危险货物运输包装类别划分方法
- 中班科学课件:《彩色的世界》
- 普通高等学校辅导员队伍建设规定解读课件
- 《论语·为政篇》课件
- 录音证据文字模版
- 垂直轴翼形叶片网状结构的
- 什么是管壁厚度号Sch
- 河南省省属煤炭企业煤矿瓦斯治理调研报告
- 酒店工程造价目标成本控制表
评论
0/150
提交评论