统计学讲义最新稿.doc_第1页
统计学讲义最新稿.doc_第2页
已阅读5页,还剩11页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第五章统计量及其分布在概率论的学习中,我们已经知道,随机变量及其概率分布 全面描述了随机现象的统计规律性,但在实际问题的研究中概率 分布往往是未知的。我们要讨论统计量的分布,找到总体参数与 统计量的分布之间的联系,进而通过样本去推断总体的数字特 征。第一节总体与样本1 总体统计学把所要研究的事物或现象的全体称为总体,而把构成 总体的每个元素成员称为个体。要研究10,000名在校大学 生,10,000名大学生就构成总体,每位大学生就是个体。实际 问题的研究中,我们关心的往往不是大学生个体的一切方面, 而是它的某个数量标志,比方大学生的身高,这时所有的身高就 构成总体,总体表现为一个数据集,其中有

2、的数值大有的数值小, 有的出现时机多,有的出现时机少,记身高为X,它是一个随机 变量,记其分布函数为F x 。可以把X的所有可能取值看做 总体,并称这一总体为具有分布函数Fx的总体。总体也可以是多维的,如研究大学生的身高对体重的影响, 身高和体重这两个数量标志就构成二维随机向量X- X?,其 取值的全体就构成总体,即二维总体,记二维随机向量Xi , X2 的联合分布函数为F xi, x2:L称这一总体为具有分布函数F xi, X2 的总体。2祥本统计学对总体的研究是以样本为工具的。为了掌握总体的分 布规律,从总体中随机抽取n个个体,其标志值(比方身高数值) 记为(X1 , X2 , . , X

3、n),那么(Xi , X2 , . , X称为总体的一个样本, 样本包含的个体的数目n称为样本容量。由于样本是从总体中随机抽取的,抽取前无法预知它的数值, 每个Xi(l,2 ,n)都是一个随机变量,样本(X1X,X那么是一个 n维随机向量。样本在抽取后就有确定的观测值,表现为n个具 体的数据(X1 , X2 / . / Xn)。3.简单随机样本抽取样本是手段,推断总体才是目的。为使样本更好的反映 总体的信息,对样本抽取有两个根本要求。一是样本具有随机性, 总体中每个个体都有同等可能性进入样本,即每个Xi与总体X 具有相同的分布F ( x 二是样本满足独立性,即XhX2Xn相 互独立,每一人的取

4、值不影响另一人的取值。如果从总体X中抽取样本(“2,X ),其每个分量(/ = 1,2,)都与总体X具有相同的概率分布,且相互独立,那么 这样的抽样方法称为简单随机抽样,而如此得到的样本,称为简 单随机样本。如果总体X具有分布函数)或概率密度/(X)z显 然来自总体X的简单随机样本(知/,)具有联合概率分布 fl F(x)或联合概率密度fl/(x)e/-I/-I4 总体分布函数与样本分布函数样本是总体的代表,简单随机样本能较好的代表总体,其代 表性到底如何呢?设Xi , X2 , . , Xn是取自分布函数为F(X)的总体的样本, 将样本观测值按升序排列,记为X(l) , X(2)X(n)/定

5、义如下函 数0,当x F(x) = k / n.当x x m那么Fn(X)是一非减右连续函数且满足Fn(-oc) = 0Fn(+co) = l由此可见,Fn(X)是一个分布函数,称为样本分布函数(经验分布 函数L对于每一固定的X , Fn(x)是事件X x发生的频率,当n 固定时,不同的样本观测值Xi ZX2.,Xn将有不同的Fn(x) z Fn(x) 是一随机变量。格里纹科定理:设Xi , X2,Xn是取自总体分布函数(理 论分布函数)为F(X)的样本,Fn(X)是样本分布函数,有P(lim sup Fn (x) 一 F(x)| = 0) = 1定理说明,当n充分大时,样本分布函数是总体分布

6、函数的一个 良好的近似,这就是为什么我们用样本推断总体的理由。第二节统计量及其分布1.统计量设Xx“,X为来自总体X的一个样本,那么称不包含任何 未知参数的实值函数冷X九为一个统计量。例如JXPX2是从正态总体中抽出的样本,其中,P是未知参数,那么|X, + X, , X,+3 , X; + Xf都是统计量,因为2 - 1 2它们不含有未知参数。而 -X.+ X2-/, 土那么不是统计量。2c必须注意,统计量中不能含有未知参数,但允许含有参 数。例如:设总体X N|JQ分从中抽取_个样本X- X2,, Xn ,那么,当pzO2时,壬半是一个统计量,而当|Jq2中有一个未知时,X-/0W;才(X

7、; )n 2打(彳)o,当 A-ai4,其中是它的参数,称为自由度。随机变量X是服从自由度为“的F分布以后简记为X *何,F图是才分布的密度函数曲线。(3 )假设XN(O,1) , rZ2(n), 且X与Y相互独立,那么随机变量侖服从自由度为啟分布泪记为。分布的密度函数为心畀2)=也半(+(+)Tn小皿nF图是吩布的密度函数曲线。(4 )假设x与丫是相互独立的随机变量,分别服从自由度为m和n的*分布。那么随机变量f = A 导服从自由度为(“)的fX. 7/ Y mm+n分布,简记为FFgn) , F分布的密度函数为/(w) = )(k)k(l + tx) 2 心0;r伴)r()2 20.x

8、= 1 一PF 良如 = 1_。5沪由比拟两式可得 如九95610 =F分布分布和尸分布的密度函数中都出现了函数厂,它 是数学分析中的一种特殊函数,形式为厂珂叫-加。上式中 的积分很难直接计算,同样这三种分布的分布函数也是很难直接 求解,因为采用制表的方法给出它的数值,在实际应用中可奁表 求的随机变量落在各区间中的概率。这里特别提请注意的是,分 布的对称性,它的密度函数曲线是关于直线x = 0对称的,因此一 般只给出x0的数值,这一点与这个态分布的情形相似。2 来自正态总体的统计量的分布本节介绍取自正态总体的一些统计量的精确分布,这些分布 在后面的统计推断中常常要用到。(1 )样本均值(2)统

9、计量0,1证明前已证得ex= xaDx= n走理设(XPX2,-,X;r雇来自正态总体N(“&)的一个样本, 那么又由概率论的知识知,服从正态分布的随机变量的线性函数仍服从正态分布,故X=-YXl-N(p.)nn所以走理2设(雇来自正态总体N(“.p)的一个样本, 那么样本均值乂与样本方差S,相互独立,并且有归竺=丄左住厂商才(-1)b s2=t-2“ Q一 11证明易知E(X-Y) = E(X)-E(Y) = “一“2D(X -F) = D(X) + D(P) = + rn n所以(X _ V)N(“ _“2,=+ =)m n从而得u_(x Y)yg)ngi)由给定的条件及定理知仝蹙小心,中

10、L八心crCT并且他们相互独立再由才分布的可加性知_/呼*+ _2于是,由定义知l = 一刃一一耳)严“a 伽 + ?_2)JVm + n - 2 J(仍_1)S;+(_T)S; V显然,当“訴时应有T = L 戸-严皿2伽+2J?_1S:+_1S; Vm + n走理5设XX2,X和僅必,比分别是来自正态总体N“b和N“2,的两个样本,它们相互独立/那么统计量S2/a2证明由定理知因两个样本相互独立,所以呼 7与誉 57也 相互独立,从而由定义可知讣皿)F = -L= Fm-,n-1)注U_l) S仙6 /显然,当b:=b;时应有F = *F也-1,“-13 来自非正态总体的样本均值乂的近似分布当样本来自非正态总体时,其样本均值乂的抽样分布又是怎 样的呢?为了答复这一问题洗来回忆概率论中的独立同分布中 心极限定理。设随机变量并/,儿相互独立,服从同一分布,且具有有限的期望EXJ = “和方差DX, = a2O , i = l,2,n z那么随机变量的分布函数巴对任意X ,满足lim Fn(x) = imPUnn-k个等 于0 ,它实际服从二项分布弘“,即

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论