版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第一章 统计量及其分布总体与样本统计量与抽样分布次序统计量及其分布常用的统计分布第一节 总体与样本总体与个体样本与样本分布从样本去认识总体2. 独立性: X1,X2,Xn是相互独立的随机变量. 最常用的一种抽样方法叫作“简单随机抽样”,它要求抽取的样本满足下面两点:1. 代表性: X1,X2,Xn中每一个与所考察的总体有相同的分布.抽样方式若总体的分布函数为F(x),则其简单随机样本的联合分布函数为样本分布解例解例样本数据的整理与显示 一、频数频率分布表 二、样本数据的图形显示 三、经验分布函数第二节 统计量与抽样分布一、统计量与抽样分布二、样本均值及其抽样分布三、样本方差与样本标准差四、样本
2、矩及其函数1. 统计量的定义一、统计量与抽样分布是不是实例12. 几个常用统计量的定义1) 样本均值其观察值(1) 样本矩可用于推断:E(X).它反映了总体均值的信息定义 设 为取自某总体的样本观察,其算术平均值称为样本均值,一般用表示,即 在分组样本场合,样本均值的近似公式为 其中k为组数,xi为第i组中值,fi为第i组的频数。样本均值及其抽样分布定理 若把样本中的数据与样本均值之差称为偏差,则样本所用偏差之和为0,即定理 数据观察值与均值的偏差平方和最小,即在形如 的函数中, 最小,其中c为任意给定常数。证明 定理:设总体X的均值为,方差为 ,(X1,X2,Xn)是X的一个样本,则有 设X
3、1,X2,Xn为来自某个总体的样本, 为样本均值。 则n较大时 的渐近分布为 ,常记为 这里渐近分布是指n较大时的近似分布。(1)若总体分布为 则 的分布为 ; (2)若总体分布未知或不是正态分布,但 2) 样本方差其观察值它反映了总体方差的信息可用于推断:D(X).3) 样本标准差其观察值4) 修正样本方差 X 1,X2,Xn为从该总体得到的样本, 和分别是样本均值和样本方差,则 .定理 设总体X具有二阶矩,即5) 样本 k 阶(原点)矩其观察值6)样本 k 阶中心矩其观察值特例:特例: 样本偏度 样本峰度峰度与偏度第三节 次序统计量及其分布次序统计量的概念次序统计量的抽样分布分位数箱线图次
4、序统计量特别地,例如,有 5 个样本: X1, X2 , X3 , X4 , X5观察值: 1, 3, 0, 3, 2 排序成: 0, 1, 2, 3, 3顺序统计量: X(1) ,X(2) ,X(3) ,X(4) ,X(5)定理极差特征R反映了样本观察值取值范围的大小R刻画数据的离散程度不稳健,易受极端值的影响当总体为正态总体时,在小样本情况下,R可用于估计总体标准差。 样本分位数与样本中位数样本中位数是样本按大小次序排列后处在中间位置上的次序统计量。设X(1),X (n)是有序样本,则样本中位数m0.5定义为譬如,若n=5,则m0.5 =X(3) ,n=6,则m0.5 =(X(3) + X
5、(4) )。中位数的特点1. 不受极端值的影响2. 各变量值与中位数的离差绝对值之和最小,即箱线图(box plot)箱线图由一组数据的5个特征值绘制而成,它由一个箱子和两条线段组成其绘制方法是:首先找出一组数据的5个特征值,即最大值、最小值、中位数Me 和两个四分位数(下四分位数QL和上四分位数QU)连接两个四分(位)数画出箱子,再将两个极值点与箱子相连接 第四节 三大抽样分布卡方分布T分布F分布标准正态分布的上 分位数 z设 X N (0,1) , 0 1, 称满足的点 z 为X 的上 分位数 z常用的几个数据1.(175)性质1性质2定理t 分布又称学生氏(Student)分布.2.(3
6、11)定理 定理 4 (两总体均值差的分布) 分别是这两个样本的且X与Y独立,X1,X2,是取自X的样本,取自Y的样本,分别是这两个样本的样本方差,均值,则有Y1,Y2,是样本3.(321) 定理 5 (两总体方差比的分布) 分别是这两个样本的且X与Y独立,X1, X2,是取自X的样本,取自Y的样本,分别是这两个样本的样本方差,均值,则有Y1,Y2,是样本若Tt(n), 问T2服从什么分布?解因为Tt(n), 可以认为其中UN(0,1), V2(n), U22(1), F(1, n). 一个正态总体的抽样分布设X1,X2,Xn是取自正态总体的样本,分别为样本均值和样本方差,则有两个正态总体的抽
7、样分布试确定Z的分布. 试确定Z的分布. 例 若Tt(n), 问T2服从什么分布?解因为Tt(n), 可以认为其中UN(0,1), V2(n), U22(1), F(1, n). 第二章 参数估计点估计点估计优劣的评价标准区间估计单侧置信限比例的区间估计第一节 点估计矩估计极大似然估计1. 矩估计法 其基本思想是用样本矩估计总体矩 . 理论依据: 或格列汶科定理 它是基于一种简单的“替换”思想建立起来的一种估计方法 .是英国统计学家K.皮尔逊最早提出的 .大数定律 矩估计法是英国统计学家K.皮尔逊最早提出来的 .由辛钦定理 ,若总体 的数学期望 有限,则有解 总体X的期望为 从而得到方程 所以
8、的矩估计量为 例 : 设某炸药厂一天中发生着火现象的次数X服从 解 解得到矩估计量分别为例3一般的,若总体的k阶中心距 存在时,其矩法估计为样本的k阶中心矩矩估计法的具体做法如下 设总体的分布函数中含有k个未知参数 , 它的前k阶矩 ,i=1,2, ,k从这 k 个方程中解出j=1,2,kj=1,2,k(3)用诸 的估计量 Ai 分别代替上式中的诸 , 即可得诸 的矩估计量 :(4)矩估计量的观察值称为矩估计值 .(1) 求出(2)解 由于 所以由矩法估计,得 解得 所以,参数 的矩估计量为 例5 对容量为n的子样,求下列密度函数中参数 的矩估计量。解 设 是总体 的一个样本, 设总体服从区间
9、上的均匀分布,求参数的矩估计量.例6(1)(2)(3)几个常见分布的矩估计泊松分布 () 二项分布 B (N,p),N 已知参数为 的指数总体 正态总体 N (,2 )均匀分布 U (a,b) 极大似然估计法 思想方法:一次试验就出现的事件有较大的概率 例如: 有两外形相同的箱子,各装100个球 一箱 99个白球 1 个红球 一箱 1 个白球 99个红球现从两箱中任取一箱, 并从箱中任取一球,结果所取得的球是白球.答: 第一箱.问: 所取的球来自哪一箱?既然在一次试验中得到的样本值 , 那么样本取该样本值的概率应较大,所以选取使 这似然函数 达到最大的参数值作为估计值 , 称为最大似然估计法.
10、 是样本的一个观测值, 设总体的分布律为 的概率为则样本极大似然估计法的具体作法求极大似然估计的一般步骤归纳如下: 解例这一估计量与矩估计量是相同的。解 总体X服从参数为的指数分布,则有 所以似然函数为 取对数 令 解得的极大似然估计值为 极大似然估计量为 例 设总体 X N (, 2), X1, X2, Xn 是 X的样本值, 求 , 2 的极大似然估计。7-26 , 2 的极大似然估计量分别为似然方程组为7-27极大似然估计的不变性设 是 的极大似然估计值, u( )( )是 的连续函数, 则 是 u( ) 的极大似然估计值。 7-35如 在正态总体N (, 2)中, 2的极大似然估计值为
11、是 2的连续函数故 的极大似然估计值为lg 的极大似然估计值为几个常见分布的最大似然估计泊松分布 () 二项分布 B (N,p),N 已知参数为 的指数总体 正态总体 N (,2 )均匀分布 U (a,b)X(1) 、X(n)第二节 点估计的评价标准 对于同一个未知参数, 不同的方法得到的估计量可能不同,于是提出问题应该选用哪一种估计量?用什么标准来评价一个估计量的好坏?常用标准(3) 一致性(2) 有效性(1) 无偏性无偏性则称 为 的无偏估计 .设是未知参数 的估计量,若证明: 不论 X 服从什么分布,是的无偏估计量。证是总体X 的样本,例1 设总体X 的 k 阶矩存在因而由于2有效性D(
12、 ) D( )则称 较 有效 .都是参数 的无偏估计量,若有设和 例4:设(X1,X2, X3)是来自总体X的一个样本,证明下面的三个估计量都是总体均值E(X)的无偏估计量证明估计量。若对于任意的 ,当n 时, 定义 设 是总体参数 的则称是总体参数 的相合估计量。依概率收敛于 , 即 一致性),(21nXXXLqq=0)(lim=-eqqPn均方误差 设 是 的估计量.称 为 的均方误差.注意到:定义第三节 区间估计区间估计的概念一个总体的区间估计两个总体的区间估计 一、 置信区间定义:满足设 是 一个待估参数,给定若由样本X1,X2,Xn确定的两个统计量则称随机区间 是 的置信水平(置信度
13、)为 的置信区间.分别称为置信下限和置信上限. 由图1可以看出,这100个区间中有91个包含参数真值15,另外9个不包含参数真值。 图1 的置信水平为0.90的置信区间 置信区间的意义可以解释如下:如果进行N次随机抽样,每次得到的样本值记为 , k=1,2,.,N ;则我们随机地得到N个区间( , ),k=1,2,.,N.这N个区间中,有的包含参数的真值,有的不包含.但是,这些区间中,包含参数的真值的区间大约占100( )%.1.设法构造一个样本和 的函数 使得G的分布不依赖于未知参数。一般称具有这种性质的G为枢轴量。2.适当地选择两个常数 、 ,使对给定的 ,有 p枢轴量法3.假如能将 进行
14、不等式等价变形化为 ,则有 这表明 , 是 的 同等置信区间。一、正态总体方差已知时均值的区间估计由总体服从正态分布可得 二、正态总体方差未知时均值的区间估计均值未知时方差的区间估计一个总体的区间估计两个正态总体均值差的区间估计 1.枢轴量 1.枢轴量 置信区间为 两个正态总体方差之比的区间估计(均值未知) 两个正态总体的区间估计均值的估计方差和标准差的估计(均值未知)第三章 假设检验假设检验的基本概念正态总体参数的假设检验比率p的检验p值正态概率纸 1.假设(原假设和备择假设)假设是指有一定的理由提出,但有没有充足证据的有关总体分布参数的一种看法,在分析之前就必须陈述。原假设:待检验的假设,
15、又称“0假设”,记为备择假设:与原假设对立的假设,记为其中原假设:没有充分理由不能拒绝备择假设:没有充分理由不能轻易接受一般来说,零假设总是“受到保护的假设”,没有充分的证据是不能拒绝零假设的。 例如,对一家信誉很好的工厂的产品进行检验,零假设就应该是“产品合格”;在医学界,如果希望推出一种新药替代原来长期使用的药品,零假设就是“新药不比旧药好”,.单侧假设的习惯规定 1. 检验质量是否合格, H0取合格情形. 2. 在技术革新后, 检验参数是否变大(或变小), H0 取不变大(或不变小)情形, 即保守情形.例 一项研究表明,改进生产工艺后,会使产品的废品率降低到2%以下。检验这一结论是否成立
16、建立的原假设与备择假设应为 H0: 2% H1: 2%双侧检验(原假设与备择假设的确定)例如,某种零件的尺寸,要求其平均长度为10cm,大于或小于10cm均属于不合格建立的原假设与备择假设应为 H0: = 10 H1: 10双侧检验与单侧检验 (假设的形式)假设研究的问题双侧检验左侧检验右侧检验H0m = m0m m0m m0H1m m0m m02.确定检验统计量,给出拒绝域形式检验:利用样本信息,依据一定的准则,对原假设做出是否成立的判断。检验统计量:用于做决策的统计量一个检验实际上就是对样本空间的一次划分:三、假设检验的一般步骤2. 确定检验统计量以及拒绝域形式;假设检验基本思想(补充)反
17、证法小概率原理概率事件发生,则否认假设H0 ;否则,不拒绝假设H0 .小概率推断原理:小概率事件2. 基本思想方法采用概率性质的反证法: 1. 基本原理(概率接近0的事件),在一次试验中,实际上可认为不会发生(这是人们长期积累起的普遍经验!).据一次抽样所得到的样本值进行计算. 若导致小先假设H0 成立, 再根第二节 正态总体参数的假设检验均值的检验方差的检验一、正态总体的检验(2 已知)1. H0 : 0 ; H1 : 0 4.求出临界值和拒绝域P(拒绝H0|H0为真)所以本检验的拒绝域为W :U 检验法H0 : 0 ; H1 : 00a/2za/2a/2-za/2 0 0 0 0 0U 检
18、验法 (2 已知)原假设 H0备择假设 H1检验统计量及其H0为真时的分布拒绝域2azUazU-azU 0 0 0 0 0T 检验法 (2 未知)原假设 H0备择假设 H1检验统计量及其H0为真时的分布拒绝域)1(0-=ntnSXTm2atTatT-atT 表: 一个正态总体均值的假设检验(显著性水平为) 表: 一个正态总体方差的假设检验(显著性水平为)表: 两个正态总体均值的假设检验(显著性水平为) 表: 两个正态总体方差的假设检验(显著性水平为) 解 建立假设 拒绝域应取作 由样本求得 故应拒绝H0,不能接受这批玻璃纸. 定义 在一个假设检验问题中,利用观测值能够做出拒绝原假设的最小显著性水平称为检验的p 值。 如果 p,则在显著性水平 下拒绝 H0; 如果 9.78,故我们可认为各水平间有显著差异。 第 5章 相关与回归分析PowerPoint统计学相关系数 (计算公式) 样本相关系数的计算公式或化简为相关系数(取值及其意义) r 的取值范围是 -1,1 -1r0,为负相关 0r1,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 《做功了吗》课件
- 手术总结 课件
- 西京学院《英美文学导读》2022-2023学年第一学期期末试卷
- 西京学院《书法》2021-2022学年第一学期期末试卷
- 西京学院《机器学习》2021-2022学年期末试卷
- 西京学院《工程造价软件应用》2022-2023学年第一学期期末试卷
- 2024-2025学年高考语文试题及参考答案
- 西华师范大学《智能计算》2022-2023学年期末试卷
- 西华师范大学《写实油画》2023-2024学年第一学期期末试卷
- 西华师范大学《审计学》2021-2022学年第一学期期末试卷
- 职业教育国家在线课程申报书
- 2025届高考语文复习:小说情节概括+课件
- 国开2024年秋《机电控制工程基础》形考任务2答案
- 西方近现代建筑史智慧树知到期末考试答案章节答案2024年天津大学
- 数据字典范例
- 正射数据处理操作步骤
- 西师大版一年级数学上册应用题与解决问题专项表
- 弯管机系统设计
- 乡镇纪委书记个人三年工作总结
- 2016中科院分区查询
- 电气控制柜出厂检验报告
评论
0/150
提交评论