第15讲概率统计王松桂.ppt

上传人：q*** IP属地：河南上传时间：2020-02-21 格式：PPT 页数：34 大小：1.07MB 积分：24 举报 版权申诉

已阅读5页，还剩29页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

概率论与数理统计第十五讲主讲教师程维虎教授北京工业大学应用数理学院数理统计学是一门应用性很强的学科它研究怎样以有效的方式收集整理和分析带有随机性的数据以便对所考察的问题作出正确的推断和预测为采取正确的决策和行动提供依据和建议数理统计不同于一般的资料统计它更侧重于应用随机现象本身的规律性进行资料的收集整理和分析第六章样本与统计量 6 1引言由于大量随机现象必然呈现出其规律性因而从理论上讲只要对随机现象进行足够多次的观察随机现象的规律性就一定能够清楚地呈现出来但是客观上只允许我们对随机现象进行次数不多的观察或试验也就是说我们获得的只能是局部的或有限的观察资料数理统计的任务就是研究怎样有效地收集整理和分析所获得的有限资料并对所研究的问题尽可能地给出精确而可靠的推断现实世界中存在着形形色色的数据分析这些数据需要多种多样的方法因此数理统计中的方法和支持这些方法的相应理论是相当丰富的概括起来可以归纳成两大类参数估计根据数据对分布中的未知参数进行估计假设检验根据数据对分布的未知参数的某种假设进行检验参数估计与假设检验构成了统计推断的两种基本形式这两种推断渗透到了数理统计的每个分支 6 2总体与样本在数理统计中称研究问题所涉及对象的全体为总体总体中的每个成员为个体例如研究某工厂生产的某种产品的废品率则这种产品的全体就是总体而每件产品都是一个个体 6 2 1总体个体与样本实际上我们真正关心的并不一定是总体或个体本身而真正关心的是总体或个体的某项数量指标如某电子产品的使用寿命某天的最高气温加工出来的某零件的长度等数量指标因此有时也将总体理解为那些研究对象的某项数量指标的全体为评价某种产品质量的好坏通常的做法是从全部产品中随机任意地抽取一些样品进行观测检测统计学上称这些样品为一个样本同样我们也将样本的数量指标称为样本因此今后当我们说到总体及样本时既指研究对象又指它们的某项数量指标例1 研究某地区N个农户的年收人在这里总体既指这N个农户又指我们所关心的N个农户的数量指标他们的年收入 N个数字如果从这N个农户中随机地抽出n个农户作为调查对象那么这n个农户以及他们的数量指标年收入 n个数字就是样本注意上例中的总体是直观的看得见摸得着的但是客观情况并非总是这样例2 用一把尺子测量一件物体的长度假定n次测量值分别为X1 X2 Xn 显然在该问题中我们把测量值X1 X2 Xn看成样本但总体是什么呢事实上这里没有一个现实存在的个体的集合可以作为上述问题的总体可是我们可以这样考虑既然n个测量值X1 X2 Xn是样本那么总体就应该理解为一切所有可能的测量值的全体又如为研究某种安眠药的药效让n个病人同时服用这种药记录服药者各自服药后的睡眠时间比未服药时增加睡眠的小时数X1 X2 Xn 则这些数字就是样本那么什么是总体呢设想让某个地区或某国家甚至全世界所有患失眠症的病人都服用此药则他们所增加睡眠的小时数之全体就是研究问题的总体对一个总体如果用X表示其数量指标那么 X的值对不同的个体就取不同的值因此如果我们随机地抽取个体则X的值也就随着抽取个体的不同而不同所以 X是一个随机变量既然总体是随机变量X 自然就有其概率分布我们把X的分布称为总体分布总体的特性是由总体分布来刻画的因此常把总体和总体分布视为同义语 6 2 2总体分布例3 例l续在例l中若农户年收入以万元计假定N户的收入X只取以下各值 0 5 0 8 l 0 1 2和1 5 取上述值的户数分别n1 n2 n3 n4和n5 n1 n2 n3 n4 n5 N 则X为离散型分布分布律为例4 例2续在例2中假定物体真实长度为未知一般说来测量值X就是总体取附近值的概率要大一些而离越远的值被取到的概率就越小如果测量过程没有系统性误差则X取大于和小于的概率也会相等在这种情况下人们往往认为X服从均值为方差为 2的正态分布 2反映了测量的精度于是总体X的分布为N 2 说明这里有一个问题即物体长度的测量值总是在其真值的附近它不可能取负值而正态分布取值在上那么怎么可以认为测量值X服从正态分布呢回答这个问题有如下两方面的理由 1 在前面讲过对于X N 2 P 3 X 3 0 9974 即X落在区间 3 3 之外的概率不超过0 003 这个概率非常小 X落在 4 4 之外的概率就更小了例如假定物体长度 10厘米测量误差为0 01厘米则 2 0 012 这时 3 3 9 97 10 03 于是测量值落在这个区间之外的概率最多只有0 003 可忽略不计可见用正态分布N 10 0 012 去描述测量值X是适当的完全可认为 X根本就不可能取到负值如若不然就需要用一个定义在有限区间 a b 取值的随机变量来描述测量值X 那么 a和b到底取什么值呢测量者事先很难确定再退一步即使能够确定出a和b 却仍很难找出一个定义在 a b 上的非均匀分布用来恰当地描述测量值与其这样还不如干脆就把取值区间放大到并用正态分布来描述测量值这样既简化了问题又不致引起较大的误差 2 另外正态分布取值范围是这样还可以解决规定测量值取值范围上的困难如果总体所包含的个体数量是有限的则称该总体为有限总体有限总体的分布显然是离散型的如例3 如果总体所包含的个体数量是无限的则称该总体为无限总体限总体的分布可以是连续型的如例4 也可是离散型的说明在数理统计中研究有限总体比较困难因为其分布是离散型的且分布律与总体中所含个体数量有关系通常在总体所含个体数量比较大时将其近似地视为无限总体并用连续型分布逼近总体的分布这样便于进一步地做统计分析例5 研究某大城市年龄在1岁到10岁之间儿童的身高显然不管城市规模多大这个年龄段的儿童数量总是有限的因此该总体X只能是有限总体总体分布只能是离散型分布然而为便于处理问题我们将有限总体近似地看成一个无限总体并用正态分布来逼近这个总体的分布当城市比较大儿童数量比较多时这种逼近所带来的误差从应用观点来看可以忽略不计样本的二重性假设X1 X2 Xn是总体X中的样本在一次具体的观测或试验中它们是一批测量值是已经取到的一组数这就是说样本具有数的属性由于在具体试验或观测中受各种随机因素的影响在不同试验或观测中样本取值可能不同因此当脱离特定的具体试验或观测时我们并不知道样本X1 X2 Xn的具体取值到底是多少因此可将样本看成随机变量故样本又具有随机变量的属性样本X1 X2 Xn既被看成数值又被看成随机变量这就是所谓的样本的二重性例6 例2续在前面测量物体长度的例子中如果我们在完全相同的条件下独立地测量了n次把这n次测量结果即样本记为X1 X2 Xn 随机样本那么我们就认为这些样本相互独立且有相同的分布其分布与总体分布N 2 相同将上述结论推广到一般的分布如果在相同条件下对总体X进行n次重复独立观测就可以认为所获得的样本X1 X2 Xn是n个独立且与总体X有同样分布的随机变量在统计文献中通常称相互独立且有相同分布的样本为随机样本或简单样本 n为样本大小或样本容量既然样本X1 X2 Xn被看作随机向量自然需要研究其联合分布 6 2 3样本分布假设总体X具有概率密度函数f x 因样本X1 X2 Xn独立同分布于X 于是样本的联合概率密度函数为例7 假设某大城市居民的收入X服从正态分布N 2 概率密度为现从总体X中随机抽取样本X1 Xn 因其独立同分布于总体X 即 Xi N 2 i 1 2 n 于是样本X1 X2 Xn的联合概率密度为由样本推断总体的某些情况时需要对样本进行加工构造出若干个样本的已知确定的函数其作用是把样本中所含的某一方面的信息集中起来 6 3 1统计量这种不含任何未知参数的样本的函数称为统计量它是完全由样本所决定的量 6 3统计量几个常见统计量样本均值样本方差反映总体均值的信息反映总体方差的信息样本标准差样本k阶原点矩样本k阶中心矩 k 1 2 反映总体k阶矩的信息反映总体k阶中心矩的信息 6 3 2抽样分布统计量既然依赖于样本而后者又是随机变量故统计量也是随机变量有一定的分布这个分布称为统计量的抽样分布定理1 设X1 X2 Xn是来自均值为方差为 2的总体的样本则当n充分大时近似地有抽样分布定理证明因X1 X2 Xn是来自均值为方差为 2的总体的样本故X1 X2 Xn独立同分布且E X Var X 2 i 1 2 n 据中心极限定理有对充分大的n 近似地有样本均值分布函数的近似计算定理应用总有样本均值与的偏差在一定范围内的概率的近似计算从上式可以看出对给定的 2和给定的c 0 当样本大小n增大时上面的概率也随之增大 n趋于无穷时上式趋近于1 任给c 0 总有例1 用机器向瓶子里灌装液体洗涤剂规定每瓶装毫升但实际灌装量总有一定波动假定灌装量的方差 2 1 如果每箱装这样的洗涤剂25瓶求这25瓶洗净剂的平均灌装量与标定值相差不

人人文库> 全部分类> 专业文献 > 金融证券

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

第15讲概率统计王松桂.ppt

文档简介

温馨提示

最新文档

评论

第15讲概率统计 王松桂.ppt

文档简介

温馨提示

最新文档

评论

相关文档

第15讲概率统计王松桂.ppt