版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、2022/8/11 为什么要学数理统计 数理统计是运用概率论的基础知识,更侧重于应用随机现象本身的规律性来考虑资料的收集整理和分析,建立有效的数学方法,从而找出相应的随机变量的分布律或它的数字特征,对所关心的问题作出估计与检验。 概率论中的一个最基本的假设就是:研究对象的分布已知。而在实际中,我们往往不知道随机变量,的确切分布,这就是数理统计所讨论问题的应用背景,它需要用已有的部分信息去推断整体情况。 数理统计研究内容十分广泛,其中一类重要的问题便是统计推断.统计推断是利用试验数据对研究对象的性质作出推断,其中有两个重要方面:参数估计和假设检验。例如,要了解全班同学的身高情况,先要测量并记录班
2、上每个同学的身高,然后用记录下来的身高数据计算全班同学的平均身高。这里的第一步就是搜集数据,第二步就是从搜集到的数据集中获取信息。平均身高正是反映全班同学身高状况的重要信息。2022/8/12当然统计学中研究的问题要比这个例子复杂得多。现代统计学所提供的各种统计方法,作为在不确定情况下进行预测和决策的重要辅助工具,被广泛地应用于所有出现定量数据且需要对它们进行分析和解释的问题中(称这类问题为统计问题)。2022/8/13在对什么是统计学做详细解释之前,我们先考查两个需要应用统计方法的问题,从这些问题中我们希望大家能领悟出统计问题的基本要素。2022/8/14例1某市场分析人员搜集一个消费者的样
3、本,要求样本中每个人回答对某商品的观点。从得到的这些样本数据中,市场分析人员必须做出这种商品有无足够需求量的决定。若存在足够需求,分析人员还要选择包括设计、价格及市场范围。所有这些问题都可以从调查的样本数据所提供的信息中得到回答。例 2某百货公司对购买的一批电灯泡进行抽样检验。在检验的基础上决定是否接受这批灯泡。这种检验可能从这批灯泡中抽取15只作为样本,检验样本的废品数和平均使用寿命。是否接受的决定建立在观察到的废品数和平均使用寿命上。2022/8/17在以上两个例子中,都需要在不确定情况下对总体状态进行预测或决策,之所以产生不确定性,是因为我们无法拥有进行预测或决策所需的全部信息(总体数据
4、)。在使用不完全信息(样本数据)进行预测和决策时,必须借助于一种叫做统计推断的统计方法。通过上面的例子大家对统计问题应该有了初步的了解。下面我们将介绍上面例子中涉及到的几个统计学的基本概念,这些概念是对统计学的本质和特征的概括和反映,是统计思维网络上的结点。掌握了这些基本概念后,大家对统计问题会有更深刻的认识和理解。2022/8/18概括地讲,数理统计研究以有效的方式统计推断: 研究如何加工、处理数据,从而采集、整理察的问题做出推断和预测,直至提供依据和建议.和分析受到随机因素影响的数据,并对所考对所考察对象的性质做出尽可能精确和可靠的推断.统计学的研究内容研究如何用有效的方法收集和整理数据的
5、抽样调查、试验设计和描述性统计;研究如何用有效的方法对所得的数据进行分析、研究,从而对所研究的对象的性质 、特点作出推断的统计推断(“样本”推断“总体”)。依据推断形式不同,统计推断可分为估计和假设检验两种,它们构成了统计学的基础 。依据不同的理论模型,统计推断可分为许多不同的分支学科。比如,参数和非参数、线性和非线性、方差分析、回归分析、时间序列分析、多元统计分析等等。依据对概率的不同解释,统计推断可分为频率统计和贝叶斯统计。频率的稳定值对某件事情发生机会的信念统计推断与概率论的区别在概率论中,我们研究的随机变量的分布都是假设已知的,在这一前题下去研究它的性质、特点和规律性。例如求出它的数字
6、特征,讨论随机变量函数的分布,介绍常用的各种分布等。统计推断以概率论为理论基础,根据试验或观察得到的数据,来研究随机现象,对研究对象的客观规律性作出种种合理的估计和判断。在统计推断中,我们研究的随机变量的分布是未知的,或者是不完全知道的,人们是通过对研究的随机变量进行重复独立的观察,得到许多观察值,对这些数据进行分析,从而对所研究的随机变量的分布作出种种推断。2022/8/111第五章数理统计的基本概念总体与样本统计量数理统计中几个常用分布抽样分布定理2022/8/112总体: 在数理统计中研究对象的全体个体: 组成总体的每个单元 例如在研究某批灯泡的平均寿命时,该批灯泡的全体就组成了总体,而
7、其中每个灯泡就是个体。但是在统计里,由于我们关心的不是每个个体的种种具体特性,而仅仅是它的某一项或某几项数量指标X和该数量指标X在总体中的分布情况。在上述例子中X是表示灯泡的寿命,就此数量指标X而言,每个个体所取的值是不同的。5.1 总体与样本总体与个体统计学中组成总体的个体不仅可以是人、物、组织单位等实体,也可以是现象、事件、活动过程等非实体。但在个体是非实体时,总体通常不是有形的,而是概念性的。例如,要判断一枚硬币是否均匀,先对这枚硬币进行100次投掷试验,然后根据这100次投掷试验的结果做出这枚硬币是否均匀的结论。这个统计问题的个体是对这枚硬币的每次投掷试验,这种个体显然是个活动过程。这
8、个统计问题的总体是所有可能的对这枚硬币的投掷试验,这个总体显然是概念性的。样本与抽样分布统计推断就是通过从总体中抽取一部分个体,根据获取的数据来对总体分布得出推断的。被抽出的部分个体叫做总体的一个样本。显然,样本就是总体的一个有限子集。若将总体定义为随机变量 X ,总体分布就是随机变量 X的概率分布,总体数量特征就是随机变量 X 的数字特征。这时,从总体中抽取一个个体,就是对总体X进行一次观察并记录其结果。2022/8/115样本的定义: 从总体X中,随机地抽取n个个体:随机样本与样本值称为总体X的一个样本,记为样本中所包含个体的总数n称为样本容量.样本值: 每一次抽取所得到的n个具体数值:称
9、为一个样本值(观察值)。容量为 n 的样本在观察之前为一个n 维随机向量 ( X1,X2,Xn),当 n 次观察一经完成,我们就得到由一组实数组成的 n 维向量 (x1,x2,xn) ,它是n 维随机向量(X1,X2,Xn )的一次实现。2022/8/1162022/8/117 由于我们是利用样本观察来对总体的分布进行推断,因而从总体中抽取样本进行观察时必须是随机的。所以对于随机抽样来说,对其某一次观察结果而论,是完全确定的一组值,但它又是随每次抽样观察而改变的,由于我们要依据这一观察结果进行分析推断,并研究比较各种推断方法的好坏,因而一般考虑问题时,就不能把看为确定的数值,而应该看作为随机向
10、量X= (X1,X2, ,Xn) ,称它为容量是n的样本,因而对样本也有分布可言。数理统计的基本任务是:根据从总体中抽取的样本,利用样本的信息推断总体的性质.事实上我们抽样后得到的资料都是具体的、确定的样本值。如我们从全班同学中抽取10人测量身高,得到10个数,它们是样本值而不是样本。我们只能观察到随机变量的取值而见不到随机变量。总体、样本、样本值的关系2022/8/119总体、样本、样本观察值的关系总体 样本 样本观察值 理论分布 统计是从已有的资料样本的观察值,去推断总体的情况总体分布。样本是联系两者的桥梁。总体分布决定了样本取值的概率规律,可以用样本观察值去推断总体?2022/8/120
11、 则称两个特征:获得简单随机样本的抽样方法称为简单随机抽样.(1) 代表性:(2) 独立性:若来自总体的样本具有下列中每一个与总体有相同的分布.是相互独立的随机变量.为n的简单随机样本.简单随机样本2022/8/121定理:样本的分布2022/8/122解由独立性有: 2022/8/123解P133 例5.22022/8/124直方图与经验分布函数2022/8/1252022/8/1262022/8/127例 某食品厂生产听装饮料,现从生产线上随机抽取5听饮料,称得其净重(克)为: 351 347 355 344 351x(1)= 344, x(2)= 347, x(3)= 351, x(4)
12、= 351, x(5)= 355分析:这是一个容量为5的样本,经排序可得有序样本:经验分布函数 0 , x 344 0.2, 344 x 347Fn(x) = 0.4, 347 x 351 0.8, 351 x 1/2时,因为N(0,1)的密度函数曲线关于y轴对称,故有: u = -u 1-2022/8/150很多统计推断都是基于正态分布假设的;以标准正态变量为基石构造的三大统计量,在实际中有广泛的应用;因为,这三大统计量不仅有明确背景,而且其抽样分布的密度函数有明显表达式,被称为统计中的“ 三大抽样分布 ” 本节学习统计学经常用到的分布: 正态分布略分布、分布,t 分布 5.3 数理统计中的
13、常用分布2022/8/151 2 分布定义 设 X1, X2, Xn, 独立同分布,均服从标准正态分布N(0,1) ,则 2= X12+ Xn2 的分布称为 自由度为 n 的2分布, 记为 X 2(n)对于 x0,2分布的密度函数为2022/8/1522 分布说明(1) 当随机变量 2 2(n) 时,对给定的 (01),称满足P ( 2 2 (n) ) 的 2 (n) 是自由度为 n 的 2分布的上 分位数(2)分位数 2 (n) 可从附表4 查到。分位数 2 (n) 近似公式2022/8/153(3)2分布关于自由度的可加性(定理5.5) 分布可加性 若X 2(m),Y 2(n ), X与
14、Y独立,则 X + Y 2(m+n )期望与方差 若X 2(n),则 E(X)= n,D(X)=2n2022/8/154证明 2分布关于自由度的可加性2022/8/155补充:关于正态分布的N阶矩2022/8/1562022/8/1572分布密度曲线(4) 2分布形状取决于参数df 即n: n1,曲线极端左偏,呈反 J 型;随着n 增大,曲线渐趋左右对称。当n 30时, 2 分布趋于正态分布。2022/8/158t 分 布 设随机变量X与Y独立,且X N(0,1), Y 2(n), 则,称称 t(n) 为自由度为n的 t分布,记为t t(n) 1. t 分布定义 2022/8/159t(n)
15、的概率密度为2022/8/160 (1)t 分布受自由度( df =n)制约,每一个自由度都有一条 t 分布密度曲线。 (2)密度曲线关于t=0(纵轴)为对称轴,左右对称,且在 t0时,分布密度函数取得最大值。 (3)与标准正态分布曲线相比,t分布曲线顶部略低,两尾稍高而平。df 越小, 这种趋势越明显; df 越大,越趋近于标准正态分布。t分布的特点2022/8/161t分布的分位点设Tt(n),若对: 00,满足P T t(n) = ,则称t(n)为t(n)的上侧分位点2022/8/162t 分布的概率分布函数t 在区间(t1,+)取值的概率,即右尾概率为1-F t (df)。由于t 分布
16、左右对称,t 在区间(-,-t1)取 值的概率也为 1-Ft (df)。 t 分布 曲线 下,由 -到- t 1和由t 1到+ 两 个 相 等 的 概 率 之和,即两尾概率为 2 (1-F t (df)。不同自由度下,t 分布的两尾概率及对应临界t 值查附表3。 2022/8/163例:随机变量t t(n) 时,求分位数 t0.95(10)已知 n=10,=0.05,由于 t0.95(10) = -t10.95(10) = -t 0.05(10) 查附表3:t0.05(10) =1.812 t0.95(10) = - 1.812 P(-1.812 t 1.812)=0.90由于 t 分布关于0
17、 对称, 计算时利用分位数如下关系t(n1)= t1(n1)t 分布的计算2022/8/164F 分布设X1 2(m), X2 2(n), X1与X2独立,则称 F = (X1/m) / (X2/n) 的分布是自由度为 m 与 n的 F分布,记为 F F(m, n),其中,m 称为分子自由度,n 称为分母自由度。概率密度为2022/8/165F分布图形F 分布密度曲线是随自由度df1、df2 变化而变化的一簇偏态曲线形态随着df1、df2的增大逐渐趋于对称当随机变量F F(m,n) 时,对给定 (01) ,称满足 P( F F(m,n) = 的F(m,n) 是自由度为m 与 n 的F 分布的上
18、 分位数。F(n,m) F分位数 及 F分布计算2022/8/1662022/8/167F分布计算2022/8/168设FF(n1,n2),知证明(2):得证。由于2022/8/1692022/8/170从总体到样本抽样分布问题在统计推断问题中,经常要利用总体的样本构造合适统计量,使其服从或渐近服从已知的确定分布。将这类统计量的分布统称为抽样分布问题的引入讨论抽样分布的两个途径精确地求出抽样分布,相应统计推断为 小样本统计推断;先求样本容量趋于无穷时抽样分布的极限分布;然后在样本容量充分大时,利用极限分布作为抽样分布近似分布,再对未知参数进行统计推断。统计推断为 大样本统计推断5.4 抽样分布定理2022/8/171一、正态总体的抽样分布 设 x1, x2, xn 是来自N(, 2) 的 样本,样本均值和方差分别为x = xi /n s2= (xix)2/(n1)定理5.8(2)(1)(一)单正态总体的抽样分布定理2022/8/172证明证:2022/8/173得证U与V独立,t分布定义证(3)X与S 2 相互独立;定理5.9(1
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024-2030年中国外用止痛药行业竞争格局及投资价值研究报告
- 2024-2030年中国型煤(型焦)行业发展前景预测规划研究报告
- 2024-2030年中国四功能折叠健身器产业未来发展趋势及投资策略分析报告
- 2024-2030年中国印花涂料色浆市场运行状况及发展趋势预测报告
- 梅河口康美职业技术学院《有限元分析与可靠性设计》2023-2024学年第一学期期末试卷
- 眉山药科职业学院《小学道德与法治课程与教学》2023-2024学年第一学期期末试卷
- 2024年物业买卖合同范本:物业信息与交易条件
- 2024年度绿色建筑HSE施工与运维服务合同2篇
- 微专题物质的制备实验突破策略-2024高考化学一轮考点击破
- 2024年标准专业施工承包协议文件版B版
- 道德与法治中考备考建议课件
- 财产保险退保申请范文推荐6篇
- 食品工程原理课程设计
- YYT 0325-2022 一次性使用无菌导尿管
- 羊膜在眼科临床中应用课件
- (71)第十五章15.2.3整数指数幂1-负整数指数幂-导学案
- 初步设计方案询价表
- 2022年江苏省环保集团有限公司招聘笔试题库及答案解析
- 《汽车焊接技术》试卷期末理论考试含参考答案一套
- FMEA分析经典案例【范本模板】
- 2023-2023年山东省学业水平考试英语试题及答案
评论
0/150
提交评论