




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
概率论与数理统计ProbabilityTheoryandMathematicalStatistics
主讲人:周鑫Tel-Mail:zhxinou2011@163.com1/31/2023概率论与数理统计第六章数理统计的基本概念SichuanUniversityJinjiangCollege1/31/2023本章转入课程的第二部分数理统计
数理统计的特点是应用面广,分支较多.社会的发展不断向统计提出新的问题.计算机的诞生与发展,为数据处理提供了强有力的技术支持,数理统计与计算机的结合是必然的发展趋势.1/31/2023从历史的典籍中,人们不难发现许多关于钱粮、户口、地震、水灾等等的记载,说明人们很早就开始了统计的工作.但是当时的统计,只是对有关事实的简单记录和整理,而没有在一定理论的指导下,作出超越这些数据范围之外的推断.1/31/2023到了十九世纪末二十世纪初,随着近代数学和概率论的发展,才真正诞生了数理统计学这门学科.数理统计学1/31/2023
数理统计学是一门应用性很强的学科.它是研究怎样以有效的方式收集、整理和分析带有随机性的数据,以便对所考察的问题作出推断和预测,直至为采取一定的决策和行动提供依据和建议.1/31/2023数理统计的任务就是研究怎样有效地收集、整理、分析所获得的有限的资料,对所研究的问题,尽可能地作出精确而可靠的结论.1/31/2023
由于推断是基于抽样数据,抽样数据又不能包括研究对象的全部信息.因而由此获得的结论必然包含不肯定性.在数理统计中,不是对所研究的对象全体(称为总体)进行观察,而是抽取其中的部分(称为样本)进行观察获得数据(抽样),并通过这些数据对总体进行推断.1/31/2023概率论与数理统计第六章数理统计的基本概念
第一节基本概念SichuanUniversityJinjiangCollege1/31/2023研究对象的全体称为总体这样定义的总体和个体是具体的对象,不符合数学研究的特点---抽象
考察某班级学生的数学课程学习成绩,则全体学生构成了一个总体,每个同学就是一个个体.
考察某工厂生产的某批灯泡的寿命,则该厂生产的该批灯泡构成了一个总体,每个灯泡就是一个个体.1、数理统计的几个基本概念总体个体总体中的一个具体对象称为个体例例问题如何改进?不是研究它们而是研究数量指标这些数量指标是服从某种分布的r.v总体:研究对象的数量指标
个体:
的值一、总体和样本1/31/2023以随机变量X代表总体的特征总体 个体 特征一批产品每件产品等级一批灯泡 每个灯泡 寿命一年的日平均气温 每天日平均气温 度数数轴上某一线段 线段中每一点 坐标一批彩票 每张彩票 号码人们感兴趣的是总体的某一个或几个数量指标的分布情况。每个个体所取的值不同,但它按一定规律分布。1/31/2023
考察某班级学生的英语课程学习成绩
因为每个学生的成绩都在全班平均成绩
的附近波动,所以总体可视为例
考察某工厂生产的某批灯泡的寿命
因为每个灯泡的寿命都在该批灯泡平均寿命
的附近波动,所以总体可视为例1/31/2023如何收集数据这一过程称为抽样问从研究对象中任取
个“个体”,观察它们的数量指标抽样的特点每次取出的样品与总体有相同的分布样本的特点?称为容量为的样本.是相互独立,与总体同分布的r.v观察前:观察后:样本值为个具体的观察数据样本的二重性独立性:要求各次取样的结果互不影响代表性:在相同条件下对总体
进行
次重复、独立观察样本观察值2、样本1/31/2023
某厂生产了一大批灯泡,现从中随机抽取5只进行检测,测得其寿命(小时)分别为总体为灯泡的寿命样本容量为5,样本为分析例样本观察值为样本二重性总体为工件长度样本容量为6,样本为分析例样本二重性对长度为的工件进行了6次测量,测量值为??样本观察值为工件实际长度未知连续型总体1/31/2023总体分析(零件合格或不合格)二重性总体分布律为
考察某工厂生产的零件是否合格,从该厂生产的一批产品中随机抽检了100个,若合格则记为0,若不合格则记为1,100个产品的检查结果为其中
为零件的次品率。例样本(独立同分布分布)样本观察值离散型总体1/31/2023由于抽样的目的是为了对总体进行统计推断,为了使抽取的样本能很好地反映总体的信息,必须考虑抽样方法.最常用的一种抽样方法叫作“简单随机抽样”.由简单随机抽样得到的样本称为简单随机样本,它可以用与总体独立同分布的n个相互独立的随机变量X1,X2,…,Xn
表示.1/31/2023定义6.1设X1,X2,…,Xn是来自总体X的容量为n的样本,如果X1,X2,…,Xn
相互独立且与总体X有相同的分布,则称X1,X2,…,Xn为简单随机样本,简称为样本或子样。代表性独立性1/31/2023设为来自总体的样本,则样本的联合分布函数为设为来自总体的样本,则样本的联合概率函数为例设为来自总体的样本,则样本的联合密度为n维正态分布样本的联合分布样本的联合概率函数1/31/2023事实上我们抽样后得到的资料都是具体的、确定的值.如我们从某班大学生中抽取10人测量身高,得到10个数,它们是样本取到的值而不是样本.我们只能观察到随机变量取的值而见不到随机变量.3.总体、样本、样本值的关系1/31/2023总体(理论分布)?样本样本值统计是从手中已有的资料--样本值,去推断总体的情况---总体分布F(x)的性质.总体分布决定了样本取值的概率规律,也就是样本取到样本值的规律,因而可以由样本值去推断总体.样本是联系二者的桥梁1/31/2023二、统计量从总体抽取样本怎样集中、提炼出有用的信息统计推断的基础:收集数据“杂乱无章”的数据包含了各种有用的“信息”问?下面的量能较好地反映全班整体学习情况
某班级《高等数学》课程考试成绩单列出
个学生成绩分别为如何评价全班整体学习情况?例分析通过构造样本函数,加工提炼出有用信息1/31/2023数据的加工整理:统计量设为来自总体的样本为
元函数,若不含任何未知参数,则称为统计量.由样本值去推断总体情况,需要对样本值进行“加工”,这就要构造一些样本的函数,它把样本中所含的(某一方面)的信息集中起来.这种不含任何未知参数的样本的函数称为统计量.它是完全由样本决定的量.1/31/2023例设为来自总体的样本,其中均未知,判断下列哪些是统计量:
1/31/2023样本均值样本方差样本标准差样本k阶矩样本k阶中心矩极小值极大值常用的统计量为什么不是(下章说明)与第4章介绍的矩有什么不同?1/31/2023例从一批灯泡中任意抽取10只,测试其寿命(单位:h),得到数据如下:
13601520153014701560138014601430试求样本均值、样本方差和样本标准差。1/31/2023概率论与数理统计第六章数理统计的基本概念
第二节抽样分布SichuanUniversityJinjiangCollege1/31/2023
统计量既然是依赖于样本的,而后者又是随机变量,故统计量也是随机变量,因而就有一定的分布,这个分布叫做统计量的“抽样分布”
.
1/31/2023
抽样分布就是通常的随机变量函数的分布.只是强调这一分布是由一个统计量所产生的.研究统计量的性质和评价一个统计推断的优良性,完全取决于其抽样分布的性质.抽样分布精确抽样分布渐近分布(小样本问题中使用)(大样本问题中使用)1/31/2023一、样本均值的分布设总体X的期望和方差分别为E(X)=μ,D(X)=σ2
,X1,X2,…,Xn是X的一个样本(子样),则有1/31/2023定理6.1设总体是X的一个样本,则定理6.2设非正态总体X具有分布F(x),且为总体X的一个样本,则当n充分大时,对于非正态总体,由中心极限定理可以得到1/31/2023分位数定义6.4设统计量U~N(0,1),对给定的常数α(0<α<1),则(1)若常数zα满足则称为为标准正态分布的显著性水平的上侧分位数。(2)若常数zα/2满足则称为为标准正态分布的显著性水平的双侧分位数。面积为1/31/2023样本统计量包含了各种有用信息集中、提炼数据中包含的有用信息它们是随机变量,必须确定其分布,称为抽样分布来自标准正态总体的抽样分布主要讨论:①②来自一般正态总体的抽样分布分布分布分布五个抽样分布定理二、三大抽样分布1/31/2023随着自由度的增加曲线重心向右下方移动(一)-分布是来自总体设的样本,令称服从自由度为的
分布,记为分布的密度函数及图形伽马函数分布的可加性且相互独立,则设推广:且设相互独立,则,于是理解为可独立变化的r.v个数则设证取个独立同分布的则与同分布分布的数学期望与方差1/31/2023KarlPearsonBorn:27March1857inLondon,England
Died:27April1936inColdharbour,Surrey,England1/31/2023它既与α有关,也与自由度n有关。书后表4给出了卡方分布的分位数1/31/2023例查
分布表,可求得1/31/2023随着自由度的增加曲线越来越趋近(二)分布且设相互独立,令称服从自由度为的
分布,记为分布的密度函数及图形易知:??利用伽马函数的斯特林公式即故当较大时,可认为英国统计学家兼化学家戈塞特(GossetWS1876-1937
)于1908年用笔名Student发表了关于
t
分布的论文,这是一篇在统计学发展史上划时代的文章,它创立了小样本代替大样本的方法,开创了现代统计学的新纪元.
Gosset,Student的最后一个字母都是t
,故取名为“t
分布”,又称为“学生氏分布”.-分布是怎样产生的t?1/31/2023WilliamSealeyGossetBorn:13June1876inCanterbury,England
Died:16Oct1937inBeaconsfield,England1/31/2023由t-分布的对称性,可知书后表5给出了t分布的双侧分位数1/31/2023(三)分布且设相互独立,令称服从自由度为的
分布,记为分布的密度函数及图形分布的重要性质若则分布是为了纪念著名统计学家费歇耳(R.A.Fisher1890-1962)而命名1/31/2023SirRonaldAylmerFisherBorn:17Feb1890inLondon,England
Died:29July1962inAdelaide,Australia1/31/20231/31/2023(四)抽样分布定理最重要的总体:问题question如何由样本推断?分析:对的推断是通过构造统计量实现的如何构造“好”的统计量①②服从什么分布?统计推断中最重要的结论:五个抽样分布定理1/31/2023仍服从正态分布,且定理一证的样设是来自总体本,则独立同分布由正态分布的性质知,线性组合1/31/2023n取不同值时样本均值的分布1/31/2023定理二的样本,设是总体分别为样本均值和样本方差,则有相互独立①②分析???(证略)1/31/2023n取不同值时的分布1/31/2023定理三的样本,设是总体分别为样本均值和样本方差,则有证由定理一、定理二有且与独立,由分布的定义有结果分析即“平均”说来与的差别不大,故可用“代替”两个未知参数一个未知参数1/31/2023定理四的样本;设是总体的样本,且两样本相互独立,是总体两样本均值和样本方差分别为则证由定理二,有因两样本独立,故独立1/31/2023定理五的样本;设是总体的样本,且两样本相互独立,是总体两样本均值和样本方差分别为则证其中,且相互独立又由的独立性及分布的可加性有由两样本的独立性及分布的定义有1/31/2023设为总体的一个样本,为样本均值,则下列结论中正确的是(
)
D1/31/2023
总体样本统计量描述作出推断研究统计量的性质和评价一个统计推断的优良性,完全取决于其抽样分布的性质.随机抽样我们介绍了数理统计的基本概念.小结1/31/2023我们介绍了常用的统计三大分布:我们还介绍了5个抽样分布定理,要牢固掌握.分布,t分布,F分布.注意它们的定义和基本性质.1/31/2023第六章数理统计的基本概念问6.1:数理统计的研究对象和目的是什么?答:“数理统计学”是数学的一个分支,它的任务是研究怎样用有效的方法去收集和使用带随机性影响的数据,它的具体含义包括以下几层意思:1)能否假定数据有随机性,是区别数理统计方法与其他数据处理方法的根本点。数据的随机性来源有两种:1/31/2023a)问题中涉及的研究对象为数很大,只能抽取部分样品加以研究,如测定10000支灯管的寿命,只能抽取其中100支进行测试(测试结束,这100支灯管就失去了使用价值),而这100支灯管的抽取是带随机性的。b)数据的随机性来源于测量误差或者试验的随机误差,如考察产品的质量,温度和压力是重要因素。但当温度和压力取为定值时,质量仍因大量其他因素的影响,如原材料的差异,使用的设备和操作人员的经验差异等而有一定的波动,试验结果仍包含有随机误差。1/31/20232)所谓“用有效的方法收集数据”可归结为:b)要使数据包含尽可能多的与研究问题有关的信息。例如对上海市居民收入的状况进行研究时,我们应调查多少户居民比较合适,太少了没有代表性,太多了费用昂贵,究竟确定几户合适就要用统计方法。另外若确定了选取1000户,如何选取?如果只从高收入人群调查,就失去了代表性,数据谈不上有效性。a)建立一个数学上易于处理的尽可能简单的模型描述所得的数据。1/31/2023如果用纯随机化方法抽取,则数据就有一定的代表性,本教材讨论的正是这种模型。是否有更有效的方法,例如高收入人群占30%、低收入人群占70%,那么我们从高收入人群中随机抽300户,而从低收入人群中随机抽700户,这时的数据确实更为有效等等。由此产生了数理统计的两个分支“抽样理论”和“试验设计”。3)“有效地使用随机数据”的含义即将抽得的随机数据用有效的方式去集中,提取与研究问题有关的信息,1/31/2023并利用它对提出问题作出一定的结论,这种结论称为“统计推断”。但统计推断并不是绝对精确和可靠的,这正是数据随机化带来的影响,然而推断应尽可能的“可靠”。本教材中讨论的“点估计,区间估计和假设检验”正是统计推断中的重要内容。显著性水平,置信水平等相应的概率大小正反映这些统计推断方法的“可靠性”的大小。“统计推断”中有许多统计方法来源于实践中产生的“统计思想”,如“极大似然法”,“矩法”等,它有一定的合理性,但又不是“绝对精确”。1/31/2023答:样本表现为一大批的数字,很难直接用来解决我们所要研究的具体问题,所以常常需要把样本数据整理加工成若干个简单明了的数字特征,当样本数据确定后,统计量的值即可以知道了。所以统计量综合了样本的信息,是统计推断的基础.只有理解了这些统计思想才会对统计方法深入理解。只有对“可靠性”大小的正确理解才能对研究的结论作出正确的阐述。问6.2:为什么要提出统计量?1/31/2023答:分布,t分布,F分布都是从正态总体中衍生出来的,几种常用的统计量的分布都与这三大分布有关,所以这三大分布在正态总体的统计推断中起着重要的作用。问6.3三大分布的作用是什么?1/31/2023第六章
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 设备自主安全管理制度
- 设施维护保养管理制度
- 设计单位勘察管理制度
- 评估公司行政管理制度
- 诊所前台登记管理制度
- 诊所药品采购管理制度
- 财务部门进出管理制度
- 财政奖励项目管理制度
- 货物托运窗口管理制度
- 货车装货排队管理制度
- 7数沪科版期末考试卷-2024-2025学年七年级(初一)数学下册期末考试模拟卷04
- 胃管置入术考试题及答案
- 2025年全国统一高考英语试卷(全国一卷)含答案
- 郑州大学cad期末考试试题及答案
- 学院就业工作管理制度
- 保利大剧院面试题及答案
- 吉林省吉林市名校2025年七下英语期末考试模拟试题含答案
- 2025年智能科技与数字经济对社会交通出行方式与效率的影响报告
- 2025年机器人技术与应用开发考试试题及答案
- 2025届福建省厦门市名校数学七下期末质量检测试题含解析
- 北京社工考试题及答案
评论
0/150
提交评论