《概率论与数理统计》课件 孟祥波 第六章 数理统计的基本概念与抽样分布_第1页
《概率论与数理统计》课件 孟祥波 第六章 数理统计的基本概念与抽样分布_第2页
《概率论与数理统计》课件 孟祥波 第六章 数理统计的基本概念与抽样分布_第3页
《概率论与数理统计》课件 孟祥波 第六章 数理统计的基本概念与抽样分布_第4页
《概率论与数理统计》课件 孟祥波 第六章 数理统计的基本概念与抽样分布_第5页
已阅读5页,还剩86页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

概率论

与数理统计理学院数学系“悟道诗---严加安”随机非随意,概率破玄机;无序隐有序,统计解迷离.第六章

数理统计基本概念与抽样分布第一节总体与样本二、抽样与样本一、总体与个体三、统计量四、小结一、总体与个体定义1:通常称研究对象的全体为总体,称组成总体的每个元素为个体,总体中包含个体的个数称为总体容量.

根据总体容量的多少可分为有限总体和无限总体.例如,要研究某地区2021年新出生婴儿身高情况,可认为该地区所有2021年新出生婴儿的身高为总体,每个新出生婴儿的身高为个体.总体具体表现为就是一些取值(数),如身高、射程、深度等.因此可以用某一随机变量X的取值去描述总体的取值,或者说将总体对应于某一随机变量X,把对总体的研究变成对某一随机变量X的研究,总体的分布对应于某一随机变量X的分布.由于每一个个体在被观测之前,取值不确定,且都在总体的取值范围内取值,所以也可将个体看作某一个随机变量(记作Xi),其与总体具有相同的分布.二、抽样与样本定义:从总体抽取个体的过程称为抽样,抽取出的个体称为样本,样本中含有个体的数量称为样本容量.简单随机抽样:(1)独立性:需要保证每个个体被抽到与否,不受其他个体的被抽取情况影响;(2)随机性:需要保证每个个体都有相同被抽到的可能性,以使抽样具有代表性.采用简单随机抽样抽出的样本,称为简单随机样本.总体用表示,简单随机样本可记作,则有(1)之间相互独立;(2)每个个体与总体有相同的分布.注6.1.1

如果对总体进行放回随机抽样,得到的样本一定是简单随机样本.如果对总体进行不放回随机抽样,则无法完全保证相互之间独立性.但当样本容量远小于总体容量时,可将此种情况的抽样近似看作是简单随机抽样.注6.1.2

对于简单随机样本

,可得(1)若总体的期望、方差都存在,则

,,;(2)若总体的分布函数为,则的联合分布函数为(3)若总体为离散随机变量,且其概率函数为,则的联合概率函数为(4)若总体为连续随机变量,且其概率密度函数为,则的联合概率密度函数为定义6.1.1

设是来自总体的一个样本,是样本的函数,记为,若中不含有未知的参数,则称为统计量.统计量的分布称为抽样分布.三、统计量注

(1)统计量是的样本函数,但样本的函数不一定是统计量;(2)统计量是一个随机变量,当样本的观测值为时,称

为该统计量的观测值.例如,对于正态总体,其中为已知,

为未知.取总体一组样本,则,都是统计量,而,就不是统计量.样本均值:样本方差:样本标准差:样本k阶原点矩:样本k阶中心矩:定义6.1.2

设是来自总体的一个样本,则常用的统计量有注6.1.4

除样本均值与样本方差(标准差)是最常用到的统计量之外,样本的三、四阶矩也有一些应用,四阶以上的则很少用到:样本偏度(skewness):样本峰度(kurtosis):在有些实际问题中,需要考虑样本的极大和极小相关的情况,比如质量管理、可靠性等方面,为此引入顺序统计量,中位数,分位数的概念.这个三个概念的定义详见教材。例6.1.1

记总体的一组样本为随机变量,具体到一次抽样可得一组样本观测值,设经过三次抽样得到三组样本观测值:样本组12.52.11.72.01.8组22.12.21.91.72.3组31.62.41.82.02.1此时,将每一组样本观测值由小到大依次排列,看成新的随机变量的观测值,即顺序统计量

的观测值:样本组11.71.82.02.12.5组21.71.92.12.22.3组31.61.82.02.12.4小结1.主要概念:总体,样本,统计量,抽样分布概率论

与数理统计理学院数学系“悟道诗---严加安”随机非随意,概率破玄机;无序隐有序,统计解迷离.第六章

数理统计基本概念与抽样分布第二节统计量与三大抽样分布二、分布一、分布三、分布四、小结一、分布定义6.2.1

是相互独立的随机变量,且均服从标准正态分布(

),则称是服从自由度为

的分布的随机变量,记作分布的密度函数图(2)当时,分布是标准正态分布的平方,当时,分布就是参数为的指数分布.注6.2.1

(1)分布的概率密度函数为(3)可加性:若,,且相互独立,则(4)分布的期望与方差:若,则,.二、分布定义6.2.1

设,且二者相互独立,则称是服从自由度为

的分布的随机变量,记作

分布的密度函数图注6.2.2(1)分布又称学生氏(Student)分布,其概率密度函数为(2)分布的期望与方差:二、分布定义6.2.1

设,且二者相互独立,则称是服从第一自由度为,第二自由为

的分布的随机变量,记作

分布的密度函数图注6.2.3(1)分布概率密度函数为(2)若,则

可知,且由与独立,可得

例6.2.1

已知

,证明:.证明:根据分布的定义可知,必存在相互独立的随机变量、,使得二、上分位数(点)定义6.2.1

设随机变量的概率密度函数为,对给定的,则称满足不等式的为随机变量的上分位数(点).1.若,则其上分位数记作,即有标准正态分布的上分位数图示我们可以类似的定义分布,分布与分布的上分位数,与.(2)根据标准正态分布与分布的对称性可知注6.2.4

(1)以上四种分位数均可以利用书后的附表进行查询;(3)根据分布的特点,可得(4)当,,分布的自由度的比较大时,其分位数可以通过标准正态分布的分位数近似(见教材)小结1.主要概念:三大抽样分布;分位数概率论

与数理统计理学院数学系“悟道诗---严加安”随机非随意,概率破玄机;无序隐有序,统计解迷离.第六章

数理统计基本概念与抽样分布第三节正态总体的抽样分布二、两个正态总体的统计量的分布一、单个正态总体的统计量的分布三、小结一、单个正态总体的统计量的分布定理6.3.1

对于任意总体,若它的期望和方差都存在,记,.设是取自的一个样本,、分别是样本均值和样本方差,则有证明:(1)(2)(3)(5)定理6.3.2

设是取自正态总体的一个样本,、分别是样本均值和样本方差,则有(4)与相互独立证明:(1)由正态分布的线性变换不变性可知

服从正态分布,从而可得标准化可得(3)(4)的证明略去(见教材)(2)由以及卡方分布的定义可得(5)由于且二者这独立,从而t分布的定义可知例6.3.1

设是取自正态总体的一个样本,是样本均值,求解:由,可知定理6.3.3

设是取自正态总体

的一个样本,是取自正态总体的一个样本,且这两个样本相互独立.样本均值和样本方差分别记为则二、两个正态总体的统计量的分布(1)(2)当时其中(3)(4)小结1.主要概念:单个、两个正态总体的抽样分布概率论

与数理统计理学院数学系“悟道诗---严加安”随机非随意,概率破玄机;无序隐有序,统计解迷离.第六章

数理统计基本概念与抽样分布第四节常用的数据描述方法二、样本分布函数一、折线图与直方图四、小结三、箱线图例6.4.1经调查,得到某高校某专业701班、702班、703班、704班等四个班的高等数学成绩,共计120个,具体信息如下

1班:8183845184887093657976766344705979754889728671712962547279732班:9860837873696355635452687860607454736360648675456068627793703班:9260869064834485655288796173667367697487738265836890616394834班:746063828870796569606577826580764687759165887890878848687470例6.4.2

为考察运动员水平,现随机调查甲(男)、乙(女)两名跳远运动员的跳远数据(单位:米)各50次

,得详细信息如下

甲:7.947.997.918.177.717.587.9787.857.757.758.047.577.67.557.797.797.837.527.487.667.337.77.757.477.577.797.747.737.57.358.037.887.597.578.037.777.7787.91

乙:6.186.286.36.465.915.676.276.336.196.126.126.446.085.985.756.276.26.115.85.725.965.636.116.275.955.966.326.186.235.825.786.3665.965.846.246.066.066.36.035.646.045.885.966.016.016.216.156.236.38一、折线图与直方图将例6.4.1中所有学生的成绩分为五类:优(90-100)、良(80-89)、中(70-79)、及格(60-69)、不及格(0-59),分别用1,2,3,4,5表示,这样120名学生的高等数学成绩的频数、频率和累计频率分布如下表所示.成绩频数频率累计频率190.0750.0752250.2080.2833350.2920.5754360.3000.8755150.1251.000合计1201.000

定义6.4.1对于总体,设为一组样本,为样本观测值,将从小到大排列成,合并相同项,设共有个互不相同的数,分别为

,每个数的个数分布为,且,令二、样本分布函数则称其为样本分布函数,亦称为样本的经验分布函数.注6.4.1

样本分布函数的性质:(1)单调非减性:当时,;(2)有界性:,且(3)右连续性:在每个样本观测值处都是右连续的,点是的跳跃间断点,且相应的跃度为.例6.4.3

从某总体中抽取样本容量为10的一个样本,经测量,得到的观测值分别为:求样本分布函数.将样本观测值从小到大排列为解:因此,随机变量Y在X=1条件下的条件分布律为

可以看到,对任意的实数x,样本分布函数表示事件发生的频率,而总体分布函数表示事件发生的概率.

由大数定律,在一定条件下,事件发生的频率依概率收敛于该事件发生的概率.而格里汶科(Glivenko)和坎泰利(Cantelli)于1933年从理论上严格地证明了样本分布函数与总体分布函数之间关系的结论.定理6.4.1(格里汶科-坎泰利定理)设总体的分布函数为,样本分布函数为,则关于x均匀地依概率1收敛于.即对任意的实数x,“数理统计基本定理”箱线图于1977年由美国著名统计学家约翰·图基发明,是一种利用数据排序分组来发现异常值和比较不同部分的分布特征的统计图形,也称为盒式图或箱形图.箱线图是利用样本的五个数(最小值、第一四分位数、中位数、第三四分位数、最大值)进行描述概括,由箱子和线段组成的图形.三、箱线图

以例6.4.1中701班的高等数学成绩为例,按以上的作法给出相应的箱线图.上图可以看出:701班大部分同学的成绩介于44分与93分之间,有一个异常值29分,数据的下半部分(中位数以下)比上半部分(中位数以上)的跨度大.

以例6.4.1中701~704班的高等数学成绩为例,按以上的作法给出相应的箱线图.上图可以比较清楚地看到,最高分出现在702班,但总体来说702班成绩偏低,703班成绩较好.

以例6.4.2中运动员甲、乙的跳远数据为例,按上面的作法给出相应的箱线图(见下图).两组数据对应的箱线图很清楚地显示了甲、乙两人的跳远数据不同分布.小结1.主要概念:折线图、直方图,样本分布函数概率论

与数理统计理学院数学系“悟道诗---严加安”随机非随意,概率破玄机;无序隐有序,统计解迷离.第六章

数理统计基本概念与抽样分布第五节综合例题一、例题选讲二、小结一、综合例题例6.5.1

设是取自正态总体

的一个样本,求

的分布.解由条件

知,则,进而有再根据分布的可加性,得且二者相互独立,则由分布的定义知例6.5.2

从正态总体中抽取容量为n的样本,如果要求其样本均值落在区间内的概率不小于0.90,问样本容量n至少应取多少?解设

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论