




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第六章 数理统计的基本概念一、教学要求 1理解总体、个体、简单随机样本和统计量的概念,掌握样本均值、样本方差及样本矩的计算。 2了解 分布、t分布和F分布的定义和性质,了解分位数的概念并会查表计算。 3掌握正态总体的某些常用统计量的分布。 4了解最大次序统计量和最小次序统计量的分布。 本章重点:统计量的概念及其分布。二、主要内容 1总体与个体 我们把研究对象的全体称为总体(或母体),把组成总体的每个成员称为个体。在实际问题中,通常研究对象的某个或某几个数值指标,因而常把总体的数值指标称为总体。设x为总体的某个数值指标,常称这个总体为总体X。X的分布函数称为总体分布函数。当X为离散型随机变量时,
2、称X的概率函数为总体概率函数。当X为连续型随机变量时,称X的密度函数为总体密度函数。当 X服从正态分布时,称总体X为正态总体。正态总体有以下三种类型: (1)未知,但已知; (2)未知,但已知; (3)和均未知。 2简单随机样本 数理统计方法实质上是由局部来推断整体的方法,即通过一些个体的特征来推断总体的特征。要作统计推断,首先要依照一定的规则抽取n个个体,然后对这些个体进行测试或观察得到一组数据,这一过程称为抽样。由于抽样前无法知道得到的数据值,因而站在抽样前的立场上,设有可能得到的值为,n维随机向量()称为样本。n称为样本容量。 ()称为样本观测值。 如果样本()满足 (1)相互独立;(2
3、) 服从相同的分布,即总体分布; 则称()为简单随机样本。简称样本。 设总体X的概率函数(密度函数)为,则样本( )的联合概率函数(联合密度函数为) 3. 统计量 完全由样本确定的量,是样本的函数。即:设是来自总体X的一个样本,是一个n元函数,如果中不含任何总体的未知参数,则称为一个统计量,经过抽样后得到一组样本观测值,则称为统计量观测值或统计量值。4. 常用统计量(1)样本均值: (2)样本方差: (3)样本标准差:它们的观察值分别为:这些观察值仍分别称为样本均值、样本方差和样本标准差。(4)样本(阶)原点矩 (5)样本(阶)中心矩 其中样本二阶中心矩又称为未修正样本方差。(6)顺序统计量
4、将样本中的各个分量由小到大的重排成则称为样本顺序统计量,为样本的极差。 (7)样本相关系数:其中:分别为数据的样本均值,分别为样本a标准差。5、直方图与箱线图 (1)直方图 先将所有采集的数据进行整理,得到顺序统计量,找出其中的最小值,最大值,即所有的数据都落在区间上,现取区间(其中可取等),该区间能覆盖区间,将区间等分为个小区间(先取一个区间,其下限比最小的数据稍小,其上限比最大的数据稍大,然后将这一区间等分为个小区间,通常较大时取,当时则取。若取得过大,则会出现某些区间内频数为零,分点通常取比数据精度高一位,以避免数据落在分点上),小区间的长度记为,称为组距,小区间的端点称为组限,数出数据
5、落在每个小区间内的数据的频数,算出频率,然后自左至右依次在各个小区间上做以为高的小矩形,这样的图形就称其为频率直方图。显然这种小矩形的面积就等于数据落在该小区间的频率,直方图的外廓曲线接近于总体的概率密度曲线。 (2)分位数定义 设有容量为的样本观察值,样本分为数记为,它具有以下性质:(1)至少有个观察值小于或等于;(2)至少有个观察值大于或等于样本分位数可按以下法则求得: 将按从小到大的顺序排成 ,若不是整数,则只有一个数据满足定义中的两点要求,这一数据位于大于的最小整数处,即为位于处的数。 ,若是整数,则都符合性质要求,故取的平均值。 综上可得: 特别的: 0.25分位数又称为第一四分位数
6、,又记为;0.75分位数又称为第三四分位数,又记为 (3)箱线图: 数据集的箱线图是由箱子和直线组成的图形,它是在基于以下5个数据的图形概括:最小值最大值,做法如下:(1)画一水平数轴,在轴上标记最小值最大值,在数轴上方画一个上下侧平行于数轴的矩形箱子,箱子的左右两侧分别位于的上方,在点的上方画一条垂直线段,线段位于箱子的内部;(2)自箱子的左侧中点引一条水平线直至最小值上方;在同一水平高度自箱子右侧引一条水平线直至最大值上方。箱线图完成。在数据集中某一个观察值不寻常的大于或小于该数集中的其他数据,称为疑似异常值。 第一四分位数与第三四分位数之间的距离:称为四分位数间距,若数据小于,就认为他是
7、疑似异常值。将上述箱线图的做法修改如下:(1)同(1)(2)计算,若一个数据小于,则认为它是一个异常值,并以表示;(3) 自箱子的左侧中点引一条水平线直至数据中除去疑似异常值之后的最小值上方,再自箱子的右侧中点引一条水平线直至数据中除去疑似异常值之后的最大值上方; 这样做出的箱线图称为修正箱线图。6关于分布(1)(Gamma)函数 它具有以下运算性质: 特别地: 令 令 所以 (2)设随机变量服从分布,即:,其密度函数为: 定理:设随机变量,都服从分布且相互独立,即:,其密度函数分别为: 则服从参数为分布,即:7、经验分布函数 设是总体的一个样本,用表示中不大于的随机变量的个数,定义经验分布函
8、数为: 例题1:设总体有一个样本值1,2,3,则经验分布函数为: 例题2:设总体有一个样本值1,1,2,则经验分布函数为: 格里汶科定理:(1933年)对于任意一实数,当时,以概率1收敛于分布函数 8. 三个重要分布(1)分布设为独立标准正态变量,称随机变量的分布为自由度为n的分布,记为。其密度函数为: 性质:(1)若则因为 所以: 又 其中:(2)分布的可加性 设,并且相互独立,则有: (3)分布的分位点 对于给定的正数,称满足条件 的点为分布的上分位点。(2)t分布设随机变量X与Y独立,则称的分布为自由度n的t分布,记为。分布又称为学生氏分布,其密度函数为: 分布的分位点:对于给定的正数,
9、称满足条件 的点为分布的上分位点。其中:(3)F分布设随机变量U与V相互独立,则称的分布为自由度的F分布,记为。密度函数为: 由定义知:若 则 分布的分位点对于给定的正数,称称满足:的点为F分布的上分位点,且有9.抽样分布(1)有限总体的抽样分布 定理1、设总体中个体总数(也称总体大小)为,样本容量为且总体有有限均值,方差,则 当抽样是有放回时 当抽样是无放回时 其中即为的标准差。(2)单正态总体的抽样分布设总体(不管服从什么分布,只要均值和方差存在)的均值为,方差为,是来自的一个样本,分别是样本均值和样本方差,则有: 而 定理2、设是来自正态总体的一个样本,是样本均值,则有: 定理3、设是来自正态总体的一个样本,分别是样本均值和样本方差,则有: 相互独立。 定理4、设是来自正态总体的一个样本,分别是样本均值和样本方差,则有: 注:(3)双正态总体的抽样分布 定理5、设分别是
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 人教版高中化学选修四2-3-2化学平衡的移动课时测试1
- 质量专项施工方案
- 人教版高中化学选修四第二章化学反应速率和化学平衡章末复习课时练习2
- 金黄色葡萄球菌IsdB、TRAP和ClfA融合蛋白的免疫保护作用
- 大豆GmWRKYs基因的克隆和功能研究
- 景观游园施工方案
- 凉山安全咨询合同范例
- 公司过户个人合同范本
- 农村置换地合同范例
- 七年级生物上册第2单元第3章细胞第2节细胞是生命活动的单位练习题无答案新版北师大版
- 2024年高等教育法学类自考-00369警察伦理学考试近5年真题集锦(频考类试题)带答案
- 矿山开采居间合作协议书范文
- 社交媒体对消费者行为的影响调研报告
- 人防工程管理制度范本(三篇)
- GB/T 15822.1-2024无损检测磁粉检测第1部分:总则
- 计算机一级考试WPS试题及答案
- 快乐读书吧《孤独的小螃蟹》整本书阅读指导课教学设计-2023-2024学年语文二年级上册统编版
- 生猪屠宰兽医卫生检验人员理论考试题库及答案
- 五、完成课题的可行性分析
- 全科医生题库附有答案
- DL∕T 5765-2018 20kV及以下配电网工程工程量清单计价规范
评论
0/150
提交评论