




已阅读5页,还剩26页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
二、总体与样本,三、样本函数与统计量,第十八讲 样本及样本函数,一、数理统计简介,数理统计学是一门应用性很强的学科. 它是研究怎样以有效的方式收集、整理和分析带有随机性的数据,以便对所考察的问题作出推断和预测,直至为采取一定的决策和行动提供依据和建议.,概率论与数理统计是两个有密切联系的学科,它们都以随机现象的统计规律为研究对象.,但在研究问题的方法上有很大区别:,概率论 已知随机变量服从某分布,寻求分布的性质、数字特征、及其应用;,数理统计 通过对试验数据的统计分析,寻找所服从的分布和数字特征, 从而推断总体的规律性.,数理统计的核心问题由样本推断总体,一、 数理统计简介,数理统计所要解决的问题:对随机现象进 行适当的合理的观测,取得数据,再根据观测 数据分析、推断随机现象的统计规律。,2. 数理统计的基本内容,采集样本 统计推断,1. 什么是数理统计,一个统计问题总有它明确的研究对象.,1.总体,研究对象的全体称为总体(母体),,总体中每个成员称为个体.,总体,二、总体与样本,然而在统计研究中,人们关心总体仅仅是关心其每个个体的一项(或几项)数量指标和该数量指标在总体中的分布情况.这时,每个个体具有的数量指标的全体就是总体.,总体可以用一个随机变量及其分布来描述.,常用随机变量的记号或用其分布函数表示总体.如说总体X或总体F(x) .,统计中,总体这个概念的要旨是: 总体就是一个随机变量.,为推断总体分布及各种特征,按一定规则从总体中抽取若干个体进行观察试验,以获得有关总体的信息,这一抽取过程称为 “抽样”,所抽取的部分个体称为样本. 样本中所包含的个体数目称为样本容量.,2. 样本,但是,一旦取定一组样本,得到的是n个具体的数(x1,x2,xn),称为样本的一次观测值,简称样本值 .,样本是随机变量.,抽到哪5辆是随机的,容量为n的样本可以看作n维随机变量(X1,X2,Xn).,2. 独立性: X1,X2,Xn是相互独立的随机变量.,由于抽样的目的是为了对总体进行统计推断,为了使抽取的样本能很好地反映总体的信息,必须考虑抽样方法.,最常用的一种抽样方法叫作“简单随机抽样”,它要求抽取的样本满足下面两点:,1. 代表性: X1,X2,Xn中每一个与所考察 的总体有相同的分布.,简单随机样本:X1,X2,Xn相互独立,且与总体X同分布.,简单随机样本是应用中最常见的情形,今后,当说到“X1,X2,Xn是取自某总体的样本”时,若不特别说明,就指简单随机样本.,事实上我们抽样后得到的资料都是具体的、确定的值.如我们从某班大学生中抽取10人测量身高,得到10个数,它们是样本取到的值而不是样本.我们只能观察到随机变量取的值而见不到随机变量.,3. 总体、样本、样本值的关系,统计是从手中已有的资料-样本值,去推断总体的情况-总体分布F(x)的性质.,样本是联系二者的桥梁,4.总体X的分布函数与密度,在概率论中,随机变量的分布往往是知道的,通过某些已知的信息计算另一些信息.,而在实际中,经常是有一个我们关心的总体X, 我们既不知道它的分布, 也不知道它的数学期望和方差.,但是,我们可以对其进行反复地试验,则试验n次,得到n个样本值, 这n个样本值可以看作是对n个与总体分布相同的样本进行观察而获得的.,数理统计的问题是,怎样在获得了这些试验数据之后,能够对总体X的某些信息获得一些估计?获得一些知识? 分为两类,一类是对总体的分布进行一些统计. 而另一类则是对总体的一些数字特征值, 经常是数学期望和方差进行一些统计.,研究总体X的分布密度,通常用频率直方图进行描述它通常是把数据的值域分成若干相等的区间,于是数据就按区间分成若干组,在每个区间上作一个小矩形:,小矩形的面积该组的频率,2所有的小长方形的面积之和.,于是,(1).总体X的密度(直方图),例1 我们来研究患某种疾病21岁44岁男子的血压 (收缩压,以mm-Hg计)这一总体X.为此抽查了63个男 子,测得如下表中所列的数据.,作图过程,1.求最大值、最小值,并求极差.,从表格上看最大值为162,最小值为96,极差R=16296.,2.分组、定组距,分组没有一定的通用原则,通常与数据个数n有关,取,左右为佳分组数 m 确定后,可按,来确定组距d,本例中,将数据分成8组,组距为10(为方便起见).,3.定分点、定区间,为方便起见(即和我们定的组距相符合),取起点为a=90.5, b=170.5. 从而得到的作图区间为I=90.5 , 170.5,可保证 所有数据均在此区间内注意,我们取的各小区间的端点坐 标常比表中数据的精度高一位,以免数据落在区间的端点上,4.样本值落入各组的频数和频率如下:,90.5 110.5 130.5 150.5 170.5,5. 作频率直方图:,演示:用软件做直方图,从总体X中抽取容量为n的样本,得到如下结果,(2).总体X的分布函数,定义样本分布函数: Fn(x)= fn(Xx) 样本分布函数 Fn(x)是事件“Xx”的频率.,例1,设总体X具有一个样本值1,2,3,则样本分布函数 F3(x) 为,0, x1,1 2 3,例2,设总体X具有一个样本值1,1,2,则样本分布函数F3(x) 为,由样本去推断总体情况,需要对样本进行“加工”,构造一些样本的函数g(X1,X2,Xn).,1. 统计量,这种不含任何未知参数的样本的函数称为统计量.它是完全由样本决定的量.,三、样本函数与统计量,是,不是,例3,2.几个常见统计量,样本均值,样本方差,它反映了总体均值的信息,它反映了总体方差的信息,样本标准差,其观察值,样本k阶原点矩,样本k阶中心矩,k=1,2,它反映了总体k 阶矩 的信息,它反映了总体k 阶 中心矩的信息,其观测值,解:,将计算器置于统计状态;输入数据.,解:,将计算器置于统计状态;
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 全面备考园艺师考试的策略与方法试题及答案
- 农作物种植系统的试题及答案
- 2024农业职业经理人考试构建有效学习习惯的重要性试题及答案
- 深入探讨农业职业经理人考点试题及答案
- 农艺师备考理论知识试题及答案
- 花艺师考试难点剖析试题及答案
- 福建事业单位考试性格分析及影响试题及答案
- 2024年福建事业单位考试的应对技巧分享与试题及答案
- 福建事业单位考试系统操作试题及答案
- 如何统筹备考资源提高花艺师考试效率试题及答案
- 2025北京丰台高三一模生物试题及答案
- 陕西省商洛市2025年高三下学期第三次模拟检测地理试卷(含答案)
- 吉林省吉林市2024-2025学年高三下学期3月三模试题 语文 含答案
- 员工法制教育培训
- 湖北省武汉市外国语学校2024-2025学年九年级下学期3月月考数学试卷 (原卷版+解析版)
- 高标准农田建设工程施工合同
- 辽宁省名校联盟2024-2025学年高三下学期3月份联合考试历史试题(含解析)
- 粉尘防爆安全培训考试题(附答案)
- 广东省广州市普通高中毕业班2025年综合测试(一)地理试卷 (含答案)
- 2025年全国普通话水平测试20套复习题库及答案
- 2025山西地质集团招聘37人笔试参考题库附带答案详解
评论
0/150
提交评论