第五章数理统计_第1页
第五章数理统计_第2页
第五章数理统计_第3页
第五章数理统计_第4页
第五章数理统计_第5页
已阅读5页,还剩45页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

©

概率统计教研室

2012第5章

数理统计的基本概念总体、样本、统计量抽样分布数理统计一、数理统计及其任务数理统计是一门以概率论为基础的应用学科。它是探讨如何有效地收集、整理、分析带有随机性的数据,以便对所考察的问题作出推断和预料,从而为决策供应依据。数据的随机性来源有二:一是由于种种缘由(如所涉及的探讨对象数量很大),人们不行能对其全部进行探讨,而只能以确定方式选择其中一部分考察,这一部分的选择就必定带有随机性;二是试验的随机误差,这是指试验中无法限制或未加限制,甚至不了解的因素引起的误差。数理统计的任务就是探讨有效地收集数据,科学地整理与分析所获得的有限的资料,对所探讨的问题,尽可能地作出精确而牢靠的结论。有效地收集数据有两方面的含义:一是可以建立一个数学上可处理并尽可能简洁便利的模型来描述所得到的数据;二是要收集包含尽可能多的与所探讨的问题有关的信息。数理统计探讨问题的方式,不是对所探讨对象的全体(称为总体)进行视察,而是抽取其中的部分(称为样本)进行视察获得数据(抽样),并通过这些数据对总体进行推断。数理统计方法具有“部分推断整体”的特征。二、数理统计探讨问题的一般流程分析问题确定总体收集数据试验设计抽样数据整理统计推断参数估计假设检验我们这门课所学的数理统计事实上是统计推断及其应用(方差分析与回来分析)的一部分内容。为什么要用数理统计方法探讨问题?随机现象有它的规律性,随机现象的特点注定了进行足够多次视察,其规律性才能清晰地呈现出来。但是,客观上只允许对随机现象进行有限次视察试验,只能获得局部视察资料.三、概率论与数理统计的区分与联系1、概率论与数理统计的联系2、概率论与数理统计的区分主要体现在探讨方法的差别上:概率论是在已知随机变量听从某种分布(概率函数、概率密度、分布函数)的状况下,探讨随机变量分布的性质,数字特征和它的应用。例如:已知随机变量的概率密度求它的分布函数、数学期望、方差;已知随机变量的分布求其函数的分布等,而数理统计则是通过对样本数据的统计分析,从中得到能够描述探讨对象的某个随机变量的具体分布和数字特征,以此推断对象整体所具有的规律。前者用的是演绎法,后者用的是归纳法。都以随机现象为对象,探讨其统计规律性。总体

(Population)在数理统计中,把探讨对象的全体称为总体(母体);组成总体的每个单元称为个体;描述总体单元在某方面特性的名称或记号称为总体指标;每个总体单元对总体指标的响应称为指标值;总体中所包含的个体的个数称为总体的容量。5.1总体、样本、统计量总体与总体特征数总体指标数量指标属性指标总体有限总体无限总体1.基本定义©

概率统计教研室

2012个体总体探讨大气中的悬浮颗粒的大小总体

(Population)2.举例考察某高校一年级学生的年龄个体总体©

概率统计教研室

2012总体指标值全集指标随机变量总体可以用随机变量及其分布来表示,探讨总体等价于探讨表达总体的随机变量概率分布;在理论上可以把总体与概率分布等同起来,总体分布就是表达总体的随机变量的分布。总体

(Population)3.总体与随机变量的关系©

概率统计教研室

2012总体

(Population)设某高校一年级学生的年龄分布如右表年龄1819202122比例0.50.30.10.070.03若从该高校一年级学生中随意抽查一个学生的年龄,所得结果为一随机变量,记作XX的概率分布是:可见,X的概率分布反映了总体中各个值的分布状况.很自然地,我们就用随机变量X来表示所考察的总体.也就是说,总体可以用一个随机变量及其分布来描述.3.总体与随机变量的关系©

概率统计教研室

2012总体特征数总体方差总体均值1.基本概念©

概率统计教研室

2012总体频率©

概率统计教研室

2012总体方差假如总体为无限总体,则其对应的总体特征数如下总体均值©

概率统计教研室

2012样本

(Sample)样本与样本的数字特征1.基本定义按确定规则从总体中抽取一部分总体单元进行观测或试验,这一抽取过程称为“抽样”;所抽取的部分总体单元的整体称为总体的一个样本(子样);样本中所包含的总体单元称为样本单元;样本中样本单元的数目称为样本容量。抽定©

概率统计教研室

20122.样本应满足的性质(1)代表性;(2)随机性。简洁随机样本1.简洁随机样本(Independenceidenticaldistribution)2.生产实践中获得简洁随机样本的方法(1)有放回抽样;(3)总体容量很大时无放回抽样可近似看成随机抽样(2)农业调研-对角线抽样;©

概率统计教研室

20123.样本分布留意:样本分布反映样本取不同实现的概率规律,其与总体分布相联系,一般求算比较麻烦,但对于简洁随机样本有下列结果。©

概率统计教研室

2012©

概率统计教研室

2012总体样本实现样本推断4.总体、样本、样本实现的关系©

概率统计教研室

2012©

概率统计教研室

2012©

概率统计教研室

2012统计量(Statistic)

统计量的基本概念©

概率统计教研室

2012©

概率统计教研室

2012几个常用的统计量样本平均值它反映了总体均值的信息样本方差它反映了总体方差的信息样本标准差

1.均值、方差、矩©

概率统计教研室

2012公式推导©

概率统计教研室

2012它反映了总体k阶中心矩的信息样本k阶原点矩样本k阶中心矩它反映了总体k阶原点矩的信息©

概率统计教研室

2012©

概率统计教研室

20122.次序统计量样本中位数定义5.1.7

设的依次序排列成,则称为样本的第统计量,特殊,称为最小次序统计量,为最大次序统。为样本,把样本按其实现由小到大个次序计量.©

概率统计教研室

2012样本极值样本极差和样本极值在某些关于灾难性现象与材料试验结果的统计分析中有用。如确定时期内一条河的最大流量、地震的最大震级、材料断裂强度、苗木受冻害的最低温度等,都是极值性的量。在数理统计中有一个叫极值统计分析的专题处理这类问题,也可视为依次统计量的统计分析的一部分。和

分别称为样本的最大值和最小值.极差可用以估计总体分布的数量变动的最大范围。

四、样本的频率分布与直方图由样本可以推断总体,其直观想法是:样原来自总体,自然带有总体的信息,从这些信息动身探讨总体,总有可能得到总体的某些真实性质。其次,由样本探讨总体,可以节约人力物力等。由样本探讨总体的可行性还可以从理论上得到证明。1.阅历分布函数例5.4数据整理:将数据分组计算各组频数作频率分布表作频率直方图为了探讨随机现象,首要的工作是收集原始数据.一般通过抽样调查或试验得到的数据往往是杂乱无章的,须要通过整理后才能显示出它们的分布状况。数据的简洁处理是以一种直观明白方式加工数据,它包括两个方面:数据整理;计算样本特征值。计算样本特征值:样本均值、样本方差等。例5.5为对某小麦杂交组合F2代的株高X进行探讨,抽取容量为100的样本,测试的原始数据记录如下(单位:厘米),试依据以上数据,画出它的频率直方图,并以此说明随机变量X的分布状况。2.样本频率分布表与直方图

87 88 111 91 73 70 92 98 1059499 91 98 110 98 97 90 83 928886 94 102 99 89 104 94 94 929687 94 92 86 102 88 75 90 908084 91 82 94 99 102 91 96 949485 88 80 83 81 69 95 80 979296 109 91 80 80 94 102 80 869190 83 84 91 87 95 76 90 9177103 89 88 85 95 92 104 92 958386 81 86 91 89 83 96 86 7592

整理原始数据,加工为分组资料,作出频率分布表,画直方图,提取样本分布特征的信息。步骤如下:(1).找数据最小值m=69,最大值M=111,极差为M-m=42;(2).数据分组,依据样本容量n的大小,确定分组数k;(3).确定组限和组中点值;(4).将数据分组,计算出各组频数,作频数、频率分布表;(5).作出频率直方图。留意:分组的一般原则为30≤n≤405≤k≤640≤n≤606≤k≤860≤n≤1008≤k≤10100≤n≤50010≤k≤20本例取k=9,一般实行等距分组(也可以不等距分组),组距等于比极差除以组数略大的测量单位的整数倍。本例测量单位为1厘米,组距为一般依据算式:各组中点值加减1/2组距=组的上限或下限,组的上限与下限应比数据多一位小数。本例取a=67.5,b=112.49(a略小于m,b略大于M,且a和b都比数据多一位小数),分组如下:[67.5,72.5)[72.5,77.5)[77.5,82.5)[82.5,87.5)[87.5,92.5)[92.5,97.5)[97.5,102.5)[102.5,107.5)[107.5,112.5)组中值分别为:70,75,80,85,90,95,100,105,110以样本值为横坐标,频率/组距为纵坐标;以分组区间为底,以为高作频率直方图,如图所示。从频率直方图可看到:靠近两个极端的数据出现比较少,而中间旁边的数据比较多,即中间大两头小的分布趋势(随机变量分布状况的最粗略的信息)。频率直方图中的小矩形的面积近似地反映了样本数据落在某个区间内的可能性大小,故它可近似描述X的分布状况。

1.枝叶图(茎叶图)

将样本的实现数据的每个数据分为两部分,一部分作为枝,另一部分为叶,构成的图称为枝叶图。以例说明枝叶图的做法:例5.6

64677072747676798081828283858688919192939393959595979799100100102104106106107108108112112114116118119119122123125126128133试作枝叶图解:将数据的百位和十位作枝,个位作叶,用竖线将枝叶分开,形成图。47024668012235681123335667790024667882246899235683

678910111213枝叶五.其他描述样本特征的图

2.五数概括与箱线图车辆重量(磅)5.2抽样分布正态总体的抽样分布重要定理及推论2.一个重要定理1.基本概念统计量的分布称为抽样分布;©

概率统计教研室

2012©

概率统计教研室

20123.三个重要推论©

概率统计教研室

2012推论1:©

概率统计教研室

2012©

概率统计教研室

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论