版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第1-2章基本概念复习
§1.1总体与样本§1.2数据的整理与显示§1.3统计量及其分布§1.4三大抽样分布§1.1总体与样本1.总体研究对象的全体称为总体,总体中每个成员称为个体,一、总体和个体
统计中,总体这个概念的要旨是:总体就是一个概率分布.
总体用一个随机变量及其分布来描述.总体的三层含义:
研究对象的全体;
数据——数量指标集;
分布——描述总体规律性。二、样本样本:从总体中抽取的部分个体或子样。由于样本抽取前无法预知它们的数值,因此,样本是随机变量,用X1,X2,…,Xn
表示;当样本在抽取以后经观测就有确定的观测值,用小写字母x1,x2,…,xn
表示。
n称为样本容量。样本的要求:随机性;独立性;同分布性。设总体X具有分布函数F(x),
X1,X2,…,Xn
为取自该总体的容量为n的样本,则样本联合分布函数为样本的联合概率密度函数为=f(x1)f(x2)…f(xn)
3、样本数据的图形显示(1)直方图(2)折线图。1、搜集数据方法2、数据整理——频数,频率分布表§1.2样本数据的整理与显示定义§1.3统计量与经验分布函数样本均值样本方差样本标准差
样本k阶原点矩样本k阶中心矩定理次序统计量及其分布
一、定义
设X1,X2,…,Xn是取自总体X的样本,X(i)称为该样本的第i个次序统计量,它的取值是将样本观测值由小到大排列后得到的第i个观测值。其中
X(1)=minX1,X2,…,Xn称为最小次序统计量
X(n)=maxX1,X2,…,Xn称为最大次序统计量。二、单个顺序统计量的分布定理设总体X的密度函数为p(x),分布函数为F(x),X1,X2,…,Xn为样本,则第k个顺序统计量X(k)的密度函数为特别地,X(1),X(2)的密度函数为:经验分布函数设
x1,x2,…,xn是取自总体分布函数为F(x)的样本,若将样本观测值由小到大进行排列,为x(1),x(2),…,x(n),则称
x(1),x(2),…,x(n)为有序样本,用有序样本定义如下函数
§1.4
三大抽样分布记为分布:定义:设相互独立,都服从正态分布N(0,1),则称随机变量:
所服从的分布为自由度为n
的分布.1.
设相互独立,都服从正态分布则2.设且X1,X2相互独立,
E(X)=n,D(X)=2n.2、F分布定义:设U与V相互独立,则称随机变量服从自由度为n1及n2的F分布,n1称为第一自由度,n2称第二自由度,记作F~F(n1,n2).~F(n2,n1)4)F分布的分位数
定义:设X~N(0,1),Y~,且X与Y相互独立,则称变量所服从的分布为自由度为n的t分布.3、t分布定理
设X1,X2,…,Xn是来自N(,2)的样本,其样本均值和样本方差分别为3)(n1)s2/2
2(n1)。抽样分布的重要结论则1)与s2相互独立;2)推论1
设X1,X2,…,Xn是来自N(,2)的样本,其样本均值和样本方差分别为2)(n1)s2/2
2(n1)。则有1)3)
t(n1)。推论2
设X1,X2,…,Xn是来自的样本,1)2)特别,若12=22,则F=s12/s22
F(n1,m1)推论3
在推论5.4.2的记号下,设12=22=2,并记则第3章参数估计
§3.1点估计的几种方法§3.2点估计的评价标准§3.4贝叶斯估计§3.5区间估计参数估计的形式有两种:点估计与区间估计。设总体X服从分布F(x,),为未知参数设x1,x2,…,xn
是来自总体X的一个样本,我们用一个统计量的取值作为的估计值,称为点的估计(量),简称估计。§3.1点估计3.1.1
矩法估计
用样本矩去替换相应的总体矩,3.1.2极(最)大似然估计
定义设总体的概率函数为P(x;),是参数可能取值的参数空间,X1,X2
,…,Xn是样本,将样本的联合概率函数看成的函数,用L(;x1,x2,
…,xn)表示,简记为L(),
称为样本的似然函数。如果某统计量满足
则称是的极(最)大似然估计,简记为MLE为了便于运算,通常由对数似然函数lnL()出发寻找的极大似然估计。(4)在最大值点的表达式中,用样本值代入就得参数的最大似然估计值.求极大似然估计(MLE)的一般步骤是:(1)由总体分布导出样本的联合联合密度;(2)把样本联合密度中自变量看成常数,把参数看作自变量,建立似然函数L();
(3)求似然函数L()的最大值点(常常转化为求lnL()的最大值点),即
的MLE;定义3.1设
∈Θ为未知参数,是的一个估计量,n是样本容量,若对任何一个ε>0,有
则称为参数的相合估计。3.5
点估计的优良性
1
相合性(一致性)在判断估计的相合性时下述两个定理是很有用的。定理3.4设是的一个估计量,若
则是的相合估计,
由大数定律
样本均值是总体均值的相合估计;样本标准差是总体标准差的相合估计;样本变异系数是总体变异系数的相合估计。2无偏性
定义3.2
设是的一个估计,
的参数空间为Θ,若对任意的∈Θ,有
则称是的无偏估计,否则称为有偏估计。
3有效性
定义3.3设是的两个无偏估计,如果对任意的
∈Θ,有且至少有一个
∈Θ使得上述不等号严格成立,则称比有效。3.6.1置信区间的概念
定义3.7
x1,x2
,
…,xn是来自该总体X的样本,对给定的一个(0<<1),若有两个统计量和,对任意的
∈Θ,有§3.6参数的置信区间
则称随机区间为的置信水平为1-的置信区间,或简称是的1-置信区间.
求置信区间一般方法
步骤如下:1.构造一个样本和的函数G=G(x1,x2
,
…,xn,)使得G具有已知分布。2.适当地选择两个常数c,d,使对给定的(0<<1)有P(c≤G≤d)=1-
3.若能将c≤G≤d进行等价变形化为则是的1-置信区间。
3.6.2正态总体参数的置信区间
设X1,…Xn是取自的样本,参数:置信度:的置信区间.置信度为求参数~N(0,1)求参数的置信度为的置信区间.设X1,…Xn是取自的样本,1、单个正态总体参数的置信区间
1)、
已知时的置信区间从中解得对给定的置信水平查正态分布表得使也可简记为于是所求的置信区间为2)、
2未知时的置信区间
这时可用t统计量,因为,因此t可以用来作为样本函数。完全类似于上一小节,可得到的1-置信区间为
此处是
2的无偏估计。3)、
2的置信区间
取,由于
2分布是偏态分布,寻找平均长度最短区间很难实现,一般都用等尾置信区间:采用
2的两个分位数
2
/2(n-1)和21-
/2(n-1),在
2分布两侧各截面积为/2的部分,使得由此给出
2的1-置信区间为求
2置信度为1-的置信区间步骤
1.选择2.给定置信水平1-,使得3.查表求得:第二步等价于:4.1-的置信区间:5.计算样本方差得到确定的置信区间:2、两个正态总体下的置信区间
设x1
,…,xm是来自N(1,12)的样本,y1
,…,yn是来自N(2,22)的样本,且两个样本相互独立。与分别是它们的样本均值,
一、1-2的置信区间1、12和22已知时的两总体平均值差的u置信区间
2、12=22=
2未知时的两样本t区间
3、当m和n都很大时的近似置信区间
二、12/22的置信
即给出12/22的如下的置信区间如果总体不是正态分布,在样本容量充分大时,可以用渐近分布来构造近似的置信区间。一个典型的例子是关于比例p的置信区间。3.6.3非正态总体参数置信区间
设x1,…,xn是来自b(1,p)的样本,有对给定
,通过变形,可得到置信区间为
其中记=u21-/2,实用中通常略去/n项,于是可将置信区间近似为第四章统计假设检验
§4.1假设检验的基本思想与概念§4.2参数假设检验的基本方法§4.3参数假设检验概要§4.4非参数假设检验参数假设检验常见的有三种基本形式(1)(2)(3)4.1.1建立假设当假设建立之后,为真,命题为真命题。想法是:当为真时,在已知样本信息下推出一个结论,如果导致不合理的现象出现,则表明“假设为真”是错的,即原假设不正确,应拒绝,反之,就应接受原假设。4.1.2假设检验的基本原理判别原假设是否成立的原理是小概率事件原理即:“在一次试验中小概率事件几乎不可能发生”。据样本判定总体情况犯第一类错误正确正确犯第二类错误为真为真拒绝接受4.1.3假设检验的两类错误
二、选择检验统计量小概率事件:假设检验的基本步骤
一、建立假设
三、确定拒绝域四、计算相应统计量的值五、作出判断
当
时,则拒绝即接收
;当时,则接收
4.3.1
正态检验法4.3参数假设检验方法
1
单个正态总体均值的检验2
非正态总体参数的检验3
两个正态总体均值的检验1
单个正态总体均值的检验一、已知时的u检验设
是来自
的样本,关于的检验问题。检验统计量可选为三种参数假设检验基本形式:2、未知时的t检验由于未知,一个自然的想法是将未知的替换成样本标准差s,这就形成t检验统计量三种假设的检验拒绝域分别为检验法条件检验统计量拒绝域u检验已知t检验未知原假设备择假设表4.3.1单个正态总体的均值的检验问题3、假设检验与置信区间的关系设
是来自正态总体
的样本,现在未知场合讨论关于均值的检验问题。考虑双侧检验问题:则显著水平为的检验接收域为
关于的水平为的显著性检验。是一一对应的。
反之若有一个如上的1-置信区间,也可获得所以:“正态均值的1-置信区间”与“关于
的双侧检验问题的水平的检验”2
大样本检验
大样本检验一般思路如下:设是来自于二点分布b(1,)总体的样本,又设该总体均值为
,方差为(1-),则在样本容量n充分大时,选择统计量
1)
关于总体为0—1分布的检验
大样本检验一般思路如下:设是来自于总体的样本,又设该总体均值为
,样本标准差为S,则在样本容量n充分大时,
2)
关于一般总体分布的均值检验
3
两个正态总体均值差的假设检验设两总体独立样本容量分别为如下假设:选择统计量:给定显著水平,通过概率确定拒绝域设两总体独立样本容量分别为如下假设:选择统计量:给定显著水平,通过概率确定拒绝域当X,Y不满足正态分布时,只要大样本,选择上述统计量进行假设检验,方法一样可行。选择统计量:4.3.2两个正态总体均值差的检验检验法条件原假设备择假设检验统计量绝拒域u检验已知t检验未知4.3.3正态总体方差的检验一、单个正态总体方差的检验
设
是来自
的样本,对方差亦可考虑如下三个检验问题:
通常假定未知,它们采用的检验统计量相同。均为
若取显著性水平为,则对应三个检验问题的拒绝域依次分别为二、两个正态总体方差比的F检验
设
是来自
的样本,
是来自
的样本。考虑如下三个假设检验问题
通常,均未知,记,分别是由算得的
的无偏估计和由
算得的
的无偏估计.检验统计量:三种检验问题对应的拒绝域依次为}。
或5其他分布参数的假设检验
指数分布参数的假设检验设x1,x2
,
…,xn是来自指数分布的样本,关于的如下检验问题:
拒绝域的形式是
,由于在=0时,所以拒绝域为线性回归分析非线性回归分析回归分析一元线性回归分析多元线性回归分析回归分析包含线性回归分析和非线性回归分析两部分,本课程只学线性部分。回归分析——处理变量之间的相关关系的一种数学方法.第5章回归分析
回归分析任务主要包括:
1)建立相关关系的变量之间数学关系式;
2)检验所建立的关系式是否有效;
3)利用有效的关系式进行预测和控制。只有一个自变量的回归分析称为一元回归分析,多于一个自变量的回归分析称为多元回归分析。研究一个随机变量与一个或几个可控变量之间的相关关系称为回归分析。一、一元线性回归模型:
y=0+1x+(5.2)这是y关于x的一元线性回归的数据结构式。通常假定
E()=0,Var()=
2
(5.3)在对未知参数作区间估计或假设检验时,还需要假定误差服从正态分布,即~N(0,
2)
y~N(0+1x,
2)(5.4)显然,假定(5.4)比(5.3)要强。
由数据(xi,yi),i=1,2,…,n,可以获得0,1的估计,称(5.6)为y关于x的经验回归函数,简称为回归方程,其图形称为回归直线。给定x=x0后,称为回归值(在不同场合也称其为拟合值、预测值)。
二回归系数的最小二乘估计
1、0和1最小二乘方法估计估计量代回线性回归方程得直线方程2、线性回归方程的精度问题
定理5.1在模型(5.5)下,有(1)(2)(3)给定x06估计量的分布
定理设yi=i+1xi+
i,其中1n相互独立,且Ei=0,Var(yi)=
2,i=1,,n,沿用上面的记号,有(5.14)(5.15)这说明是
2的无偏估计。
无偏估计
定理5.2设y1,y2,,yn相互独立,且
yi~N(i+1
xi
,
2),i=1,,n,则在上述记号下,有(1)SSe/
2~2(n2),(2)若H0:1=0成立,则有SSr/
2~2(1)(3)SSr与SSe,独立(或与SSe,独立)。
5.3回归方程的显著性检验
对回归方程是否有意义作判断就是要作如下的显著性检验:
H0:1=0vsH1:10
拒绝H0表示回归方程是显著的。采用F比作为检验统计量:
在1=0时,F~F(1,n2),其中fR=1,fe=n2.对于给定的显著性水平,拒绝域为
FF1-(1,n2)来源平方和自由度均方和F比回归SRfA=1MSAMSA/MSe残差Sefe=
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 二零二五年度附条件生效的赠与合同涵盖教育基金捐赠与使用
- 二零二五年度顺丰快递员年度考核合同样本
- 2025年度水电设施运维安全协议责任书
- 二零二五年度重庆建筑公司劳动合同附入口安全协议
- 二零二五年度城市核心区精装住宅租赁协议合同
- 清淤疏浚工程施工方案
- 二零二五年度2024BGL气化炉耐火材料质量保证采购合同3篇
- 二零二四年度政府机关人事代理业务合同3篇
- pvc电线管施工方案
- 失业保障中的数字鸿沟问题-深度研究
- 2024多级AO工艺污水处理技术规程
- 2024年江苏省盐城市中考数学试卷真题(含答案)
- DZ∕T 0287-2015 矿山地质环境监测技术规程(正式版)
- 2024年合肥市庐阳区中考二模英语试题含答案
- 质检中心制度汇编讨论版样本
- 药娘激素方案
- 提高静脉留置使用率品管圈课件
- GB/T 10739-2023纸、纸板和纸浆试样处理和试验的标准大气条件
- 《心态与思维模式》课件
- C语言程序设计(慕课版 第2版)PPT完整全套教学课件
- 危险化学品企业安全生产标准化课件
评论
0/150
提交评论