版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、 1.统计基础知识统计基础知识2.参数估计参数估计3.假设检验假设检验4.对比实验报告编写和练习对比实验报告编写和练习课程进程课程进程为什么要学习对比实验为什么要学习对比实验许多许多的的问题问题需要就某些需要就某些参数参数作出接受或作出接受或拒绝的决拒绝的决定,这说明是一个假设。它代表把一个实务的问定,这说明是一个假设。它代表把一个实务的问题演绎成统计学上的问题。而这个决策过程便称题演绎成统计学上的问题。而这个决策过程便称为:为:Hypothesis TestingHypothesis Testing我们把实现假设检验的过程成为对比实验。我们把实现假设检验的过程成为对比实验。统计学上的测试能为
2、我们就问题作出客观解说,统计学上的测试能为我们就问题作出客观解说,相比较以前,我们只能作出主观的解说。这是后相比较以前,我们只能作出主观的解说。这是后续学习内容的基础。续学习内容的基础。第一单元第一单元n 总体总体(Population):在统计问题中在统计问题中,我们把研究对象的我们把研究对象的全体成为总体全体成为总体n 个体个体:构成总体的每个成员称为个体构成总体的每个成员称为个体n 样本样本(Sample):从总体中抽取部分个体所组成的集合从总体中抽取部分个体所组成的集合称为样本称为样本n 样品样品:样本中的个体称为样品样本中的个体称为样品n 样本容量样本容量:样品的个数称为样本容量样品
3、的个数称为样本容量,常用常用n表示表示1.1总体和样本总体和样本样本样本n 随机样本随机样本(Random sample):能够被推广应用于更大能够被推广应用于更大的总体的样本。总体的每个个体有一个已知的(有的总体的样本。总体的每个个体有一个已知的(有时是相等的)机会被包含在该样本中。时是相等的)机会被包含在该样本中。n 简单随机样本简单随机样本(Simple random sample):1、同一性:样本与总体有同样的分布、同一性:样本与总体有同样的分布2、独立性:、独立性: 如果给定第一个事件,无论它的结果是什么,第二如果给定第一个事件,无论它的结果是什么,第二个事件的机会都一样。个事件的
4、机会都一样。1.2统计量和抽样分布统计量和抽样分布n 统计量统计量:不含未知参数的样本函数称为统计量。不含未知参数的样本函数称为统计量。n 抽样分布:统计量的分布称为抽样分布。抽样分布:统计量的分布称为抽样分布。n 有序样本:有序样本: 是从总体是从总体X中随机抽取的容量为中随机抽取的容量为n的样本,将它们的样本,将它们的观测值从小到大排序,这便是有序样本。的观测值从小到大排序,这便是有序样本。nxxxx,.,321统计推断过程统计推断过程n 统计学的主要任务:统计学的主要任务:1、研究总体是什么分布?、研究总体是什么分布?2、这个总体(即分布)的均值、方差是多少?、这个总体(即分布)的均值、
5、方差是多少?样本统计量例如:样本均值、方差总体均值、方差总体均值、方差抽样1.2常用统计量常用统计量n 描述中心位置的统计量:描述中心位置的统计量:1、众数(、众数(mode):一个变量的众数是指出现次数最一个变量的众数是指出现次数最多的值,不过它不一定唯一。多的值,不过它不一定唯一。2、中位数:、中位数:3、均值、均值(mean):niixx1n1为偶数为奇数nxxxnxxnnn)12()2()21(211.2常用统计量常用统计量n 描述数据分散程度的统计量:描述数据分散程度的统计量:1、极差(、极差(range):2、方差(、方差(variance)3、标准差(、标准差(standard
6、deviation):):4、标准误差(、标准误差(standard error ):是很多不同样本):是很多不同样本的均值的标准差。的均值的标准差。5、变异系数:、变异系数:)1()(xxRn21211niixxns2ss xsCv1.3正态分布正态分布n 正态分布:正态分布:xexpx,21)(222-3-2-10123),(2N1.3正态分布正态分布n 标准正态分布:标准正态分布:n 它是特殊的正态分布,服从标准的正态分布的它是特殊的正态分布,服从标准的正态分布的随机变量记为随机变量记为z,概率密度函数记为,概率密度函数记为(z z)1)(2)()()()()(1)()(1)(aazPa
7、bbzaPaaaazP-3-2-101232221)(_) 1 , 0(zezN1.3正态分布正态分布n 标准正态分布的变换:标准正态分布的变换:-3-2-10123xz-3 -2 -1 0 1 2 3-3-2-101231.3正态分布正态分布n 标准正态分布的分位数:标准正态分布的分位数:n 0.975是随机变量是随机变量z不超过不超过1.96的概率的概率n 1.961.96是标准正态分布是标准正态分布N N(0,1)0,1)的的0.9750.975的分位数的分位数,记为,记为z z0.9750.975975. 0)96. 1(zP-3-2-101230.9750.0251.4常用的抽样分布
8、常用的抽样分布正态样本均值的分布正态样本均值的分布:nNXnXnii21,1X X5x5 . 2x50X50X总体分布总体分布抽样分布抽样分布1.4常用的抽样分布常用的抽样分布n t分布分布: t t 分布与正态分布的比较分布与正态分布的比较不同自由度的不同自由度的t t分布分布标准正态分布标准正态分布1ntnsX1.4常用的抽样分布常用的抽样分布n F F分布分布: :设设X X1 1,X X2 2,X Xn n是来自正态总体是来自正态总体N N( (1 1, ,1 12 2 ) )的一个样本,的一个样本, Y Y1 1,Y Y2 2,Y Yn n是来自正态总体是来自正态总体N N( (2
9、2, ,2 22 2 ) )的一个样本,且相互独立的一个样本,且相互独立, ,则则: :n 将将F F( (n n-1 , m-1 )-1 , m-1 )称为第一自由度为称为第一自由度为( (n n-1)-1),第二自,第二自由度为由度为(m-1)(m-1)的的F F分布分布1, 12122222122212221mnFssss1.4常用的抽样分布常用的抽样分布n F F分布分布: :第二单元第二单元2.1点估计点估计n 点估计的概念(点估计的概念(point estimation): n 用样本均值估计总体均值用样本均值估计总体均值n 用样本方差估计总体方差用样本方差估计总体方差n 用样本标
10、准差估计总体标准差用样本标准差估计总体标准差),.,(321nxxxxX22ss2.2区间估计区间估计n 区间估计的概念(区间估计的概念(interval estimate):n 置信区间(置信区间(confidence interval):):n ,则称这种置信区间,则称这种置信区间为等尾置信区间。为等尾置信区间。),.,(),.,(321321nUUnLLxxxxxxxx1)(ULP2)()(ULPP2.2区间估计区间估计 置信区间下限值1 /2/2x 置信区间上限值n 点估计与区间估计的区别点估计与区间估计的区别:我是意见是这个值是我是意见是这个值是10,但误差在但误差在1之间。之间。2
11、.2区间估计区间估计2.2区间估计区间估计n 置信水平的概念置信水平的概念: 是是的置信水平为的置信水平为1-1-的置信区间。它的置信区间。它的含义是能盖住未知参数的含义是能盖住未知参数的概率为的概率为1-1-。n 置信区间量化了数据的不定性。置信区间量化了数据的不定性。,UL2.2区间估计区间估计n 总体均值置信区间的计算总体均值置信区间的计算:n 已知已知:n 未知未知:nzxnzxnzx212121nstxnstxnstxnnn)1(21)1(21)1(212.2区间估计区间估计n 2 2分布分布:n 方差置信区间的计算:方差置信区间的计算:11222122nXXsnnii2122212
12、121,1nnsnsn2.2区间估计区间估计n 置信区间的长度置信区间的长度:1、大的样本产生、大的样本产生较短的区间,小的样本产生较长的较短的区间,小的样本产生较长的区间。区间。2 2、低的置信水平产生较短的区间,高的置信水平产、低的置信水平产生较短的区间,高的置信水平产生较长的区间。生较长的区间。N=100N=200N=300N=400N=500ExerciseX=XnDistribution of Sampling AveragesXXn研究草莓酱的重量是多少?研究草莓酱的重量是多少?n答案:答案:= =9595的置信区间的置信区间第三单元第三单元3.1假设检验问题假设检验问题n 例:草
13、莓酱的净重服从正态分布例:草莓酱的净重服从正态分布N(,2),), 6月份从产品中随机抽取月份从产品中随机抽取50瓶称重的平均重量为瓶称重的平均重量为180.5克克, 5月份从产品中随机抽取月份从产品中随机抽取50瓶称重的平均重量为瓶称重的平均重量为179.6克克, ,问从总体上是否重量比原来少了?,问从总体上是否重量比原来少了?1、这不是一个参数估计问题、这不是一个参数估计问题2、要求对、要求对6 6- -5 5=0=0作出回答:是与否作出回答:是与否3、这类问题被称为统计假设检验问题、这类问题被称为统计假设检验问题n 估计的主要任务是找参数值等于几;估计的主要任务是找参数值等于几;n 假设
14、检验的兴趣主要是看参数的值是否等于某个特假设检验的兴趣主要是看参数的值是否等于某个特别感兴趣的值别感兴趣的值3.2定义假设定义假设H0和和HaH0n 要判断要判断0.9克这个值是否超出了样本变换所能造成的克这个值是否超出了样本变换所能造成的差异的范围,我们先要问一问在总体均值相等的情况差异的范围,我们先要问一问在总体均值相等的情况下,样本均值会发生什么情况,即是否两个均值的差下,样本均值会发生什么情况,即是否两个均值的差等于等于0,在统计学上被称为,在统计学上被称为零假设零假设(null hypothesis)n 之所以用零来修饰假设,其原因是假设的内容总是没之所以用零来修饰假设,其原因是假设
15、的内容总是没有差异或没有改变有差异或没有改变0:560H3.2定义假设定义假设H0和和HaHAn 零假设其逻辑上的反面假设是零假设其逻辑上的反面假设是“两个参数有区别两个参数有区别”。这种反面假设称为这种反面假设称为备择假设(备择假设(alternative hypothesis)。)。n 当零假设所提问的问题被否定时,备择假设的答案就当零假设所提问的问题被否定时,备择假设的答案就是正确的。如果样本数据能证明对于零假设提出的问是正确的。如果样本数据能证明对于零假设提出的问题应该否定,那么我们就拒绝(题应该否定,那么我们就拒绝(rejectreject)零假设而倾)零假设而倾向于备择假设。向于备
16、择假设。0:56AH3.3怎样回答零假设所提出的问题怎样回答零假设所提出的问题概率:概率:p-值值n p-值是当零假设正确时,得到所观测的数据或更极端值是当零假设正确时,得到所观测的数据或更极端的数据的概率,这个概率称为的数据的概率,这个概率称为p-值(值(p-value)。)。n 当当p-值小到以至于几乎不可能在零假设正确时出现目值小到以至于几乎不可能在零假设正确时出现目前的观测数据时,我们就拒绝零假设。前的观测数据时,我们就拒绝零假设。 p-值越小,拒值越小,拒绝零假设的理由就越充分。绝零假设的理由就越充分。n 注意:注意: 有时错误以为有时错误以为p-值与零假设对错的概率有关,值与零假设
17、对错的概率有关,但这是不可能的但这是不可能的. p-值指的是关于数据的概率。值指的是关于数据的概率。 p-值值告诉我们在某总体的许多样本中,某一类数据出现的告诉我们在某总体的许多样本中,某一类数据出现的经常程度。经常程度。3.3怎样回答零假设所提出的问题怎样回答零假设所提出的问题假设检验机制:假设检验机制:n 为了求为了求p-值,统计理论指出要把观测到的值,统计理论指出要把观测到的0.9这个样本这个样本均值之差变换成标准得分。均值之差变换成标准得分。n 标准得分:标准得分:0.0H00.00.510.9观测到的差观测到的差样本均值的差样本均值的差标准得分标准得分2.142 p-值0.03473
18、.3怎样回答零假设所提出的问题怎样回答零假设所提出的问题假设检验机制:假设检验机制:n t值等于值等于2.142的概率是的概率是0.0347,因此两个样本均值之差因此两个样本均值之差等于等于0.9的概率也是的概率也是0.0347 ,换句话说就是如果两总,换句话说就是如果两总体均值相等的话,从均值相等的总体中抽取体均值相等的话,从均值相等的总体中抽取200个样个样本两两相减所得之差只有本两两相减所得之差只有3.47个样本的样本均值相差个样本的样本均值相差在在0.9,是小概率(,是小概率(0.05)事件,我们拒绝零假设。)事件,我们拒绝零假设。H00.00.510.9观测到的差观测到的差样本均值的
19、差样本均值的差标准得分标准得分2.142 p-值0.03473.4显著水平显著水平n 显著水平:我们不是在数据收集显著水平:我们不是在数据收集完毕完毕之后计算之后计算p-值,值,而是在收集数据而是在收集数据以前以前就已经确定好的小概率来构造一就已经确定好的小概率来构造一个区间。当样本数据落入这个区间时就拒绝零假设。个区间。当样本数据落入这个区间时就拒绝零假设。这个小概率这个小概率 称为检验的显著水平(称为检验的显著水平(significant level),通常选),通常选0.05.n 一个检验的显著水平一个检验的显著水平是抽样所得的数据拒绝了本来是抽样所得的数据拒绝了本来是正确的零假设的概率
20、。是正确的零假设的概率。n 拒绝域:当样本数据落入这个区间时就拒绝零假设,拒绝域:当样本数据落入这个区间时就拒绝零假设,那么这个区间就称为拒绝域。那么这个区间就称为拒绝域。n 临界值(临界值(critical values):):拒绝域的边界所对应的拒绝域的边界所对应的标准得分的值。对于双边检验,样本统计量的临界标准得分的值。对于双边检验,样本统计量的临界值值是两个值。是两个值。3.4显著水平显著水平 /2 3.5风险(风险(和和)True StateH0 TrueH0 FalseAccept H0CorrectDecisionType IIError ()DecisionReject H0T
21、ype IError ()CorrectDecisionX=XnDistribution of Sampling AveragesXX3.5和和的关系的关系X=XnDistribution of Sampling AveragesXX你不能同时减你不能同时减少两类错误少两类错误! !3.6假设检验的步骤假设检验的步骤1 1、建立假设、建立假设2 2、数据独立性检查、数据独立性检查3 3、数据正态性检查、数据正态性检查4 4、如为、如为One to OneOne to One问题进行方差的问题进行方差的F F检验检验5 5、计算检验统计量、计算检验统计量6 6、给出显著性水平、给出显著性水平 ,
22、通常,通常 =0.05=0.057 7、定出临界值,写出拒绝域、定出临界值,写出拒绝域8 8、判断、判断案例案例1例:草莓酱的净重服从正态分布例:草莓酱的净重服从正态分布N(180,22),), 5月份随机抽取月份随机抽取50罐称罐称重的平均重量为重的平均重量为179.6克,问是否符克,问是否符合标准?合标准?平均净重:179.6g3.7One to Standard的问题的问题n 是假设检验的特例是假设检验的特例: 其中一个其中一个 已知已知0180:0180:550AHH3.7One to Standard的问题的问题n 计算标准得分计算标准得分: 已知时,使用已知时,使用z z统计量计算
23、统计量计算 未知时,使用未知时,使用t t统计量计算统计量计算n 双侧问题双侧问题nsxtnxzn1 /2 3.7One to Standard的问题的问题单侧左检验单侧左检验 表格值表格值(临界值临界值)拒绝范围拒绝范围 无法拒绝无法拒绝HOHa: (大于大于)3.7One to Standard的问题的问题单侧右检验单侧右检验拒绝范围拒绝范围 无法拒绝无法拒绝HO 表格值表格值(临界值临界值)Ha: (小于小于)3.7One to Standard的问题的问题JMP中的操作中的操作172174176178180182184186.01.05.10.25.50.75.90.95.99-3-2
24、-10123 Normal QuantileTest for NormalityShapiro-Wilk W TestW 0.987388Prob |z|Prob zProb |t|Prob tProb tt Test-1.2213 0.2278 0.8861 0.1139案例案例2例:草莓酱的净重服从正态分布例:草莓酱的净重服从正态分布N(,2),), 6月份从产品中随机抽取月份从产品中随机抽取50瓶瓶称重的平均重量为称重的平均重量为180.5克克, 5月份从产月份从产品中随机抽取品中随机抽取50瓶称重的平均重量为瓶称重的平均重量为179.6克克, ,问从总体上是否重量比原来,问从总体上是否
25、重量比原来少了?少了?假设检验的步骤假设检验的步骤1 1、建立假设、建立假设2 2、数据独立性检查、数据独立性检查3 3、数据正态性检查、数据正态性检查4 4、如为、如为One to OneOne to One问题进行方差的问题进行方差的F F检验检验5 5、计算检验统计量、计算检验统计量6 6、给出显著性水平、给出显著性水平 ,通常,通常 =0.05=0.057 7、定出临界值,写出拒绝域、定出临界值,写出拒绝域8 8、判断、判断3.8One to One的问题的问题n 建立假设建立假设:0:0:65650AHH假设检验的步骤假设检验的步骤1 1、建立假设、建立假设2 2、数据独立性检查、数
26、据独立性检查3 3、数据正态性检查、数据正态性检查4 4、如为、如为One to OneOne to One问题进行方差的问题进行方差的F F检验检验5 5、计算检验统计量、计算检验统计量6 6、给出显著性水平、给出显著性水平 ,通常,通常 =0.05=0.057 7、定出临界值,写出拒绝域、定出临界值,写出拒绝域8 8、判断、判断假设检验的步骤假设检验的步骤1 1、建立假设、建立假设2 2、数据独立性检查、数据独立性检查3 3、数据正态性检查、数据正态性检查4 4、如为、如为One to OneOne to One问题进行方差的问题进行方差的F F检验检验5 5、计算检验统计量、计算检验统计
27、量6 6、给出显著性水平、给出显著性水平 ,通常,通常 =0.05=0.057 7、定出临界值,写出拒绝域、定出临界值,写出拒绝域8 8、判断、判断3.8One to One的问题的问题Fcrit F检验:检验:1, 12122222122212221mnFssss假设检验的步骤假设检验的步骤1 1、建立假设、建立假设2 2、数据独立性检查、数据独立性检查3 3、数据正态性检查、数据正态性检查4 4、如为、如为One to OneOne to One问题进行方差的问题进行方差的F F检验检验5 5、计算检验统计量、计算检验统计量6 6、给出显著性水平、给出显著性水平 ,通常,通常 =0.05=
28、0.057 7、定出临界值,写出拒绝域、定出临界值,写出拒绝域8 8、判断、判断3.8One to One的问题的问题n 相等时相等时t的计算:的计算:Sp为为s s1 1 ,s s2 2的加权平的加权平均,称为两个样本的联合方差。均,称为两个样本的联合方差。21111212222112121221nnsnsnsnnsxxtppnn3.8One to One的问题的问题n 不等时不等时t的计算:的计算: 122222112121222212122212121nnsnnsnsnsfnsnsxxtf3.8One to One的问题的问题假设检验的步骤假设检验的步骤1 1、建立假设、建立假设2 2、
29、数据独立性检查、数据独立性检查3 3、数据正态性检查、数据正态性检查4 4、如为、如为One to OneOne to One问题进行方差的问题进行方差的F F检验检验5 5、计算检验统计量、计算检验统计量6 6、给出显著性水平、给出显著性水平 ,通常,通常 =0.05=0.057 7、定出临界值,写出拒绝域、定出临界值,写出拒绝域8 8、判断、判断3.8One to One的问题的问题 /2 假设检验的步骤假设检验的步骤1 1、建立假设、建立假设2 2、数据独立性检查、数据独立性检查3 3、数据正态性检查、数据正态性检查4 4、如为、如为One to OneOne to One问题进行方差的
30、问题进行方差的F F检验检验5 5、计算检验统计量、计算检验统计量6 6、给出显著性水平、给出显著性水平 ,通常,通常 =0.05=0.057 7、定出临界值,写出拒绝域、定出临界值,写出拒绝域8 8、判断、判断3.8One to One的问题的问题因为因为Prob0.0347|t| 0.0347Assuming equal variancesTests that the Variances are EqualLevelJuneMayCount 50 50Std Dev 2.101368 2.049716MeanAbsDif to Mean 1.702087 1.512500MeanAbsDif to Median 1.696158 1.512131TestOBrien.5Brown-ForsytheLeveneBartlettF Ratio 0.0274 0.4999 0.5403 0.0300DF Num 1 1 1 1DF Den 98 98 98 ?ProbF0.86880.48120.46410.8624Welch Anova testing Means Equal, allowing Stds Not EqualF Ratio 4.5893t-Test 2.1423DF Num 1DF Den97.93
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 大型影剧院改造工程合同会签表
- 餐饮成本控制方法
- 汕头市剧院租赁合同
- 小型企业财务分析指南
- 建筑设计合同履行跟踪准则
- 建筑装修安全注意事项合同
- 国有企业财务主管聘用合同
- 商业大厦栏杆装修协议
- 工作期限合同模板
- 商业房产购买合同模板
- SJG 164-2024 自密实混凝土应用技术规程
- 2024年上海市中考语文一轮复习:教材知识点归纳
- 《雁门太守行》复习省公开课一等奖全国示范课微课金奖课件
- 临床医学职业生涯规划
- 幼儿园课程故事开展培训
- 《电力建设施工技术规范 第3部分:汽轮发电机组》DLT 5190.3
- 重大版小学英语六年级上册全册教案
- 跌倒坠床护理个案分析
- 艺术设计专业的职业生涯报告
- 火力发电厂施工图设计内容深度规定
- 污水处理厂EPC项目建设方案
评论
0/150
提交评论