版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、统计推断(statistical inference)假设检验假设检验参数估计参数估计由一个样本或一系列样本所得的结果来由一个样本或一系列样本所得的结果来推断总体的特征。推断总体的特征。统计推断概念概念分析误差产生的原因分析误差产生的原因确定差异的性质确定差异的性质排除误差干扰排除误差干扰对总体特征做出正确判断对总体特征做出正确判断统计推断任务第四章第四章第一节第一节第二节第二节第四节第四节第五节第五节假设检验的原理与方法假设检验的原理与方法样本平均数的假设检验样本平均数的假设检验参数的区间估计与点估计参数的区间估计与点估计方差的同质性检验方差的同质性检验假设检验的原理与方法假设检验的原理与方
2、法例例:设矽肺病患者的血红蛋白含量具平均数:设矽肺病患者的血红蛋白含量具平均数 0 0126(mg/L)126(mg/L), 2 2 240240 (mg/L)(mg/L)2 2的正态分布。现用克矽平对的正态分布。现用克矽平对6 6位矽肺病患者进位矽肺病患者进行治疗,治疗后化验测得其平均血红蛋白含量行治疗,治疗后化验测得其平均血红蛋白含量x =136(mg/L)x =136(mg/L)。矽肺病患者的血红蛋白含量矽肺病患者的血红蛋白含量治疗后患者的血红蛋白含量治疗后患者的血红蛋白含量总体平均数总体平均数样本平均数样本平均数1260136x差差 异异二者之间的差异是由于抽样误差所致,即二者之间的差
3、异是由于抽样误差所致,即治疗后的总体平均数治疗后的总体平均数 与与 0 0是相同的。是相同的。由于药物的影响,两个均数由于药物的影响,两个均数 与与 0 0间有本质间有本质的差异,即二者不相同,不完全是抽样误的差异,即二者不相同,不完全是抽样误差的原因。差的原因。抽样误差抽样误差本质差异本质差异假设检验根据根据总体的理论分布总体的理论分布和和小概率原理小概率原理,对未知或不,对未知或不完全知道的总体提出两种完全知道的总体提出两种彼此对立彼此对立的假设,然后的假设,然后由样本的实际结果,经过一定的计算,作出在一由样本的实际结果,经过一定的计算,作出在一定定概率意义概率意义上应该接受的那种假设的推
4、断。上应该接受的那种假设的推断。一、假设检验的概念假设检验假设检验(hypothesis test)显著性检验显著性检验(significance test)小概率原理小概率原理 概率很小的事件在一次抽样试验中实际是几乎不可能发生的。 =0.05/0.01如果假设一些条件,并在假设的条件下能够准确地算出如果假设一些条件,并在假设的条件下能够准确地算出事件出现的概率事件出现的概率 为很小,则在假设条件下的为很小,则在假设条件下的n次独次独立重复试验中,事件立重复试验中,事件A将按预定的概率发生,而在一次将按预定的概率发生,而在一次试验中则几乎不可能发生。试验中则几乎不可能发生。000二、假设检验
5、的步骤例例:设矽肺病患者的血红蛋白含量具平均数:设矽肺病患者的血红蛋白含量具平均数 0 0126(mg/L)126(mg/L), 2 2 240240 (mg/L)(mg/L)2 2的正态分布。现用克矽平对的正态分布。现用克矽平对6 6位矽肺病患者进位矽肺病患者进行治疗,治疗后化验测得其平均血红蛋白含量行治疗,治疗后化验测得其平均血红蛋白含量x =136(mg/L)x =136(mg/L)。矽肺病患者的血红蛋白含量治疗后患者的血红蛋白含量总体平均数总体平均数样本平均数样本平均数1260136x 总体假假 设设无效假设无效假设 (ineffective hypothesis)(ineffecti
6、ve hypothesis)零零 假假 设设 (null hypothesis)(null hypothesis)零假设是针对实验重点考查内容提出来的。零假设:治疗后的血红蛋白平均数仍是治疗前的。零假设:治疗后的血红蛋白平均数仍是治疗前的。=0 =126(mg/L)(1)零假设是有意义的;(2)根据零假设可以计算因抽样误差而获得样本结果的概率。接受零假设否定零假设二、假设检验的步骤1. 1. 提出假设提出假设H0假设假设克矽平没有疗效克矽平有疗效备择假设备择假设 (alternative hypothesis)对应假设对应假设与零假设相对立的假设HA:0 0 HA:0 0 二、假设检验的步骤在
7、拒绝H0的情况下,可供选择的假设。HA1. 1. 提出假设提出假设对对立立无效假设备择假设 H0: 0 HA: 0 误差效应处理效应1. 1. 提出假设提出假设0.05= 0.01显著水平*极显著水平*统计中,常把概率小于0.05或0.01作为小概率。P0.05(0.01)P0.05(0.01)二、假设检验的步骤2. 2. 确定显著水平确定显著水平H H0 0的假设可能是正确的,应该接受,同时否定的假设可能是正确的,应该接受,同时否定H HA A;否定否定H H0 0,接受,接受H HA A;选定检验方法,计算检验统计量(test statistic)ut2F针对不同的研究问题和不同类型的变量
8、,所涉及的统计分布不同,显著性检验使用的方法也不相同。两个样本平均数的比较多个样本平均数的比较事物间的构成比的差异进行比较二、假设检验的步骤3. 3. 确定统计量,计算概率确定统计量,计算概率1260 x例例:设矽肺病患者的血红蛋白含量具平均数:设矽肺病患者的血红蛋白含量具平均数 0 0126(mg/L)126(mg/L), 2 2 240240 (mg/L)(mg/L)2 2的正态分布。现用克矽平对的正态分布。现用克矽平对6 6位矽肺病患者进位矽肺病患者进行治疗,治疗后化验测得其平均血红蛋白含量行治疗,治疗后化验测得其平均血红蛋白含量x =136(mg/L)x =136(mg/L)。矽肺病患
9、者的血红蛋白含量治疗后患者的血红蛋白含量总体平均数总体平均数样本平均数样本平均数1260136x如果从正态分布总体N(,2)进行抽样,其样本平均数x是一具有平均数 ,方差2/n的正态分布,记作N(,2/n)。1260 x40624022nx(126,40)x = 136(mg/L)581. 140126136xxuP( u 1.581)=20.0571=0.1142依据小概率原理,作出推断结论,是否接受假设PP0.05接受H0可以推断治疗前后的血红蛋白含量未发现有显著差异,可以推断治疗前后的血红蛋白含量未发现有显著差异,其差值其差值10(mg/L)10(mg/L)应归于误差所致。应归于误差所致
10、。即抽出样本的总体平均数即抽出样本的总体平均数 0 0二、假设检验的步骤4. 4. 推断是否接受假设推断是否接受假设差异达显著水平差异达显著水平差异达极显著水平差异达极显著水平01. 0)58. 2(05. 0)96. 1(uPuP 0.950.0250.025-1.961.9696. 1u58. 2u05. 0)96. 1(uP01. 0)58. 2(uP分分析析题题意意提提出出假假设设确确定定显显著著水水平平计计算算检检验验统统计计量量作作出出推推断断二、假设检验的步骤 00.950.95(接受区)(接受区)0.0250.025临界值临界值双尾检验双尾检验(双侧检验双侧检验)否定区否定区左
11、尾右尾xu假设检验的两个否定区,分别位于分布的两尾x96. 10 x96. 10三、双尾检验与单尾检验H H0 0:=:=0 0 时,则时,则H HA A:0 0备择假设有两种可能,备择假设有两种可能, 0 0 或或 :0 0备择假设只有一种可能,备择假设只有一种可能, 0 0其否定区只有一个,相应的检验只能考虑一侧(左侧其否定区只有一个,相应的检验只能考虑一侧(左侧或右侧)的概率。或右侧)的概率。单尾检验三、双尾检验与单尾检验假设:H0 : 0 HA : 0否定区H0 : 0 HA : 0或不可能或不可能30时,卡方分布已接近正态分布。对于给定的对于给定的(01)(02 2=的的点点 2 2
12、为为2 2分布的上分布的上分位点(右尾概率)。分位点(右尾概率)。表中表头的概率表中表头的概率P P是是2 2大于表内所列大于表内所列2 2值的概率。值的概率。df = 205. 0)99. 5(2P01. 0)21. 9(2P95. 0)10. 0(2P025. 0)05. 0(2P95. 0025. 0975. 0)38. 705. 0(2P对于给定的对于给定的(01)(0 (n(n,)=)=的点的点 (n(n,) )为分布的上为分布的上分位点(或临界值点)。分位点(或临界值点)。05. 0)48. 3(FP01. 0)99. 5(FP在在dfdf1 1=4,df=4,df2 2=10=1
13、0的正态总体中连续的正态总体中连续抽样,所得抽样,所得F F值大于值大于3.483.48的仅有的仅有5%5%,而大于而大于5.995.99的仅有的仅有1%1%。第四章第四章第一节第一节第二节第二节第四节第四节第五节第五节假设检验的原理与方法假设检验的原理与方法样本平均数的假设检验样本平均数的假设检验参数的区间估计与点估计参数的区间估计与点估计方差的同质性检验方差的同质性检验样本平均数的假设检验样本平均数的假设检验大样本平均数的假设检验大样本平均数的假设检验 u检验检验小样本平均数的假设检验小样本平均数的假设检验 t检验检验单样本单样本双样本双样本总体方差总体方差2 2已知已知总体方差总体方差2
14、 2未知未知n30n 30nxu/nsxu/nsxt/n30n 301 12 2和和2 22 2已知已知1 12 2和和2 22 2未知未知222121212121nnxxxxuxx222121212121nsnsxxsxxuxx成对数据成对数据成组数据成组数据2121xxsxxtdsdt u u检验检验 这是检验总体方差 已知,或总体方差 未知,样本容量 的平均数 是否属于平均数为 的指定总体的一种检验方法。两样本的方差 、 已知,或两总体方差未知,但两样本容量都是大样本时,两样本间平均数的比较。 2230nx02122 例4.1 豌豆籽粒重(g/100粒)服从正态分布N(37.72,0.3
15、32),改善栽培后,随机抽取9粒,平均重37.92g,s=0.33,问籽粒重是否有显著提高。 这是 已知,对平均数的检验,用u检验。 Ho: HA: 单尾检验, 查正态离差(u)值表,临界u值( )得1.6449。 ;接受Ho的概率p0.05。 结论:拒绝Ho,栽培条件的改善显著地提高了豌豆的籽粒重。 272.370005.082. 1933. 072.3792.370nxu10. 02 p2u2uu 例4.2 优质草龟卵的平均重为5g,标准差为0.8g,从某种龟场随机抽取龟卵100枚,平均重为4.9g,试问该场的龟卵是否属于优质龟卵?1)假设H0:=0 =5g,即该场龟卵属于优质龟卵。对HA
16、: 0 ; 2) 确定显著水平=0.05; 3)检验计算 = = 0.08 u= =-1.25 4)推断: 1.96,实得|u |0.05,则接受H0,认为该场龟卵属于优质龟卵。x1008 . 0n08. 059 . 405. 0u05. 0u第四章第四章第一节第一节第二节第二节第四节第四节第五节第五节假设检验的原理与方法假设检验的原理与方法样本平均数的假设检验样本平均数的假设检验参数的区间估计与点估计参数的区间估计与点估计方差的同质性检验方差的同质性检验参数的区间估计与点估计参数的区间估计与点估计(自学自学)在实践中,我们常常希望对某些参数给出估计值在实践中,我们常常希望对某些参数给出估计值
17、农作物的产量农作物的产量产品的合格率产品的合格率某种疾病的发病率某种疾病的发病率参数估计参数估计(parameter estimation) 参数估计的一般原理参数估计的一般原理1、点估计点估计(Piont estimate): 以样本统计量直接估计总体的相应参数。以样本统计量直接估计总体的相应参数。估计总体参数的统计量称为估计量(估计总体参数的统计量称为估计量(Estimator)。)。nxx2)( 一般来说,一个好的估计量应满足以下三个一般来说,一个好的估计量应满足以下三个条件:无偏性、有效性和相容性。条件:无偏性、有效性和相容性。 无偏估计量无偏估计量 如果一个统计量的理论平均数,即它如
18、果一个统计量的理论平均数,即它的数学期望等于总体的参数,就称为无偏估计量的数学期望等于总体的参数,就称为无偏估计量 ; 有效估计量有效估计量 在样本含量相同的情况下,如果一个在样本含量相同的情况下,如果一个统计量的方差小于另一个统计量的方差,则前一个统计量统计量的方差小于另一个统计量的方差,则前一个统计量是更有效的估计量是更有效的估计量 ; 相容估计量相容估计量 如果统计量的取值,任意接近于参数如果统计量的取值,任意接近于参数值的概率,随样本含量值的概率,随样本含量n n的无限增加而趋于的无限增加而趋于1 1,则该统计量,则该统计量称为参数的相容估计量称为参数的相容估计量 。例:用某地成年男子
19、红细胞数的样本均数例:用某地成年男子红细胞数的样本均数5.385.3810101212/L/L来估计该地成年男子红细胞的总体均数。来估计该地成年男子红细胞的总体均数。2、区间估计区间估计(Interval estimate): 按一定的概率估计总体参数在那个范围。按一定的概率估计总体参数在那个范围。 581. 140106/240126136/0nxu 326 . 04046/240261013/0nxu 949. 04066/240261201/0nxu 581. 140106/240261611/0nxu136x130 x126x116xxxu096. 1 uxxxx96. 196. 10
20、5. 0195. 0)96. 196. 1(Pxxxx0.01-199 . 0)58. 258. 2(Pxxxx96. 196. 10 xx-1)(Pxxuxux) (xxuxux,)L (L21xxuxux, Lxux 96.1Lxx)96. 1L 96. 1(L21xxxx, 58.2Lxx)58. 2L 58. 2(L21xxxx, 40.12136L60.1234096. 1136L104 .4814096. 1136L2 95. 0)40.14860.123(P第四章第四章第一节第一节第二节第二节第四节第四节第五节第五节假设检验的原理与方法假设检验的原理与方法样本平均数的假设检验样本
21、平均数的假设检验参数的区间估计与点估计参数的区间估计与点估计方差的同质性检验方差的同质性检验方差的同质性检验方差的同质性检验一、概念一、概念方差的同质性方差的同质性(homogeneity)(homogeneity),又称为,又称为方方差齐性差齐性(homogeneity of variance)(homogeneity of variance),就,就是指各个总体的方差是相同的。是指各个总体的方差是相同的。适用范围:适用范围:各样本的方差来推断其总体方各样本的方差来推断其总体方差是否相同。差是否相同。二、一个样本方差二、一个样本方差 的同质性检验的同质性检验适用范围适用范围:用于检验一个样本所属总体方差用于检验一个样本所属总体方差2222211222322212)1()()(.skxxuuuuukkiik 22步骤步骤 提出假设提出假设 H0: 2=0 2, HA: 202 推断推断 否定区为否定区为 x2 x2 222) 1(sk df=k-1 检验统计量检验统计量 确定显著水平确定显著水平 0.05/0.01例例: 已知某农田受到重金属的污染,经抽样测定其铅浓度为已知某农田受到重金属的污染,经抽样测定其铅浓度为4.2,4.5,3.6,4.7,4.0
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 个性化动产抵押贷款协议模板2024版版A版
- 2025年度环保型压路机买卖合同-绿色施工项目专用采购协议3篇
- 2025年微信公众号转让与内容合作协议范本下载3篇
- 二零二五版房屋共有权公证与房地产权属登记及法律援助协议3篇
- 2024版危险品货物运输协议书
- 2024汽车零部件运输合同
- 二零二五年度杭州高端家居装修合同标准范本
- 2024版标准劳务派遣协议
- 2024版桩基施工的合同范本
- 二零二五年度应急物资储备与责任落实合同3篇
- 小学三年级数学下册计算题大全(每日一练共25份)
- Unit 3 同步练习人教版2024七年级英语上册
- “十四五”期间推进智慧水利建设实施方案
- EPC项目机电安装专业工程重难点分析及经验交流
- 大型活动联合承办协议
- 工程项目采购与供应链管理研究
- 2024年吉林高考语文试题及答案 (2) - 副本
- 拆除电缆线施工方案
- 搭竹架合同范本
- Neo4j介绍及实现原理
- 焊接材料-DIN-8555-标准
评论
0/150
提交评论