




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第7讲假设检验1假设检验基础定义2定义1:假设检验是指对总体的某种规律(如总体参数、总体分布等)提出一个假设,通过样本数据来开展推断,从而决定是否拒绝这一假设的统计活动。假设检验的核心思想是反证法。假设检验的原理是小概率原理。步骤1——提出假设3
步骤1——提出假设4
假设双侧检验左单侧检验右单侧检验步骤1——提出假设5
步骤1——提出假设6例某机构认为A地区居民在过去一周用于外卖的平均支出超过200元,为了验证该观点,机构开展随机调查,并准备开展假设检验,请问该问题中的原假设与备择假设应该如何给出?
步骤2——选择检验统计量7检验统计量是假设检验中的一种统计量。在原假设下,检验统计量服从一个给定的概率分布。步骤2——选择检验统计量8
步骤3——显著性水平与拒绝区域9
不拒绝区域0
拒绝区域拒绝区域标准正态分布步骤3——显著性水平与拒绝区域10正确决策正确决策
步骤3——显著性水平与拒绝区域11
步骤3——显著性水平与拒绝区域12考虑单侧问题
0
拒绝区域
标准正态分布
0
拒绝区域
标准正态分布步骤4——计算检验统计量的值13在这个步骤里,我们就需要依据假设检验问题中包括样本信息在内的所有已知信息,计算检验统计量的值,这个步骤并不复杂,可以借助EXCEL等软件来协助计算。步骤5——统计决策14如果检验统计量的值落在拒绝区域内,那么就意味着一次实验中小概率事件发生了,我们就有足够的理由做出“拒绝原假设”的决策。反之,如果检验统计量的值没有落在拒绝区域内,那么就意味着一次实验中小概率事件没有发生了,我们就没有足够的理由“拒绝原假设”,此时的决策应该是“无法拒绝原假设”。第7讲假设检验157.2.1一个总体均值的假设检验1方法讲解——提出假设16方法讲解——确定检验统计量17总体方差已知总体方差未知正态总体非正态总体(大样本)方法讲解——显著性水平与拒绝区域18显著性水平α是我们在开展假设检验过程中进行给定的,表示在假设检验中犯第一类错误概率的上限。(1)双侧检验0
拒绝区域拒绝区域
标准正态分布方法讲解——显著性水平与拒绝区域19显著性水平α是我们在开展假设检验过程中进行给定的,表示在假设检验中犯第一类错误概率的上限。(1)双侧检验0
拒绝区域拒绝区域
标准正态分布0
拒绝区域拒绝区域
T分布方法讲解——显著性水平与拒绝区域20(2)单侧检验0
拒绝区域
标准正态分布0
拒绝区域
标准正态分布方法讲解21计算检验统计量的值做出统计决策
P值决策22P值是原假设为真时,得到样本观察结果或者更极端结果的概率。
P值决策23
例题24例
某机构认为A电商平台用户的平均支出不足400元,为了检验其观点,对60位用户开展了随机调查,用户支出的调查结果如下:418408368387413370414409387348373376391395407410418408387435415398408389408405402357408402433358413388405385397386430385379406374393377423394386414423379378397397390387416394436362
例题25
例题26(3)确定显著性水平与拒绝区域。0
拒绝区域
标准正态分布例题27(4)计算检验统计量的值。
例题28
例题29
0
标准正态分布
大于显著性水平0.05,所以我们没有足够的理由拒绝原件设,也就不能认为平台用户的平均支出显著小于400元。第7讲假设检验307.2.1一个总体均值的假设检验2引例:购物中心的决策难题运营部门认为顾客在购物中心内的平均时间超过2小时,建议应在中心内新增休息区域.决策层认为,如果情况确实如此,就考虑采纳这个建议.你觉得运营部门应该如何验证自己的判断呢?31引例:购物中心的决策难题样本量样本均值(h)样本标准差(h)4102.050.4顾客购物时间的调查结果决策层:调查结果只是比2小时多0.05小时,可能是随机抽样造成的,不能认为超过了2小时.运营部门:调查结果显示顾客购物时间超过了2小时,可以考虑新增休息区域.一个总体均值的假设检验32一个总体均值的假设检验(正态总体且方差未知)
问题能用方差已知情形的均值检验(已学习)来做吗?
33一个总体均值的假设检验(正态总体且方差未知)
样本均值自由度
0
拒绝区域
0
拒绝区域拒绝区域
假设检验的流程34例题
样本量样本均值(h)样本标准差(h)4102.050.435
13
2确定检验统计量:
0
拒绝区域0.05例题36
在0.05显著性水平上,顾客在购物中心内的平均购物时间显著超过2小时,可以考虑新增休息区域.作出统计决策:45计算检验统计量的值:假设的总体均值样本均值样本标准差样本量
0
拒绝区域0.05例题37例题(利用P值进行决策)123
计算检验统计量的值:决策:P值:原假设为真时,得到样本观察结果或者更极端结果的概率0
拒绝区域0.051.652.53
结论:
38例题的思考“顾客在购物中心内的平均购物时间超过2小时”,该结论一定是正确的.如果检验统计量为0.8,这意味着平均购物时间一定小于等于2小时.0
拒绝区域0.0539小结假定条件:检验统计量:检验步骤:正态总体、方差未知
5个步骤40思考与练习
41第7讲假设检验一个总体比例的假设检验42引例:共享巴士计划某创业团队发现,部分上班族每天在A地区和B地区之间通勤时间超过1.5小时.团队计划开通共享巴士,预判超过30%的上班族支持该方案.如果预判正确,团队就开始筹划,那么应该如何验证该预判呢?/news/detail?id=17646143引例:共享巴士计划样本量支持数量样本比例100033033%共享巴士方案的调查结果观点2:只是比30%多了3%,是不是我们运气好才得到了超过30%的结果?观点1:超过30%的上班族支持这一方案,可以开始筹划.一个总体比例的假设检验44一个总体比例的假设检验
/~sdunbar1/ProbabilityTheory/Lessons/BernoulliTrials/DeMoivreLaplaceCLT/demoivrelaplaceclt.xmlAbrahamdeMoivre1667-1754Pierre-SimonLaplace1749-1827
45一个总体比例的假设检验假设检验的流程
0为假设的总体比例
样本比例0
拒绝区域拒绝区域0
拒绝区域提出假设确定检验统计量确定显著性水平
计算检验统计量的值作出统计决策46例题
样本量支持数量样本比例100033033%47
132确定检验统计量:
01.65
拒绝区域例题48
作出统计决策:45计算检验统计量的值:
01.65
拒绝区域例题49例题(利用P值进行决策)312计算检验统计量的值:决策:
P值:原假设为真时,得到样本观察结果或者更极端结果的概率.01.65
拒绝区域
结论:1.652.07
50例题的思考例题的结论“支持的比例大于30%”,一定是成立的.
51小结假定条件:检验统计量:检验步骤:总体服从两点分布、大样本
5个步骤52第7讲假设检验53一个总体方差的假设检验引例:工业机器人的调试某制造商近期怀疑流水线机器人可能存在故障,需要进行各项性能评价.其中一项是竖直方向的焊接位置标准差小于2毫米,否则需要停工调试.在该性能上是否达标呢?/robotic-welding-technology-improve-speed-consistency/54引例观点1:测量得到标准差大于2毫米,应该停工检查.观点2:测量得到的是样本标准差,具有随机性,差得并不多,也许只是运气不好,没必要停工检查.样本量样本标准差(毫米)6002.16一个总体方差的假设检验55一个总体方差的假设检验假定条件:假设检验的流程:总体服从正态分布提出假设56一个总体方差的假设检验假设检验的流程
假设的总体方差57例题
样本量样本标准差(毫米)6002.1658例题
13
2
59
结论:在0.05显著性水平下,焊接位置标准差显著大于2毫米,建议停工检查.作出统计决策:45
例题60例题(利用P值进行决策)123计算检验统计量的值:决策:
P值:原假设为真时,得到样本观察结果或者更极端结果的概率
结论:
698.67
61例题的思考
62小结假定条件:检验统计量:检验步骤:总体服从正态分布
5个步骤63思考与练习
64第14讲两个总体方差比的检验65两个总体方差比的检验引例66判断两个总体方差是否相等,通常是两个总体均值差检验的前期工作。一份报告认为A地区与B地区学生,在过去一个月的课外学习时间方差是相等的,某调查机构为了检验这一结果,应该如何做呢?全面调查?抽样调查?引例67A地区B地区29.330.528.433.933.922.628.127.028.227.628.530.528.130.929.831.422.728.324.123.129.629.827.326.830.527.927.426.531.829.231.630.633.333.128.826.823.731.129.820.429.626.429.929.831.923.426.627.031.828.529.130.431.128.129.821.927.230.126.029.031.931.830.527.825.823.625.329.829.2调查机构对A和B两个地区的学生开展了抽样调查,结果如下
是由抽样的随机性造成的?A地区与B地区学生课外学习时间方差不相等造成的?两个总体方差比的检验68假定条件两个总体都服从正态分布.两个独立的随机样本.样本方差比的分布
原假设与备择假设两个总体方差比的检验69
例题70
A地区B地区29.330.528.433.933.922.628.127.028.227.628.530.528.130.929.831.422.728.324.123.129.629.827.326.830.527.927.426.531.829.231.630.633.333.128.826.823.731.129.820.429.626.429.929.831.923.426.627.031.828.529.130.431.128.129.821.927.230.126.029.031.931.830.527.825.823.625.329.829.2单侧?双侧?例题71
21
3
例题72计算检验统计量的值:4
作出统计决策:5意义:A、B地区学生课外学习时间方差存在显著差异.调查结果并不支持报告的观点.例题(利用P值进行决策)计算检验统计量的值:决策:73450.503
P值:原假设为真时,得到样本观察结果或者更极端结果的概率
小概率事件发生
小结74假定条件两个总体都服从正态分布.两个独立的随机样本.样本方差比的分布
第7讲假设检验75两个总体均值之差的假设检验概述原假设和备择假设76
独立样本、正态总体、总体方差已知77
独立样本、非正态总体、大样本78
独立样本、非正态总体、大样本79
第7讲假设检验80两个总体均值之差的检验正态总体、总体方差未知且相等学生群体与图书馆利用程度81问题不同学生群体对图书馆利用程度存在差异吗?学生群体与图书馆利用程度82研究问题:不同性别学生的“与课程学习相关的文献利用”情况是否存在差异?高校图书馆利用与学生学习结果关系的实证研究——基于“2017年首都大学生就读经验调查”[J].图书情报工作,2019,63(21):56-65.开展了不同性别、是否担任学生干部、是否有深造意愿、不同年级、不同生源地、不同院校类型的学生对图书馆利用情况的分析.两个总体均值之差的检验83是由抽样的随机性造成的?女生的“与课程学习相关的文献利用”情况好于男生造成的?与课程学习相关的文献利用性别男生女生样本量42075061估计量均值标准差均值标准差文献利用2.300.9392.380.928女生样本均值:2.38大于男生样本均值:2.30注:数值越大,与课程学习相关的文献利用情况越好正态总体、总体方差未知且相等两个总体均值之差的检验84两个总体均值之差的检验(正态总体、总体方差未知)
需要首先判断是哪种情形
0F拒绝区域a/2
a/2拒绝区域
复习一下下节内容本节内容正态总体、总体方差未知且相等两个总体均值之差的检验85
0F拒绝区域0.025
0.025拒绝区域EXCEL函数F.INVF.INV.RT与课程学习相关的文献利用性别男生女生样本量42075061估计量均值标准差均值标准差文献利用2.300.9392.380.928正态总体、总体方差未知且相等两个总体均值之差的检验86
合并统计量
原假设与备择假设正态总体、总体方差未知且相等证明见第六章例题87根据2017年首都大学生就读经验调查,在“与课程学习相关的文献利用”变量上,具体数据如下,在正态总体的假设下,请问不同性别学生的“与课程学习相关的文献利用”的均值是否存在差异?
21总体方差是否相等两个总体方差不存在显著差异(考虑方差相等情形).与课程学习相关的文献利用性别男生女生样本量42075061估计量均值标准差均值标准差文献利用2.300.9392.380.928例题884
3确定检验统计量(总体方差未知且相等)
0拒绝区域
拒绝区域
例题计算检验统计量的值:
检验结果显示:不同性别学生的“与课程学习相关的文献利用”的均值存在显著差异.作出统计决策:意义:8956
0拒绝区域
拒绝区域
例题(利用P值进行决策)计算检验统计量的值:决策:9056-1.96
P值:原假设为真时,得到样本观察结果或者更极端结果的概率
小概率事件发生0拒绝区域
拒绝区域
小结91两个总体均值之差的检验(正态总体、总体方差未知)
第一步先做两个总体方差的F检验(已学习)
下节内容本节内容
第二步思考与练习92思考:根据文献信息,建立“创业”与“非创业”群体数学能力均值差的置信区间.(注:不考虑正态总体假设)李涛,朱俊兵,伏霖.聪明人更愿意创业吗?——来自中国的经验发现[J].经济研究,2017,52(03):91-105.第7讲假设检验93两个总体均值之差的假设检验正态总体、总体方差未知且不等引例:健身中心的选址某健身连锁企业计划在B地区开设分店,但运营部门认为A地区居民的过去一周平均运动时间更长,建议在A地区开店.总部认为同等条件下,如果运营部门的判断是正确的,则优先考虑A地区.运营部门应该如何收集数据来检验自己的判断呢?94引例:健身中心的选址地区AB样本量300400估计量均值标准差均值标准差周平均运动时长(h)9.361.569.081.97
两个总体均值之差的假设检验95两个总体均值之差的假设检验上节课学习的两个总体均值之差的检验方法能用吗?
两个总体方差相等吗?96两个总体均值之差的假设检验地区AB样本量300400估计量均值标准差均值标准差周平均运动时长(h)9.361.569.081.97
0F拒绝区域0.025
0.025拒绝区域97两个总体均值之差的假设检验
检验统计量
自由度(接近的整数)原假设与备择假设
98例题
21总体方差存在显著差异地区AB样本量300400估计量均值标准差均值标准差周平均运动时长(h)9.361.569.081.97994
30拒绝区域
确定检验统计量(总体方差未知且不相等)
100例题
作出统计决策:56计算检验统计量的值:
0拒绝区域
101例题例题(利用P值进行决策)12计算检验统计量的值:
0拒绝区域
决策:P值:原假设为真时,得到样本观察结果或者更极端结果的概率
2.1
102例题思考
A地区居民的上一周平均运动时间大于B地区的决策结果一定正确.103小结前提条件:检验统计量:检验步骤:独立正态总体、方差未知且不等
6个步骤104思考与练习思考题:中国4G网络覆盖全国95%的行政村和99%的人口[1],有观点认为“互联网的建设增加了农民的非农收入”,你能结合文献数据[2],谈谈你对这一观点的看法吗?练习:见课程网络平台.[1]/politics/2018-06/11/c_1122965120.htm[2]杨柠泽,周静.互联网使用能否促进农民非农收入增加?——基于中国社会综合调查(CGSS)2015年数据的实证分析[J].经济经纬,2019,36(05):41-48.105第7讲假设检验匹配样本总体均值差的假设检验106引例:玩视频游戏能减肥吗?有机构认为在传统运动器械上增加运动视频游戏有助于减肥.应该如何检验该判断呢?HaddockBL,SiegelSR,WikinLD.Theadditionofavideogametostationarycycling:Theimpactonenergyexpenditureinoverweightchildren[J].Theopensportssciencesjournal,2009,2:42.107引例:玩视频游戏能减肥吗?共20名青少年参加运动视频游戏试验,所有人骑行两次,并评估能量消耗.一次有运动视频游戏设备.一次无运动视频游戏设备.游戏
A1A2A3A4A5A6A7A8A9A10有5.046.975.524.775.575.675.134.884.558.89无7.273.463.206.722.793.374.724.957.143.11
游戏A11A12A13A14A15A16A17A18A19A20有5.144.627.904.297.986.925.516.417.045.25无6.104.014.495.005.334.323.546.536.666.02Kcal/min108匹配样本样本特点同一对象先后测量两次.
匹配样本总体均值差的假设检验游戏
A1A2A3A4A5A6A7A8A9A10有5.046.975.524.775.575.675.134.884.558.89无7.273.463.206.722.793.374.724.957.143.11
游戏A11A12A13A14A15A16A17A18A19A20有5.144.627.904.297.986.925.516.417.045.25无6.104.014.495.005.334.323.546.536.666.02两个样本的样本量相同.两个样本的顺序是一一对应的.109匹配样本总体均值差的假设检验假定条件:两个总体都服从正态分布.作用:检验两个总体的均值差.假设检验的流程1假设研究的问题H0H1提出假设110匹配样本总体均值差的假设检验假设检验的流程观察序号样本1样本2差值MMMM
假设的差值
样本差值均值样本差值标准差检验统计量2345
111例题
Kcal/min游戏
A1A2A3A4A5A6A7A8A9A10有5.046.975.524.775.575.675.134.884.558.89无7.273.463.206.722.793.374.724.957.143.11
游戏A11A12A13A14A15A16A17A18A19A20有5.144.627.904.297.986.925.516.417.045.25无6.104.014.495.005.334.323.546.536.666.02112
13
2确定检验统计量:0拒绝区域
113例题计算检验统计量的值:4
0拒绝区域
游戏A1A2A3A4A5A6A7A8A9A10有无
游戏A11A12A13A14A15A16A17A18A19A20有无
114例题
作出统计决策:5115例题例题(利用P值进行决策)计算检验统计量的值:12
0拒绝区域
统计决策:P值:原假设为真时,得到样本观察结果或者更极端结果的概率.
1.72
116问题拓展:两种t检验是一样的?[1]Xu,M.,Fralick,D.,Zheng,J.Z.,Wang,B.,Tu,X.M.,&Feng,C.(2017).Thedifferencesandsimilaritiesbetweentwo-samplet-testandpairedt-test.Shanghaiarchivesofpsychiatry
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 车辆智能充电管理制度
- 顺风快递公司管理制度
- 进出办公大厦管理制度
- 银行渠道开户管理制度
- 食堂现场卫生管理制度
- 超市调料存储管理制度
- 输血护理管理制度讲课
- 太阳能热电联产系统产业化示范项目可行性分析报告
- 高中综合楼项目可行性分析报告
- 2024年护士资格证考试紧急护理措施试题及答案
- 消防安全知识培训课件文库
- 2025年合肥兴泰金融控股(集团)有限公司招聘23人笔试参考题库附带答案详解
- 古代小说戏曲专题-形考任务2-国开-参考资料
- 扒胎机的使用
- 民用爆炸物品出口审批单
- SJG 63-2019 建设工程建筑废弃物减排与综合利用技术标准-高清现行
- smm7 中文版 工程量清单
- 国学论语中国风国学文化水墨国学文化道德讲堂中国风传统文化ppt模板课件
- 人教统编版高中语文必修下册第一单元(单元总结)
- 《电气照明设备安装》ppt课件
- 天然烟用香料的芳香组分和提取工艺分析
评论
0/150
提交评论