




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第四讲估计与检验第1页,共41页,2023年,2月20日,星期三一、区间估计第2页,共41页,2023年,2月20日,星期三总体均值区间估计总体均值置信水平为100(1-α)%的置信区间为:注意:1、估计成立的条件是:样本必须是随机、独立的;2、使用t分布表时,要求总体必须是近似正态的,需对样本作正态性检验;3、置信水平不是概率(置信区间是确定的而不是随机的),可以认为以置信水平(如95%)相信总体均值在执行区间内;或是说,置信水平这一计算方法可以使得置信区间以95%的概率覆盖总体均值。大样本下:方差未知:或小样本下第3页,共41页,2023年,2月20日,星期三例1某小组随机抽样调查了250户家庭的年收入,样本均值为9.8万,样本标准差为4.8万。小组给出一个置信区间(9.2,10.4),但未给出置信水平。1、问该区间的置信水平?(试比较两种分布的情形)2、小组给出解释:该地区家庭平均年收入为9.2~10.4的概率为95%,这种说法对吗?3、若同时有10个小组在进行相同的独立调查,问9个或以上小组得出的95%置信区间都覆盖总体均值的概率是多少?提示:可以将每一个区间是否覆盖总体均值作为一次Bernoulli试验。令Y为覆盖总体均值的全金属区间数,显然Y~Bin(10,0.95)第4页,共41页,2023年,2月20日,星期三单侧置信区间总体均值100(1-α)%的置信区间:下限为:上限为:第5页,共41页,2023年,2月20日,星期三例21、同例1,问总体均值95%置信区间的下限?当置信水平提高时,估计的可靠性将(提高or降低)?精确性将(提高or降低)?第6页,共41页,2023年,2月20日,星期三比例置信区间若X~Bin(n,p),由中心极限定理传统方法是以样本p代替总体p进行区间估计,最近的研究表明,Agresti–Coull区间有改进,置信水平为100(1-α)%的置信区间计算公式如下:若下限小于0则用0代替,上限大于1则用1代替。第7页,共41页,2023年,2月20日,星期三例3:某企业从所购买的元件中随机抽检了150份,有5份不合格,估计不合格品率95%置信区间。(试用传统方法和Agresti–Coull方法分别计算比较)第8页,共41页,2023年,2月20日,星期三根据指定精度确定所需样本数为获得总体平均100(1-α)%的置信区间,且要求区间宽度不超过D时,则需从这个总体中抽取随机样本数为:总体方差未知的两阶段法:阶段1:从总体中抽取n1个先期样本(如n1=30),计算这个样本的方差S2;阶段2:以S2替代总体未知方差计算所需样本数n,若n>n1,再补抽n–n1
份样本。另:请同学们自行计算确定总体比例所需样本数。第9页,共41页,2023年,2月20日,星期三例4例1中,若要求所获得总体均值99%置信区间的偏差为(+-)0.5万元,问至少要调查多少样本?例3中,若要求所获得总体不合格品率99%置信区间的偏差为(+-)0.5%万元,问至少要抽取多少样本?第10页,共41页,2023年,2月20日,星期三两个总体均值之差的置信区间根据第三讲的知识,请同学们自行给出大样本情形下的计算公式。小样本不能使用中心极限定理,可以使用t分布,计算公式:第11页,共41页,2023年,2月20日,星期三例5欲比较A、B两医院住院病人的住院天数。随机抽取A医院64个住院病历,计算平均住院天数为6.54天,标准差为1.2;随机抽取B医院81个住院病历,计算平均住院天数为6.24天,标准差为0.96。则两个医院住院病人平均住院天数差的95%置信区间是多少?有人认为两个医院病人的住院时间没有差异,与上述数据矛盾吗?为什么?第12页,共41页,2023年,2月20日,星期三例6随机抽取A、B两地空气污染指数PSI,如下表所示A150146132164126128B9510411299109假设两地空气污染指数都服从正态分布,试估计两地PSI平均差95%置信区间。第13页,共41页,2023年,2月20日,星期三例7有文献给出一项对睡眠习惯的研究结果。在一个由87个成年人组成的样本中,每天躺在床上的平均时间为7.70小时(不管处于清醒状态还是睡眠状态),标准差为1.02小时,其中处于睡眠状态的平均时间为7.06小时,标准差为1.11小时。所以躺在床上的平均清醒时间为7.70-7.06=0.64小时。有可能建立平均清醒时间95%的置信区间吗?如果行,是多少?如不行,为什么?第14页,共41页,2023年,2月20日,星期三例8:数据对的置信区间某轮胎制造商希望比较新、旧材料制成的轮胎的磨损情况。从每种轮胎中各选一个随机安装在10辆前驱汽车左、右前轮上。4万公里后测量磨损情况如下(单位:mm):12345678910新材料4.355.004.215.035.714.614.706.033.804.70旧材料4.194.624.044.725.524.264.276.243.464.50差值0.160.380.170.310.190.350.43-0.210.340.2问新、旧材料轮胎磨损差值95%的置信区间。第15页,共41页,2023年,2月20日,星期三两个总体比例之差的置信区间若X~Bin(nx,px),Y~Bin(ny,py),则px-py
置信水平为100(1-α)%的置信区间的计算方法为:传统方法:改进方法:第16页,共41页,2023年,2月20日,星期三例9重复交易次数是顾客满意度的一个很好的度量。某企业随机抽取了今年的120个交易账户,有56个订购次数在2次以上。从去年抽取80个样本,有30个订购次数在2次以上。试计算这两年中订购次数在2次以上顾客的比例之差的置信水平为95%的置信区间。第17页,共41页,2023年,2月20日,星期三二、假设检验第18页,共41页,2023年,2月20日,星期三问题1某校新入学学生被随机分配进入高一两个班,人数都是70人,化学课分别由2个老师任教。期末考试的平均分分别是70.5和72.4分,标准差都为5.4分。其中第一个班有一个学生想找第2个班的老师补课,他的选择有道理吗?第19页,共41页,2023年,2月20日,星期三分析每一次考试都包含很多随机因素;老师1可以认为自己的教学水平(以学生考试平均分来测量)为72.4分;老师1可以认为老师2的教学水平其实和自己是一样的,这次考试的结果是因为自己班级发挥不好而对方班级发挥的好。对于这种具有随机性的结果的证明只能寻求统计意义上的检验。第20页,共41页,2023年,2月20日,星期三统计检验检验1:老师1的教学水平达不到72.4。零假设(nullhypothesis,也称原假设)H0:1≥72.4,备择假设(alternatehypothesis)
H1:1<72.4。检验2:老师1与老师2的教学水平有差异。零假设H0:1
-2=0,备择假设H1:1–2
≠0。第21页,共41页,2023年,2月20日,星期三假设检验的概念假设:对总体参数包括总体均值、比例、方差等的一种看法。假设检验:事先对总体参数或分布形式作出某种假设,然后利用样本信息来判断原假设是否成立。通常依据统计上的小概率不显著原理而对0假设作反证。0假设:待检验的假设,表示为H0备择假设:与0假设对立的假设表示为H1第22页,共41页,2023年,2月20日,星期三假设检验思想示例图因此我们拒绝假设
=50样本均值抽样分布这个值不像我们应该得到的样本均值20H0如果这是总体的真实均值
μ=50第23页,共41页,2023年,2月20日,星期三P-值(P-Value)首先我们假设0假设成立,P-值是观测到的随机样本与0假设不一致的强度的度量。计算步骤(以均值检验为例):在0假设H0为真的条件下,求样本均值的分布,这个分布称为的0分布;在0假设为真的条件下,计算观察值与H0不一致(大于、小于或不等于)的概率即为P-值。当P-值充分小(如
),我们就放弃H0,而认为H1成立。判断阈值称为显著水平(significantlevel),当P<,此时我们称在显著水平下拒绝原假设。第24页,共41页,2023年,2月20日,星期三总体均值统计检验对总体和样本的假设同前。对形如H0:≤
0,或H0:≥0,或H0:=0的0假设进行检验,检验统计量为:P-值就是对应分布密度曲线下某一区域的面积,分别对应的是单尾检验(右侧面积),单尾检验(左侧面积),双尾检验(双侧面积)。大样本下:方差未知:或小样本下第25页,共41页,2023年,2月20日,星期三总体比例的统计检验对总体和样本的假设同前。对形如H0:p
≤
p0,或H0:p
≥p0
,或H0:p
=p0
的0假设进行检验,若np0和n(1-p0)都大于10,则有检验统计量为:P-值计算同上。第26页,共41页,2023年,2月20日,星期三例10某有线电视服务商在免费提供了一个月的某付费频道后进行了调查。他们随机抽取了400个家庭组成样本,其中25个家庭愿意付费续订该频道。该公司能够得出结论认为该地区有超过5%的家庭愿意付费观看该频道吗?第27页,共41页,2023年,2月20日,星期三两个总体均值差的检验对总体和样本的假设同前。对形如H0:X-Y
≤D0
,或H0:X-Y≥D0
,或
H0:X-Y=D0
的0假设进行检验,检验统计量为:大样本下:方差未知:或小样本下或当两总体方差近似相等时,可以采用合并样本方差的方法:第28页,共41页,2023年,2月20日,星期三续P-值计算同上。第29页,共41页,2023年,2月20日,星期三两个总体比例差的检验设X~Bin(nx,px)和Y~Bin(ny,py)相互独立且nx和ny都很大。对形如H0:pX-pY
≤0,或H0:pX-pY≥0,或
H0:pX-pY=0
的0假设进行检验,检验统计量为:P-值计算同上。第30页,共41页,2023年,2月20日,星期三例11为确定某燃油添加剂是否具有节油的功能,某司机记录了自己的油耗。6箱油的平均油耗为7.4升/百公里,标准差为0.63;使用添加剂后的4箱油平均油耗为7.0升/百公里,标准差为0.75。添加剂价格为200元,问是否有必要使用该添加剂?此外,该实验是否存在瑕疵?第31页,共41页,2023年,2月20日,星期三例12某课题组调查企业项目风险管理的方法。45个建筑企业样本中有17家企业采用了风险转移的方法,38个IT类企业中有16家企业采用了风险转移的方法。你能认为IT企业风险转移比例高于建筑企业吗?第32页,共41页,2023年,2月20日,星期三关于P-值P-值不能证明0假设的真实性;(科学方法本质上是否定虚假)例:某建筑工程师要为桥墩混凝土选定水泥,其抗压强度必须大于0
,在对某一品牌水泥进行多次试验后测度平均值和方差,然后进行假设检验。若他采用的假设检验为:H0:≥0,H1:<0
,计算得到P-值为0.168,他能否采用这一品牌水泥?P-值显著也不一定有现实的意义。例:调查2X200个某一学校两个专业学生毕业一年后平均月工资分别为1587元和1590元,方差都为100,这两个专业的毕业生工资差异显著吗?这种差异有实际意义吗?第33页,共41页,2023年,2月20日,星期三关于显著性水平a的值在固定的a水平下所作判断可能导致两类错误:第I类错误H0为真时拒绝了H0第II类错误H0为假时接受了H0犯第I类错误的概率不会大于a。通常我们选取a足够小,但我们也希望确定第II类错误是可控的,于是定义功效(Power)如下:功效=1-P(第II类错误)功效需在采样之前确定。第34页,共41页,2023年,2月20日,星期三多项分布与c2检验频数分析以下资料是从某工厂搜集而来的缺勤数。在0.05的显著水平之下,试判定一周内每天的缺勤率是否有差异。星期次数期望星期一12089星期二
4589星期三
6089星期四
9089星期五13089合计445445第35页,共41页,2023年,2月20日,星期三检验H0:p1=p2=……p5=1/5,当各单元格的期望次数﹙或理论次数﹚不小于5时,在0假设下有统计量其中:Oi为观察值,Ei为期望值第36页,共41页,2023年,2月20日,星期三列联表(contingencytab
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年 湖南株洲消防招聘考试笔试试题附答案
- 2025年 贵州水利水电职业技术学院招聘教师附答案
- 2025年养护机械市场分析现状
- 中国背投电视行业发展潜力预测及投资战略研究报告
- 焦化耐火设备项目投资可行性研究分析报告(2024-2030版)
- 2025年中国兔毛手袋行业市场发展前景及发展趋势与投资战略研究报告
- 长江存储培训课件
- 视频拍摄制作合同
- 技术服务合同
- 中国电子特种气体行业市场调查研究及投资前景预测报告
- 国开《离散数学》形考任务1-3试题及答案
- 2025年互联网营销师-直播销售员竞赛考试题库及答案
- 社会体育指导与管理专业大学生职业生涯发展
- 反恐验厂管理手册程序文件制度文件表单一整套
- 老旧小区改造、提升项目部与小区居民、单位协调方案
- 反诈宣讲培训课件
- 上海市幼儿园幼小衔接活动指导意见(修订稿)
- 培训学校收费和退费管理制度
- 护理安全意识
- 法社会学教程(第三版)教学
- 6综合与实践(北京五日游)(教案)-六年级下册数学人教版
评论
0/150
提交评论