版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、2022-5-191第五章 抽样推断2022-5-192n第一节 总体参数估计n第二节 样本容量的确定n第三节 总体参数检验第五章 统计推断2022-5-193 学习目标n1.掌握估计量的优良标准n2.参数区间估计的思想与方法n3.参数假设检验的临界值法与P值法n4.一定条件下,样本容量确定的方法2022-5-194 重点与难点n1.参数区间估计的统计思想n2.估计的可靠程度、平均误差及极限误差的关系n3.临界值检验法的统计思想n4.P值的计算方法及其含义的理解n5.参数抽样检验中的两类错误及其关系2022-5-195抽样平均误差与抽样极限误差n抽样平均误差是指所有可能出现的样本指标(样本平均
2、数或样本成数或样本方差、标准差等)的标准差,也可理解为所有样本指标和总体指标之间的平均离差。n抽样实际误差是指某一次具体抽样的过程中所得样本指标值与总体指标数值之差。n抽样极限误差:样本统计量与总体参数之间的抽样实际误差的可允许范围。2022-5-196抽样平均误差与抽样极限误差n抽样平均误差xx样本配合总数2xnnn重复抽样n不重复抽样21xNnnNn抽样平均误差 未知时,可用下面方法解决:(1)用过去资料或同类地区资料代替;(2)用 代替。2和2s2022-5-197抽样平均误差与抽样极限误差n抽样极限误差xxX n极限误差除以抽样平均误差得到的相对数t,我们称之为概率度。xxxxtt n
3、与置信度密切相关。问题是:我们希望得到一个精确度较高的样本,同时又希望置信度较高。当然,这是不可能的。2022-5-198例1:某商场从一批袋装食品中随机抽取10袋,测得每袋重量(单位:克)分布为:789/780/794/762/802/813/770/785/810/806。假设每袋重量服从正态分布,以95%的把握程度估计这批产品的平均每袋重量时,允许误差是多少?解:样本平均数=791.1(克)样本标准差=17.136 (克)抽样平均误差=5.42 (克)已知把握程度为95%,查表得t=2.2622所以允许误差=2.26225.42=12.26 (克)2022-5-199 第一节 总体参数估
4、计n一、点估计n1.点估计的定义n2.点估计量的优良标准n二、区间估计n1.区间估计的定义n2.总体均值的区间估计2022-5-1910 一、点估计(1)n1.参数估计按是否考虑估计误差的大小及发生的概率,估计方法分为点估计和区间估计两大类。 n2.点估计的定义 n3.点估计不考虑估计误差的大小,故不需确定估计量的概率分布。点估计的主要作用是寻找参数的估计量。 2022-5-1911 一、点估计(2)n点估计量的评价标准 n1.无偏性2022-5-1912n一般来说,无偏估计量并不唯一,甚至可以是无限多个。n如果 是参数的无偏估计量,但 通常不是 g( )的无偏估计量。如:( )g2ss是总体
5、方差的无偏估计量,但 不是 的无偏估计量。2XX是总体均值 的无偏估计量,但不是 的无偏估计量。2022-5-1913 一、点估计(3)n2.有效性 2022-5-1914n无偏估计量使用方差作为评判标准。n有偏估计量使用均方误差 作为优劣的评判标准,即总体参数的两个点估计量 满足 ,则称在均方误差意义下12、2212EE12优于2211EEEE 222EEEEE E 2DE E 2MSEE 均方误差包括两部分:可见, 为未知参数的无偏估计时, 。均方误差越小则估计量 的误差平均越小,因而也越优。20E E 2022-5-1915 一、点估计(4)n3.一致性 2022-5-1916 二、区间
6、估计(1)n1.区间估计的含义 n在概率意义下计算参数 的变化范围,即n2.区间估计中的两个基本要求n q121Pqqqa=-2022-5-1917 二、区间估计(2)n3.Neyman原则n4.区间估计中的一些名词2022-5-1918 二、区间估计(3)n5.区间估计时应考虑的一些具体问题2022-5-1919二、区间估计(4)总体均值的区间估计 n1.正态总体、总体方差已知;或非正态总体、大样本 2022-5-1920 二、区间估计(5)总体均值的区间估计n2正态总体、总体方差未知、小样本 2022-5-1921 二、区间估计(6)总体成数的区间估计 n只讨论大样本情形2022-5-19
7、22 二、区间估计(7)总体方差的区间估计2022-5-1923 二、区间估计(8)n根据上述例子,区间估计的步骤可归纳为:n(1)依题意确定待估参数;n(2)依题设条件构造与待估参数相对应的估计量;n(3)确定估计量的抽样分布;n(4)依估计量的抽样分布,由给定的置信度计算待估参数置信区间的上、下限。2022-5-1924例:某企业生产某种产品的工人有500人,为了了解工人生产产品的日产量资料,随机抽取了36人进行调查。调查结果,人均日产量为25件,标准差为3件。试问:有多大的把握程度可推断该企业日总产量在12000件13000件之间。解:抽样平均误差=0.5工人日均产量:2426件t=1/
8、0.5=2查表得:1-=0.95452022-5-1925例:军队战士的身高服从正态分布。经抽取100个战士,测得平均身高175cm,标准差40cm。现在军服厂要裁制1万套军服,问身高在171179cm之间应裁制多少套?解:抽样平均误差=4cm身高在171179cm的概率度t=4/4=1查表,得 1-=0.8413+(1-0.8413)=0.6826应裁制0.682610000=6826(套)2022-5-1926 第二节 样本容量的确定n一、问题的提出n二、处理问题的原则n三、简单随机抽样下,调查成本既定时样本容量确定的方法2022-5-1927 第二节 样本容量的确定 (1)一、问题的提出
9、n从推断来看,要达到估计所要求的精确程度,自然要求样本容量越大越好;但从抽样来看,增大样本容量,势必增加人力、物力,从而导致调查成本增大,这无疑是不经济的做法。于是在抽样推断中,势必要在统计推断的精确度与调查成本这一对矛盾间进行权衡。 2022-5-1928 第二节 样本容量的确定 (2)n二、处理问题的原则 n1.从抽样角度来看,处理推断目标实现的精确度与调查成本间矛盾的原则是:在保证达到推断目标的要求下,尽量使调查成本最低。 n2.从推断角度来看,处理统计推断精确度与调查成本间矛盾的原则是:在调查成本一定的情况下,尽量使推断目标实现的效果好,即估计的精度更高。 n3.抽样设计中样本容量的确
10、定通常按推断原则处理。 2022-5-1929 第二节 样本容量的确定 (3)n三、简单随机抽样下、调查成本既定时,样本容量的确定方法 n1. 总体均值估计情形2022-5-1930 第二节 样本容量的确定 (4)2022-5-1931其他抽样组织方式的抽样误差n常见的抽样组织形式主要有:纯随机抽样、机械抽样、类型抽样、整群抽样、多阶段抽样。2022-5-1932纯随机抽样,即简单随机抽样,是指对总体不作任何处理,不进行分类也不进行排队,而是完全按照随机的原则,直接从总体全部单位中抽选出样本单位加以观察。 具体方法有:直接抽选法、抽签法、随机数字表述法 特点:总体每一个单位被抽到的机会均等,且
11、方便简单,易于掌握。 适用于总体单位的标志变异程度不大,或具有某种特征的单位均匀地分布在总体的各个部分,或对总体了解很少的情况。2022-5-1933分层抽样,即类型抽样或分类抽样,是指将总体各单位按主要标志加以分层,而后在各层中按随机原则抽取若干个样本单位,由各层的样本单位组成一个样本。n 先分层,再在各层总体中随机抽取一定的单位数。 特点:1)能提高样本的代表性;2)能降低总体方差对抽样平均误差的影响。 适用对总体有一定认识的情况。从各层抽取样本单位时,可以根据各层的单位数等比例抽样,也可以是不等比例抽样。等比例抽样就是从各层中按相同的比例抽取样本单位数。样本单位在各层的分配比例同总体单位
12、在各层的分配比例相同。不等比例抽样就是从方差较大的组抽取较多的样本单位数,反之少抽一些。目的是减少抽样误差,提高样本指标的代表性。2022-5-1934分层抽样的抽样误差计算公式分层抽样的抽样误差计算公式项目重复抽样不重复抽样平均数的抽样误差公式成数的抽样误差公式2ixn21ixnnN1pppn11pppnnN2022-5-1935例题:某地全部粮食耕地5000公顷,按平原和山区面积比例抽取样本容量100公顷,各层平均每公顷产量和标准差如表。试用重复抽样方法计算抽样误差。地形全部面积抽样面积抽样平均每公顷产量每公顷产量标准差平原4000807200600山区10002056251000合计50
13、00100-单位:公顷,公斤2022-5-1936解:平均层内方差:采用重复抽样方法计算抽样误差,则:所以,抽样误差为69.86公斤。222260080 100020488000100iinn248800069.86100ixn2022-5-1937等距抽样,即机械抽样或系统抽样,是指将总体各单位按某一标志排队,而后按固定顺序和相等间隔在总体中抽取若干样本单位,构成样本。n 先排队,再计算抽样间隔d,然后等距抽样。 特点:保证样本单位在总体中均匀分布,从而提高了样本对总体的代表性,利于降低抽样误差。 适用对总体有一定认识的情况。按排队依据的标志是否与所要调查的标志关,可分为无关标志排队法和有关
14、标志排队法。2022-5-1938按样本单位抽选的方式不同,分为随机起点等距抽样、半距起点等距抽样和对称等距抽样。抽样误差与分层抽样类似。2022-5-1939例题:设有15个单位,已知其职工的月人均收入,并按顺序进行了排列,如表所示。现按等距抽样法从中抽取了5个单位进行调查,要求计算抽样平均误差。解:间隔距离=15/5=3223.47223.475111.8515ixnnN2022-5-1940整群抽样,是指将总体各单位划分为若干群,然后以群为单位,从总体中。n 划分群, 抽取群单位。 特点:设计和组织抽样较方便;误差大,抽样估计精度较低。平均数的抽平均误差:成数的抽平均误差:21ppRrr
15、R21xxRrrR2022-5-1941n例题:某化肥厂昼夜连续生产,每分钟产量为100袋,现在采用整群抽样来检验一昼夜生产的化肥每袋的重量和包装的一等品率,每144分钟抽取1分钟的全部袋装化肥进行检查,工抽检10分钟的袋装化肥,结果如表。以95%的置信水平推断该厂一昼夜生产的化肥平均每袋重的可能范围和包装一等品率的可能范围。解:R=1440,r=10,已知1-=95%,所以t=1.9650.2ixxr22()0.094ixxxr20.0971xxRrrR0.19xxt 2022-5-1942平均袋重在50.0150.39公斤之间。70%ippr22()0.048%ipppr20.69%1pp
16、RrrR1.35%ppt 包装一等品率在68.65%71.35%之间。2022-5-1943多阶段抽样,总体很大时,将抽样过程划分为几个过渡阶段,到最后才具体抽到样本单位。n 先一阶单位,再抽二阶单位,。 特点:利于抽样的组织和实施,可以提高抽样估计精度和满足各阶段对调查资料的要求。 抽样误差是各阶段抽样误差之和。2212如两阶段抽样,其抽样误差为:2022-5-1944n例题:某校学生月生活费支出情况调查采用两阶段抽样方式。将1000名学生分为10群,每群包括100名学生,先从10群中抽出5群,即以群为第一阶段的抽取单位;然后从抽中的各群中抽取3%的学生组成样本,样本资料如表,求抽样平均误差
17、。n解:第一阶段群内方差平均数:266i第二阶段群间方差为:210666抽样平均误差为:2210666 10566 100334.4911510 115 100 1ixRrMmrRnM2022-5-1945 第三节 总体参数检验n一、假设检验的一般性问题n1.问题的提出n2.解决问题的统计思想n3.统计结论的两类错误n4.单、双侧检验问题n5.P值检验法n6.统计检验的显著性n7.假设检验的步骤n二、几种常用、具体的参数检验方法n1.Z检验法; 2.T检验法n3. 检验法 4.F检验法2c2022-5-1946 一、假设检验的一般性问题(1)n(一) 问题的提出 2022-5-1947 一、假
18、设检验的一般性问题(2)n(二) 解决问题的统计思想 2022-5-1948 一、假设检验的一般性问题(3)2022-5-1949 一、假设检验的一般性问题(4)2022-5-1950 一、假设检验的一般性问题(5)n上述的判断实际上体现着反证法的思想。判断的基础是样本信息,判断的理论依据是小概率原理,即小概率事件在一次试验(或抽样)中几乎不发生。直观来想,在所做假设是正确的情况下,那么一次试验(或抽样)中人们期望的结果出现的概率应该较大。然而现在的事实却不是这样的,期望的结果出现的概率不仅不大,反而很小,即所谓的小概率事件居然发生了,这就很不正常了,意味着一次试验(或抽样)中出现了出人意料的
19、结果,也意味着给了我们做出否定原假设的充分证据。可见假设检验的思想是从不利于原假设的角度来对原假设做决策的。因此,当我们拒绝原假设时,并不意味着原假设一定是错误的,只是说概率意义下接受原假设的理由很不充分,而否定原假设的证据却非常强。这与数学家“证明”某个结论的方式不同,而有点儿类似于法院里法官的判案方式。并且只要小概率 不等于零,对原假设做决策就可能错判,存在做出错误选择的风险。a2022-5-1951 一、假设检验的一般性问题(6)2022-5-1952 一、假设检验的一般性问题(7)n临界值检验法示意图 2022-5-1953 一、假设检验的一般性问题(8)n (三) 单、双侧检验问题n
20、因H1的选择所引起并由H1的具体形式所决定。00100100010:0000对H 做双侧检验对H 做右侧检验对H 做左侧检验HHHHHHmmmmmmmmmmmm=2022-5-1954 一、假设检验的一般性问题(9)n(四) 统计结论的两类错误n1.两类错误的原因样本的随机性n2.2022-5-1955 一、假设检验的一般性问题(10)2022-5-1956 一、假设检验的一般性问题(11)2022-5-1957接受原假设拒绝原假设原假设H0为真判断正确1-弃真错误原假设H0为伪取伪错误判断正确1-假设检验中各种可能结果及其发生概率假设检验中各种可能结果及其发生概率2022-5-1958一、假
21、设检验的一般性问题(12)n两类错误的关系2022-5-19592022-5-1960一、假设检验的一般性问题(13)n两类错误的控制原则2022-5-1961 一、假设检验的一般性问题(14)n(五) P值检验法(概率值检验法)n1.2022-5-1962 一、假设检验的一般性问题(15)nP值的计算方法2022-5-1963 一、假设检验的一般性问题(16)nP值拒绝H0的力度2022-5-1964 一、假设检验的一般性问题(17)nP值检验法的决策规则 2022-5-1965 一、假设检验的一般性问题(18)n(六) 统计检验的显著性2022-5-1966 一、假设检验的一般性问题(19
22、)n(七) 假设检验的步骤 2022-5-1967二、几种常用、具体的参数检验方法2022-5-1968 Z 检验法(1)nZ检验法是在已知总体分布的方差时,对一个正态总体的均值或两个正态总体均值的关系(均值之差)进行检验的方法。Z检验法也可用于大样本下非正态总体的成数检验。 2022-5-1969 Z 检验法(2)n1一个正态总体均值的检验 n所提的假设n所构造的检验量0XZnms-=2022-5-1970 Z 检验法(3)2022-5-1971 Z 检验法(4)n2两个正态总体均值之差的检验n所提的假设n所构造的检验量() ()1212221212xxZnnmmss-=+2022-5-1972 Z 检验法(5)2
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- YC/T 621-2024烟草商业企业烟草零售客户服务质量评价指南
- 安庆医药高等专科学校《食品消费者行为及市场营销学》2023-2024学年第一学期期末试卷
- 安徽中澳科技职业学院《分布式与并行计算》2023-2024学年第一学期期末试卷
- 安徽职业技术学院《大学生创新创业基础与实务》2023-2024学年第一学期期末试卷
- 安徽艺术职业学院《知识发现理论与实务》2023-2024学年第一学期期末试卷
- 安徽冶金科技职业学院《美术创作理论与实践》2023-2024学年第一学期期末试卷
- 安徽信息工程学院《数据分析与R语言》2023-2024学年第一学期期末试卷
- 安徽现代信息工程职业学院《泰语阅读与理解(一)》2023-2024学年第一学期期末试卷
- 安徽体育运动职业技术学院《生物教学论》2023-2024学年第一学期期末试卷
- 安徽审计职业学院《电路分析与模拟电子技术》2023-2024学年第一学期期末试卷
- 马克思主义基本原理+2024秋+试题 答案 国开
- 《地震灾害及其防治》课件
- 2023年深圳市云端学校应届生招聘教师考试真题
- 店铺三年规划
- 全国园地、林地、草地分等定级数据库规范1123
- 蜜雪冰城合同范例
- 2023年国网四川省电力公司招聘笔试真题
- 建设项目全过程工程咨询-终结性考试-国开(SC)-参考资料
- LPG液化气充装站介质分析操作规程 202412
- 养老院环境卫生保洁方案
- 2023-2024学年广东省深圳市龙华区六年级上学期期末英语试卷
评论
0/150
提交评论