




已阅读5页,还剩93页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
.,1,第五章抽样分布与参数估计,第一节抽样的基本概念与数学原理第二节抽样分布第三节参数估计第四节样本容量的确定第五节EXCEL在参数估计中的应用,.,2,康师傅矿物质水“太酸”吗?成都消费者尹先生到四川大学华西附二院看望一生病的朋友,并给朋友买去一件康师傅矿物质水。就在他拿出来准备给朋友喝时,邻床一位姓金的先生提醒他说:这种水PH值偏低,呈酸性,不适合常喝,体质较弱的病人更不宜饮用。尹先生对此半信半疑,先后带了两瓶水到四川省人民医院和成都市二医院分别进行PH值检测。两次检测均显示,其PH值仅为5.86.2,根本达不到中国生活饮用水卫生标准(GB5749-2006)规定的6.58.5。10月6日,尹先生要求重庆顶津公司就康师傅瓶装水的“PH值”问题给消费者一个说法,并向记者反映了此事。尹先生的要求合理吗?康师傅矿物质水是真的“太酸”吗?,.,3,一、抽样调查及其特点,(一)抽样调查的概念,第一节抽样的基本概念与数学原理,指样本单位的抽取不受主观因素及其他系统性因素的影响,每个总体单位都有均等的被抽中机会,按照随机原则从调查对象(即总体)中抽取一部分单位进行调查,用调查所得指标数值对调查对象相应指标数值作出具有一定可靠性的估计和判断的一种统计调查方法。,统计推断,全及总体指标:参数(未知量),样本总体指标:统计量(已知量),抽样推断,并非所有的抽样估计都按随机原则抽取样本,也有非随机抽样,总体,随机样本,非随机样本,与总体分布特征相同,与总体分布特征不同,按随机原则抽取样本单位以样本的数量特征推断总体的数量特征抽样推断产生抽样误差,但抽样误差可以事先计算并控制,抽样推断的特点,与全面调查相比,抽样调查既节省了人力、物力、财力和时间,又达到了认识总体数量特征的目的。我国在1994年确立了以周期性普查为基础,以经常性抽样调整为主体,同时辅之以重点调查、科学核算等综合运用的统计调查方法体系。,二、抽样推断的基本概念,全及总体,抽样总体,就是调查对象,又称总体或母体,是由许多性质相同的调查单位组成,常用N表示全及总体的单位数目。,又称样本或子样,是指从全及总体中按照随机原则抽取的那部分个体的组合。抽样总体的单位数称为样本容量,通常用n表示。1nN。,.,8,n30称为大样本,n30称为小样本.n/N称为抽样比.,例如:在100万户居民中,随机抽取1000户居民进行家庭收支情况调查,其中的100万户居民就是全及总体,而被抽中的1000户居民则构成抽样总体。,抽样推断的基本概念,.,9,概率抽样及其组织形式所谓概率抽样,就是要求对总体的每一次观察(每一次抽取)都是一次随机试验,并且有和总体相同的分布。按这样的要求对总体观测(抽取)n次,可得到容量为n的样本。,.,10,.,11,根据全及总体各个单位的标志值或标志特征所计算的反映总体某种属性的综合指标,又称总体指标。,全及指标,全及指标主要有四个:,全及平均数,总体是非标准差及方差,总体标准差及方差,全及成数,是非标志总体,为研究是非标志总体的数量特征,令,性别:男、女(非男)产品质量:合格、不合格,10,10,是非标志总体的指标,具有某种标志表现的单位数所占的成数,不具有某种标志表现的单位数所占的成数,是非标志总体的指标,平均数,标准差,是非标志总体的指标,方差,标准差系数,【例】某厂某月份生产了400件产品,其中合格品380件,不合格品20件。求产品质量分布的集中趋势与离中趋势。,是非标志总体的指标,解:,.,18,设总体中个总体单位某项标志的标志值分别为,其中具有某种属性的有个单位,不具有某种属性的有个单位,则,总体平均数(又叫总体均值):,总体标准差:,总体方差:,总体成数(全及成数):,总体是非标志标准差:,总体是非标志的方差:,设样本中个样本单位某项标志的标志值分别为,其中具有和不具有某种属性的样本单位数目分别为和个,则,样本平均数(又叫样本均值):,样本单位标志值的标准差:,样本单位标志值的方差:,为的无偏估计,为的无偏估计,样本成数:,样本单位是非标志的标准差:,样本单位是非标志的方差:,为的无偏估计,为的无偏估计,抽样的基本方法,重复抽样,从总体N个单位中随机抽取一个样本容量为n的样本,每次从总体中抽取一个,并把结果登记下来,又放回总体中重新参加下一次的抽选。又称放回抽样,不重复抽样,每次从总体中抽选一个单位后就不再将其放回参加下一次的抽选。又称不放回抽样.,总体单位数N不变,同一单位可能多次被抽中。,总体单位数减少n,同一单位只可能被抽中一次。,根据取样方式不同,可分为:,抽样方法的分类,根据对样本的要求不同,可分为:,考虑顺序抽样,考虑各单位的中选顺序。,ABCCBA,例如:从1,2,3三个数中取两个数排成一个两位数,显然十位数取1,个位数取2,和十位数取2,个位数取1是完全不同的.,.,26,综合起来共有四种抽样方法,考虑顺序的重复抽样,不考虑顺序的不重复抽样,不考虑顺序的重复抽样,考虑顺序的不重复抽样,不考虑顺序抽样,不考虑各单位的中选顺序。,ABCCBA,例如:从三个产品中抽取两个进行质量检验,第一个选1号产品,第二个选2号产品组成一组,和第一个选2号产品,第二个选1号产品组成一组没有什么差别.,.,27,抽样分布从总体中可以随机地抽取许多样本,由每一个样本都可以计算样本统计量的观测值,所有可能的样本观测值及其所对应的概率便是所谓的抽样分布。因此,抽样分布也可以称为样本统计量的概率分布。抽样分布可能是精确地服从某种已知分布(所谓已知分布,例如我们在第四章介绍过的各种常见分布),也可能是以某种已知分布为极限分布。在实际应用中,后者更为多见。,.,28,.,29,.,30,表5-310人中有放回抽二人的全部可能样本,.,5-31,表5-4任职年限样本均值分布数列,.,32,.,33,抽样调查的理论基础,.,34,抽样调查的理论基础,大数定律,表明大量随机观象平均结果具有稳定性的性质。大数定律论证了如果独立随机变量总体存在有限的平均数和方差,则对于充分大的样本可以近乎100%的概率,期望样本平均数与总体平均数的绝对离差为任意小。,抽样平均数和总体平均数的离差究竟有多大?离差不超过一定范围的概率究竟有多少?这个离差的分布究竟怎样?,.,35,.,36,从正态分布的再生定理可以看出,只要总体变量服从正态分布,则从中抽取的样本,不管n是多少,样本平均数都服从正态分布。但是在客观实际中,总体并非都是正态分布。对于从非正态分布的总体中抽取的样本平均数的分布问题,需要由中心极限定理来解决。,.,37,中心极限定律,如果变量总体存在有限的平均数和方差,那么不论这个总体的分布如何,随着样本容量的增加,样本平均数的分布,便趋近于正态分布。,.,38,样本均值的抽样分布与中心极限定理,当总体服从正态分布N(,2)时,来自该总体的所有容量为n的样本的均值X也服从正态分布,X的数学期望为,方差为2/n。即XN(,2/n),.,39,中心极限定理(centrallimittheorem),的分布趋于正态分布的过程,.,40,.,41,第二节抽样分布,一、样本平均数的抽样分布二、样本比例的抽样分布,.,5-42,一、样本平均数的抽样分布,(一)样本平均数的期望值与方差,.,5-43,.,44,.,45,.,5-46,(二)样本平均数的分布规律,.,47,.,48,.,5-49,二、样本比例的抽样分布,(一)样本比例的期望值与方差,.,50,.,51,.,52,.,5-53,(二)样本比例的分布规律,.,54,表5-5用正态分布来近似时对样本量的要求,.,5-55,(三)样本方差的抽样分布,.,56,.,57,第三节参数估计,一、参数估计概述二、总体均值的估计三、总体比例的估计四、总体方差的估计,.,58,一、参数估计概述,(一)参数估计的定义与种类所谓参数估计,就是用样本统计量去估计总体的未知参数(或参数的函数)。例如,估计总体均值,估计总体比例和总体方差等等。参数估计有两种基本形式:点估计和区间估计。前者是用一个数值作为未知参数的估计值,后者则是给出具体的上限和下限,把包括在这个区间内。下面分别介绍点估计与区间估计的有关概念。,.,59,(二)点估计点估计,主要有矩估计法和最大似然估计法。矩估计法是用样本矩去估计总体矩(或是用样本矩的函数去估计总体矩的相应函数)的一种估计方法,由此获得的估计量称作矩估计量;最大似然估计法是把待估计的总体参数看作一个可以取不同数值的变量,计算当总体参数取上述不同数值的时候,发生我们当前所得到的样本观测值的不同概率,总体参数取哪一个数值的时候这种概率最大,便把这个数值作为对总体参数的估计结果。,.,5-60,(三)估计量的优良标准,2.有效性。又称最小方差性。,.,61,4.充分性。估计量包含了样本中关于的全部信息。,.,5-62,(四)区间估计与估计的精度和可靠性,.,63,.,64,.,5-65,二、总体均值的估计,.,66,.,67,.,68,.,69,.,70,.,71,.,5-72,(二)总体方差2未知的情形,.,73,2.区间估计,.,74,.,75,.,5-76,【例5-4】在例5-3中,若总体方差未知,但通过抽取的6个样本测得的样本方差为0.0025,试在0.95的置信度下,求该产品直径的均值置信区间。,.,5-77,三、总体比例的估计,.,78,.,79,.,5-80,三、总体方差的估计,.,81,(二)区间估计,.,82,.,83,标准差、样本标准差、样本平均数的标准差及抽样误差的区别与联系,标准差()是总体各单位标志值的变异程度指标。它是总体各单位在某一变量上的取值X与该变量的平均值的离差平方加以平均再开方求得。计算公式为:其中N为总体单位总数,即变量值的个数。样本标准差S是样本中各单位在某一变量上的取值X与该变量的样本平均值的离差的平均,其计算公式为:其中n为样本单位数样本标准差反映抽样总体在某一变量上的差异程度,.,84,标准差、样本标准差、样本平均数的标准差及抽样误差的区别与联系,样本平均数的标准差则是指:从总体中抽出所有可能的样本,每个样本都由n个单位组成,都有一个样本平均数,这些样本平均数与样本平均数的平均数的离差的平均值其计算公式为:根据无偏性原则,式中样本平均数的平均数等于总体平均数即,则上式又可以写成:其中为样本总数,.,85,标准差、样本标准差、样本平均数的标准差及抽样误差的区别与联系,抽样误差即抽样平均误差,它就是样本平均数的标准差由于总体平均数是不可知的,所以仅具有理论意义,实际计算时则是根据样本平均值的标准差与总体方差的关系推算,因此,此式常用表示,其中n为样本单位数,.,86,第四节样本容量的确定,一、问题的提出二、估计总体均值时样本容量的确定三、估计总体比例时样本容量的确定四、使用上述公式应注意的问题,.,87,由前面的论述,我们已知参数估计中的精度要求与可靠性要求常常是一对矛盾,但是,通过增加样本容量n有可能降低样本平均数的标准差,从而实现既保证一定的估计精度,又具有较高的置信度的目的。这时,需要考虑在给定的置信度与极限误差的前提下,样本容量n究竟取多大合适?这就是所谓样本容量的确定问题。,一、问题的提出,.,88,二、估计总体均值时样本容量的确定,.,89,.,90,.,91,三、估计总体比例时样本容量的确定,.,92,四、使用上述公式应注意的问题,1计算样本容量时,总体的方差与成数常常是未知的,这时可用有关资料替代:一是用历史资料已有的方差与成数代替;二是在进行
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 瓣膜置换的围术期护理
- 人教A版 (2019)选择性必修 第一册3.2 双曲线获奖教案
- 2024中铝共享服务(天津)有限公司校园招聘1人笔试参考题库附带答案详解
- 凤仙花的一生(教学设计)-2024-2025学年科学三年级下册人教鄂教版
- 人教部编版一年级下册20 咕咚第2课时教学设计
- 人教版(2024)八年级上册(2024)第4节 眼睛和眼镜教案
- 2024中建一局二级公司总工程师公开竞聘1人笔试参考题库附带答案详解
- 钉钉使用详尽培训
- 2024中国邮政福建建省分公司校园招聘预笔试参考题库附带答案详解
- 人美版三年级下册第3课 竖弯钩教案及反思
- 中国高职院校毕业生薪酬报告(2024年度)
- 2025-2030中国团餐行业市场发展现状分析及发展前景与投资机会研究报告
- 山东省济南西城实验中学2024-2025学年高一下学期4月月考地理试题(原卷版+解析版)
- IT系统架构规划与设计手册
- 口腔门诊6S管理
- 沉浸式体验活动设计合同
- 档案档案管理基础知识试题及答案
- 2025-2030中国金红石发展现状及未来趋势研究报告
- 2025-2030中国慢性腰痛治疗行业市场现状供需分析及投资评估规划分析研究报告
- 演出经纪人与文化经济试题
- pcb抄板合同范例
评论
0/150
提交评论