![统计学提纲第五章_第1页](http://file3.renrendoc.com/fileroot_temp3/2022-1/7/d4ee2a2f-352c-4b98-85f3-d5892865054b/d4ee2a2f-352c-4b98-85f3-d5892865054b1.gif)
![统计学提纲第五章_第2页](http://file3.renrendoc.com/fileroot_temp3/2022-1/7/d4ee2a2f-352c-4b98-85f3-d5892865054b/d4ee2a2f-352c-4b98-85f3-d5892865054b2.gif)
![统计学提纲第五章_第3页](http://file3.renrendoc.com/fileroot_temp3/2022-1/7/d4ee2a2f-352c-4b98-85f3-d5892865054b/d4ee2a2f-352c-4b98-85f3-d5892865054b3.gif)
![统计学提纲第五章_第4页](http://file3.renrendoc.com/fileroot_temp3/2022-1/7/d4ee2a2f-352c-4b98-85f3-d5892865054b/d4ee2a2f-352c-4b98-85f3-d5892865054b4.gif)
![统计学提纲第五章_第5页](http://file3.renrendoc.com/fileroot_temp3/2022-1/7/d4ee2a2f-352c-4b98-85f3-d5892865054b/d4ee2a2f-352c-4b98-85f3-d5892865054b5.gif)
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第五章 抽样推断第一节 抽样推断的相关基本概念一、抽样调查(一)什么是抽样调查抽样调查是按随机原则从总体中选取部分单位进行观察,用所获得的样本数据推算总体数量特征的一种非全面调查。 (二)抽样调查的特点:1按随机原则去抽取调查单位。 随机原则也就是机会均等的原则,每个单位被抽中的机会相等。其目的是保证抽出的样本是随机样本。2以样本数据估计总体参数或检验总体的某种假设。抽样调查虽仅是直接调查被抽取的那一部分样本,但其目的是着眼于研究总体的数量特征。3抽样误差可以事先计算并加以控制。(三)抽样调查的适用范围:1能够解决全面调查无法或难以解决的问题; 2对能取得全面资料,但不必进行全面调查的情况。3
2、可以补充和订正全面调查的结果; 4可用于对总体的某种假设进行检验,为行动决策提供依据。(四)抽样调查的基本形式基本形式有简单随机抽样、类型随机抽样、等距抽样、整群抽样。1简单随机抽样按随机原则直接从总体中抽选样本单位进行调查。这里,不论是重复抽样还是不重复抽样,每个单位都有相等的中选机会。2类型随机抽样(分层抽样)先将总体单位按某一标志分类,然后按随机原则直接从各类中抽取一定的样本单位进行调查。3等距抽样(机械抽样或系统抽样)它是先将总体单位按某一标志进行排列,再按照一定的间隔抽取样本单位进行调查。4整群抽样(集团抽样)整群抽样是先将总体单位按某一标志进行分群,再按随机原则从各群中抽取部分群,
3、对抽中的群的所有单位进行调查是抽样组织方式。二、抽样推断的概念及主要内容(一)抽样推断是在抽样调查的基础上,以样本实际数据计算的样本指标推算总体相应数量特征的一种统计分析方法。(二)抽样推断的主要内容为:参数估计和假设检验三、抽样的有关基本概念(一)全及总体和样本总体1全及总体简称总体,又称母体,它是指所要认识的研究对象的全体。也就是具有某种共同性质的许多单位的集合体。 2样本总体简称样本,又称子样,是从全及总体中抽取,代表全及总体的那部分单位的集合体。全及总体是我们所要研究的对象,而样本总体则是我们所要观察和采集数据的对象,两者是有区别。(二)样本容量和样本个数1样本容量是指样本所包含的单位
4、数。2样本个数又称样本可能数目,也就是从一个总体中可能抽取的样本个数。重复抽样时:样本个数=Nn;不重复抽样时:样本个数=Nn对于一次抽样调查,全及总体是唯一确定的,而一个全及总体可能抽出很多个样本总体;样本的个数和样本的容量有关,也和抽样的方法有关。(三)参数和统计量1根据全及总体各个单位的标志值或标志属性计算的,反映总体某一数量特征的综合指标称为全及指标,也称为总体参数,简称参数。2由样本总体各单位标志值或标志属性计算的,反映样本数量特征,并用以估计全及指标的综合指标称为样本指标,或称为抽样指标、统计量。统计量有:样本平均数 抽样成数样本方差: 样本标准差:注意: 对于一个问题,全及总体是
5、唯一确定的,而一个总体有多少样本;总体指标值是唯一确定的;而统计量是样本变量的函数,也就是样本统计量就有多种取值。(四)重复抽样和不重复抽样重复抽样:从有N个单位的总体中,每次随机抽取1个单位,登记其标志表现后放回,再从总体中重新抽取,一直抽取n次。不重复抽样:从有N个单位的总体中,每次随机抽取1个单位,登记其标志表现后不放回,再从总体中重新抽取,一直抽取n次。第二节 抽样误差一、误差调查资料的检查是指对资料的准确性、完整性、及时性检查(一)登记性误差凡是由于错误判断事实、错误登记事实或错误计算而发生的误差,登记性误差在全面调查与非全面调查中都可能存在。它分为1偶然登记性误差;2系统登记性误差
6、 其特点是具有明显的倾向性和一贯性。(二)代表性误差在没有登记性误差的条件下,由于用样本指标代表总体指标而产生的误差,它分为:1偏差 凡是由于违反随机原则抽样而产生的代表性误差,又称为系统性代表误差、非偶然性代表误差。2抽样误差 是指由于随机抽样的偶然因素,使样本的结构不足以代表总体各单位的结构,而引起抽样指标和总体指标之间的误差,也称为随机误差、偶然性代表误差。抽样误差既不包括登记误差,也不包括系统性代表误差。影响抽样误差的因素有:总体各单位标志值的差异程度;样本的单位数;抽样的方法;抽样调查的组织形式。二、抽样平均误差。抽样平均误差是反映抽样误差一般水平的指标,它反映了抽样指标与总体指标的
7、平均离差程度,即样本指标与总体指标的标准差。通常用抽样平均数的标准差来衡量 抽样平均误差的作用首先表现在它能够说明样本指标代表性的大小。平均误差大,说明样本指标对总体指标的代表性低;反之,则说明代表性高。抽样平均数的平均数=总体平均数。抽样平均误差的计算:(一)简单随机抽样条件下:1、重复抽样: 2、不重复抽样:当总体单位数N很大时,当N很大且nN很小时,其中,为总体标准差,n为样本单位数,在总体标准差未知,用样本标准差代替;但如果是大样本时,可以用样本标准差代替。(二)分层抽样条件下:分类12k合计总体单位数N1N2NkN总体标准差12k样本单位数n1n2nkn抽重复抽样:NiN2i2ni不
8、重复抽样:NiN21-niNi i2ni若总体标准差未知时,可用样本标准差代替。分层抽样为等比例抽样时:nin=NiN(三)整群抽样条件下:由于整群抽样一般采用不重复抽样,因而有:2(R-R)r(R-1)其中,R为总体群数;r为样本群数;2为群(组)间方差。2xi-x2rxi为第i群的样本平均数;x为全样本平均数,xxir。三、抽样极限误差抽样极限误差是指用绝对值形式表示的样本指标与总体指标之间偏差的最大允许范围。 即: 四、抽样误差的概率度抽样极限误差以抽样平均误差为标准单位来衡量。即把极限误差 x或 p相应除以或,得出相对的误差程度t倍,t称为抽样误差的概率度。于是有:或概率度与概率保证程
9、度之间的几个数值关系:概率度1234概率保证程度68.27%95.45%99.73%99.99%五、样本容量的确定在简单随机抽样下:1在重复抽样的条件下,样本容量的确定: 2在不重复抽样的条件下,样本容量: 第三节 抽样估计一、抽样估计的的概念抽样估计就是利用实际调查计算的样本指标值来估计相应的总体指标值。抽样估计有点估计和区间估计两种估计量是根据样本数据来估计总体参数的形式。一般情况下估计量就是样本统计量。估计量的优良标准:(1)无偏性 要求样本指标值的平均数等于被估计的总体指标值,即无系统性误差。(2)有效性 要求作为优良估计量的方差(标准差)应比其它估计量的方差(标准差)小,即估计量的数
10、学期望等于总体参数;(3)一致性 当作为优良估计量的样本容量充分大时,抽样指标也应充分地靠近总体指标. 即估计量的误差随着样本容量的增大而减小。二、点估计参数的点估计:直接以样本指标作为相应总体参数的估计量。总体平均数的估计:用样本平均数估计总体平均数三、区间估计参数的区间估计:根据给定的概率保证程度的要求,利用实际抽样资料,指出总体被估计值的上限和下限。抽样估计的置信度是表明抽样指标和总体指标的误差不超过一定范围的概率保证程度。注意:抽样估计的置信度并不是概率度,但两者之间存在一一对应的关系。2区间估计步骤:(1)计算抽样平均数和标准差。(2)计算抽样平均误差(3)计算抽样极限误差(4)根据
11、给定的抽样极限误差计算总体平均数的上下限如果抽样误差的概率度已给出,查正态分布概率表得出置信度。 四、抽样估计的精度 估计精度=1-误差率误差率是抽样的相对误差率。概率保证程度,置信区间长度及估计精度的关系:概率保证程度越大,置信区间长度越长,估计精度越低;反之,概率保证程度越小,置信区间长度越短,估计精度越高。例1、某学校进行一次统计学测验,为了解学生的考试情况,随机从全校统计学考生中抽选部分学生进行调查,所得资料如下: 成绩60以下60-7070-8080-9090以上组中值5565758595人数102022408(1)试以95.45%的可靠性估计该校学生统计学的平均成绩的范围
12、;(2)试以95.45%的可靠性估计该校学生成绩在80分以上的学生所占的比重的范围;(3)如果其它条件不变,将允许极限误差缩小一半,应抽取多少名学生?解:1、该校学生统计学平均成绩的范围:计算样本平均数:=76.6(分)计算样本标准差:=11.38(分)计算抽样平均误差:=1.1377(分) 查正态概率表得出误差概率度t=2 计算抽样极限误差:x tx2×1.13772.2754 该校学生考试的平均成绩的区间范围是: -xx 76.62.275476.62.275474.3278.89在95.45概率保证程度下,该校学生的平均成绩74.32%78。89.99%之间。2、估计该校学生成
13、绩在80分以上的学生所占的比重的范围 计算样本成数平均数:计算样本成数标准差:计算抽样平均误差:查正态概率表得出误差概率度t=2 计算抽样极限误差:80分以上学生所占的比重的范围:p±p0.48±0.09992 0.38010.5799在95.45概率保证程度下,该校学生成绩在80分以上学生所占的比重在38.01%57.99%之间。3、如果其它条件不变,允许极限误差缩小一半时应抽取的样本容量:=4×100=400(人)第四节 抽样组织设计的基本原则一、抽样组织设计的基本原则(一)要保证随机抽样抽取样本单位时,应确保每个总体单位都有被抽取的可能;在对样本单位的资料进
14、行搜集和整理时,不能随意遗漏或更换样本单位。(二)要保证抽样误差最小在其他条件相同的情况下,选抽样误差最小的方案。(三)费用最少在其他条件相同的情况下,选费用最少的方案。本章计算题1 从一批元件中按简单随机重复抽样抽取100件产品进行检验,结果发现10件不合格品。要求:(1)在95.45%的概率保证程度下(t=2)估计该批元件合格率的区间范围;(2)当允许误差不变,概率保证程度提高到99.73% (t=3)时,这时应抽取多少元件进行检验?2 某工厂共有5000名职工,现以不重复随机抽样方式抽取19%的职工,调查他们在5月份的手机话费,所得调查资料如下:手机话费(元)职工的比重(%)040408080120120160160以上103040155合计100试以95.45%的可靠性:(1)估计该厂职工5月份的人均话费;(2)估计该厂职工5月份话费在80元及以上的职工所占比重。3 对某鱼塘的鱼进行抽样调查,随机地从鱼塘不同地方同时撒网捕鱼捕到150条,其中草
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年中国木材加工行业市场现状及投资态势分析报告(智研咨询)
- 《计算机网络基础与应用(第三版)》 课件 项目九 服务器操作系统
- 模型16、电场模型 (原卷版)-2025版高考物理解题技巧与模型讲义
- 二零二五年度门面铺面转租合同模板创新版
- 消化内科的病例分析课件
- 《信号与系统资料》课件
- 《粥天粥地》课件
- 《幼儿体育游戏》课件
- 历史外交事业的发展课件人教
- 2.2 基因在染色体上 【知识精研】高一下学期生物人教版必修2
- 小羊诗歌大全1479首(小羊喝水扩句)
- 脓毒血症指南
- 四年级下册口算练习-减法简便计算
- 【企业杜邦分析国内外文献综述6000字】
- 腹部按压技巧肠镜检查辅助技巧
- 安徽华纳化学工业有限公司年产1000吨均苯四甲酸二酐、300吨润滑油助剂项目环境影响报告书
- 中国农村居民储蓄行为研究共3篇
- 华为鸿蒙深度研究
- YY 9706.230-2023医用电气设备第2-30部分:自动无创血压计的基本安全和基本性能专用要求
- GB/T 7307-200155°非密封管螺纹
- GB/T 32972-2016钢铁企业轧钢加热炉节能设计技术规范
评论
0/150
提交评论