




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
抽样调查营销第1页,共47页,2023年,2月20日,星期一第一节抽样调查的意义
一、抽样调查的概念
一般所讲的抽样调查,即指狭义的抽样调查(随机抽样):按照随机原则从总体中抽取一部分单位进行观察,并运用数理统计的原理,以被抽取的那部分单位的数量特征为代表,对总体作出数量上的推断分析。第2页,共47页,2023年,2月20日,星期一二、抽样调查的特点
(一)抽样调查的目的是由部分来推断整体。(二)抽选部分单位时要遵循随机原则(三)抽样调查会产生抽样误差,抽样误差可以计算,并且可以加以控制。第3页,共47页,2023年,2月20日,星期一一、全及总体和抽样总体(一)全及总体,简称总体全及总体:所要认识对象的全体。总体单位数用N表示。第二节抽样调查的基本概念及理论依据
(二)抽样总体,简称样本抽样总体:抽取出来调查观察的单位。抽样总体的单位数用n表示。
n≥30大样本
n<30小样本第4页,共47页,2023年,2月20日,星期一二、
全及指标和抽样指标(总体指标和样本指标)全及指标:全及总体的那些指标。(一)全及指标第5页,共47页,2023年,2月20日,星期一(二)抽样指标抽样指标:抽样总体的那些指标。nnn第6页,共47页,2023年,2月20日,星期一三、抽样方法和样本可能数目根据取样的方式不同,抽样方式分为:重复抽样和不重复抽样。根据对样本的要求不同,抽样方式分为:考虑顺序抽样和不考虑顺序抽样。样本可能数目:111111111111第7页,共47页,2023年,2月20日,星期一四、抽样调查的理论依据(1)独立同分布大数定律当n足够大时,独立同分布的一系列随机变量的算术平均数接近数学期望,即平均数具有稳定性。该定律提供了用样本平均数估计总体平均数的理论依据。(2)贝努大数定律当n足够大时,事件A发生的频率接近事件A发生的概率,即频率具有稳定性。该定律提供了用频率代替概率的理论依据。1.大数定律第8页,共47页,2023年,2月20日,星期一2.中心极限定理(1)独立同分布中心极限定理不论总体服从何种分布,只要它的数学期望X和方差σ2存在,从中抽取容量为n的样本,当n充分大时,样本平均数趋于正态分布。即,(2)德莫佛-拉普拉斯中心极限定理
X服从二项分布B(n,p),当n足够大时,X趋于均值为np,方差为npq的正态分布。即,第9页,共47页,2023年,2月20日,星期一第三节抽样平均误差
一、抽样误差的概念在统计调查中,调查资料与实际情况不一致,两者的偏离称为统计误差。偏差
抽样误差即指随机误差,这种误差是抽样调查固有的误差,是无法避免的。第10页,共47页,2023年,2月20日,星期一二、影响抽样平均误差的因素
(一)
全及总体标志变异程度。——正比关系(二)抽样单位数目的多少。——反比关系(三)抽样的组织方式。第11页,共47页,2023年,2月20日,星期一三、抽样平均误差的计算
抽样平均误差实际上是样本指标的标准差。
通常用μ表示。K:全部可能的样本个数第12页,共47页,2023年,2月20日,星期一例:某班组有4名工人,甲、乙、丙、丁,基本工资分别为210元、220元、230元和240元,从中抽取2名工人,请计算以样本平均工资估计总平均工资的抽样平均误差。(1)若采用重复抽样,共有16个可能样本。(4名工人平均工资为225元)第13页,共47页,2023年,2月20日,星期一(2)若采用不重复抽样,共有12个可能样本。(4名工人平均工资为225元)第14页,共47页,2023年,2月20日,星期一1.重复抽样条件下抽样平均数的抽样平均误差2.不重复抽样条件下抽样平均数的抽样平均误差(一)抽样平均数的抽样平均误差不重复抽样的抽样平均误差一定小于重复抽样的抽样平均误差,当抽样比远小于1时,两者非常接近。第15页,共47页,2023年,2月20日,星期一(二)抽样成数的抽样平均误差重复抽样条件下抽样成数的抽样平均误差不重复抽样条件下抽样成数的抽样平均误差第16页,共47页,2023年,2月20日,星期一1.用过去调查所得的资料。3.用小规模调查资料。2.用样本方差的资料代替总体方差。4.用估计的材料。进行推断时,如果总体方差未知,一般采用样本标准差作为总体标准差的估计。第17页,共47页,2023年,2月20日,星期一解:即:当根据样本学生的平均体重估计全部学生的平均体重时,抽样平均误差为1公斤。已知:则:例:随机(重复)抽选某校学生100人,调查他们的体重。得到他们的平均体重为58公斤,标准差为10公斤。问抽样推断的平均误差是多少?第18页,共47页,2023年,2月20日,星期一例:某厂生产一种新型灯泡共2000只,随机抽出400只作耐用时间试验,测试结果平均使用寿命为4800小时,样本标准差为300小时,求抽样推断的平均误差?解:已知:即:当根据样本灯泡的平均使用寿命估计全部灯泡的平均寿命时,抽样平均误差为13.42小时。第19页,共47页,2023年,2月20日,星期一已知:则:样本成数即:根据样本资料推断全部学生中戴眼镜的学生所占的比重时,推断的平均误差为2%。例:某校随机抽选400名学生,发现戴眼镜的学生有80人。根据样本资料推断全部学生中戴眼镜的学生所占比重时,抽样误差为多大?第20页,共47页,2023年,2月20日,星期一已知:则:样本合格率例:一批食品罐头共60000桶,随机抽查300桶,发现有6桶不合格,求合格品率的抽样平均误差?即:根据样本资料推断总体合格品率时,推断的平均误差为0.806%。第21页,共47页,2023年,2月20日,星期一练习:
某超市第三次购进福临门5升装食用油,抽取30瓶进行检验。经检验,这30瓶食用油的平均容量为4.99升,以往两批食用油容量的标准差为0.12升和0.10升。1、计算这次检验的抽样平均误差。2、按规定容量≥4.9升为合格,这30瓶食用油有2瓶不合格,计算这批食用油合格率的抽样平均误差。第22页,共47页,2023年,2月20日,星期一第23页,共47页,2023年,2月20日,星期一
第四节全及指标的推断
抽样推断就是按照已经抽定的样本指标来估计总体指标,或其所在的区间范围。第24页,共47页,2023年,2月20日,星期一(一)点估计例一、抽样推断的方法第25页,共47页,2023年,2月20日,星期一2.修正分数法
就是用抽样所得的调查结果同有关资料对比的分数来修正全面统计资料时采用的一种方法。第26页,共47页,2023年,2月20日,星期一
某村6000农户,2005年年末统计养猪头数,从下往上报的是9000头,现抽10%(600户)的农户再复查一下,发现有漏报,也有重报。按600户,原来数字是890头,实际复查为935头,故总的来说,是少报。例1第27页,共47页,2023年,2月20日,星期一某市房地局,年报工资总额3218.1万元。现抽查14个单位:年报:415.03万元多报:0.44万元少报:1.47万元抵冲后1.47-0.44=1.03(万元)例2第28页,共47页,2023年,2月20日,星期一(二)区间估计
在一定的概率保证下,用样本指标去推断总体指标,在考虑抽样误差的前提下,使得总体指标落到某一范围之内,即根据抽样指标定出置信区间和置信度。1.区间估计的含义第29页,共47页,2023年,2月20日,星期一2、抽样极限误差
抽样极限误差指在进行抽样估计时,根据研究对象的变异程度和分析任务的要求所确定的样本指标与总体指标之间可允许的误差范围。样本均值的抽样极限误差:样本成数的抽样极限误差:第30页,共47页,2023年,2月20日,星期一3、抽样估计的概率保证程度(置信度)抽样指标和总体指标的误差不超过一定范围的概率大小。理论上已证明,在样本单位数足够多(n>=30)的条件下,样本均值的分布接近于正态分布,这一分布的特点是样本均值是以总体均值为中心,两边完全对称的分布。第31页,共47页,2023年,2月20日,星期一x95.45%x-2μx+2μ99.73%x-3μ
x+3μ68.27%x-1μ
x+1μ第32页,共47页,2023年,2月20日,星期一……第33页,共47页,2023年,2月20日,星期一4、抽样误差的概率度抽样误差的概率度是测量抽样估计可靠程度的一个参数。用符号“t”表示。公式表示:(极限误差是t倍的抽样平均误差)可变形为:第34页,共47页,2023年,2月20日,星期一常用的概率度与概率保证程度(置信度)第35页,共47页,2023年,2月20日,星期一总体平均指标的区间估计计算步骤根据上面的讨论,总体平均指标推断的最终结果表现为一定概率保证程度下的置信区间。根据调查资料计算出抽样平均误差μ。根据概率保证要求,查表得出t值,然后计算抽样极限误差(△=tμ)。得出置信区间。第36页,共47页,2023年,2月20日,星期一例:从某年级学生中按简单随机抽样方式抽取100名学生,对统计学的考试成绩进行检查,得知其平均分数为75.6分,样本标准差10分,试以95.45%(t=2)的概率保证程度推断全年级学生统计学成绩的区间范围。
第37页,共47页,2023年,2月20日,星期一所以,可以95.45%的可靠程度说,平均分的区间是[73.6,77.6]第38页,共47页,2023年,2月20日,星期一当问起健康的成年人体温是多少时,多数人的回答是37度,这似乎已经成了一种共识。右边是一个研究人员测量的50个健康成年人的体温数据37.136.936.937.136.436.936.636.236.736.937.636.737.336.936.436.137.136.636.536.737.136.236.337.536.937.036.736.937.037.136.637.236.436.637.336.137.137.036.636.936.737.236.337.136.736.837.037.036.137.0请以95%(t=1.96)的概率保证程度推断健康成年人体温的的区间范围第39页,共47页,2023年,2月20日,星期一因此,不应该再把37度作为正常人体温的一个有任何特定意义的概念第40页,共47页,2023年,2月20日,星期一例:从某中学1万名学生中,随机抽取100名学生平均身高为160cm,学生身高的标准差为3cm。现要求可信度达到95.45%,试对全体学生平均身高进行区间估计。第41页,共47页,2023年,2月20日,星期一解已知:N=10000,n=1001、计算抽样平均误差:3、计算总体平均数的置信区间上限:下限:2、计算抽样极限误差即以95.45%的把握程度估计全体学生的平均身高的区间范围为159.4cm-160.6cm.第42页,共47页,2023年,2月20日,星期一
某机械厂日产某种产品8000件,现采用纯随机不重复抽样方式(按重复抽样公式计算),从中抽取400件进行观察,其中有380件为一级品,试以概率95.45%的可靠程度推断全部产品的一级品率及一级品数量的范围。则:抽样一级品率:~
例2第43页,共47页,2023年,2月20日,星期一例
:为调查农民生活状况,在某地区5000户农民中,按不重复简单随机抽样法,抽取400户进行调查,得知这400户中拥有彩色电视机的农户为87户。要求计算:以95%的把握程度估计该地区全部农户中拥有彩色电视机的农户在多大比例之间?第44页,共47页,2023年,2月20日,星期一解已知:N=5000n=4001、计算样本成数:2、计算抽样平均误差:3、计算抽样极限误差:
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年03月上半年浙江舟山市属事业单位公开招聘36人笔试历年典型考题(历年真题考点)解题思路附带答案详解
- 高级信息系统项目管理师-2018年下半年《信息系统项目管理师》真题
- 渭南师范学院《土地与房地产法规》2023-2024学年第二学期期末试卷
- 德州学院《数据结构与算法课设》2023-2024学年第一学期期末试卷
- 异丁醇项目安全评估报告
- 甘肃省会师中学2025届初三下学期期中考试英语试题(A)含答案
- 暨南大学《临床医学概要1》2023-2024学年第二学期期末试卷
- 湖北恩施学院《财税法学及案例研习》2023-2024学年第二学期期末试卷
- 西藏大学《英语演讲》2023-2024学年第一学期期末试卷
- 广东第二师范学院《船舶操纵与摇摆》2023-2024学年第二学期期末试卷
- 自动转运小车结构及控制系统设计说明书
- 《医学心理学》课件:第11章 医患关系
- 饮水设备巡查维护记录表
- 洛阳十三朝古都课件
- RomaxDesigner 培训教程(合)教学提纲
- 《中国传统服饰——汉服》PPT课件
- 顾洁Storytime
- 小学信息技术认识《画图》
- 【精品】宇通客车涂装车间实习报告
- 冷冻机的制冷效率与运行电费
- 物业服务流程图
评论
0/150
提交评论