




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
统计学第八章ppt第一页,共四十一页,编辑于2023年,星期三第一节抽样推断概述一、抽样推断的概念及特点
按随机原则从总体中抽取一部分单位(称为样本),根据样本的信息对总体的数量特征进行科学估计与推断的方法称为抽样推断。
第二页,共四十一页,编辑于2023年,星期三抽样推断的主要特点:第一、按随机原则抽取调查单位。
随机原则:(1)每个单位有相同的中选可能性。(2)每个单位的中选不中选不是主观所决定的。第二、根据部分推断总体,是对总体的间接认识,属于非全面调查。第三、抽样误差可以估计和控制,推断结果具有一定的可靠性和准确性。是运用概率的估计方法。
例如:通过抽样推断得出,深大学生的平均月支出在(1020,1070)元上的可靠性为90%。第三页,共四十一页,编辑于2023年,星期三二、抽样的若干基本概念
总体均值:m
样本均值:总体成数:P
样本成数:p
总体方差:s2
样本方差:S2
总体标准差:s
样本标准差:S
第四页,共四十一页,编辑于2023年,星期三
1.总体:又称全及总体、母体,指所要研究对象的全体,由许多客观存在的具有某种共同性质的单位构成。组成总体的个别事物称为总体单位。分有限总体和无限总体,总体单位数用N表示。2.样本:又称子样,来自总体,是从总体中按随机原则抽选出来的部分,由抽选的单位构成。样本单位数用n
表示。3.总体是唯一的、确定的,而样本是不确定的、可变的、随机的。样本的个数为M。第五页,共四十一页,编辑于2023年,星期三
总体指标和样本指标1.总体指标:反映总体数量特征的指标。其数值是唯一的、确定的。(又称参数)(1)常用的总体指标有:(均值、总体方差)(2)对0—1分布的是非标志总体有:设总体中N个单位中,有N1个单位具有某种性质,N0个不具有某种性质,且N1+N0=N,则第六页,共四十一页,编辑于2023年,星期三2.样本指标(统计量):根据样本分布计算的指标。有(样本平均数、样本方差)样本统计量是可变的、不确定的,是随机变量。为简便起见,分母中的n-1常用n近似代替。一般是n较大时。第七页,共四十一页,编辑于2023年,星期三
样本容量与样本个数1.样本容量:一个样本中所包含的单位数,用n表示。2.样本个数:又称样本可能数目,指从一个总体中所可能抽取的样本的个数。对于有限总体,样本个数可以计算出来。样本个数的多少与抽样方法有关。(1)重置抽样:例如从A、B、C、D、E五个字母中随机抽取两个作为样本。N=5,n=2考虑顺序时:样本个数=Nn=52=25不考虑顺序时:样本个数=第八页,共四十一页,编辑于2023年,星期三(2)不重置抽样例如从A、B、C、D、E五个字母中随机抽取两个作为样本。N=5,n=2考虑顺序时:样本个数不考虑顺序时:样本个数第九页,共四十一页,编辑于2023年,星期三一、简单随机抽样简单随机抽样又称纯随机抽样(有时简称为随机抽样),是直接从总体中按随机的原则重复抽取样本,每一个总体单位有相同的可能性被抽中。第二节抽样的组织方式第十页,共四十一页,编辑于2023年,星期三2.计算样本平均数和抽样平均误差
1.定义:又称分层(类)抽样。对总体各单位按一定标志加以分组,然后从每一组中按随机原则抽取一定单位构成样本。3.两点结论(1)抽样效果一般来说好于简单随机抽样。(2)在分组时应尽量扩大组间方差(组间差异),缩小组内方差(组内差异),从而减少抽样误差,提高抽样效果。二、类型抽样第十一页,共四十一页,编辑于2023年,星期三三、机械抽样1.定义:又称等距抽样或系统抽样。先按某个标志对总体单位进行排序,然后依固定的间隔来抽取样本单位。这样可以保证样本单位均匀地分布在总体的各个部分,有较高的代表性。2.无关标志排队3.有关标志排队(1)半距中点取样:取每一部分位于中间位置的单位。(2)对称等距取样4.在排队时,要注意避免抽样间隔与现象本身的周期性节奏相重合。5.抽样平均误差的计算第十二页,共四十一页,编辑于2023年,星期三四、整群抽样
1.定义:又称聚点抽样或群体抽样。将总体各单位分为若干群,然后从中抽取部分群,对中选群的所有单位进行全面调查。2.抽样平均误差的计算实质是以群代替总体单位,以群平均数代替总体标志值的简单随机抽样。有3.抽样效果评价(1)在日常工作中,“自然群”。误差较大,但操作方便、省时、省力。可以增加样本单位来减少误差。(2)分群时,应尽量扩大群内方差(群内差异),缩小群间方差(群间差异)来提高抽样效果。第十三页,共四十一页,编辑于2023年,星期三
五、多阶段抽样
多阶段抽样是先将一个很大的总体划分为若干个子总体,即一阶单位,再把一阶单位划分为若干个更小的单位,称为二阶单位,照此继续下去划分出更小的单位,依次称为三阶单位、四阶单位等。然后分别按随机原则逐阶段抽样。
第十四页,共四十一页,编辑于2023年,星期三
第三节抽样误差一、抽样误差概述(一)抽样误差概念
抽样误差是指由于随机抽样的偶然因素使样本各单位的结构不足以代表总体各单位的结构,而引起样本指标和总体指标之间的绝对离差。第十五页,共四十一页,编辑于2023年,星期三二、抽样平均误差(一)、抽样平均误差的概念
抽样平均误差就是样本指标的标准差。第十六页,共四十一页,编辑于2023年,星期三
抽样分布:由样本统计量的全部可能取值和与之相应的概率(频率)组成的分配数列。(一)重置抽样分布下的平均误差1、样本平均数的分布
某班组5个工人的日工资为34、38、42、46、50元。
现用重置抽样的方法从5人中随机抽2个构成样本。共有52=25个样本。第十七页,共四十一页,编辑于2023年,星期三
此指标反映所有的样本平均数与总体平均数的平均误差,称为抽样平均误差,用表示。得出两个结论:第十八页,共四十一页,编辑于2023年,星期三
总体方差为
从总体中抽取容量为n的样本,样本成数p的分布实质是样本平均数的分布。有:
抽样平均误差为:
对于(0,1)分布的总体,总体平均数为2、样本成数的分布to14第十九页,共四十一页,编辑于2023年,星期三(二)不重置抽样分布下的平均误差1、样本平均数的分布
某班组5个工人的日工资为34、38、42、46、50元。
现用不重置抽样的方法从5人中随机抽2个构成样本。共有20个样本。第二十页,共四十一页,编辑于2023年,星期三得出两个结论:
此指标反映所有的样本平均数与总体平均数的平均误差,称为抽样平均误差,用
表示。第二十一页,共四十一页,编辑于2023年,星期三
总体方差为
从总体中抽取容量为n的样本,样本成数p的分布实质是样本平均数的分布。有:
抽样平均误差为:
对于(0,1)分布的总体,总体平均数为2、样本成数的分布to14第二十二页,共四十一页,编辑于2023年,星期三例:1.已知一批产品的合格率为90%,现采用重置抽样方法从中抽取400件,求样本合格率的抽样平均误差。2.现从一批产品中,采用重置抽样方法从中抽取400件,经检验有360件合格,求样本合格率的抽样平均误差。3.现从一批产品共10000件中,采用不重置抽样方法从中抽取400件,经检验有360件合格,求样本合格率的抽样平均误差。第二十三页,共四十一页,编辑于2023年,星期三抽样误差的影响因素1、总体方差或标准差2、样本容量3、抽样方法4、抽样调查的组织形式第二十四页,共四十一页,编辑于2023年,星期三第四节参数估计所谓参数估计,就是指以样本统计量对总体参数进行估计。参数估计通常有两种形式,一种叫点估计,另外一种叫区间估计。一、点估计(一)、点估计的概念及特点所谓点估计,就是直接以样本统计量作为相应的总体参数的估计量。
(二)、估计量优劣的衡量标准无偏性;有效性;一致性
第二十五页,共四十一页,编辑于2023年,星期三优良估计标准:(1)无偏性:要求样本统计量的平均数等于被估计的总体参数本身。(2)一致性:当样本容量充分大时,样本统计量充分靠近总体参数本身。(3)有效性:第二十六页,共四十一页,编辑于2023年,星期三二、区间估计区间估计的原理所谓区间估计,就是在一定的概率保证下,由样本指标推断总体指标可能在的区间。
第二十七页,共四十一页,编辑于2023年,星期三
区间估计的基本要素:样本点估计值、抽样极限误差、估计的可靠程度1.抽样极限误差:可允许的误差范围。即样本统计量可允许变动的上(下)限与被估计总体参数的离差绝对值。
例:根据样本资料计算深大学生的月平均支出为700元,若可允许误差为20元,即总体真值在(680,720)内即为有效,(680,720)就是估计的区间。第二十八页,共四十一页,编辑于2023年,星期三2.抽样估计的可靠程度(置信度、概率保证程度)及概率度第二十九页,共四十一页,编辑于2023年,星期三例:经抽样调查计算样本亩产粮食600公斤,并求得抽样平均误差为3公斤,现给定允许极限误差为6公斤,求总体平均亩产落在估计区间的概率。结果表明,如果多次反复抽样,每次都可以由样本值确定一个估计区间,每个区间或者包含总体参数的真值,或者不包含总体参数的真值,包含真值的区间占F(t),即每一万次抽样,就有9545个样本区间包括总体亩产,其余455个样本区间不包括总体平均数,即若接受估计区间的判断要冒4.55%的机会犯错误的风险。第三十页,共四十一页,编辑于2023年,星期三总体平均数(成数)的估计:第三十一页,共四十一页,编辑于2023年,星期三例:对某型号的电子元件进行耐用性能检查,抽查资料分组如下表,要求耐用性能的允许误差范围为10.5小时,(1)试估计该批电子元件的平均耐用时数。
(2)设该厂的产品质量检验标准规定,元件耐用时数达到1000小时以上为合格品。要求以95%的概率保证程度估计该批电子元件的合格率。Z或第三十二页,共四十一页,编辑于2023年,星期三三、样本容量的确定(一)确定样本容量的意义找出在规定误差范围内的最小样本容量,这样确定的样本容量可以在保证满足误差要求下,使得调查费用最小
第三十三页,共四十一页,编辑于2023年,星期三
在设计抽样时,先确定允许的误差范围和必要的概率保证程度,然后根据历史资料或试点资料确定总体的标准差或方差,来确定样本容量。第三十四页,共四十一页,编辑于2023年,星期三
例1:对某批木材进行检验,根据以往经验,木材长度的标准差为0.4米,而合格率为90%。现采用重复抽样方式,要求在95.45%的概率保证程度下,木材平均长度的极限误差不超过0.08米,抽样合格率的极限误差不超过5%,问必要的样本单位数应该是多少?
例2:对某批木材进行检验,根据以往经验,木材的合格率为90%、92%、95%。现采用重复抽样方式,要求在95.45%的概率保证程度下,抽样合格率的极限误差不超过5%,问必要的样本单位数应该是多少?第三十五页,共四十一页,编辑于2023年,星期三一、假设检验基本概念(一)、假设检验基本原理假设检验的一般步骤:第一步:确定原假设和备择假设;第二步:明确检验统计量;第三步:根据显著性水平,确定拒绝域;第四步:计算检
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 数据库考试中的案例解读与复盘试题及答案
- 学习方法的试题及答案分享
- 投资组合的动态调整技术考核试卷
- 天然气开采业的创新路径与发展模式研究考核试卷
- 数据库中的数据排序与分组试题及答案
- 数据库管理中的代码审计与安全控制策略试题及答案
- 金融顾问培训理财知识和投资技巧培训考核试卷
- 嵌入式遥控技术的实现试题及答案
- 稀土金属加工质量改进项目策划与管理方法考核试卷
- 报考信息系统监理师2025年试题及答案
- 神经科护士的疼痛管理和舒适护理
- 冲洗结膜囊操作流程
- 公共场所卫生许可证申请表
- 信息安全风险清单之2:信息安全典型脆弱性清单-脆弱性示例、涵义、事件类别、后果和安全控制措施(雷泽佳编制2024A0)
- 亲子教育健康养生知识讲座
- GB/T 2881-2023工业硅
- 氧化铝厂溶出车间水洗方案
- 【多旋翼无人机的组装与调试分析6000字(论文)】
- 城中村改造的法律问题探讨
- 商标分割申请书
- 上海租赁合同
评论
0/150
提交评论