版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
简单随机抽样与系统抽样第1页,共45页,2023年,2月20日,星期三我国土地沙漠化问题非常严重,全国沙漠化土地面积已超过174000平方公里,并以每年3400平方公里的速度扩张。你知道这些数据是怎么来的吗?通过调查获得的。怎么调查?是对考察对象进行全面调查还是抽样调查?第2页,共45页,2023年,2月20日,星期三妈妈:“儿子,帮妈妈买盒火柴去。”妈妈:“这次注意点,上次你买的火柴好多划不着。”………儿子高兴地跑回来。孩子:“妈妈,这次的火柴全划得着,我每根都试过了。”笑过之后,谈谈你的看法这个调查具有破坏性,不可能每根试过,不能展开全面调查。看一看第3页,共45页,2023年,2月20日,星期三
例如,为了了解一批计算器的寿命,我们能将它们逐一测试吗?很明显,这既不可能也没必要。实践中,由于所考察的总体中的个体数往往很多,而且许多考察带有破坏性,因此,我们通常只考察总体中的一个样本,通过样本来了解总体的情况。提出问题进一步,从节约费用的角度考虑,在保证样本估计总体达到一定的精度的前提下,样本中包含的个体数越少越好。第4页,共45页,2023年,2月20日,星期三要了解全国高中生的视力情况,在全国抽取了这15所中学的全部高中生15000人进行视力测试。考察对象是什么?在统计中,我们把所要考察的对象的全体叫做总体全国每位高中学生的视力情况。把组成总体的每一个考察的对象叫做个体这15000名学生的视力情况又组成一个集体从总体中取出的一部分个体的集体叫做这个总体的一个样本。15000样本中的个体的数目叫做样本的容量。第5页,共45页,2023年,2月20日,星期三阅读一个著名的案例
在抽样调查中,样本的选择是至关重要的,样本能否代表总体,直接影响着统计结果的可靠性。下面的故事是一次著名的失败的统计调查,被称为抽样中的泰坦尼克事件。它可以帮助我们理解为什么一个好的样本如此重要。在1936年美国总统选举前,一份颇有名气的杂志的工作人员做了一次民意调查。调查兰顿(当时任堪萨斯州州长)和罗斯福(当时的总统)中谁将当选下一届总统。为了了解公众意向,调查者通过电话簿和车辆登记簿上的名单给一大批人发了调查表(注意在1936年电话和汽车只有少数富人拥有)。通过分析收回的调查表,显示兰顿非常受欢迎,于是杂志预测兰顿将在选举中获胜。实际上选举结果正好相反,最后罗斯福在选举中获胜,其数据如下:候选人预测结果选举结果罗斯福4362兰顿5738第6页,共45页,2023年,2月20日,星期三?思考你认为预期结果出错的原因是什么?原因是:用于统计推断的样本来自少数富人,只能代表富人的观点,不能代表全体选民的观点(样本不具有代表性)。像本例中这样容易得到的样本称为方便样本。如果使用“方便样本”,那么得出与事实不符的结论的可能性就会大大增加。结论:在抽样时不能只图方便。如果只从一些容易得到的个体中抽取样本,那么所得到的样本只是一个“方便样本”,“方便样本”的代表性差,基本这种方便样本得出的结论就会与事实相左。第7页,共45页,2023年,2月20日,星期三
为了了解学生对学校伙食的满意程度,小红访问了50名女生;小聪访问了50名男生;小明访问了24名男生和24名女生,其中高一、高二和高三的男生和女生各8名。你认为小红、小聪、小明三人的不同抽样方法那一种最好?为什么?学以致用答:小明的方法最好。小明抽得样本既有男生,又有女生,而均匀分布在各年级,这样的抽样较具有代表性,反映的情况具有普遍意义。1.我们常常根据样本得到结果来推测总体的结果。不同的抽样可能得到不同的结果。2.为了使结果更具准确性,抽样时,样本的容量要合理,样本的个体要有代表性。抽样才具有普遍意义温馨提示:第8页,共45页,2023年,2月20日,星期三——统计的基本思想方法:
用样本估计总体,即通常不直接去研究总体,而是通过从总体中抽取一个样本,根据样本的情况去估计总体的相应情况.第9页,共45页,2023年,2月20日,星期三关于“总体和样本”
总体通常是指我们需要考虑的对象的全体.其中每一个考察对象叫做个体.
样本就是从总体中抽取的一个“部分”.
样本中个体的个数叫做样本的容量.第10页,共45页,2023年,2月20日,星期三要从某汽车厂生产的30辆汽车中随机抽取3辆进行测试。(2)如何抽取呢?请问:
实例一
(1)此例中总体、个体、样本、样本容量分别是什么?第11页,共45页,2023年,2月20日,星期三
一般地,设一个总体的个体数为N,如果通过逐个不放回地抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率相等,就称这样的抽样为简单随机抽样。(P56第三段)一、简单随机抽样第12页,共45页,2023年,2月20日,星期三简单随机抽样的特点:(1)它要求被抽取的样本的个数有限,这样,便于通过随机抽取的样本对总体进行分析;(2)它是从总体中逐个地进行抽取。这样,便于在抽样实践中进行操作;(3)它是一种不放回抽样。由于抽样实践中多采用不放回抽样,使其具有较广泛的实用性,而且由于所抽取的样本中没有被重复抽取的个体,便于进行有关的分析和计算。(4)它每一次抽取时总体中的各个个体有相同的可能性被抽到,从而保证了这种抽样方法的公平性。第13页,共45页,2023年,2月20日,星期三
简单随机抽样是在特定总体中抽取样本,总体中每一个体被抽取的可能性是等同的,而且任何个体之间彼此被抽取的机会是独立的。如果用从个体数为N的总体中抽取一个容量为n的样本,那么每个个体被抽取的可能性等于第14页,共45页,2023年,2月20日,星期三1、抽签法
先将总体中的所有个体(共N个)编号(号码可以从1到N),并把号码写在形状、大小相同的号签上(号签可以用小球、卡片、纸条等制作),然后将这些号签放在同一个箱子里,进行均匀搅拌。抽签时,每次从中抽出1个号签,连续抽取n次,就得到一个容量为n的样本。对个体编号时,也可以利用已有的编号。例如学生的学号,座位号等。简记为:编号;制签;搅匀;抽签;取个体。第15页,共45页,2023年,2月20日,星期三例如:将全班同学按学号编号,制作相应的卡片号签,放入同一个箱子里均匀搅拌,从中抽出15个号签,就相应的15名学生对看足球比赛的喜爱程度(很喜爱、喜爱、一般、不喜爱、很不喜爱)进行调查。分析并说明整个抽签过程中每个同学被抽到的概率是相等的。简单随机抽样的特点:它是一种不放回抽样;它是逐个地进行抽取;它是一种等概率抽样.它的总体个数有限的;有限性逐个性不回性等率性第16页,共45页,2023年,2月20日,星期三抽签法的优点和缺点:优点:抽签法能够保证每个个体入选样本的机会都相等(得到的样本是简单随机样本);缺点:(1)当总体中的个体数较多时,制作号签的成本将会增加,使得抽签法成本高(费时、费力);(2)号签很多时,把它们“搅拌均匀”就比较困难,结果很难保证每个个体入选样本的可能性相等,从而使产生坏样本(即代表性差的样本)的可能性增加。第17页,共45页,2023年,2月20日,星期三2、随机数表法(1)随机数表是统计工作者用计算机生成的随机数,并保证表中的每个位置上的数字是等可能出现的。(2)随机数表并不是唯一的,因此可以任选一个数作为开始,读数的方向可以向左,也可以向右、向上、向下等等。(3)用随机数表进行抽样的步骤:将总体中个体编号;选定开始的数字;获取样本号码。(4)由于随机数表是等概率的,因此利用随机数表抽取样本保证了被抽取个体的概率是相等的。第18页,共45页,2023年,2月20日,星期三
3、从7开始往右读(方向随意),得到第一个三位数785<编号799,将对应编号的牛奶取出;继续向右读,得到916>编号799,舍弃;如此继续下去,直至抽出60袋牛奶。范例:要考察某公司生产的500克袋装牛奶的质量是否达标,现从800袋牛奶中抽取60袋进行检验。1、将800袋牛奶编号,000,001,…,7992、在随机数表(课本103页)中任选一数,例如第8行第7列,是7。能从本例体会下,从000开始编号的好处吗?第19页,共45页,2023年,2月20日,星期三用随机数表法抽取样本的步骤:
S1将总体中的所有个体编号(每个号码位数一致);S2在随机数表中任选一个数作为开始;S3从选定的数开始按一定的方向读下去,得到的号码若不在编号中,则跳过;若在编号中,则取出。得到的号码若在前面已经取出,也跳过,如此进行下去,直到取满为止;S4根据选定的号码抽取样本。编号、选数、取号、抽取.第20页,共45页,2023年,2月20日,星期三用随机数表法抽取样本的优缺点:优点:简单易行。它很好地解决了用抽签法时,当总体中的个体数较多时制签难的问题。缺点:当总体中的个体数很多,需要的样本容量也很大时,用随机数表法抽取样本仍不方便。第21页,共45页,2023年,2月20日,星期三例1.要从某汽车厂生产的30辆汽车中随机抽取3辆进行测试,请选择合适的抽样方法,写出抽样过程。解:本题总体容量较小,样本容量也较小,可用抽签法。S1将30辆汽车编号,号码是01,02,…,30;S2将号码分别写在一张纸条上,揉成团,制成号签;第22页,共45页,2023年,2月20日,星期三S3将得到的号签放入一个不透明的袋子中,并充分搅匀;S4从袋子中依次抽取3个号签,并记录上面的编号;S5所得号码对应的3辆汽车就是要抽取的对象。第23页,共45页,2023年,2月20日,星期三例2.从30个灯泡中抽取10个进行质量检测,说明利用随机数表法抽取这个样本的步骤。(随机数表见本章末第103页附表)解:S1将30个灯泡编号:00,01,02,03,……,30;S2在随机数表中任取一组数作为开始。如从第4行第1组的数12开始;S3从12开始向右读,依次选出12,26,27,05,03,15,10,14,21,22这10个编号的灯泡。第24页,共45页,2023年,2月20日,星期三练习2.欲从本班46名学生中随机抽取8名学生参加党的基本知识竞赛,试用随机表法确定这8名学生.1.中央电视台要从春节联欢晚会的60名热心观众中随机抽出4名幸运观众,试用抽签法为其设计产生这4名幸运观众的过程.评点:抽签法—编号、制签、搅拌、抽取,关键是“搅拌”后的随机性;随机数表法—编号、选数、取号、抽取,其中取号位置与方向具有任意性.第25页,共45页,2023年,2月20日,星期三练习3、下列抽取样本的方式是属于简单随机抽样的是()①从无限多个个体中抽取100个个体作样本;②盒子里有80个零件,从中选出5个零件进行质量检验,在抽样操作时,从中任意拿出一个零件进行质量检验后,再把它放回盒子里;③从8台电脑中不放回的随机抽取2台进行质量检验(假设8台电脑已编好号,对编号随机抽取)A.①B.②C.③D.以上都不对C第26页,共45页,2023年,2月20日,星期三知识探究(一)某学校为了了解高一年级学生对老师教学的意见,教务处打算从年级500名学生中抽取50名进行问卷调查,除了用简单随机抽样获取样本外,你能否设计其他抽样方法?思考1:你能用简单随机抽样对上述问题进行抽样吗?具体如何操作?
第27页,共45页,2023年,2月20日,星期三第二步,将总体平均分成50部分,每一部分含10个个体.第四步,从该号码起,每隔10个号码取一个号码,就得到一个容量为50的样本.(如8,18,28,…,498)第三步,在第1部分中用简单随机抽样抽取一个号码(如8号).第一步,将这500件产品编号为1,2,3,…,500.系统抽样第28页,共45页,2023年,2月20日,星期三思考2:上述抽样方法称为系统抽样,一般地,怎样理解系统抽样的含义?
系统抽样:当总体的个体数较多时,采用简单随机抽样太麻烦,这时将总体平均分成几个部分,然后按照预先定出的规则,从每个部分中抽取一个个体,得到所需的样本,这样的抽样方法称为系统抽样(等距抽样)。第29页,共45页,2023年,2月20日,星期三系统抽样的特点:(1)用系统抽样抽取样本时,每个个体被抽到的可能性是相等的,(2)系统抽样适用于总体中个体数较多,抽取样本容量也较大时;(3)系统抽样是不放回抽样。个体被抽取的概率等于第30页,共45页,2023年,2月20日,星期三知识探究(二):系统抽样的操作步骤
思考1:用系统抽样从总体中抽取样本时,首先要做的工作是什么?将总体中的所有个体编号.思考2:如果用系统抽样从505位同学中抽取50位进行调查,由于505不能均衡分成50部分,对此应如何处理?
先从总体中随机剔除5个个体,再均衡分成50部分.第31页,共45页,2023年,2月20日,星期三思考3:用系统抽样从含有N个个体的总体中抽取一个容量为n的样本,要平均分成多少段?思考4:如果N不能被n整除怎么办?
从总体中随机剔除N除以n的余数个个体后再分段.第32页,共45页,2023年,2月20日,星期三思考5:将含有N个个体的总体平均分成n段,每段的号码个数称为分段间隔,那么分段间隔k的值如何确定?总体中的个体数N除以样本容量n所得的商.第33页,共45页,2023年,2月20日,星期三
用简单随机抽样抽取第1段的个体编号.在抽取第1段的号码之前,自定义规则确定以后各段的个体编号,通常是将第1段抽取的号码依次累加间隔k.思考6:用系统抽样抽取样本时,每段各取一个号码,其中第1段的个体编号怎样抽取?以后各段的个体编号怎样抽取?第34页,共45页,2023年,2月20日,星期三思考7:一般地,用系统抽样从含有N个个体的总体中抽取一个容量为n的样本,其操作步骤如何?第35页,共45页,2023年,2月20日,星期三系统抽样的步骤:(1)采用随机的方式将总体中的个体编号;(2)将整个的编号按一定的间隔(设为K)分段,当
(N为总体中的个体数,n为样本容量)是整数时,;当不是整数时,从总体中剔除一些个体,使剩下的总体中个体的个数能被n整除,这时,,并将剩下的总体重新编号;(3)在第一段中用简单随机抽样确定起始的个体编号
;(4)将编号为的个体抽出。简记为:编号;分段;在第一段确定起始号;加间隔获取样本。第36页,共45页,2023年,2月20日,星期三理论迁移
例3、
某中学有高一学生322名,为了了解学生的身体状况,要抽取一个容量为40的样本,用系统抽样法如何抽样?第37页,共45页,2023年,2月20日,星期三第一步,随机剔除2名学生,把余下的320名学生编号为1,2,3,…320.第四步,从该号码起,每间隔8个号码抽取1个号码,就可得到一个容量为40的样本.第三步,在第1部分用抽签法确定起始编号.
第二步,把总体分成40个部分,每个部分有8个个体.
第38页,共45页,2023年,2月20日,星期三2、采用系统抽样的方法,从个体数为1003的总体中抽取一个容量50的样本,则在抽样过程中,被剔除的个体数为(),抽样间隔为()。320练习:1、某工厂生产产品,用传送带将产品送放下一道工序,质检人员每隔十分钟在传送带的某一个位置取一件检验,则这种抽样方法是()。A.抽签法B.随机数表法C.系统抽样D.其他C第39页,共45页,2023年,2月20日,星期三3、为了解1200名学生对学校某项教改试验的意见,打算从中抽取一个容量为30的样本,考虑采用系统抽样,则分段的间隔k为()A、40 B、30 C、20 D、124、为了了解参加一次知识竞赛的1252名学生的成绩,决定采用系统抽样的方法抽取一个容量为50的样本,那么总体中应随机剔除的个体数目()A、2 B、4 C、5 D、6
AA
第40页,共45页,2023年,2月20日,星期三5、用系统抽样的方法从个体数为1003的总体中抽取一个容量为50的样本,在整个抽样过程中每个个体被抽到的可能性为()A、1/1000 B、1/1003 C、50/1003 D、50/10006、从已编号为1-50的50枚最新研制的某种型号的导弹中随机抽取5枚来进行发射实验,若采用每部分选取的号码间隔一样的系统抽样方法,则所选取5枚导弹的编号可能为()A、5,10,15,20,25 B、3,13,23,33,43C、1,2,3,4,5 D、2,4,6,16,32
C
B
第41页,共45页,2023年,2月20日,星期三7、※(2004年福建省高考卷)一个总体中有100个个体,随机编号为
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 公共交通安全提升方案
- 患者安全文化建设及管理制度
- 2024-2030年中国螨除尽行业市场发展规模及投资可行性分析报告
- 2024-2030年中国蚝油酱行业生产销售模式及投资前景展望报告
- 2024-2030年中国营养保健品行业销售模式及投资潜力分析报告
- 2024-2030年中国胆酸行业市场运营模式及未来发展动向预测报告
- 环保设备维修技术管理制度
- 2024-2030年中国硫铁矿石产业发展规模及投资可行性研究报告版
- 2024-2030年中国矿山机械行业市场发展研究与提升竞争力策略分析报告
- 2024-2030年中国石化物流行业前景预测发展规划建议报告
- 《8 课余生活真丰富》教学设计-2024-2025学年道德与法治一年级上册统编版
- 2024年网络安全知识竞赛考试题库500题(含答案)
- 2024住房公积金借款合同范本
- 15八角楼上第一课时公开课一等奖创新教学设计
- 小学数学教学中数学模型的构建与应用
- 经导管主动脉瓣置换术(TAVR)患者的麻醉管理
- 运筹学智慧树知到答案2024年哈尔滨工程大学
- 行政执法证专业法律知识考试题库含答案(公路路政)
- 《人行自动门安全要求》标准
- 广铁集团校园招聘机考题库
- 第一章、总体概述:施工组织总体设想、工程概述、方案针对性及施工标段划分
评论
0/150
提交评论