




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第45讲获取数据的基本途径及抽样方法考情分析1.知道获取数据的基本途径;2.了解总体、样本、样本容量的概念,了解数据的随机性;3.了解简单随机抽样的含义及其解决问题的过程,掌握两种简单随机抽样方法:抽签法和随机数法;4.了解分层随机抽样的特点和适用范围,了解分层随机抽样的必要性,掌握各层样本量比例分配的方法.知识梳理1.获取数据的基本途径获取数据的基本途径包括:统计报表和年鉴、社会调查、试验设计、普查和抽样、互联网等.(1)统计报表是指各级企事业、行政单位按规定的表格形式、内容、时间要求报送程序,自上而下统一布置,提供统计资料的一种统计调查方式.(2)年鉴是以全面、系统、准确地记述上年度事物运动、发展状况为主要内容的资料性工具书.汇辑一年内的重要时事、文献和统计资料,按年度连续出版的工具书.2.总体、样本、样本容量要考察的对象的全体叫做总体,每一个考察对象叫做个体,从总体中被抽取的考察对象的集体叫做总体的一个样本,样本中个体的数目叫做样本容量.3.简单随机抽样(1)定义:从元素个数为N的总体中不放回地抽取容量为n的样本,如果每一次抽取时总体中的各个个体有相同的可能性被抽到,这种抽样方法叫做简单随机抽样.(2)最常用的简单随机抽样的方法:抽签法和随机数法.(3)应用范围:总体中的个体数较少.4.分层抽样(1)定义:在抽样时,将总体中各个个体按某种特征分成若干个互不重叠的几部分,每一部分叫做层,在各层中按层在总体中所占比例进行简单随机抽样或系统抽样,这种抽样方法叫做分层抽样.(2)应用范围:当总体是由差异明显的几个部分组成时,往往选用分层抽样.[微点提醒]1.不论哪种抽样方法,总体中的每一个个体入样的概率都是相同的.2.分层抽样是按比例抽样,每一层入样的个体数为该层的个体数乘抽样比.3.统一性是统计报表的基本特点.具体表现为:(1)统计报表的内容和报送的时间是由国家强制规定的,以保证调查资料的统一性.(2)统计报表的指标含义,计算方法、口径是全国统一的.经典例题考点一总体、样本、样本容量【例1】为了解普陀区高中二年级学生的身高,有关部门从高二年级中抽200名学生测量他们的身高,然后根据这一部分学生的身高去估计普陀区所有高二学生的平均身高.写出总体、个体、样本和样本容量.解总体是普陀区高二年级学生每人身高的全体,每名学生的身高是个体;从中抽取的200名学生的每人身高的集体是总体的一个样本,样本容量是200.规律方法要考察的对象的全体叫做总体,每一个考察对象叫做个体,抽取的考察对象的集体叫做样本.所有的个体构成了总体,样本取决于总体,样本是总体的一部分,没有个体就没有总体,样本的特征反映了总体的相应特征.考点二简单随机抽样及其应用【例2】(1)下列抽取样本的方式属于简单随机抽样的个数为()①从无限多个个体中抽取100个个体作为样本.②盒子里共有80个零件,从中选出5个零件进行质量检验.在抽样操作时,从中任意拿出一个零件进行质量检验后再把它放回盒子里.③从20件玩具中一次性抽取3件进行质量检验.④某班有56名同学,指定个子最高的5名同学参加学校组织的篮球赛.A.0 B.1 C.2 D.3(2)总体由编号为01,02,…,19,20的20个个体组成,利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为()A.08 B.07 C.02 D.01解析(1)①不是简单随机抽样,因为被抽取样本的总体的个数是无限的,而不是有限的;②不是简单随机抽样.因为它是有放回抽样;③不是简单随机抽样.因为这是“一次性”抽取,而不是“逐个”抽取;④不是简单随机抽样.因为不是等可能抽样.故选A.(2)从第1行第5列和第6列组成的数65开始由左到右依次选出的数为08,02,14,07,01,所以第5个个体编号为01.答案(1)A(2)D规律方法1.简单随机抽样需满足:(1)被抽取的样本总体的个体数有限;(2)逐个抽取;(3)是不放回抽取;(4)是等可能抽取.2.简单随机抽样常有抽签法(适用于总体中个体数较少的情况)、随机数法(适用于个体数较多的情况).考点三分层抽样及其应用多维探究角度1求某层入样的个体数【例3-1】某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为200,400,300,100件,为检验产品的质量,现用分层抽样的方法从以上所有的产品中抽取60件进行检验,则应从丙种型号的产品中抽取________件.解析因为样本容量n=60,样本总体N=200+400+300+100=1000,所以抽取比例为eq\f(n,N)=eq\f(60,1000)=eq\f(3,50).因此应从丙种型号的产品中抽取300×eq\f(3,50)=18(件).答案18角度2求总体或样本容量【例3-2】(1)某中学有高中生960人,初中生480人,为了了解学生的身体状况,采用分层抽样的方法,从该校学生中抽取容量为n的样本,其中高中生有24人,那么n等于()A.12 B.18 C.24 D.36(2)甲、乙两套设备生产的同类型产品共4800件,采用分层抽样的方法从中抽取一个容量为80的样本进行质量检测.若样本中有50件产品由甲设备生产,则乙设备生产的产品总数为________件.解析(1)根据分层抽样方法知eq\f(n,960+480)=eq\f(24,960),解得n=36.(2)由题设,抽样比为eq\f(80,4800)=eq\f(1,60).设甲设备生产的产品为x件,则eq\f(x,60)=50,∴x=3000.故乙设备生产的产品总数为4800-3000=1800.答案(1)D(2)1800规律方法1.分层抽样中分多少层,如何分层要视具体情况而定,总的原则是:层内样本的差异要小,两层之间的样本差异要大,且互不重叠.2.进行分层抽样的相关计算时,常用到的两个关系(1)eq\f(样本容量n,总体的个数N)=eq\f(该层抽取的个体数,该层的个体数);(2)总体中某两层的个体数之比等于样本中这两层抽取的个体数之比.[方法技巧]1.统计报表有三个显著优点:来源可靠、回收率高、方式灵活.2.年鉴集辞典、手册、年表、图录、书目、索引、文摘、表谱、统计资料、指南、便览于一身,具有资料权威、反应及时、连续出版、功能齐全的特点.3.两种抽样方法的共同点都是等概率抽样,即抽样过程中每个个体被抽到的概率相等,体现了这两种抽样方法的客观性和公平性.若样本容量为n,总体容量为N,每个个体被抽到的概率是eq\f(n,N).4.分层抽样适用于总体由差异明显的几部分组成的情况;分层后,在每一层抽样时可采用简单随机抽样.课时作业1.(2020·云南文山·高三其他(文))清源学校髙一、高二、高三年级学生的人数之比为,为了了解学校学生对数学学科的喜爱程度,现用分层抽样的方法从该校高中三个年级中抽取一个容量为120的样本,则应该从高三年级中抽取()名学生.A.30 B.40 C.50 D.60【答案】A【解析】,2.(2020·五华·云南师大附中高三月考(理))某工厂为了对40个零件进行抽样调查,将其编号为00,01,…,38,39.现要从中选出5个,利用下面的随机数表,从第一行第3列开始,由左至右依次读取,则选出来的第5个零件编号是()034743738636964736614698637162332616804560111410957774246762428114572042533237322707360751245179A.36 B.16 C.11 D.14【答案】C【解析】从题中给的随机数表第一行第3列开始从左往右开始读取,重复的数字只读一次,读到的小于40的编号分别为36,33,26,16,11,3.(2020·沙坪坝·重庆南开中学高三月考)为了解高三学生对“社会主义核心价值观”的学习情况,现从全年级1004人中抽取50人参加测试.首先由简单随机抽样剔除4名学生,然后剩余的1000名学生再用系统抽样的方法抽取,则()A.每个学生入选的概率均不相等 B.每个学生入选的概率可能为0C.每个学生入选的概率都相等,且为 D.每个学生入选的概率都相等,且为【答案】C【解析】因为简单随机抽和系统抽样都是等可能抽样,所以每个学生入选的概率都相等,且入选的概率等于.4.(2020·河南高三月考(理))某工厂生产,,三种不同型号的产品,某月生产这三种产品的数量之比依次为,现用分层抽样方法抽取一个容量为120的样本,已知B种型号产品抽取了60件,则()A.3 B.4 C.5 D.6【答案】C【解析】由题意,,解得.5.(2020·山西运城·高三月考(文))教育部日前出台《关于普通高中学业水平考试的实施意见》,根据意见,学业水平考试成绩以“等级”或“合格、不合格”呈现.计入高校招生录取总成绩的学业水平考试的3个科目成绩以等级呈现,其他科目一般以“合格、不合格”呈现.若某省规定学业水平考试中历史科各等级人数所占比例依次为:A等级15%,B等级35%,C等级30%,D、E等级共20%.现采用分层抽样的方法,从某省参加历史学业水平考试的学生中抽取100人作为样本,则该校本中获得A或B等级的学生中一共有().A.45人 B.60人 C.50人 D.90人【答案】C【解析】由题意,、等级人数所占比例依次为:等级,等级,则或等级所占比例为,人的样本中,获得或等级的学生一共有50人.6.(2020·西藏日喀则·高三其他(文))某中学有高中生3500人,初中生1500人,为了解学生的学习情况,用分层抽样的方法从该校学生中抽取一个容量为n的样本,已知从高中生中抽取140人,则n为()A.300 B.250 C.200 D.150【答案】C【解析】由题意得:,解得,7.(2020·广东霞山·湛江二十一中高三月考)2021年高考实行选择性考试,其中物理和历史中选考1科(必须选1科而且只能选1科),再在化学、生物、政治、地理中选考2科(必须选2科而且只能选2科).某中学选考物理的考生199人,选考历史的考生251人,未选化学的考生310人,既选物理又选化学的考生80人,则既选历史又选化学的考生人数为()A.40 B.50 C.60 D.80【答案】C【解析】依题意可得总人数为450人,所以选化学的人数为人,所以既选历史又选化学的人数为人.8.(2020·江西高三其他(文))某学校在校学生2000人,为了学生的“德、智、体”全面发展,学校举行了跑步和登山比赛活动,每人都参加而且只参与其中一项比赛,各年级参与比赛的人数情况如下表:高一年级高二年级高三年级跑步人数abc登山人数xyz其中a∶b∶c=2∶5∶3,全校参与登山的人数占总人数的.为了了解学生对本次活动的满意程度,从中抽取一个200人的样本进行调查,则高三年级参与跑步的学生中应抽取()A.15人 B.30人 C.40人 D.45人【答案】D【解析】全校参与登山的人数是2000×=500,所以参与跑步的人数是1500,应抽取=150,c=150×=45(人).9.(2020·湖北高三月考)从年起,北京考生的高考成绩由语文、数学、外语门统一高考成绩和考生选考的3门普通高中学业水平考试等级性考试科目成绩构成.等级性考试成绩位次由高到低分为、、、、,各等级人数所占比例依次为:等级,等级,等级,等级,等级.现采用分层抽样的方法,从参加历史等级性考试的学生中抽取人作为样本,则该样本中获得或等级的学生人数为()A.55 B.80 C.90 D.110【答案】D【解析】设该样本中获得或等级的学生人数为,则10.(2020·宁夏利通·吴忠中学高一期中)总体由编号为01,02,…,19,20的20个个体组成.利用下面的随机数表选取5个个体,选取方法从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为()A.08 B.07 C.02 D.01【答案】D【解析】从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字中小于20的编号依次为08,02,14,07,02,01,.其中第二个和第四个都是02,重复.可知对应的数值为08,02,14,07,01,则第5个个体的编号为0111.(2020·广西高三其他(理))总体由编号为01,02,,49,50的50个个体组成,利用下面的随机数表选取6个个体,选取方法是从随机数表第6行的第9列和第10列数字开始从左到右依次选取两个数字,则选出的第4个个体的编号为附:第6行至第9行的随机数表27486198716441487086288885191620747701111630240429797991968351253211491973064916767787339974673226357900337091601620388277574950A.3 B.19 C.38 D.20【答案】B【解析】解:从随机数表第6行的第9列和第10列数字开始从左到右依次选取两个数字,位于01至50中间,含端点,则这四个数为:41、48、28,19,12.(2020·山西大同·高三月考(理))中国传统文化是中华民族智慧的结晶,是中华民族的历史遗产在现实生活中的展现.为弘扬中华民族传统文化,某校学生会为了解本校高一1000名学生的课余时间参加传统文化活动的情况,随机抽取50名学生进行调查.将数据分组整理后,列表如下:参加场数01234567参加人数占调查人数的百分比8%10%20%26%18%%4%2%以下四个结论中正确的是().A.表中的数值为10B.估计该校高一学生参加传统文化活动次数不高于2场的学生约为180人C.估计该校高一学生参加传统文化活动次数不低于4场的学生约为360人D.若采用系统抽样方法进行调查,从该校高一1000名学生中抽取容量为50的样本,则分段间隔为25【答案】C【解析】A选项,由题意可得,,则;故A错;B选项,由题意可得,样本中该校高一学生参加传统文化活动次数不高于2场的学生占比为,则该校高一学生参加传统文化活动次数不高于2场的学生约为人;故B错;C选项,由题意,样本中该校高一学生参加传统文化活动次数不低于4场的学生占比为,则该校高一学生参加传统文化活动次数不低于4场的学生约为360人;故C正确;D选项,从若采用系统抽样方法进行调查,从该校高一1000名学生中抽取容量为50的样本,则分段间隔为;故D错.13.(2020·山西长治·高三月考(文))由于疫情期间大多数学生都进行网上上课,我校高一、高二、高三共有学生1800名,为了了解同学们对“钉钉”授课软件的意见,计划采用分层抽样的方法从这1800名学生中抽取一个容量为72的样本,若从高一、高二、高三抽取的人数恰好是从小到大排列的连续偶数,则我校高三年级的人数为()A.800 B.750 C.700 D.650【答案】D【解析】设从高三年级抽取的学生人数为2x人,则从高二、高一年级抽取的人数分别为2x-2,2x-4,由题意可得设我校高三年级的学生人数为N,再根据求得,14.(2020·上海市七宝中学高三其他)在传染病学中,通常把从致病刺激物侵入机体或者对机体发生作用起,到机体出现反应或开始呈现相应的症状时止的这一阶段称为潜伏期.一研究团队统计了某地区名患者的相关信息,得到如下表格:潜伏期(单位:天)人数已知该传染病的潜伏期受诸多因素的影响,为研究潜伏期与患者年龄的关系,以潜伏期是否超过天为标准进行分层抽样,若从上述名患者中抽取人,得到如下联表.潜伏期天潜伏期天总计岁以上(含岁)①②岁以下③则表格中的位置分别应填入数字是()A.①;②;③ B.①;②;③C.①;②;③ D.①;②;③【答案】C【解析】由分层抽样可知,从上述名患者中抽取人,其中潜伏期天的人数为,所以,①处应填的数字为,②处应填的数字为,③处应填的数字为.15.(2020·东北育才学校高三其他(理))某地区甲、乙、丙、丁四所高中分别有120,150,180,150名高三学生参加某次数学调研考试,为了解学生能力水平,现制定以下两种卷面分析方案:方案①;从这600名学生的试卷中抽取一个容量为200的样本进行分析:方案②:丙校参加调研考试的学生中有30名数学培优生,从这些培优生的试卷中抽取10份试看进行分析.完成这两种方案宜采用的抽样方法依次是()A.分层抽样法、系统抽样法 B.分层抽样法、简单随机抽样法C.系统抽样法、分层抽样法 D.简单随机抽样法、分层抽样法【答案】B【解析】①四所学校,学生有差异,故①使用分层抽样;②在同一所学校,且人数较少,所以可使用简单随机抽样.16.(2020·陕西高三二模(文))总体由编号01,,02,…,19,20的20个个体组成.利用下面的随机数表选取5个个体,选取方法是随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为7816
6572
0802
6314
0702
4369
9728
0198
3204
9234
4935
8200
3623
4869
6938
7481
A.08 B.07 C.02 D.01【答案】D【解析】从第一行的第5列和第6列起由左向右读数划去大于20的数分别为:08,02,14,07,01,所以第5个个体是01,选D.17.(2020·湖北武昌·高三其他(文))某小区为了调查本小区业主对物业服务满意度的真实情况,对本小区业主进行了调查,调查中问了两个问题1:你的手机尾号是不是奇数?问题2:你是否满意物业的服务?调查者设计了一个随机化装置,其中装有大小、形状和质量完全相同的白球和红球,每个被调查者随机从装置中摸到红球和白球的可能性相同,其中摸到白球的业主回答第一个问题,摸到红球的业主回答第二个问题,回答“是”的人往一个盒子中放一个小石子,回答“否”的人什么都不要做由于问题的答案只有“是”和“否”,而且回答的是哪个问题别人并不知道,因此被调查者可以毫无顾虑地给出符合实际情况的答案.已知某小区80名业主参加了问卷,且有47名业主回答了“是”,由此估计本小区对物业服务满意的百分比大约为()A.85% B.75% C.63.5% D.67.5%【答案】D【解析】要调查80名居民,在准备的两个问题中每一个问题被问到的概率相同,第一个问题可能被询问40次,在被询问的40人中有20人手机号是奇数,而有47人回答了“是”,估计有27个人回答是否满意物业的服务时回答了“是”,在40人中有27个人满意服务,估计本小区对物业服务满意的百分比,18.(多选题)(2020·江苏启东中学高一开学考试)为了了解参加运动会的名运动员的年龄情况,从中抽取了名运动员的年龄进行统计分析.就这个问题,下列说法中正确的有()A.名运动员是总体; B.所抽取的名运动员是一个样本;C.样本容量为; D.每个运动员被抽到的机会相等.【答案】CD【解析】由已知可得,名运动员的年龄是总体,名运动员的年龄是样本,总体容量为,样本容量为,在整个抽样过程中每个运动员被抽到的机会均为,所以A、B错误,C、D正确.19.(多选题)(2020·江苏泗洪·高一月考)(多选)某中学高一年级有20个班,每班50人;高二年级有30个班,每班45人.甲就读于高一,乙就读于高二.学校计划从这两个年级中共抽取235人进行视力调查,下列说法中正确的有()A.应该采用分层随机抽样法B.高一、高二年级应分别抽取100人和135人C.乙被抽到的可能性比甲大D.该问题中的总体是高一、高二年级的全体学生的视力【答案】ABD【解析】由于各年级的年龄段不一样,因此应采用分层随机抽样法.由于比例为,因此高一年级1000人中应抽取100人,高二年级1350人中应抽取135人,甲、乙被抽到的可能性都是,因此只有C不正确,故应选ABD.20.((多选题)2020·山东费县·高三期末)下列说法正确的是()A.从匀速传递的产品生产流水线上,质检员每10分钟从中抽取一件产品进行某项指标检测,这样的抽样是分层抽样B.某地气象局预报:5月9日本地降水概率为,结果这天没下雨,这表明天气预报并不科学C.在回归分析模型中,残差平方和越小,说明模型的拟合效果越好D.在回归直线方程中,当解释变量每增加1个单位时,预报变量增加0.1个单位【答案】CD【解析】对A,分层抽样为根据样本特征按比例抽取,从匀速传递的产品生产流水线上,质检员每10分钟从中抽取一件产品进行某项指标检测不满足.故A错误.对B,降水概率为,但仍然有的概率不下雨,故B错误.对C,在回归分析模型中,残差平方和越小,说明模型的拟合效果越好正确.对D,回归直线方程中的系数为0.1,故当解释变量每增加1个单位时,预报变量增加0.1个单位正确.21.(2020·湖南高三其他(文))疫情爆发以来,相关疫苗企业发挥专业
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 河北女子职业技术学院《BM三维建模》2023-2024学年第二学期期末试卷
- 四川省宜宾市翠屏区2025年初三下学期第四次模拟语文试题含解析
- 新疆昌吉二中2024-2025学年高三下学期3月统一联合考试数学试题含解析
- 西南林业大学《服务器虚拟化技术》2023-2024学年第二学期期末试卷
- 重庆智能工程职业学院《合唱与指挥(3)》2023-2024学年第二学期期末试卷
- 延边职业技术学院《智能终端与移动应用开发》2023-2024学年第二学期期末试卷
- 水果种植园农业土壤健康与肥力提升考核试卷
- 电池制造过程中的电气安全考核试卷
- 水产品加工设备智能化改造与升级考核试卷
- 漆器制作与非物质文化遗产传承考核试卷
- 住建局安全生产汇报
- 《老年社会工作》课件-老年社会生活相关理论及应用
- 2022年全国高考数学(新高考1卷)试题及答案解析
- 消化系统肿瘤的预防和治疗
- 2024年山东淄博市热力集团有限责任公司招聘笔试参考题库含答案解析
- 审查易系统操作指南
- 期中 (试题) -2023-2024学年鲁科版(五四学制) (三起)英语三年级下册
- 抗战胜利纪念日抗日战争胜利爱国主题教育宣传PPT
- 高中物理学法指导讲座
- 《神经系统发育》课件
- 2024年中通服网盈科技有限公司招聘笔试参考题库含答案解析
评论
0/150
提交评论