版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第82讲随机抽样的方法、用样本估计总体一、抽样方法1.简单随机抽样(1)定义:设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.(2)最常用的简单随机抽样的方法:抽签法和随机数表法.2.分层抽样(1)定义:在抽样时,将总体分成互不交叉的层,然后按照一定的比例从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法叫做分层抽样.(2)分层抽样的应用范围:当总体是由差异明显的几个部分组成时,往往选用分层抽样.3.两种抽样方法的区别与联系:类别简单随机抽样分层抽样共同点抽样过程中每个个体被抽到的机会均等,不放回抽样各自特点从总体中逐个抽取将总体分n层,分层进行抽取适用范围总体中个体数较少总体由差异明显的几部分组成二、总体分布特征数的估计1.总体分布(1)频率分布表:当总体很大或不便于获得时,可以用样本的频率分布估计总体的频率分布,我们把反映总体频率分布的表格称为频率分布表.(2)频率分布直方图:利用直方图反映样本的频率分布规律,这样的直方图称为频率分布直方图.(3)频率分布折线图:如果将频率分布直方图中,各相邻的矩形的上底边的中点顺次连结起来,就得到一条折线,我们称这条折线为本组数据的频率分布折线图.频率分布折线图的优点是它反映了数据的变化趋势.4.总体特征数的估计(1)中位数:在频率分布直方图中,中位数左边和右边的直方图面积应该相等,由此可以估计中位数的值.(2)众数:在频率分布直方图中,众数是最高的矩形的中点的横坐标.(3)平均数及其估计:平均数是直方图的“重心”,等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.平均数x=eq\f(1,n)_(x1+x2+…+xn).(4)方差与标准差标准差s=eq\r(\f(1,n)[x1-\x\to(x)2+x2-\x\to(x)2+…+xn-\x\to(x)2]).、方差s2=eq\f(1,n)[(x1-eq\x\to(x))2+(x2-eq\x\to(x))2+…+(xn-eq\x\to(x))2].5、频率分布直方图中的常见结论(1)众数的估计值为最高矩形的中点对应的横坐标.(2)平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.(3)中位数的估计值的左边和右边的小矩形的面积和是相等的.平均数、方差的公式推广(1)若数据x1,x2,…,xn的平均数为eq\x\to(x),则mx1+a,mx2+a,mx3+a,…,mxn+a的平均数是meq\x\to(x)+a.(2)若数据x1,x2,…,xn的方差为s2,则数据ax1+b,ax2+b,…,axn+b的方差为a2s2.1、如图为SKIPIF1<0年上海市货物进出口总额的条形统计图,则下列对于进出口贸易额描述错误的是SKIPIF1<0SKIPIF1<0A.从2018年开始,2021年的进出口总额增长率最大 B.从2018年开始,进出口总额逐年增大 C.从2018年开始,进口总额逐年增大 D.从2018年开始,2020年的进出口总额增长率最小2、现有某地一年四个季度的SKIPIF1<0(亿元),第一季度SKIPIF1<0为232(亿元),第四季度SKIPIF1<0为241(亿元),四个季度的SKIPIF1<0逐季度增长,且中位数与平均数相同,则该地一年的SKIPIF1<0为.3、某校抽取100名学生测身高,其中身高最大值为SKIPIF1<0,最小值为SKIPIF1<0,根据身高数据绘制频率组距分布直方图,组距为5,且第一组下限为153.5,则组数为.4、为研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:SKIPIF1<0的分组区间为SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,将其按从左到右的顺序分别编号为第一组,第二组,SKIPIF1<0,第五组,右图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为SKIPIF1<0SKIPIF1<0A.8 B.12 C.16 D.185、从某网络平台推荐的影视作品中抽取400部,统计其评分数据,将所得400个评分数据分为8组:SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,并整理得到如下的频率分布直方图,则评分在区间SKIPIF1<0,SKIPIF1<0内的影视作品数量是SKIPIF1<0SKIPIF1<0A.20 B.40 C.64 D.806、(多选题)有一组样本数据SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,其中SKIPIF1<0是最小值,SKIPIF1<0是最大值,则SKIPIF1<0SKIPIF1<0A.SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0的平均数等于SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0的平均数 B.SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0的中位数等于SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0的中位数 C.SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0的标准差不小于SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0的标准差 D.SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0的极差不大于SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0的极差7、(多选题)下列统计量中,能度量样本SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0的离散程度的有SKIPIF1<0SKIPIF1<0A.样本SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0的标准差 B.样本SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0的中位数 C.样本SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0的极差 D.样本SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0的平均数8、(多选题)有一组样本数据SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,由这组数据得到新样本数据SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,其中SKIPIF1<0,2,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0为非零常数,则SKIPIF1<0SKIPIF1<0A.两组样本数据的样本平均数相同 B.两组样本数据的样本中位数相同 C.两组样本数据的样本标准差相同 D.两组样本数据的样本极差相同1、某公司有员工500人,其中不到35岁的有125人,35~49岁的有280人,50岁以上的有95人,为了调查员工的身体健康状况,从中抽取100名员工,则应在这三个年龄段分别抽取人数为()A.33,34,33B.25,56,19C.20,40,30D.30,50,202、一个容量为32的样本,已知某组样本的频率为0.25,则该组样本的频数为()A.4B.8C.12D.163、已知某地区中小学生人数和近视情况分别如图①和图②所示.为了解该地区中小学生的近视形成原因,用分层随机抽样的方法抽取2%的学生进行调查,则样本量和抽取的高中生近视人数分别为()A.200,20 B.100,20C.200,10 D.100,104、给定一组数据5,5,4,3,3,3,2,2,2,1,则这组数据()A.众数为2 B.平均数为2.5C.方差为1.6 D.标准差为4考向一抽样方法例1要考察某种品牌的850颗种子的发芽率,从中抽取50颗种子进行实验,利用随机数表法抽取种子,先将850颗种子按001,002,…,850进行编号,如果从随机数表第3行第6列的数开始向右读,请依次写出最先检验的4颗种子的编号:.注:下面抽取了随机数表第1行至第5行.0347437386369647366146986371623326168045601114109597742467624281145720425332373227073607512451798973167662276656502671073290797853135538585988975414101256859926969668273105037293155712101421882649817655595635643854824622316243099006184432532383013030变式1、下列抽取样本的方式属于简单随机抽样的个数为()①从无限多个个体中抽取100个个体作为样本;②盒子里共有80个零件,从中选出5个零件进行质量检验.在抽样操作时,从中任意拿出一个零件进行质量检验后再把它放回盒子里;③从20件玩具中一次性抽取3件进行质量检验;④某班有56名同学,指定个子最高的5名同学参加学校组织的篮球赛.A.0B.1C.2D.3变式2、.下列抽样方法是简单随机抽样的是()A.质检员从50个零件中一次性抽取5个做质量检验B.“隔空不隔爱,停课不停学”,网课上,李老师对全班45名学生中点名表扬了3名发言积极的C.老师要求学生从实数集中逐个抽取10个分析奇偶性D.某运动员从8条跑道中随机抽取一条跑道试跑方法总结:简单随机抽样的两种方法(1)抽签法,抽签法的步骤是:①将总体中的N个个体编号;②将这N个号码写在形状、大小相同的号签上;③将号签放在同一箱中,并搅拌均匀;④从箱中每次抽取1个号签,连续抽取k次;⑤将总体中与抽到的号签的编号一致的k个个体取出.(2)随机数表法,随机数表法的步骤是:①将总体的个体编号(每个号码的位数一致);②在随机数表中任选一个数作为开始;③从选定的数开始按一定的方向读下去,若得到的号码在编号中,则取出;若得到的号码不在编号中或前面已经取出,则跳过,如此继续下去,直到取满为止;④根据选定的号码抽取样本.考向二总体分布的估计以及均值与方差例2、为了分析某次考试的情况,随机抽取了若干学生,将其考试成绩分组为:SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,并绘制成如下图所示的频率分布直方图,据此可估计该次考试成绩的中位数SKIPIF1<0,则整数k的值为()A.99 B.100 C.101 D.102变式1、酒后驾驶是严重危害交通安全的行为,某交通管理部门对辖区内四个地区(甲、乙、丙、丁)的酒驾治理情况进行检查督导,若“连续8天,每天查获的酒驾人数不超过10”,则认为“该地区酒驾治理达标”,根据连续8天检查所得数据的数字特征推断,酒驾治理一定达标的地区是()A.甲地,均值为4,中位数为5 B.乙地:众数为3,中位数为2C.丙地:均值为7,方差为2 D.丁地:极差为SKIPIF1<0,SKIPIF1<0分位数为8变式2、某年的足球联赛上,甲队每场比赛平均失球数是SKIPIF1<0个,全年比赛失球个数的标准差为SKIPIF1<0;乙队每场比赛平均失球数是SKIPIF1<0个,全年比赛失球个数的标准差为SKIPIF1<0,下列说法正确的是()A.甲乙两队相比,乙队很少失球B.甲队比乙队技术水平更稳定C.平均来说,甲队比乙队防守技术好D.乙队有时表现很差,有时表现又非常好变式3、甲同学投掷骰子SKIPIF1<0次,并请乙同学将向上的点数记录下来,计算出平均数和方差.由于记录遗失,乙同学只记得这五个点数的平均数为SKIPIF1<0,方差在区间SKIPIF1<0内,则这五个点数()A.众数可能为SKIPIF1<0 B.中位数可能为SKIPIF1<0C.一定不会出现SKIPIF1<0 D.出现SKIPIF1<0的次数不会超过两次方法总结:本题主要考查频率分布直方图,是一道基础题目.图表题作为一道应用题,主要考查考生的视图、用图能力,以及应用数学解决实际问题的能力.频率分布直方图的两个要点:(1)各个小矩形的面积之和等于1,各个小矩形的面积为各组的频率,小矩形的高为eq\f(频率,组距).(2)eq\f(频数,样本容量)=频率,eq\f(频数,频率)=样本容量,样本容量×频率=频数.考向三统计图表例3、已知某市某居民小区户主人数和户主对户型结构的满意率分别如图1和图2所示,为了解该小区户主对户型结构的满意程度,用分层随机抽样的方法抽取30%的户主进行调查,则样本量和抽取的户主对四居室满意的人数分别为()A.240,18 B.200,20C.240,20 D.200,18变式1、如图是民航部门统计的SKIPIF1<0年春运期间十二个城市售出的往返机票的平均价格以及相比去年同期变化幅度的数据统计图表,根据图表,下面叙述不正确的是()A.深圳的变化幅度最小,北京的平均价格最高B.深圳和厦门的春运期间往返机票价格同去年相比有所下降C.平均价格的涨幅从高到低居于前三位的城市为天津、西安、厦门D.平均价格从高到低居于前三位的城市为北京、深圳、广州变式2、为了增强大学生的环保意识,加强对“碳中和”概念的宣传,某公益组织分别在SKIPIF1<0两所大学随机选取10名学生进行环保问题测试(满分100分),这20名学生得分的折线图如图所示,关于这两所学校被选取的学生的得分,下列结论错误的是()A.SKIPIF1<0校学生分数的平均分大于SKIPIF1<0校学生分数的平均分B.SKIPIF1<0校学生分数的众数大于SKIPIF1<0校学生分数的众数C.SKIPIF1<0校学生分数的中位数等于SKIPIF1<0校学生分数的中位数D.SKIPIF1<0校学生分数的方差大于SKIPIF1<0校学生分数的方变式3、某中学为了解学生数学史知识的积累情况,随机抽取150名同学参加数学史知识测试,测试题共5道,每答对一题得20分,答错得0分.得分不少于60分记为及格,不少于80分记为优秀,测试成绩百分比分布图如图所示,则()A.该次数学史知识测试及格率超过90%B.该次数学史知识测试得满分的同学有15名C.该次测试成绩的中位数大于测试成绩的平均数D.若该校共有1500名学生,则数学史知识测试成绩能得优秀的同学大约有720名方法总结:统计图表的主要应用扇形图:直观描述各类数据占总数的比例;折线图:描述数据随时间的变化趋势;条形图和直方图:直观描述不同类别或分组数据的频数和频率;1、为贯彻落实健康第一的指导思想,切实加强学校体育工作,促进学生积极参加体育锻炼,养成良好的锻炼习惯,提高体质健康水平.某市抽调三所中学进行中学生体育达标测试,现简称为A校、B校、C校.现对本次测试进行调查统计,得到测试成绩排在前200名学生层次分布的饼状图、A校前200名学生的分布条形图,则下列结论不一定正确的是()A.测试成绩前200名学生中B校人数超过C校人数的1.5倍B.测试成绩前100名学生中A校人数超过一半以上C.测试成绩在51—100名学生中A校人数多于C校人数D.测试成绩在101—150名学生中B校人数最多29人2、某地教育行政部门为了解“双减”政策的落实情况,在某校随机抽取了100名学生,调查他们课后完成作业的时间,根据调查结果绘制如下频率直方图.根据此频率直方图,下列结论中错误的是()A.估计该校学生平均完成作业的时间超过2.7小时B.所抽取的学生中有25人在2小时至2.5小时之间完成作业C.该校学生完成作业的时间超过3.5小时的概率估计为20%D.估计该校有一半以上的学生完成作业的时间在2小时至3小时之间3、(多选题)一组数据SKIPIF1<0,SKIPIF1<0,…,SKIPIF1<0是公差为SKIPIF1<0的等差数列,若去掉首末两项SKIPIF1<0,SKIPIF1<0后,则()A.平均数变大 B.中位数没变 C.方差变小 D.极差没变4、(多选题)某学校组织了一次劳动技能大赛,共有100名学生参赛,经过评判,这100名参
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 精益服务解决方案
- 面部护理客户分析方案
- 煤炭车队营运方案
- 公共卫生突发事件下中小企业面临困境及应对策略
- 离婚孩子探视方案
- 部编版八年级(上)第三单元练习语文试卷含答案
- 期中测试卷-2024-2025学年统编版(五四制)语文一年级上册
- 怒杀阎婆惜概括50字左右
- 军史长廊策划方案
- 2024-2025学年湖南省长沙市长郡月亮岛学校九年级(上)第一次月考物理试卷(含答案)
- 医疗机构消毒技术规范(2023年版)
- GB/T 35005-2018集成电路倒装焊试验方法
- GB/T 18337.3-2001生态公益林建设技术规程
- 新闻传播与名誉权案例讨论
- GB 253-2008煤油
- 优化完善法律制度规定解读2021年新修订《军事设施保护法》PPT教学讲座
- 小学三年级下册综合实践活动.奇妙的水果-(16张)ppt
- 大鱼海棠课件
- 挤出机螺杆组合原理和应用教育课件
- 业绩考核薪酬激励课件
- 如何构建德育课程体系
评论
0/150
提交评论