版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
专题24统计与统计案例【考纲要求】1、了解随机抽样2、掌握用样本估计总体3、理解统计是实际应用一、随机抽样【思维导图】【考点总结】一、随机抽样
像人口普查那样,对每一个调查对象都惊醒调查的方法,称为全面调查,又称普查.在一个调查中,我们把调查对象的全体成为总体,组成总体的每一个调查对象成为个体.
像这样,根据一定目的,从总体中抽取-一部分个体进行调查,并以此为依据对总体的情况作出估计和推断的调查方法,称为抽样调查.我们把从总体中抽取的那部分个体称为样本,样本中包含的个体数称为样本量.调查样本获得的变量值称为样本的观测数据,简称样本数据.
1.简单的随机抽样
一般地,设一个总体含有N
(N为正整数)个个体,从中逐个抽取n(1≤n<N)个个体作为样本,如果抽取是放回的,且每次抽取时总体内的各个个体被抽到的概率都相等,我们把这样的抽样方法叫做放回简单随机抽样;如果抽取是不放回的,且每次抽取时总体内未进人样本的各个个体被抽到的概率都相等,我们把这样的抽样方法叫做不放回简单随机抽样.放回简单随机抽样和不放回简单随机抽样统称为简单随机抽样.通过简单随机抽样获得的样本称为简单随机样本.
2.分层随机抽样
一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体称为层.在分层随机抽样中,如果每层样本量都与层的大小成比例,那么称这种样本量的分配方式为比例分配.
二、用样本估计总体1.总体取值规律的估计
为了探索-组数据的取值规律,一般先要用表格对数据进行整理,或者用图将数据直观表示出来.在初中,我们曾用频数分布表和频数分布图来整理和表示这种数值型数据,由此能使我们清楚地知道数据分布在各个小组的个数.
在这个实际问题中,因为我们更关心月均用水量在不同范围内的居民用户占全市居民用户的比例,所以选择频率分布表和频率分布直方图来整理和表示数据.与画频数分布直方图类似,我们可以按以下步骤制作频率分布表、画频率分布直方图.
1.求极差
极差式一组数据中最大值与最小值的差
2.决定组距与组数
合适的组距与组数对发现数据分布规律有重要意义.组数太多或太少,都会影响我们了解数据的分布情况组距与组数的确定没有固定的标准,常常需要-一个尝试和选择的过程。数据分组的组数与数据的个数有关,一般数据的个数越多,所分组数也越多.
3.将数据分组
4.列频率分布表
5.画频率分布直方图
小长方形的面积=组距×SKIPIF1<0总体百分位数的估计
把100个样本数据按从小到大排序,得到第80个和第81个数据分别为13.6和13.8.可以发现,区间(13.6,
13.8)内的任意一个数,都能把样本数据分成符合要求的两部分.一般地,我们取这两个数的平均数SKIPIF1<0=13.7,并称此数为这组数据的第80百分位数,或80%分位数.
一般地,一组数据的第p百分位数是这样-一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且少有(100-p)%的数据大于或等于这个值.
三、统计案例公司员工的肥胖情况调查分析
背景与数据
近年来,我国肥胖人群的规模急速增长,肥胖人群有很大的心血管安全隐患.目前,国际上常用身体质量指数来衡量人体胖瘦程度以及是否健康,其计算公式是
BMI=SKIPIF1<0
中国成人的BMI数值标准为:BM1<18.5为偏瘦;18.5≤BMI<23.9为正常;24≤
BMI<27.9为偏胖;BMI≥28为肥胖.【题型汇编】题型一:随机抽样题型二:用样本估计总体题型三:统计案例【题型讲解】题型一:随机抽样一、单选题1.(2022·上海静安·二模)2022年2月4日至2月20日春节期间,第24届冬奥会在北京市和张家口市联合举行.共有SKIPIF1<0个冬奥村供运动员和代表队官员入住,其中北京冬奥村的容量约为SKIPIF1<0人,延庆冬奥村的容量约SKIPIF1<0人,张家口冬奥村的容量约SKIPIF1<0人.为了解各冬奥村服务质量,现共准备了SKIPIF1<0份调查问卷,采用分层抽样的方法,则需在延庆冬奥村投放的问卷数量是(
)A.58份 B.50份 C.32份 D.19份2.(2022·青海·大通回族土族自治县教学研究室三模(文))2021年东京奥运会某国家游泳队有男运动员48人,女运动员36人,世界反兴奋剂机构采用分层抽样的方法,从该国游泳运动员中抽出一个容量为28的样本进行尿样兴奋剂检查,其中女运动员应抽的人数为(
)A.12 B.14 C.16 D.183.(2022·陕西宝鸡·二模(文))北京2022年冬奥会吉祥物“冰墩墩”和冬残奥会吉祥物“雪容融”很受欢迎,现工厂决定从20只“冰墩墩”,15只“雪容融”和10个北京2022年冬奥会会徽中,采用比例分配分层随机抽样的方法,抽取一个容量为n的样本进行质量检测,若“冰墩墩”抽取了4只,则n为(
)A.3 B.2 C.5 D.94.(2022·江西·二模(理))某工厂利用随机数表对生产的300个零件进行抽样测试,先将300个零件进行编号001,002,…,299,300.从中抽取30个样本,根据提供随机数表的第5行到第6行,若从表中第5行第6列开始向右读取数据,则得到的第3个样本编号是(
)844212
533134
578607
362530
073286
234578
890723
68960804325678
084367
895355
773489
948375
225355
783245
77892345A.072 B.134 C.007 D.2535.(2022·新疆乌鲁木齐·二模(理))从某中学随机抽取100名学生,将他们的身高数据(单位cm)绘制成频率分布直方图,若要从身高在SKIPIF1<0,SKIPIF1<0,SKIPIF1<0三组内的学生中,用分层抽样的方法选取16人参加一次活动.则从身高在SKIPIF1<0内的学生中选取的人数应为(
)A.3 B.4 C.5 D.7二、多选题1.(2022·湖南·雅礼中学二模)下列说法正确的有(
)A.一组数据按大小顺序排列,位于最中间的一个数据就是中位数B.分层抽样为保证每个个体等可能入样,需在各层中进行简单随机抽样C.若A∩B为不可能事件,A∪B为必然事件,则事件A与事件B互为对立事件D.线性回归分析中,SKIPIF1<0的值越小,说明残差平方和越小,则模型拟合效果越好三、解答题1.(2022·四川成都·三模(理))某中学为增强学生的环保意识,举办了“爱成都,护环境”的知识竞赛活动,为了解本次知识竞赛活动参赛学生的成绩,从中抽取了n名学生的分数(得分取正整数,满分为100分,所有学生的得分都在区间SKIPIF1<0中)作为样本进行统计.按照SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0的分组作出如下的频率分布直方图,并作出下面的样本分数茎叶图(图中仅列出了得分在SKIPIF1<0,SKIPIF1<0的数据).(1)求样本容量n和频率分布直方图中x,y的值;(2)在选取的样本中,从竞赛成绩不低于70分的三组学生中按分层抽样抽取了9名学生,再从抽取的这9名学生中随机抽取2名学生到天府广场参加环保知识宣传活动,求这2名学生中恰好有1名学生的分数在SKIPIF1<0中的概率.2.(2022·江西师大附中三模(文))随着经济的高速发展,南昌市居住环境及人文环境进一步得到改善.目前已基本依水建成赣江西岸绿道、赣江东岸绿道、乌沙河绿道、玉带河桃花河绿道、抚河故道绿道、幸福渠绿道、艾溪湖瑶湖绿道等城市主干绿道.新建提升20个公园,精心打造100条景观路,织起一张“四横七纵六环”的“绿道网”.另外,位于凤凰洲赣江边的省文化中心的建成已成为展示江西历史文化的地标建筑.省文化中心由省博物馆、省图书馆、省科技馆三馆组成,三个主体建筑由北向南排列,分别隐喻历史、现在与未来,反映出文化发展的路径,描述了探索知识的故事与旅程.作为江西省文化的新地标,城市的新客厅,成为加快推动江西文化强省建设的一个亮丽缩影,成为丰富江西省人民群众精神文化需求的重要阵地.(1)相比老年人而言,青年人更喜欢在闲暇时间选择去省文化中心参观、学习.已知某区青年人的男女比例为3:2,现采用分层抽样的方法从中抽取100名作为样本,对这100位青年是否在闲暇时间去省文化中心进行统计,得条形图如下所示.男女合计去省文化中心不去省文化中心合计完成下列2×2列联表,并判断是否有90%的把握认为青年人选择去省文化中心与性别有关?(2)现有甲、乙、丙、丁四位青年人,他们每个周末都选择去省文化中心,将他们想去的场馆情况汇总如下:场馆图书馆科技馆博物馆意向甲、乙、丙甲、乙、丁乙、丙、丁若每人只能从已登记的选择意向中随机选取一个场馆,且每个场馆至多有两人选择,求甲、乙两人选择去同一个场馆的概率.附:SKIPIF1<00.1000.0500.0250.010SKIPIF1<0,其中SKIPIF1<0.SKIPIF1<02.7063.8415.0246.635题型二:用样本估计总体一、单选题1.(2022·辽宁·抚顺市第二中学三模)下列一组数据SKIPIF1<0、SKIPIF1<0、SKIPIF1<0、SKIPIF1<0、SKIPIF1<0、SKIPIF1<0、SKIPIF1<0、SKIPIF1<0、SKIPIF1<0、SKIPIF1<0的SKIPIF1<0分位数为(
)A.SKIPIF1<0 B.SKIPIF1<0 C.SKIPIF1<0 D.SKIPIF1<02.(2022·全国·二模(理))以下三组数据的标准差分别为SKIPIF1<0,SKIPIF1<0,SKIPIF1<0.5,5,5,5,5,5,5,5,53,3,4,4,5,6,6,7,72,2,2,2,5,8,8,8,8则有(
)A.SKIPIF1<0 B.SKIPIF1<0C.SKIPIF1<0 D.SKIPIF1<03.(2022·新疆·三模(文))塔里木河为中国第一大内流河,全长2179千米,由发源于天山的阿克苏河,发源于昆仑山的叶尔羌河,和田河汇流而成,塔里木河自西向东蜿蜓于塔里木盆地北部,上游地区大多流经起伏不平的戈壁荒漠,所以河水的含沙量大,很不稳定,被称为“无缰的野马”,已知阿克苏河,和田河和叶尔羌河的含沙量和流量比(见表),则塔里木河河水的含沙量约为(
)三河河水的含沙量和流量比河的名称含沙量流量比阿克苏河和田河叶尔羌河3.86SKIPIF1<09.85SKIPIF1<03.2SKIPIF1<0721A.3.333SKIPIF1<0 B.4.060SKIPIF1<0C.4.992SKIPIF1<0 D.5.637SKIPIF1<04.(2022·江西赣州·二模(理))一组数据按从小到大排列为2,3,3,x,7,10,若这组数据的平均数是中位数的SKIPIF1<0倍,则下列说法错误的是(
)A.SKIPIF1<0 B.众数为3 C.中位数为4 D.方差为SKIPIF1<05.(2022·陕西商洛·二模(文))数据SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,…,SKIPIF1<0的平均数为SKIPIF1<0,数据SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,…,SKIPIF1<0的平均数为SKIPIF1<0,则数据SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,…,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,…,SKIPIF1<0的平均数为(
)A.SKIPIF1<0 B.SKIPIF1<0C.SKIPIF1<0 D.SKIPIF1<06.(2022·河南河南·三模(理))一支田径队有男运动员48人,女运动员36人,用分层抽样的方法从全体运动员中抽取一个容量为7的样本,抽出的男运动员平均身高为SKIPIF1<0,抽出的女运动员平均身高为SKIPIF1<0,估计该田径队运动员的平均身高是(
)A.SKIPIF1<0 B.SKIPIF1<0 C.SKIPIF1<0 D.SKIPIF1<07.(2022·辽宁葫芦岛·一模)有一组样本数据SKIPIF1<0,SKIPIF1<0,…,SKIPIF1<0,由这组数据得到新样本数据,SKIPIF1<0,SKIPIF1<0,…,SKIPIF1<0,其中SKIPIF1<0,c为非零常数,则(
)A.两组样本数据的样本方差相同 B.两组样本数据的样本众数相同C.两组样本数据的样本平均数相同 D.两组样本数据的样本中位数相同8.(2022·天津·二模)为了检查“双减”政策落实效果,某校邀请学生家长对该校落实效果进行评分.现随机抽取100名家长进行评分调查,发现他们的评分都在40—100之间,将数据按SKIPIF1<0SKIPIF1<0分成6组,整理得到如图所示的频率分布直方图,则在抽取的家长中,评分落在区间SKIPIF1<0内的人数是(
)A.55 B.75 C.80 D.85二、多选题1.(2022·辽宁大连·二模)为评估一种农作物的种植效果,选了10块地作试验田.这10块地的亩产量(单位:kg)互不相等,且从小到大分别为SKIPIF1<0,则下列说法正确的有(
)A.SKIPIF1<0的平均数可以用来评估这种农作物亩产量稳定程度B.SKIPIF1<0的标准差可以用来评估这种农作物亩产量稳定程度C.SKIPIF1<0可以用来评估这种农作物亩产量稳定程度D.SKIPIF1<0的中位数为SKIPIF1<02.(2022·重庆·三模)已知一组样本数据:4,4,5,7,7,7,8,9,9,10.关于这组样本数据,结论正确的是(
)A.平均数为8 B.众数为7 C.极差为6 D.中位数为8三、解答题1.(2022·黑龙江·哈九中三模(文))某经销商采购了一批水果,根据某些评价指标进行打分,现从中随机抽取20筐(每筐1kg),得分数据如下:17,23,29,31,34,40,46,50,51,51,58,62,62,68,71,78,79,80,85,95.根据以往的大数据认定:得分在区间SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0内的分别对应四级、三级、二级、一级.(1)试求这20筐水果得分的平均数.(2)用样本估计总体,经销商参考以下两种销售方案进行销售;方案1:将得分的平均数换算为等级,按换算后的等级出售;方案2:分等级出售.不同等级水果的售价如下表所示:等级一级二级三级四级售价(万元/吨)21.81.41.2请从经销商的角度,根据售价分析采用哪种销售方案较好,并说明理由.2.(2022·贵州遵义·三模(文))某中学在2021年高考分数公布后对高三年级各班的成绩进行分析.经统计,某班有50名同学,总分都在区间SKIPIF1<0内,将得分区间平均分成5组,统计频数、频率后,得到了如图所示的“频率分布”折线图.(1)请根据频率分布折线图,画出频率分布直方图;(2)根据频率分布直方图估计该班级的平均分.题型三:统计案例一、单选题1.(2022·全国·高三专题练习(理))为保障食品安全,某监管部门对辖区内一家食品企业进行检查,现从其生产的某种产品中随机抽取100件作为样本,并以产品的一项关键质量指标值为检测依据,整理得到如下的样本频率分布直方图.若质量指标值在SKIPIF1<0内的产品为一等品,则该企业生产的产品为一等品的概率约为(
)A.0.38 B.0.61C.0.122 D.0.752.(2022·全国·高三专题练习(理))某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了如图所示的折线图.根据该折线图,下列结论错误的是(
)A.月接待游客量逐月增加B.年接待游客量逐年增加C.各年的月接待游客量高峰期大致在7,8月D.各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳3.(2022·全国·高三专题练习)某地区经过一年的新农村建设,农村的经济收入增加了一倍.实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例.得到如下饼图:则下面结论中不正确的是A.新农村建设后,种植收入减少B.新农村建设后,其他收入增加了一倍以上C.新农村建设后,养殖收入增加了一倍D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半4.(2022·天津·高三专题练习)某学校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是17.5,30],样本数据分组为17.5,20),20,22.5),22.5,25),25,27.5),27.5,30).根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是A.56 B.60 C.140 D.120二、多选题5.(2022·湖南娄底·高三期末)2017年3月,由国家信息中心“一带一路”大数据中心等编写的《“一带一路”贸易合作大数据报告(2017)》发布,呈现了我国与“一带一路”沿线国家的贸易成果现状报告.贸易顺差额=贸易出口额-贸易进口额.由数据分析可知,在2011年到2016年这六年中(
).中国与“一带一路”沿线国家出口额和进口额(亿美元)A.2016年中国与沿线国家贸易进口额最小B.中国与沿线国家贸易进口额的中位数为4492亿美元C.中国与沿线国家贸易出口额逐年递增D.中国与沿线国家贸易顺差额逐年递增6.(2022·江苏·高三专题练习)江西省重点中学协作体于2020年进行了一次校际数学竞赛,共有100名同学参赛,经过评判,这100名参赛者的得分都在SKIPIF1<0之间,其得分的频率分布直方图如图,则下列结论正确的是(
)A.得分在SKIPIF1<0之间的共有40人B.从这100名参赛者中随机选取1人,其得分在SKIPIF1<0
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年乌海小型客运从业资格证理论考试题
- 吉首大学《国际贸易实务A》2021-2022学年第一学期期末试卷
- 《机械设计基础》-试卷9
- 吉林艺术学院《图案与装饰》2021-2022学年第一学期期末试卷
- 浙江省2023年中考数学一轮复习:数据分析初步 练习题
- 2024年公园铺砖工程合同范本
- 2024年大学生兼职保密协议书模板
- 吉林师范大学《西方音乐史与名作欣赏Ⅱ》2021-2022学年第一学期期末试卷
- 软件服务许可使用协议书范文范本
- 【初中数学】求代数式的值第1课时直接求代数式的值 2024-2025学年人教版七年级数学上册
- 2024浙江绍兴市人才发展集团第1批招聘4人(第1号)高频难、易错点500题模拟试题附带答案详解
- 幼儿园说课概述-课件
- 冠状动脉介入风险预测评分的临床应用
- 35导数在经济中的应用
- 苏科版(2024新版)七年级上册数学期中学情评估测试卷(含答案)
- 部编版《道德与法治》三年级上册第10课《父母多爱我》教学课件
- 大语言模型赋能自动化测试实践、挑战与展望-复旦大学(董震)
- 期中模拟检测(1-3单元)2024-2025学年度第一学期西师大版二年级数学
- 气管插管操作规范(完整版)
- 2024-2025学年外研版英语八年级上册期末作文范文
- 四级劳动关系协调员试题库含答案
评论
0/150
提交评论