93统计案例公司员工的肥胖情况调查分析(讲义例题小练)-2021-2022学年高一数学课堂抄重点讲义(人教A版2019)_第1页
93统计案例公司员工的肥胖情况调查分析(讲义例题小练)-2021-2022学年高一数学课堂抄重点讲义(人教A版2019)_第2页
93统计案例公司员工的肥胖情况调查分析(讲义例题小练)-2021-2022学年高一数学课堂抄重点讲义(人教A版2019)_第3页
93统计案例公司员工的肥胖情况调查分析(讲义例题小练)-2021-2022学年高一数学课堂抄重点讲义(人教A版2019)_第4页
93统计案例公司员工的肥胖情况调查分析(讲义例题小练)-2021-2022学年高一数学课堂抄重点讲义(人教A版2019)_第5页
已阅读5页,还剩16页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

9.3统计案例公司员工的肥胖情况调查分析统计分析报告的主要组成部分1.标题2.前言:简单交代调查的目的、方法、范围等背景情况,使读者了解调查的基本情况.3.主体:展示数据分析的全过程:(1)首先明确所关心的问题是什么,说明数据蕴含的信息;(2)根据数据分析的需要,说明如何选择合适的图表描述和表达数据;(3)从样本数据中提取能刻画其特征的量,用于分析比较;(4)通过样本估计总体的统计规律,分析总体的情况.4.结尾:对主体部分的内容进行概括,给出解决问题的方法和对策.教材拓展补遗[微判断]1.用于样本数据分析的统计图表主要有条形图、扇形图、折线图、频率分布直方图等.(√)2.反映样本数据的集中趋势的特征量有平均数、中位数、众数等.(√)3.反映样本数据的离散程度的特征量有方差和标准差.(√)[微思考]进行数据分析的过程是什么?提示(1)明确主题,说明数据信息;(2)选择图表描述和表达数据;(3)计算样本数据的特征量;(4)估计统计规律.题型一数据分析过程的探究【例1】为了实施“精准扶贫”战略,农科院试种了甲、乙两个西红柿新品种,从这两个品种中各任选5株,测量其产量(单位:kg),得到如下数据:甲6080709070乙8060708075利用上述数据,现从中选出一个品种推荐给农民种植,应该推荐哪个品种呢?[描述数据]使用折线图描述数据如下:从折线图上可以看出甲品种的平均产量稍高,但其产量不稳定;乙品种的产量稍低,但其产量较稳定.[计算特征量]甲品种的平均产量为eq\o(x,\s\up6(-))甲=74(kg),乙品种的平均产量为eq\o(x,\s\up6(-))乙=73(kg),所以甲品种的平均产量稍高;甲品种的方差是seq\o\al(2,甲)=eq\f(1,5)(142+62+42+162+42)=104,乙品种的方差是seq\o\al(2,乙)=eq\f(1,5)(72+132+32+72+22)=56,由于seq\o\al(2,甲)>seq\o\al(2,乙),所以乙品种的产量较稳定.举一反三1.为了保证食品安全,保障公众身体健康和生命安全,2018年国家对《食品安全法》进行了修正.2020年春节前夕,某市质检部门随机抽取了20包某种品牌的速冻水饺,对某项质量指标进行检测.经统计,质量指标均在区间[0,50]内,将其按[0,10)、[10,20)、[20,30)、[30,40)、[40,50]分成5组,制成如图所示的频率分布直方图.则该频率分布直方图中x的值为___________;若同组中的每个数据用该组区间中点值代替,则估计该品牌速冻水饺的该项质量指标的平均值为___________;【答案】

0.015

22.5【解析】【分析】第一空利用频率之和为1,列出等式可求;第二空用每个直方图的组中值乘以其对应的频率最后相加即可.【详解】∵质量指标均在区间[0,50]内,∴(2x+0.030×2+0.010)×10=1,解得x=0.015,∴该频率分布直方图中x的值为0.015.各组的频率分别为0.15,0.3,0.3,0.15,0.1,各组区间中点值分别为5,15,25,35,45,∴平均值为:5×0.15+15×0.3+25×0.3+35×0.15+45×0.1=22.5,∴估计该品牌速冻水饺的该项质量指标的平均值为22.5.故答案为:0.015;22.52为了备战下届奥运会,甲、乙两名运动员在相同条件下各射击10次,得到如下数据:甲射击10次中靶环数分别为:9,5,7,8,7,6,8,6,7,7.乙射击10次中靶环数分别为:2,4,6,8,7,7,8,9,9,10.射击队教练希望利用此次射击成绩为依据,挑选一名运动员参加奥运会,请你帮助教练分析两个运动员的成绩,并作出判断.[描述数据]用折线图描述数据如下图所示:由折线图可以看出甲运动员的成绩较稳定.[计算特征量]甲射击10次中靶环数由小到大排列为5,6,6,7,7,7,7,8,8,9.乙射击10次中靶环数由小到大排列为2,4,6,7,7,8,8,9,9,10.运动员甲的平均成绩eq\o(x,\s\up6(-))甲=eq\f(1,10)×(5+6×2+7×4+8×2+9)=7(环),运动员乙的平均成绩eq\o(x,\s\up6(-))乙=eq\f(1,10)×(2+4+6+7×2+8×2+9×2+10)=7(环),运动员甲的方差seq\o\al(2,甲)=eq\f(1,10)×[(5-7)2+(6-7)2×2+(7-7)2×4+(8-7)2×2+(9-7)2]=eq\f(1,10)×(4+2+0+2+4)=1.2,运动员乙的方差seq\o\al(2,乙)=eq\f(1,10)×[(2-7)2+(4-7)2+(6-7)2+(7-7)2×2+(8-7)2×2+(9-7)2×2+(10-7)2]=eq\f(1,10)×(25+9+1+0+2+8+9)=5.4.比较如下:平均数方差命中9环及9环以上的次数甲71.21乙75.43①∵平均数相同,seq\o\al(2,甲)<seq\o\al(2,乙),∴甲成绩比乙稳定.②∵平均数相同,命中9环及9环以上的次数甲比乙少,∴乙成绩比甲好些.③甲成绩在平均数上下波动;而乙处于上升势头,从第三次以后就没有比甲少的情况发生,乙更有潜力.3.如图,从参加环保知识竞赛的学生中抽出名,将其成绩(均为整数)整理后画出的频率分布表和频率分布直方图如下,回答下列问题:分组人数频率[39.5,49.5)a0.10[49.5,59.5)9x[59.5,69.5)b0.15[69.5,79.5)180.30[79.5,89.5)15y[89.5,99.5]30.05(1)分别求出的值,并补全频率分布直方图;(2)估计这次环保知识竞赛平均分;(3)若从所有参加环保知识竞赛的学生中随机抽取一人采访,抽到的学生成绩及格的概率有多大?【答案】(1),,,(2)70.5(3)0.75【解析】【分析】(1)根据频率分布表的相关计算即可求出的值,再作出频率分布直方图.(2)用组中给出的数据代入相应的公式即可估计平均分(3)本题考察的是某一组的概率问题,先求出满足条件的本次竞赛及格率,用样本估计总体,每个人被抽到的概率相同,故可以求出抽到的学生成绩几个的概率.【详解】(1),,,(2)用组中值估计平均分:(3)本次竞赛及格率为:,用样本估计总体,每个人被抽到的概率相同,∴从所有参加环保知识竞赛的学生中随机抽取一人采访,抽到的学生成绩及格的概率为.考点:(1)互斥事件的概率加法公式(2)频率分布表题型二统计案例分析活动的探究和统计分析报告的撰写【例2】阶梯电价的设计一、背景与数据为了实现绿色发展,践行“绿水青山就是金山银山”的发展理念,避免浪费能源,某市政府计划对居民用电采用阶梯收费的方法.为此,相关部门在该市随机调查了200户居民六月份的用电量(单位:kW·h),以了解这个城市家庭用电量的情况.数据如下:10710178992081277422331131214135896660115189135146127203979662651115615110681629167932121596163178194194216101981397811019210596225013825112011210020198841372032601341566170100721641741319310016380769515218288247191701304911411016320226518941461491471773395710910718210114827428982213165224142611081379025420183253113130821701101086325023712084154288170123172319621331301271077196140771061321061351321678225854251107699872481091342504232011318014411653020017413516046213913330419128312113211813412417820662612027414180187883241364981697757二、任务与要求根据以上数据,应当如何确定阶梯电价中的电量临界值,才能使得电价更为合理?三、问题的解决[问题分析]选取六月份调查,是因为这个城市六月份的部分时间需要使用空调,因此六月份的用电量在一年12个月中处于中等偏上水平.如果阶梯电价临界值的确定依赖于居民月用电量的分布,例如计划实施3阶的阶梯电价,有人给出一个分布如下:75%用户在第一档(最低一档),20%用户在第二档,5%用户在第三档(最高一档).这样,需要通过样本数据估计第一档与第二档、第二档与第三档的两个电量临界值,即75%和95%这两个电量临界值.利用电子表格软件,对上面的样本数据进行排序,可以得到下面的结果:81822314248495051565757606161616262636365666769707071727274767777787880808282828384848888899091939394959696969798989899100100100101101101105106106106107107107107108108109109110110110111112113113114115116118120120120121123124127127127130130130131131132132132133133134134134135135135135136137137138139139140141142144416146147148149151152154156159160162163163164165167169170170172174174177178178180182182187189191191192194194200201201202203203206208212213214216223224237247250250251253254258260265274274283288289304319320324339462498530542626[特征量分析](1)样本数据总共有200个,最小值是8,最大值是626,说明200户居民六月份的最小用电量为8kW·h,最大用电量为626kW·h,极差为618.(2)因为数据量是200,那么这组数据的样本中位数就是有序样本第100个数130和第101个数130的平均数,即130,说明这个城市六月份居民用电量的中间水平大约在130kW·h左右.(3)因为200×75%=150,所以第一个临界值为有序样本中第150个数178和第151个数178的平均数,仍然是178.因为200×95%=190,所以第二个临界值为有序样本中第190个数289和第191个数304的平均数,这个平均数为296.5(因为是对第百分位数的估计,估计值可以是289和304之间任何一个数,为了便于操作可以取值为297).[解决问题]依据确定了的电量临界值,阶梯电价可以规定如下:(1)用户每月用电量不超过178kW·h(或每年用电量不超过2136kW·h),按第一档电价标准缴费;(2)每月用电量(单位:kW·h)在区间(178,297]内(或每年用电量在区间(2136,3564]内),其中的178kW·h按第一档电价标准缴费,超过178kW·h的部分按第二档电价标准缴费;(3)每月用量超过297kW·h(或每年用电量超过3564kW·h),其中的178kW·h按第一档电价标准缴费,119kW·h按第二档电价标准缴费,超过297kW·h的部分按第三档电价标准缴费.社会上对这种制定阶梯电价的原则和方法存在不同意见,可以讨论制定合理阶梯电价的原则和方法.举一反三大数据配合乔布斯癌症治疗苹果创始人乔布斯是世界上第一个对自身所有DNA和肿瘤DNA进行排序的人.为此,他支付了高达几十万美元的费用.他得到的不是样本,而是包括整个基因的数据文档.医生按照所有基因按需下药,最终这种方式帮助乔布斯延长了好几年的生命.这是一个著名的数据分析案例.问题你知道什么是统计数据分析吗?提示数据分析是指用适当的统计分析方法对收集来的大量数据进行分析,提取有用信息和形成结论而对数据加以详细研究和概括总结的过程.这一过程也是质量管理体系的支持过程.在实用中,数据分析可帮助人们作出判断,以便采取适当行动.巩固提升一、单选题1.某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了如图所示的折线图.根据该折线图,下列结论错误的是(

)A.月接待游客量逐月增加B.年接待游客量逐年增加C.各年的月接待游客量高峰期大致在7,8月D.各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳【答案】A【解析】【分析】观察折线图,结合选项逐一判断即可【详解】对于选项A,由图易知月接待游客量每年7,8月份明显高于12月份,故A错;对于选项B,观察折线图的变化趋势可知年接待游客量逐年增加,故B正确;对于选项C,观察折线图,各年的月接待游客量高峰期大致在7,8月份,故C正确;对于D选项,观察折线图,各年1月至6月的月接待游客量相对7月至12月,波动性更小,变化比较平稳,故D正确.故选:A2.2021年起,我市将试行“3+1+2”的普通高考新模式,即除语文、数学、外语3门必选科目外,考生再从物理、历史中选1门,从化学、生物、地理、政治中选2门作为选考科目.为了帮助学生合理选科,某中学将高一每个学生的六门科目综合成绩按比例均缩放成5分制,绘制成雷达图.甲同学的成绩雷达图如图所示,下面叙述一定不正确的是(

)A.甲的化学成绩领先年级平均分最多.B.甲有2个科目的成绩低于年级平均分.C.甲的成绩最好的前两个科目是化学和地理.D.对甲而言,物理、化学、地理是比较理想的一种选科结果.【答案】A【解析】【分析】根据雷达图,对四个选项逐个分析,可选出答案.【详解】根据雷达图,可知物理成绩领先年级平均分最多,即A错误;甲的政治、历史两个科目的成绩低于年级平均分,即B正确;甲的成绩最好的前两个科目是化学和地理,即C正确;对甲而言,物理成绩比年级平均分高,历史成绩比年级平均分低,而化学、生物、地理、政治中优势最明显的两科为化学和地理,故物理、化学、地理的成绩是比较理想的一种选科结果,即D正确.故选:A.【点睛】本题考查统计知识,涉及到雷达图的识别及应用,考查学生识图能力、数据分析能力,是一道容易题.3.某射手在一次训练中五次射击的成绩分别为9.4,9.4,9.4,9.6,9.7,则该射手五次射击的成绩的方差是()A.0.127 B.0.016 C.0.08 D.0.216【答案】B【解析】【详解】=×(9.4+9.4+9.4+9.6+9.7)=9.5,所以s2=×[(9.49.5)2+(9.49.5)2+(9.49.5)2+(9.69.5)2+(9.79.5)2]=0.016,故选B.4.《西游记》《三国演义》《水浒传》和《红楼梦》是中国古典文学瑰宝,并称为中国古典小说四大名著.某中学为了解本校学生阅读四大名著的情况,随机调查了100学生,其中阅读过《西游记》或《红楼梦》的学生共有90位,阅读过《红楼梦》的学生共有80位,阅读过《西游记》且阅读过《红楼梦》的学生共有60位,则该校阅读过《西游记》的学生人数与该校学生总数比值的估计值为A. B. C. D.【答案】C【解析】根据题先求出阅读过西游记的人数,进而得解.【详解】由题意得,阅读过《西游记》的学生人数为9080+60=70,则其与该校学生人数之比为70÷100=0.7.故选C.【点睛】本题考查容斥原理,渗透了数据处理和数学运算素养.采取去重法,利用转化与化归思想解题.5.演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是A.中位数 B.平均数C.方差 D.极差【答案】A【解析】【分析】可不用动笔,直接得到答案,亦可采用特殊数据,特值法筛选答案.【详解】设9位评委评分按从小到大排列为.则①原始中位数为,去掉最低分,最高分,后剩余,中位数仍为,A正确.②原始平均数,后来平均数平均数受极端值影响较大,与不一定相同,B不正确③由②易知,C不正确.④原极差,后来极差可能相等可能变小,D不正确.【点睛】本题旨在考查学生对中位数、平均数、方差、极差本质的理解.6.[2019·牡丹江一中]某校从参加高一年级期末考试的学生中抽取60名学生的成绩(均为整数),其成绩的频率分布直方图如图所示,由此估计此次考试成绩的中位数,众数和平均数分别是A.73.3,75,72 B.73.3,80,73C.70,70,76 D.70,75,75【答案】A【解析】【分析】由频率分布直方图,求出这组数据的中位数、众数和平均数.【详解】由频率分布直方图知,小于70的有24人,大于80的有18人,则在[70,80]之间18人,所以中位数为7073.3;众数就是分布图里最高的小矩形底边的中点,即[70,80]的中点横坐标,是75;平均数为45×0.05+55×0.15+65×0.20+75×0.30+85×0.25+95×0.05=72.故选A.【点睛】本题考查了利用频率分布直方图求中位数、平均数和众数的应用问题,是基础题.二、多选题7.某旅游城市为向游客介绍本地的气温情况,绘制了一年中各月平均最高气温和平均最低气温的雷达图.图中点表示十月的平均最高气温约为,点表示四月的平均最低气温约为.下面叙述正确的有(

)A.各月的平均最低气温都在以上B.七月的平均温差比一月的平均温差大C.三月和十一月的平均最高气温基本相同D.平均最高气温高于的月份有5个【答案】ABC【解析】【分析】根据雷达图提供的数据判断各选项可得.【详解】对于选项A,由图易知各月的平均最低气温都在以上,A正确;对于选项B,七月的平均最高气温点与平均最低气温点间的距离大于一月的平均最高气温点与平均最低气温点间的距离,所以七月的平均温差比一月的平均温差大,B正确;对于选项C,三月和十一月的平均最高气温均为,所以C正确;对于选项D,平均最高气温高于的月份有七月、八月,共2个月份,故D错误.故选:ABC.8.某地区城乡居民储蓄存款年底余额(单位:亿元)变化情况如图所示,下列判断一定正确的是(

)A.该地区城乡居民储蓄存款年底余额总数逐年上升B.到年农村居民存款年底总余额已超过了城镇居民存款年底总余额C.城镇居民存款年底余额逐年下降D.年城乡居民存款年底余额增长率大约为【答案】AD【解析】结合扇形图与条形图分析对比,对选项逐一分析判断.【详解】由条形图可知,余额总数逐年上升,故A项正确;由城乡储蓄构成百分比可知,年农村居民存款年底总余额占,城镇居民存款年底总余额占,没有超过,故B项错误;城镇居民存款年底余额所占的比重逐年下降,但城镇居民存款年底余额年,年,年分别为(亿元),(亿元),(亿元),总体不是逐年下降的,故C项错误,年城乡居民存款年底余额增长率大约为,故D项正确.故选:AD.三、填空题9.甲、乙两套设备生产的同类型产品共48000件,采用分层随机抽样的方法从中抽取一个容量为80的样本进行质量检测若样本中有50件产品由甲设备生产,则乙设备生产的产品总数为________件.【答案】18000【解析】根据样本容量为80,可得抽取的比例,再求得样本中由乙设备生产的产品数,乙设备生产的产品总数.【详解】解:∵样本中有50件产品由甲设备生产,样本中有30件产品由乙设备生产,则乙设备生产的产品总数为(件)故答案为:【点睛】本题考查了分层抽样方法,熟练掌握分层抽样方法的特征是解题的关键.10.为了考查某校各班参加课外书法小组的人数,在全校随机抽取5个班级,把每个班级参加该小组的认为作为样本数据.已知样本平均数为7,样本方差为4,且样本数据互相不相同,则样本数据中的最大值为___________.【答案】10【解析】【详解】试题分析:设样本数据为:若样本数据中的最大值为11,不妨设,由于样本数据互不相同,与这是不可能成立的,若样本数据为4,6,7,8,10,代入验证知两式均成立,此时样本数据中的最大值为10考点:1.总体分布的估计;2.极差、方差与标准差四、解答题11.某地教育部门对某学校学生的阅读素养进行检测,在该校随机抽取了名学生进行检测,实行百分制,现将所得的成绩按照分成6组,并根据所得数据作出了如下所示的频数与频率

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论