版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第04讲用样本估计总体【学习目标】1.能根据实际问题的特点,选择恰当的统计图表对数据进行可视化描述,体会合理使用统计图表的重要性.2.结合实例,能用样本估计总体的集中趋势参数(平均数、中位数、众数),3.结合实例,理解集中趋势参数的统计含义,能用样本估计总体的离散程度参数(标准差、方差、极差),4.结合实例,理解离散程度参数的统计含义,5.能用样本估计总体的取值规律,能用样本估计百分位数,理解百分位数的统计含义【基础知识】一、频率分布直方图1.制作频率分布直方图的步骤第一步:求极差,决定组数和组距,组距=eq\f(极差,组数);第二步:分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间;第三步:登记频数,计算频率,列出频率分布表;第四步:画频率分布直方图。2.解决频率分布直方图问题时要抓住3个要点(1)直方图中各小长方形的面积之和为1.(2)直方图中纵轴表示eq\f(频率,组距),故每组样本的频率为组距×eq\f(频率,组距),即矩形的面积.(3)直方图中每组样本的频数为频率×总体数.二、样本的数字特征1.众数:在一组数据中,出现次数最多的数据叫做这组数据的众数.2.中位数:将一组数据按大小依次排列,把处在中间位置的一个数据(或中间两个数据的平均数)叫做这组数据的中位数3.平均数:样本数据的算术平均数,即.4.百分位数:求总体百分位数的估计,首先要从小到大排列数据,然后计算出i=n×p%,当i不是整数要取整,当i是整数,则百分位数为第i项与第(i+1)项数据的平均数.5.方差与标准差(1)标准差是样本数据到平均数的一种平均距离.(2)方差:(是样本数据,是样本容量,是样本平均数).(3)标准差:.6.平均数、方差公式的推广若数据x1,x2,…,xn的平均数为eq\o(x,\s\up6(-)),方差为s2,则数据mx1+a,mx2+a,…,mxn+a的平均数为meq\o(x,\s\up6(-))+a,方差为m2s2.7.平均数和方差是重要的数字特征,是对总体的一种简明的阐述.平均数描述总体的平均水平,方差反映了数据偏离于平均数的程度,它们从整体和全局上刻画了总体特征,是生产实际中用于方案取舍的重要的理论依据,一般先比较平均数,若平均数相同,再用方差来决定.8.用频率分布直方图估计众数、中位数、平均数的方法(1)众数为频率分布直方图中最高矩形底边中点横坐标;(2)中位数为平分频率分布直方图面积且垂直于横轴的直线与横轴交点的横坐标;(3)平均数等于每个小矩形面积与小矩形底边中点横坐标之积的和。三、统计图1.统计图是利用点、线、面、体等绘制成几何图形,以表示各种数量间的关系及其变动情况的工具.其中有条形统计图、扇形统计图、折线统计图、象形图等.其特点是:形象具体、简明生动、通俗易懂、一目了然.其主要用途有:表示现象间的对比关系;揭露总体结构;检查计划的执行情况;揭示现象间的依存关系,反映总体单位的分配情况;说明现象在空间上的分布情况.一般采用直角坐标系.横坐标用来表示事物的组别或自变量x,纵坐标常用来表示事物出现的次数或因变量y;或采用角度坐标(如圆形图)、地理坐标(如地形图)等.2.茎叶图的画法步骤第一步:将每个数据分为茎(高位)和叶(低位)两部分;第二步:将最小茎与最大茎之间的数按大小次序排成一列;第三步:将各个数据的叶依次写在其茎的两侧.3.折线图折线图是用直线段将各数据点连接起来而组成的图形,以折线方式显示数据的变化趋势.折线图可以显示随时间(根据常用比例设置)而变化的连续数据,因此非常适用于显示在相等时间间隔下数据的趋势.在折线图中,类别数据沿水平轴均匀分布,所有值数据沿垂直轴均匀分布.另外,在折线图中,数据是递增还是递减、增减的速率、增减的规律(周期性、螺旋性等)、峰值等特征都可以清晰地反映出来.所以,折线图常用来分析数据随时间的变化趋势,也可用来分析多组数据随时间变化的相互作用和相互影响.例如可用来分析某类商品或是某几类相关的商品随时间变化的销售情况,从而进一步预测未来的销售情况.在折线图中,一般x轴用来表示时间的推移,并且间隔相同;而y轴代表不同时刻的数据的大小.四、频率分布折线图和总体密度曲线1.频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.2.总体密度曲线:随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.【考点剖析】考点一:频率分布直方图例1.(2022学年河北省邢台市卓越联盟高一下学期第三次月考)为了解学生在“弘扬传统文化,品读经典文学”月的阅读情况,现从全校学生中随机抽取了部分学生,并统计了他们的阅读时间(阅读时间),分组整理数据得到如图所示的频率分布直方图.则图中a的值为(
)A.0.028 B.0.029 C.0.280 D.0.290【答案】A【解析】由得.故选A考点二:折线图例2.(2022学年山东省滨州市阳信县高一下学期期中)走路是“最简单、最优良的锻炼方式”,它不仅可以帮助减肥,还可以增强心肺功能、血管弹性、肌肉力量等.下图为甲、乙两名同学在同一星期内日步数的折线统计图,则下列结论中不正确的是(
)A.这一星期内甲的日步数的中位数为11600 B.这一星期内甲的日步数的平均值大于乙C.这一星期内甲的日步数的方差大于乙 D.这一星期内乙的日步数的30%分位数是7030【答案】D【解析】对于A:甲的步数:16000,7965,12700,2435,16800,9500,11600.从小到大排列为:2435,7965,9500,11600,12700,16000,16800.中位数是11600.故A正确;对于B:,.所以.故B正确;对于C:所以.故C正确;甲的步数从小到大排列为:5340,7030,10060,11600,12300,12970,14200,,故这一星期内乙的日步数为分位数是10060,故D错误.故选D.考点三:其他统计图表例3.(多选)(2020-2021学年湖南师范大学附属中学高一下学期期末)中兴、华为事件暴露了我国计算机行业中芯片、软件两大短板,为防止“卡脖子”事件的再发生,科技专业人才就成了决胜的关键.为了解我国在芯片、软件方面的潜力,某调查机构对我国若干大型科技公司进行调查统计,得到了这两个行业从业者的年龄分布的饼形图和“90后”从事这两个行业的岗位分布雷达图,则下列说法中正确的是(
)A.芯片、软件行业从业者中,"90后”占总人数的比例超过60%B.芯片、软件行业中从事技术、设计岗位的"90后”人数超过总人数的25%C.芯片、软件行业从事技术岗位的人中,“90后”比“80后”多D.芯片、软件行业中,“90后”从事市场岗位的人数比“80前”的总人数多【答案】BD【解析】对于A,由饼形图知,芯片、软件行业从业者中,"90后”占总人数的比例为55%,没超过60%,A不正确;对于B,由雷达图和饼形图知,芯片、软件行业中从事技术、设计岗位的"90后”人数占总人数的,B正确;对于C,芯片、软件行业从事技术岗位的人中,“90后”占总人数的,而“80后”占总人数的40%,从事技术岗位的人数比例不知,无法确定两者间的大小关系,C不正确;对于D,芯片、软件行业中,从事市场岗位的“90后”人数占总人数的,而“80前”总数占总人数的5%,D正确.故选BD考点四:众数与中位数例4.(多选)(2022学年吉林省长春市第二实验中学高一下学期期中)某人射箭10次,射中的环数依次为:8,7,8,9,7,6,9,8,10,8关于这组数据,下列说法正确的是(
)A.这组数据的众数是8 B.这组数据的平均数是8C.这组数据的中位数是8 D.这组数据的方差是【答案】ABCD【解析】数据从小到大排列为:,所以众数为,A选项正确;中位数为,C选项正确;平均数为,所以B选项正确;方差为,所以D选项正确.故选ABCD考点五:百分位数例5.(2022学年山西省太原市第五中学校高一下学期5月阶段性检测)互不相等的5个正整数从小到大排序为1,,,,,若它们的和为18,且其分位数是分位数的2倍,则的值为_________.【答案】【解析】因为,所以这组数据的分位数为,同理可知这组数据的分位数为,据题意有,若,则这5个数为1,3,,6,,由,,,知,不满足题意,所以,则这5个数为1,2,,4,,由,,知,由,知.考点六:平均数与方差例6.已知某省二、三、四线城市数量之比为1∶3∶6,2019年8月份调查得知该省所有城市房产均价为1.2万元/平方米,方差为20,二、三、四线城市的房产均价分别为2.4万元/平方米,1.8万元/平方米,0.8万元/平方米,三、四线城市房价的方差分别为10,8,则二线城市房价的方差为________.【答案】【解析】设二线城市的房价的方差为,由题意可知解得,即二线城市房价的方差为.考点七:用样本估计总体例7.(2022学年福建省德化一中、永安一中、漳平一中三校协作高一5月联考)2021年根据移动通信协会监测,某校全体教师通讯费用(单位:元)如图所示,数据分组依次为[20,40),[40,60),[60,80),[80,100].(1)若该校有200名教师,采用分层抽样的方法从这200名教师中抽取容量为20的样本,求每组应抽取的样本量;(2)估计该校教师话费的80%分位数;(3)估计该校教师通讯费用的众数和平均数.【解析】(1)采用分层抽样的方法从这200名该校教师中抽取容量为20的样本,即费用(单位:元)在[20,40)中抽取2位教师在[40,60)中抽取4位教师.在[60,80)中抽取8位教师在[80,100]中抽取6位教师.(2)该校教师话费在80元以下的频率为:,该校教师话费在[80,100]的频率为0.3,因此,该校教师话费的80%分位数在[80,100]内,由.可以估计该校教师话费的80%分位数为.(3)该校教师通讯费用的众数为70;平均数为:考点八:平均数与方差的实际应用例8.为了比较两种治疗失眠症的药(分别称为A药,B药)的疗效,随机地选取20位患者服用A药,20位患者服用B药,这40位患者在服用一段时间后,记录他们日平均增加的睡眠时间(单位:h).试验的观测结果如下:服用A药的20位患者日平均增加的睡眠时间:0.61.22.71.52.81.82.22.33.23.52.52.61.22.71.52.93.03.12.32.4服用B药的20位患者日平均增加的睡眠时间:3.21.71.90.80.92.41.22.61.31.41.60.51.80.62.11.12.51.22.70.5分别计算两组数据的平均数,从计算结果看,估计哪种药的疗效更好?【解析】设A药观测数据的平均数为,B药观测数据的平均数为.由观测结果可得=×(0.6+1.2+1.2+1.5+1.5+1.8+2.2+2.3+2.3+2.4+2.5+2.6+2.7+2.7+2.8+2.9+3.0+3.1+3.2+3.5)=2.3,=×(0.5+0.5+0.6+0.8+0.9+1.1+1.2+1.2+1.3+1.4+1.6+1.7+1.8+1.9+2.1+2.4+2.5+2.6+2.7+3.2)=1.6.由以上计算结果可得>,因此可以估计A药的疗效更好【真题演练】1.(多选)(2021新高考全国卷Ⅰ卷)有一组样本数据,,,,由这组数据得到新样本数据,,,,其中,2,,,为非零常数,则A.两组样本数据的样本平均数相同 B.两组样本数据的样本中位数相同 C.两组样本数据的样本标准差相同 D.两组样本数据的样本极差相同【答案】CD【解析】对于,两组数据的平均数的差为,故错误;对于,两组样本数据的样本中位数的差是,故错误;对于,标准差,两组样本数据的样本标准差相同,故正确;对于,,2,,,为非零常数,的极差为,的极差为,两组样本数据的样本极差相同,故正确.故选.2.(2021新高考全国卷Ⅱ)下列统计量中,能度量样本的离散程度的是()A.样本的标准差 B.样本的中位数C.样本的极差 D.样本的平均数【答案】AC【解析】由标准差的定义可知,标准差考查的是数据的离散程度;由中位数的定义可知,中位数考查的是数据的集中趋势;由极差的定义可知,极差考查的是数据的离散程度;由平均数的定义可知,平均数考查的是数据的集中趋势;故选AC3.(2021高考全国卷Ⅱ)为了解某地农村经济情况,对该地农户家庭年收入进行抽样调查,将农户家庭年收入的调查数据整理得到如下频率分布直方图:根据此频率分布直方图,下面结论中不正确的是A.该地农户家庭年收入低于4.5万元的农户比率估计为 B.该地农户家庭年收入不低于10.5万元的农户比率估计为 C.估计该地农户家庭年收入的平均值不超过6.5万元 D.估计该地有一半以上的农户,其家庭年收入介于4.5万元至8.5万元之间【答案】C【解析】对于,该地农户家庭年收入低于4.5万元的农户比率为,故选项正确;对于,该地农户家庭年收入不低于10.5万元的农户比率为,故选项正确;对于,估计该地农户家庭年收入的平均值为万元,故选项错误;对于,家庭年收入介于4.5万元至8.5万元之间的频率为,故估计该地有一半以上的农户,其家庭年收入介于4.5万元至8.5万元之间,故选项正确.故选.4.(2018高考全国卷Ⅰ)某地区经过一一年的新农村建设,农村的经济收入增加了一倍,实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如下饼图:则下面结论中不正确的是 ()A.新农村建设后,种植收入减少 B.新农村建设后,其他收入增加了一倍以C.新农村建设后,养殖收入增加了一倍D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半【答案】A【解析】设建设前经济收入为,建设后经济收入为.A项,种植收入37×﹣60%=14%>0,故建设后,种植收入增加,故A项错误.B项,建设后,其他收入为5%×2=10%,建设前,其他收入为4%,故10%÷4%=2.5>2,故B项正确.C项,建设后,养殖收入为30%×2=60%,建设前,养殖收入为30%,故60%÷30%=2,故C项正确.D项,建设后,养殖收入与第三产业收入总和为(30%+28%)×2=58%×2a,经济收入为2,故(58%×2a)÷2a=58%>50%,故D项正确,因为是选择不正确的一项.故选A.5.(2021高考全国卷Ⅰ)某厂研制了一种生产高精产品的设备,为检验新设备生产产品的某项指标有无提高,用一台旧设备和一台新设备各生产了10件产品,得到各件产品该项指标数据如下:旧设备9.810.310.010.29.99.810.010.110.29.7新设备10.110.410.110.010.110.310.610.510.410.5旧设备和新设备生产产品的该项指标的样本平均数分别记为和,样本方差分别记为和.(1)求,,,;(2)判断新设备生产产品的该项指标的均值较旧设备是否有显著提高(如果,则认为新设备生产产品的该项指标的均值较旧设备有显著提高,否则不认为有显著提高).【解析】(1)由题中的数据可得,,,;;(2),,所以,故新设备生产产品的该项指标的均值较旧设备有显著提高.6.(2019高考全国卷Ⅲ)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成两组,每组100只,其中组小鼠给服甲离子溶液,组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:记为事件:“乙离子残留在体内的百分比不低于”,根据直方图得到的估计值为.(1)求乙离子残留百分比直方图中的值;(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).【解析】(1)由已知得,故,.(2)甲离子残留百分比的平均值的估计值为.乙离子残留百分比的平均值的估计值为.【过关检测】1.(2022学年河南省豫西部分名校高一下学期月考)某实验围种植甲、乙两种水稻,面积相等的两块稻田(种植环境相同)连续5次的产量如下:甲/kg260250210250280乙/kg220260230250290则下列说法错误的是(
)A.甲种水稻产量的众数为250B.乙种水稻产量的极差为70C.甲种水稻产量的平均数大于乙种水稻产量的平均数D.甲种水稻产量的方差小于乙种水稻产量的方差【答案】C【解析】根据给定数表知,甲种水稻产量的众数为250,乙种水稻产量的极差为,A,B都正确;甲种水稻产量平均数为,乙种水稻产量平均数为,C错误;甲种水稻产量方差为,乙种水稻产量方差为,D正确.故选C2.(2022学年山东省淄博市博山区、沂源县联考高一6月份月考)排球社的同学为训练动作组织了垫排球比赛,以下为排球社50位同学的垫球个数所做的频率分布直方图,所有同学垫球数都在5——40之间,估计垫球数的样本数据的75%分位数是(
)A.25 B.26 C.27 D.28【答案】D【解析】由已知,根据频率分布直方图可得:垫球数在的人数为,占总数的;垫球数在的人数为,占总数的;垫球数在的人数为,占总数的;垫球数在的人数为,占总数的;垫球数在的人数为,占总数的;垫球数在的人数为,占总数的;垫球数在的人数为,占总数的;因为分位数位于内,由,所以估计垫球数的样本数据的75%分位数是.故选D.3.(2022学年河北省邢台市卓越联盟高一下学期第三次月考)已知某7个数的平均数为4,方差为2,现加入一个新数据4,此时这8个数的平均数为,方差为,则(
)A., B.,C., D.,【答案】D【解析】设7个数为,则,,所以,所以,则这个数的平均数为,方差为.故选D.4.(2022学年山西省高一下学期第三次月考)有一组样本数据,由这组数据得到的另一组数据,,…,,满足(c为非零常数),则下列结论一定成立的是(
)A.两组数据的样本平均数不同 B.两组数据的中位数相同C.两组数据的样本方差相同 D.两组数据的样本标准差不同【答案】C【解析】设的平均数是,,,…,的平均数是,由题意,如果,则,否则,A不正确;同理如果的中位数是,则两者中位数相同,否则不相同,B不正确;设的方差是,,,…,的差是,则,又,,所以,,2,…,n,所以,从而,所以方差相同,标准差也相同,C正确,D不正确,故选C.5.(多选)(2022学年山东省济南市第一中学高一5月月考)根据关于世界人口变化情况的三幅统计图(如图所示),有下列四个结论:①从折线统计图能看出世界人口的变化情况;②2050年非洲人口将达到大约15亿;③2050年亚洲人口比其他各洲人口的总和还要多;④从1957年到2050年各洲中北美洲人口增长速度最慢.其中所有正确结论的编号是(
)A.① B.② C.③ D.④【答案】AC【解析】①从折线统计图能看出世界人口的变化情况,故①正确;②从条形统计图中可得到:2050年非洲人口大约将达到18亿,故②错;③从扇形统计图中能够明显的得到结论:2050年亚洲人口比其他各洲人口的总和还要多,故③正确;④由上述三幅统计图并不能得出从1957年到2050年中哪个洲人口增长速度最慢,故④错误.因此正确的命题有①③.故选AC.6.(多选)(2022学年三湘名校教育联盟高一下学期5月联考)在发生某公共卫生事件期间,有专业机构认为该事件在一段时间没有发生大规模群体感染的标准为“连续天,每天新增疑似病例不超过人”,过去天,甲、乙、丙、丁四地新增疑似病例数据信息如下:甲地:中位数为,极差为;乙地:平均数为,众数为;丙地:平均数为,中位数为;丁地:平均数为,方差为,甲、乙、丙、丁四地中,一定没有发生大规模群体感染的是(
)A.甲地 B.乙地 C.丙地 D.丁地【答案】ACD【解析】甲地的中位数为,极差为,所以,最大值不大于,故A符合;若乙地过去天每天新增疑似病例人数分别为、、、、、、、、、,则满足平均数为,众数为,但不满足每天新增疑似病例不超过人,故B不符合;假设丙地至少有一天新增疑似病例人数超过人,由中位数为可得平均数的最小值为,与题意矛盾,故C符合;假设至少有一天新增疑似病例超过人,则方差的最小值为,与题意矛盾,故D符合.故选ACD.7.(2022学年广东省广州市八十六中高一下学期期中)若样本数据的方差为8,则数据的方差为________.【答案】32【解析】若样本数据的方差为8,则数据的方差为8.(2022学年湖南师范大学附属中学高一下学期期中)棉花的纤维长度是棉花质量的重要指标.在一批棉花中随机抽测了60根棉花的纤维长度(单位:mm),按从小到大排序结果如下:2528335052585
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 工程承包简易协议书
- 足浴店员工劳动合同范本完整版
- 2024版高速公路工程知识产权合同:专利技术与著作权保护2篇
- 2024年度医疗机构建设项目合同2篇
- 军神课件教学课件
- 四年级品德知识课件
- 新版风险代理协议完整版
- 阅读胸片课件
- 2024版房屋装修设计合同3篇
- 对数函数课件
- 小学数学六年级上册《用百分数解决问题》(新人教版)课件
- 14《故都的秋》课件29张 高中语文统编版必修上册第七单元
- 临床医师甲乳外科进修总结
- 压力性损伤的预防
- 隧道施工现场通用检查表
- 高速公路施工道路安全管理措施教学课件
- 公司战略规划和落地方法之:五看三定工具解析课件
- 求平面直角坐标系中三角形的面积市公开课一等奖省名师优质课赛课一等奖课件
- 幼儿卫生学皮肤课件
- 维吾尔族服饰课件
- 高考作文指导系列:核心概念的界定课件23张
评论
0/150
提交评论