下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
用样本估计总体学习目标:1.能从样本数据中提取基本的数字特征(如平均数、标准差),并作出合理的解释;2.会用样本的频率分布估计总体的频率分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想;要点梳理:1.频率分布直方图(1)频率分布表的画法:第一步:求极差,决定组数和组距,组距=eq\f(极差,组数);第二步:分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间;第三步:登记频数,计算频率,列出频率分布表.(2)频率分布直方图:反映样本频率分布的直方图(如图)横轴表示样本数据,纵轴表示eq\f(频率,组距),每个小矩形的面积表示样本落在该组内的频率.2.频率分布折线图和总体密度曲线(1)频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.(2)总体密度曲线:随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率分布折线图就会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.4.样本的数字特征(1)众数:一组数据中出现次数最多的那个数据,叫做这组数据的众数.(2)中位数:把n个数据按大小顺序排列,处于最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.(3)平均数:把eq\f(a1+a2+…+an,n)称为a1,a2,…,an这n个数的平均数.(4)极差:一组数据中最大值与最小值的差值(5)标准差与方差:设一组数据x1,x2,x3,…,xn的平均数为,则这组数据的标准差和方差分别是[常用结论与微点提醒]1.频率分布直方图与众数、中位数与平均数的关系(1)最高的小长方形底边中点的横坐标即是众数.(2)中位数左边和右边的小长方形的面积和是相等的.(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.2.平均数、方差的公式推广(1)若数据x1,x2,…,xn的平均数为,那么mx1+a,mx2+a,mx3+a,…,mxn+a的平均数是.(2)数据x1,x2,…,xn的方差为s2.①数据x1+a,x2+a,…,xn+a的方差也为s2;②数据ax1,ax2,…,axn的方差为a2s2.5.总体百分位数的估计(1)概念:一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有%的数据小于或等于这个值,且至少有的数据大于或等于这个值.(2)求解步骤可以通过下面的步骤计算一组n个数据的第百分位数:第1步,按从小到大排列原始数据第2步,计算.第3步,若不是整数,而大于的比邻整数为,则第百分位数为第项数据;若是整数,则第百分位数为第项与第项数据的平均数(3)知识剖析:几个重要的百分位数1)我们在初中学过的中位数,相当于是第50百分位数.2)在实际应用中,除了中位数外,常用的分位数还有第25百分位数.第75百分位数.以上三个分位数把一组由小到大排列后的数据分成四等份,因此称为四分位数.其中第25百分位数也称为第一四分位数或下四分位数等,第75百分位数也称为第三四分位数或上四分位数等.题型一求总体或样本容量1.某机构对青年观众是否喜欢跨年晚会进行了调查,人数如表所示:现要在所有参与调查的人中用分层抽样的方法抽取n人做进一步的调研,若在“不喜欢”的男性青年观众中抽取了6人,则n=()A.12 B.16 C.24 D.32题型二统计图表及应用多维探究角度1扇形图2.某高中2022年的高考考生人数是2021年高考考生人数的倍.为了更好地对比该校考生的升学情况,统计了该校2021年和2022年高考分数达线情况,得到如图所示扇形统计图:下列结论正确的是(
)A.该校2022年与2021年的本科达线人数比为6:5B.该校2022年与2021年的专科达线人数比为6:7C.2022年该校本科达线人数增加了80%D.2022年该校不上线的人数有所减少角度2折线图3.(多选题)(2020·聊城调研)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图.根据该折线图,下列结论正确的是()A.月接待游客量逐月增加B.年接待游客量逐年增加C.各年的月接待游客量高峰期大致在7,8月D.各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳角度3频率分布直方图4.某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:[20,30),[30,40),…,[80,90].并整理得到如下频率分布直方图:(1)从总体的400名学生中随机抽取一人,估计其分数小于70的概率;(2)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的人数;(3)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等.试估计总体中男生和女生人数的比例.题型三样本的数字特征5.已知一组数据:1,2,3,5,m,则下列说法错误的是(
)A.若平均数为4,则B.中位数可以是5C.众数可以是1D.总体方差最小时,6.某组样本数据的平方和,平均数,则该组数据的方差(
)A.1B.C.2D.题型四总体百分位数的估计7.一个容量为20的样本,其数据按从小到大的顺序排列为:1,2,2,3,5,6,6,7,8,8,9,10,13,13,14,15,17,17,18,18.则该组数据的第75百分位数为__________,第86百分位数为________8.军事飞行人员是国家的特殊人才和宝贵资源,招收和培养飞行员历来受到国家的高度重视,某地区招收海军飞行员,从符合条件的高三学生中随机抽取8人,他们的身高(单位:cm)分别为168,175,171,180,175,172,173,179则这8名高三学生身高的第75百分位数为__________.题型五统计图表与数字特征的综合应用9.下图为2022年8月5日通报的14天内31省区市疫情趋势,则下列说法正确的是(
)无症状感染者的极差大于 B.确诊病例的方差大于无症状感染者的方差C.实际新增感染者的平均数小于 D.实际新增感染者的第80百分位数为64110.心绞痛是冠状动脉供血不足,心肌急剧地暂时缺血与缺氧所引起的以发作性胸痛或胸部不适为主要表现的临床综合征.在某地随机调查10位心绞痛患者第一次出现症状的年龄,得到如图所示的样本数据频率分布直方图.(1)求直方图中a的值;(2)估计这组数据的平均数;(同一组中的数据以该组区间的中点值为代表)(3)估计这组数据的第55百分位数.随堂练习1.下列四个图中,用来表示不同品种的奶牛的平均产奶量最为合适的是()2.(多选)关于一组样本数据的平均数、中位数、频率分布直方图和方差,下列说法正确的是(
)A.改变其中一个数据,平均数和中位数都会发生改变B.频率分布直方图中,中位数左边和右边的直方图的面积相等C.若数据的频率分布直方图为单峰不对称,且在右边“拖尾”,则平均数大于中位数D.样本数据的方差越小,说明样本数据的离散程度越小据报道,去年某咨询公司对1500个家庭进行了关于奶粉市场的调查,下图是关于每月购买奶粉袋数的有关数据,则每月购买1袋奶粉的比率同每月购买2袋奶粉的比率合计为()A.79.9% B.70.9%C.38.8% D.32.1%4.若数据x1,x2,…,xn的平均数为,方差为s2,则2x1+3,2x2+3,…,2xn+3的平均数和方差分别为()A.和s2 B.2+3和4s2C.2+3和s2 D.2+3和4s2+12s+95.(多选)已知甲、乙两个水果店在“十一黄金周”七天的水果销售量统计如图所示.则下列说法正确的是()A.甲组数据的极差大于乙组数据的极差B.甲组数据的平均数大于乙组数据的平均数C.甲组数据的方差大于乙组数据的方差D.甲组数据的中位数大于乙组数据的中位数6.用样本估计总体1.由分层抽样的性质得eq\f(6,30)=eq\f(n,30+30+10+50),解得n=24.故选C.题型4统计图表及应用多维探究角度1扇形图2.【答案】C【详解】不妨设2021年的高考人数为100,则2022年的高考人数为年本科达线人数为50,2022年本科达线人数为90,得2022年与2021年的本科达线人数比为,本科达线人数增加了,故选项不正确,选项C正确;2021年专科达线人数为35,2022年专科达线人数为45,所以2022年与2021年的专科达线人数比为,选项B错误;2021年不上线人数为15,2022年不上线人数也是15,不上线的人数无变化,选项错误.故选:C角度2折线图3.解析对于选项A,由图易知,月接待游客量每年7,8月份明显高于12月份,故A错;对于选项B,观察折线图的变化趋势可知,年接待游客量逐年增加,故B正确;对于选项C,D,由图可知显然正确.答案BCD规律方法折线图可以显示随时间(根据常用比例放置)而变化的连续数据,因此非常适用于显示在相等时间间隔下数据的趋势.角度3频率分布直方图4.解(1)根据频率分布直方图可知,样本中分数不小于70的频率为(0.02+0.04)×10=0.6,所以样本中分数小于70的频率为1-0.6=0.4.所以从总体的400名学生中随机抽取一人,其分数小于70的概率估计值为0.4.(2)根据题意,样本中分数不小于50的频率为(0.01+0.02+0.04+0.02)×10=0.9,故样本中分数小于50的频率为0.1,故分数在区间[40,50)内的人数为100×0.1-5=5.所以总体中分数在区间[40,50)内的人数估计为400×eq\f(5,100)=20.(3)由题意可知,样本中分数不小于70的学生人数为(0.02+0.04)×10×100=60.所以样本中分数不小于70的男生人数为60×eq\f(1,2)=30.所以样本中的男生人数为30×2=60,女生人数为100-60=40,男生和女生人数的比例为60∶40=3∶2.所以根据分层抽样原理,总体中男生和女生人数的比例估计为3∶2.5.【答案】B【详解】对于A,平均数为4时,,解得,A正确;对于B,当时,易得中位数为3;当时,5是数据中的最大的数,不可能是中位数,故B错误;对于C,当时,众数可以是1,故C正确;对于D,设平均数为a,则方差,故当且仅当时,方差取得最小值,D正确.故选:B.6.【答案】D【分析】根据方差的公式结合已知条件求解即可.【详解】,故选:D7.8.【详解】因为,所以第75百分位数是从低到高第6个和第7个数据的平均数,即故答案为:1779.【答案】AD【分析】观察图表,逐一运算验证即可.【详解】由图表知无症状感染者的极差大于,故A正确;由图表知无症状感染者的波动幅度明显大于确诊病例的波动幅度,故B错误;由图表数据计算实际新增感染者的平均数为471.2,故C错误;,故实际新增感染者的第80百分位数为641,故D正确.故选:AD.10.【答案】(1)(2)53.5(3)55(1)解:根据直方图,,解得;(2)估计这组数据的平均数约为(3)解:前三组的频率之和为,前四组的频率之和为,所以第百分位数位于区间内,估计这组数据的第百分位数约为.随堂练习1.答案D2【答案】BCD【分析】根据平均数、中位数、频率分布直方图和方差的性质,逐一分析选项,即可得答案.【详解】对于A:例如数据1,3,5,将数据改成2,3,5,数据的中位数未改变,仍为3,故A错误;对于B:根据频率分布直方图中中位数的求法,可得B正确;对于C:根据频率直方图可得,单峰不对称且在右边“拖尾”,则平均数变大,中位数变小,所以平均数大于中位数,故C正确;对于D:样本数据方差越小,数据越稳定,离散程度越小,故D正确.故选:BCD答案 BB解析方法一平均数为eq\f(1,n)(2x1+3+2x2+3+…+2xn+3)=eq\f(1,n)[2(x1+x2+…+xn)+3n]=2eq\x\to(x)+3;方差为eq\f(1,n){[(2x1+3)-(2eq\x\to(x)+3)]2+[(2x2+3)-(2eq\x\to(x)+3)]2+…+[(2xn+3)-(2eq\x\to(x)+3)]2}=eq\f(1,n)[4(x1-eq\x\to(x))2+4(x2-eq\x\to(x))2+…+4(xn-eq\x\to(x))2]=4s2.方法二原数据乘以2加上3
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论