




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
PAGEPAGE1专题40统计与统计案例一、考纲要求:1.理解随机抽样的必要性和重要性.2.会用简洁随机抽样方法从总体中抽取样本.3.了解分层抽样和系统抽样方法.4.会用随机抽样的基本方法解决一些简洁的实际问题.5.了解分布的意义与作用,能依据概率分布表画频率分布直方图、频率折线图、茎叶图,体会它们各自的特点.6.理解样本数据标准差的意义和作用,会计算数据标准差.7.能从样本数据中提取基本的数字特征(如平均数、标准差),并做出合理的说明.8.会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征.理解用样本估计总体的思想,会用样本估计总体的思想解决一些简洁的实际问题.二、概念驾驭及解题上的留意点:1.简洁随机抽样的特点1抽取的个体数较少.2逐个抽取.3不放回抽取.4等可能抽取.只有四个特点都满意的抽样才是简洁随机抽样.2.抽签法与随机数法的适用状况1)抽签法适用于总体中个体数较少的状况,随机数法适用于总体中个体数较多的状况.2)一个抽样试验能否用抽签法,关键看两点:一是制签是否便利;二是号签是否易搅匀.一般地,当总体容量和样本容量都较小时可用抽签法.3.从总体数N中抽取一个样本容量为n的样本1)在整个抽样过程中,每个个体被抽到的概率是eq\f(n,N).2)在一次抽取中,每个个体被抽到的概率是eq\f(1,N).4.系统抽样的三个关注点1)若不变更抽样规则,则所抽取的号码构成一个等差数列,其首项为第一组所抽取的号码,公差为样本间隔.故问题可转化为等差数列问题解决.2)抽样规则变更,应留意每组抽取一个个体这一特征不变.3)假如总体容量N不能被样本容量n整除,可随机地从总体中剔除余数,然后再按系统抽样的方法抽样.5.系统抽样有一个抽样距eq\b\lc\[\rc\](\a\vs4\al\co1(\f(N,n)))其步骤为剔除,编号,均分,抽样.6频率、频数、样本容量的计算方法1)eq\f(频率,组距)×组距=频率.2)eq\f(频数,样本容量)=频率,eq\f(频数,频率)=样本容量,样本容量×频率=频数.易错警示:绘制频率分布直方图时的3个留意点1)制作好频率分布表后,可以利用各组的频率之和是否为1来检验该表是否正确;2)频率分布直方图的纵坐标是eq\f(频率,组距),而不是频率.3)留意中值估算法.三、高考考题题例分析:例1.(2024全国卷II)如图是某地区2000年至2024年环境基础设施投资额y(单位:亿元)的折线图.为了预料该地区2024年的环境基础设施投资额,建立了y与时间变量t的两个线性回来模型.依据2000年至2024年的数据(时间变量t的值依次为1,2,…,17)建立模型①:=﹣30.4+13.5t;依据2010年至2024年的数据(时间变量t的值依次为1,2,…,7)建立模型②:=99+17.5t.(1)分别利用这两个模型,求该地区2024年的环境基础设施投资额的预料值;(2)你认为用哪个模型得到的预料值更牢靠?并说明理由.【答案】见解析(2)模型②得到的预料值更牢靠;因为从总体数据看,该地区从2000年到2024年的环境基础设施投资额是逐年上升的,而从2000年到2009年间递增的幅度较小些,从2010年到2024年间递增的幅度较大些,所以,利用模型②的预料值更牢靠些.例2.(2024全国卷III)某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人.第一组工人用第一种生产方式,其次组工人用其次种生产方式.依据工人完成生产任务的工作时间(单位:min)绘制了如下茎叶图:(1)依据茎叶图推断哪种生产方式的效率更高?并说明理由;(2)求40名工人完成生产任务所需时间的中位数m,并将完成生产任务所需时间超过m和不超过m的工人数填入下面的列联表:超过m不超过m第一种生产方式其次种生产方式(3)依据(2)中的列联表,能否有99%的把握认为两种生产方式的效率有差异?附:K2=,P(K2≥k)0.0500.0100.001k3.8416.63510.828【答案】见解析由此填写列联表如下;超过m不超过m总计第一种生产方式15520其次种生产方式51520总计202040(3)依据(2)中的列联表,计算K2===10>6.635,∴能有99%的把握认为两种生产方式的效率有差异.例10(2024山东高考)为了探讨某班学生的脚长x(单位:厘米)和身高y(单位:厘米)的关系,从该班随机抽取10名学生,依据测量数据的散点图可以看出y与x之间有线性相关关系.设其回来直线方程为eq\o(y,\s\up9(^))=eq\o(b,\s\up9(^))x+eq\o(a,\s\up9(^)).已知eq\o(∑,\s\up9(10),\s\do7(i=1))xi=225,eq\o(∑,\s\up9(10),\s\do7(i=1))yi=1600,eq\o(b,\s\up9(^))=4.该班某学生的脚长为24,据此估计其身高为()A.160 B.163C.166 D.170【答案】C统计与统计案例练习题一、选择题1.下面的抽样方法是简洁随机抽样的为()A.在某年明信片销售活动中,规定每100万张为一个开奖组,通过随机抽取的方式确定号码的后四位为2709的为三等奖B.某车间包装一种产品,在自动包装的传送带上,每隔30分钟抽一包产品,称其重量是否合格C.某学校分别从行政人员、老师、后勤人员中抽取2人、14人、4人了解对学校机构改革的看法D.用抽签方法从10件产品中选取3件进行质量检验【答案】D【解析】:A,B选项中为系统抽样,C为分层抽样.2.重庆市2024年各月的平均气温(℃)数据的茎叶图如图,则这组数据的中位数是()A.19 B.20C.21.5 D.23【答案】B3.下列说法错误的是()A.回来直线过样本点的中心(eq\o(x,\s\up9(-)),eq\o(y,\s\up9(-)))B.两个随机变量的线性相关性越强,则相关系数的肯定值就越接近于1C.对分类变量X与Y,随机变量K2的观测值k越大,则推断“X与Y有关系”的把握程度越小D.在回来直线方程eq\o(y,\s\up9(^))=0.2x+0.8中,当说明变量x每增加1个单位时,预报变量eq\o(y,\s\up9(^))平均增加0.2个单位【答案】C【解析】:依据相关定义分析知A,B,D正确;C中对分类变量X与Y的随机变量K2的观测值k来说,k越大,推断“X与Y有关系”的把握程度越大,故C错误,故选C.4.福利彩票“双色球”中红色球的编号有33个,分别为01,02,…,33,某彩民利用下面的随机数表选取6组数作为6个红色球的编号,选取方法是从随机数表第1行的第6列和第7列数字起先由左到右依次选取两个数字,则选出来的第6个红色球的编号为()49544354821737932378873520964384263491645724550688770474476721763350258392120676A.23 B.09C.02 D.17【答案】C【解析】:从随机数表第1行的第6列和第7列数字起先由左到右依次选取两个数字,则选出的6个红色球的编号依次为21,32,09,16,17,02,故选出的第6个红色球的编号为02.5.某班一次测试成果的茎叶图和频率分布直方图可见部分(如图),依据图中的信息可确定被抽测的人数及分数在[90,100]内的人数分别为()A.20,2 B.24,4C.25,2 D.25,4【答案】C6.某公司在2024年上半年的月收入x(单位:万元)与月支出y(单位:万元)的统计资料如表所示:月份1月份2月份3月份4月份5月份6月份收入x12.314.515.017.019.820.6支出y5.635.755.825.896.116.18依据统计资料,则()A.月收入的中位数是15,x与y有正线性相关关系B.月收入的中位数是17,x与y有负线性相关关系C.月收入的中位数是16,x与y有正线性相关关系D.月收入的中位数是16,x与y有负线性相关关系【答案】C【解析】:月收入的中位数是eq\f(15+17,2)=16,收入增加,支出增加,故x与y有正线性相关关系.7.从编号为001,002,…,500的500个产品中用系统抽样的方法抽取一个样本,已知样本中编号最小的两个编号分别为007,032,则样本中最大的编号应当为()A.480 B.481C.482 D.483【答案】C8.下列说法错误的是()A.自变量取值肯定时,因变量的取值带有肯定随机性的两个变量之间的关系叫做相关关系B.在线性回来分析中,相关系数r的值越大,变量间的相关性越强C.在残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高D.在回来分析中,R2为0.98的模型比R2为0.80的模型拟合的效果好【答案】B【解析】:依据相关关系的概念知A正确;当r>0时,r越大,相关性越强,当r<0时,r越大,相关性越弱,故B不正确;对于一组数据拟合程度好坏的评价,一是残差点分布的带状区域越窄,拟合效果越好;二是R2越大,拟合效果越好,所以R2为0.98的模型比R2为0.80的模型拟合的效果好,C,D正确,故选B.9.2017年2月20日,摩拜单车在济南推出“做文明骑士,周一摩拜单车免费骑”活动.为了解单车运用状况,记者随机抽取了五个投放区域,统计了半小时内被骑走的单车数量,绘制了如图所示的茎叶图,则该组数据的方差为()A.9 B.4C.3 D.2【答案】B【解析】:由茎叶图得该组数据的平均值为eq\f(1,5)(87+89+90+91+93)=90,所以该组数据的方差为eq\f(1,5)[(87-90)2+(89-90)2+(90-90)2+(91-90)2+(93-90)2]=4,故选B.10.某工厂的三个车间在12月份共生产了3600双皮靴,在出厂前要检查这批产品的质量,确定采纳分层抽样的方法进行抽取,若从第一、二、三车间抽取的产品数分别为a,b,c,且a,b,c构成等差数列,则其次车间生产的产品数为()A.800 B.1000C.1200 D.1500【答案】C11.若样本数据x1,x2,…,x10的标准差为8,则数据2x1-1,2x2-1,…,2x10-1的标准差为()A.8 B.15C.16 D.32【答案】C【解析】:已知样本数据x1,x2,…,x10的标准差为s=8,则s2=64,数据2x1-1,2x2-1,…,2x10-1的方差为22s2=22×64,所以其标准差为eq\r(22×64)=2×8=16.12.为比较甲、乙两地某月14时的气温状况,随机选取该月中的5天,将这5天中14时的气温数据(单位:℃)制成如图9317所示的茎叶图.考虑以下结论:①甲地该月14时的平均气温低于乙地该月14时的平均气温;②甲地该月14时的平均气温高于乙地该月14时的平均气温;③甲地该月14时的气温的标准差小于乙地该月14时的气温的标准差;④甲地该月14时的气温的标准差大于乙地该月14时的气温的标准差.其中依据茎叶图能得到的统计结论的编号为()A.①③ B.①④C.②③ D.②④【答案】B【解析】:由茎叶图中的数据通过计算求得eq\x\to(x)甲=29,eq\x\to(x)乙=30,s甲=eq\r(3.6),s乙=eq\r(2),∴eq\x\to(x)甲<eq\x\to(x)乙,s甲>s乙,故①④正确.故选B.络购物者2014年度的消费状况进行统计,发觉消费金额(单位:万元)都在区间[0.3,0.9]内,其频率分布直方图如图所示.(1)直方图中的a=________;(2)在这些购物者中,消费金额在区间[0.5,0.9]内的购物者的人数为________.【答案】(1)3(2)6000三、解答题17.某车间将10名技工平均分成甲、乙两组加工某种零件,在单位时间内每个技工加工的合格零件数的统计数据的茎叶图如图所示,已知两组技工在单位时间内加工的合格零件的平均数都为10.(1)求出m,n的值;(2)求出甲、乙两组技工在单位时间内加工的合格零件的方差seq\o\al(2,甲)和seq\o\al(2,乙),并由此分析两组技工的加工水平.【答案】(1)m=3,n=8);(2)见解析【解析】:(1)依据题意可知:eq\x\to(x)甲=eq\f(1,5)(7+8+10+12+10+m)=10,eq\x\to(x)乙=eq\f(1,5)(9+n+10+11+12)=10,∴m=3,n=8.(2)seq\o\al(2,甲)=eq\f(1,5)[(7-10)2+(8-10)2+(10-10)2+(12-10)2+(13-10)2]=5.2,seq\o\al(2,乙)=eq\f(1,5)[(8-10)2+(9-10)2+(10-10)2+(11-10)2+(12-10)2]=2,∵eq\x\to(x)甲=eq\x\to(x)乙,seq\o\al(2,甲)>seq\o\al(2,乙),∴甲、乙两组的平均水平相当,乙组更稳定一些.18.一企业从某条生产线上随机抽取100件产品,测量这些产品的某项技术指标值x,得到如下的频率分布表:x[11,13)[13,15)[15,17)[17,19)[19,21)[21,23]频数2123438104(1)作出样本的频率分布直方图,并估计该技术指标值x的平均数和众数;(2)若x<13或x≥21,则该产品不合格.现从不合格的产品中随机抽取2件,求抽取的2件产品中技术指标值小于13的产品恰有一件的概率.【答案】见解析【解析】:(1)频率分布直方图为19.某医院对治疗支气管肺炎的两种方案A,B进行比较探讨,将志愿者分为两组,分别采纳方案A和方案B进行治疗,统计结果如下:有效无效总计运用方案A组96120运用方案B组72总计32(1)完成上述列联表,并比较两种治疗方案有效的频率;(2)能否在犯错误的概率不超过0.05的前提下认为治疗是否有效与方案选择有关?附:K2=eq\f(nad-bc2,a+bc+da+cb+d),其中n=a+b+c+d.P(K2≥k0)0.050.0100.001k03.8416.63510.828【答案】见解析20.下表数据为某地区某种农产品的年产量x(单位:吨)及对应销售价格y(单位:千元/吨).x12345y7065553822(1)若y与x有较强的线性相关关系,依据上表供应的数据,用最小二乘法求出y关于x的线性回来方程eq\o(y,\s\up9(^))=eq\o(b,\s\up9(^))x+eq\o(a,\s\up9(^));(2)若每吨该农产品的成本为13.1千元,假设该农产品可全部卖出,预料当年产量为多少吨时,年利润Z最大?参考公式:eq\b\lc\{\rc\(\a\vs4\al\co1(\o(b,\s\up9(^))=\f(\o(∑,\s\up9(n),\s\do7(i=1))xiyi-n\o(x,\s\up9(-))\o(y,\s\up9(-)),\o(∑,\s\up9(n),\s\do7(i=1))x\o\al(2,i)-n\o(x,\s\up9(-))2)=\f(\o(∑,\s\up9(n),\s\do7(i=1))xi-\x\to(x)yi-\o(y,\s\up9(-)),\o(∑,\s\up9(n),\s\do7(i=1))xi-\x\to(x)2),,\o(a,\s\up9(^))=\o(y,\s\up9(-))-\o(b,\s\up9(^))\o(x,\s\up9(-)).))【答案】见解析【解析】:(1)∵eq\x\to(x)=eq\f(1+2+3+4+5,5)=3,eq\o(y,\s\up9(-))=eq\f(70+65+55+38+22,5)=50,21.某校在高一年级学生中,对自然科学类、社会科学类校本选修课程的选课意向进行调查.现从高一年级学生中随机抽取180名学生,其中男生105名;在这180名学生中选择社会科学类的男生、女生均为45名.(1)试问:从高一年级学生中随机抽取1人,抽到男生的概率约为多少?(2)依据抽取的180名学生的调查结果,完成下面的2×2列联表.并推断能否在犯错误的概率不超过0.025的前提下认为科类的选择与性别有关?选择自然科学类选择社会科学类合计男生女生合计附:K2=eq\f(nad-bc2,a+bc+da+cb+d),其中n=a+b+c+d.P(K2≥k0)0.5000.4000.2500.1500.1000.0
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 二零二五年度数据中心建设项目工程可行性研究合同
- 2025版智能网联汽车体验馆国际汽车贸易城商铺租赁协议
- 2025版仓库保管员安全责任与职业保障合同
- 二零二五年度房地产抵押融资合同范本下载
- 2025版建筑工程施工合同变更管理协议书范本
- 二零二五年体育赛事广告合作合同模板
- 二零二五年度金融科技合作联盟协议书范本
- 二零二五年度垃圾填埋场工程分包消防安全生产责任协议
- 二零二五年度基础设施建设项目场地勘探与咨询服务合同
- 二零二五年度房屋租赁委托与租户退出保障协议
- (2025.06.12)领导干部任前应知应会党内法规和法律知识考试题库(2025年度)
- 开放性骨折诊断与治疗指南讲课件
- 2022信息化项目建设预算定额信息系统运行维护
- 2025至2030年中国少儿类图书行业市场运营状况及投资方向研究报告
- 山东兖矿能源集团股份有限公司招聘笔试真题2024
- 三级医院等级评审标准实施细则检查方式及责任分解表章
- T/CCOA 49-2023生湿面制品专用小麦粉
- 中医讲西洋参课件
- 俱乐部股份协议书
- 2025抖音即时零售营销通案【商家版】
- 【MOOC期末】《深度学习及其应用》(复旦大学)期末考试慕课答案
评论
0/150
提交评论