下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
eq\b\lc\\rc\(\a\vs4\al\co1(第17讲理,第15讲文))统计与统计案例1.(2022·四川高考)在“世界读书日”前夕,为了了解某地5000名居民某天的阅读时间,从中抽取了200名居民的阅读时间进行统计分析.在这个问题中,5000名居民的阅读时间的全体是()A.总体B.个体C.样本的容量D.从总体中抽取的一个样本【解析】5000名居民的阅读时间的全体为总体,故选A.【答案】A2.(2022·重庆高考)某中学有高中生3500人,学校生1500人.为了解同学的学习状况,用分层抽样的方法从该校同学中抽取一个容量为n的样本,已知从高中生中抽取70人,则n为()A.100B.150C.200D.250【解析】样本抽取比例为eq\f(70,3500)=eq\f(1,50),该校总人数为1500+3500=5000,则eq\f(n,5000)=eq\f(1,50),故n=100,选A.【答案】A3.(2022·湖北高考)依据如下样本数据x345678y4.02.5-0.50.5-2.0-3.0得到的回归方程为eq\o(y,\s\up6(^))=bx+a,则()A.a>0,b>0B.a>0,b<0C.a<0,b>0D.a<0,b<0【解析】回归直线方程过中心点(5.5,1.5),即1.5=5.5b+a,由题意,两个变量负相关,b<0,∴a>0,故选B.【答案】B4.(2022·广东高考)某车间20名工人年龄数据如下表:年龄(岁)工人数(人)191283293305314323401合计20(1)求这20名工人年龄的众数与极差;(2)以十位数为茎,个位数为叶,作出这20名工人年龄的茎叶图;(3)求这20名工人年龄的方差.【解】(1)由题可知,这20名工人年龄的众数是30,极差是40-19=21.(2)这20名工人年龄的茎叶图如图所示:(3)这20名工人年龄的平均数为eq\x\to(x)=eq\f(1,20)(19+3×28+3×29+5×30+4×31+3×32+40)=30,∴这20名工人年龄的方差为s2=eq\f(1,20)eq\o(,\s\up6(20),\s\do4(i=1))(xi-eq\x\to(x))2=eq\f(112+6×22+7×12+5×02+102,20)=eq\f(252,20)=12.6.从近三年高考来看,该部分高考命题的热点考向为:1.随机抽样①随机抽样问题与实际生活紧密相连,是高考考查的热点之一.主要考查系统抽样中号码的确定和分层抽样中各层人数的确定.②多以选择题和填空题的形式呈现,属简洁题.2.用样本估量总体①该考向重点考查样本特征数的计算,样本频率分布直方图和茎叶图等学问.特殊是茎叶图是新课标中的新增内容,与实际生活联系亲密,可便利处理数据,是高考中新的热点.②多以选择题、填空题的形式考查,有时也消灭在解答题中,属简洁题.3.线性回归分析①线性回归分析是新增内容,在现实生活中有着广泛的应用,应引起重视.②多以选择题、填空题的形式考查,有时也消灭在解答题中,属中、低档题目.4.独立性检验①独立性检验也是新增内容,在现实生活中有着广泛的应用,近几年很多省的高考题涉及本考向,应引起关注.②既可以以选择题、填空题的形式考查,也可以以解答题的形式呈现,属中、低档题目.eq\a\vs4\al(随机抽样)【例1】(1)(2022·天津高考)某高校为了解在校本科生对参与某项社会实践活动的意向,拟接受分层抽样的方法,从该校四个班级的本科生中抽取一个容量为300的样本进行调查.已知该校一班级、二班级、三班级、四班级的本科生人数之比为4∶5∶5∶6,则应从一班级本科生中抽取________名同学.(2)(2022·广东高考)为了解1000名同学的学习状况,接受系统抽样的方法,从中抽取容量为40的样本,则分段的间隔为()A.50B.40C.25D.20【解析】(1)由题意知应抽取人数为300×eq\f(4,4+5+5+6)=60.(2)由eq\f(1000,40)=25,可得分段的间隔为25.故选C.【答案】(1)60(2)C【规律方法】解答与抽样方法有关的问题时应留意:(1)要深刻理解各种抽样方法的特点和实施步骤.(2)娴熟把握系统抽样中被抽个体号码的确定方法.(3)娴熟把握分层抽样中各层人数的计算方法.留意:抽样方法常和概率、频率分布直方图等学问结合在一起考查.[创新猜测]1.(1)(2021·湖南高考)某工厂甲、乙、丙三个车间生产了同一种产品,数量分别为120件、80件、60件.为了解它们的产品质量是否存在显著差异,用分层抽样方法抽取了一个容量为n的样本进行调查,其中从丙车间的产品中抽取了3件,则n=()A.9B.10C.12D.13(2)(2021·江西高考)总体由编号为01,02,…,19,20的20个个体组成.利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开头由左到右依次选取两个数字,则选出来的第5个个体的编号为()7816657208026314070243699728019832049234493582003623486969387481A.08B.07C.02D.01【解析】(1)依据分层抽样的特点,用比例法求解.依题意得eq\f(3,60)=eq\f(n,120+80+60),故n=13.(2)由随机数表法的随机抽样的过程可知选出的5个个体是08,02,14,07,01,所以第5个个体的编号是01.【答案】(1)D(2)Deq\a\vs4\al(用样本估量总体)【例2】(2022·北京高考)从某校随机抽取100名同学,获得了他们一周课外阅读时间(单位:小时)的数据,整理得到数据分组及频数分布表和频率分布直方图:组号分组频数1[0,2)62[2,4)83[4,6)174[6,8)225[8,10)256[10,12)127[12,14)68[14,16)29[16,18)2合计100(1)从该校随机选取一名同学,试估量这名同学该周课外阅读时间少于12小时的概率;(2)求频率分布直方图中的a,b的值;(3)假设同一组中的每个数据可用该组区间的中点值代替,试估量样本中的100名同学该周课外阅读时间的平均数在第几组.(只需写出结论)【解】(1)依据频数分布表,100名同学中课外阅读时间不少于12小时的同学共有6+2+2=10名,所以样本中的同学课外阅读时间少于12小时的频率是1-eq\f(10,100)=0.9.从该校随机选取一名同学,估量其课外阅读时间少于12小时的概率为0.9.(2)课外阅读时间落在组[4,6)的有17人,频率为0.17,所以a=eq\f(频率,组距)=eq\f(0.17,2)=0.085.课外阅读时间落在组[8,10)的有25人,频率为0.25,所以b=eq\f(频率,组距)=eq\f(0.25,2)=0.125.(3)样本中的100名同学课外阅读时间的平均数在第4组.【规律方法】1.用样本估量总体时应留意的问题:(1)理解在抽样具有代表性的前提下,可以用样本的频率分布估量总体的频率分布,用样本的特征数估量总体的特征数,这是统计的基本思想.(2)反映样本数据分布的主要方式,一个是频率分布表,一个是频率分布直方图.要学会依据频率分布直方图估量总体的概率分布以及总体的特征数,特殊是均值、众数和中位数.2.样本数字特征及茎叶图:(1)要把握好样本均值和方差的实际意义,并在具体的应用问题中会依据所计算出的样本数据的均值和方差对实际问题作出解释.(2)茎叶图是表示样本数据分布的一种方法,其特点是保留了全部的原始数据,这是茎叶图的优势.[创新猜测]2.(1)(2021·福建高考)某校从高一班级同学中随机抽取部分同学,将他们的模块测试成果分成6组:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]加以统计,得到如图所示的频率分布直方图.已知高一班级共有同学600名,据此估量,该模块测试成果不少于60分的同学人数为()A.588B.480C.450D.120(2)(2021·山东高考)将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91,现场作的9个分数的茎叶图后来有1个数据模糊,无法辨认,在图中以x表示:87794010x91则7个剩余分数的方差为()A.eq\f(116,9)B.eq\f(36,7)C.36D.eq\f(6\r(7),7)【解析】(1)先求出频率,再求样本容量.不少于60分的同学的频率为(0.030+0.025+0.015+0.010)×10=0.8,∴该模块测试成果不少于60分的同学人数应为600×0.8=480.故选B.(2)利用平均数为91,求出x的值,利用方差的定义,计算方差.依据茎叶图,去掉1个最低分87,1个最高分99,则eq\f(1,7)[87+94+90+91+90+(90+x)+91]=91,∴x=4.∴s2=eq\f(1,7)[(87-91)2+(94-91)2+(90-91)2+(91-91)2+(90-91)2+(94-91)2+(91-91)2]=eq\f(36,7).【答案】(1)B(2)Beq\a\vs4\al(线性回归分析)【例3】(2022·全国新课标Ⅱ高考)某地区2007年至2021年农村居民家庭人均纯收入y(单位:千元)的数据如下表:年份2007200820092010201120222021年份代号t1234567人均纯收入y2.93.33.64.44.85.25.9(1)求y关于t的线性回归方程;(2)利用(1)中的回归方程,分析2007年至2021年该地区农村居民家庭人均纯收入的变化状况,并猜测该地区2021年农村居民家庭人均纯收入.附:回归直线的斜率和截距的最小二乘估量公式分别为:eq\o(b,\s\up6(^))=eq\f(\i\su(i=1,n,)ti-\o(t,\s\up6(-))yi-\o(y,\s\up6(-)),\i\su(i=1,n,)ti-\o(t,\s\up6(-))2),eq\o(a,\s\up6(^))=eq\o(y,\s\up6(-))-eq\o(b,\s\up6(^))eq\o(t,\s\up6(-)).【解】(1)由所给数据计算得eq\o(t,\s\up6(-))=eq\f(1,7)(1+2+3+4+5+6+7)=4,eq\o(y,\s\up6(-))=eq\f(1,7)(2.9+3.3+3.6+4.4+4.8+5.2+5.9)=4.3eq\i\su(i=1,7,)(ti-eq\o(t,\s\up6(-)))2=9+4+1+0+1+4+9=28,eq\i\su(i=1,7,)(ti-eq\o(t,\s\up6(-)))(yi-eq\o(y,\s\up6(-)))=(-3)×(-1.4)+(-2)×(-1)+(-1)×(-0.7)+0×0.1+1×0.5+2×0.9+3×1.6=14,eq\o(b,\s\up6(^))=eq\f(\i\su(i=1,7,)ti-\o(t,\s\up6(-))yi-\o(y,\s\up6(-)),\i\su(i=1,7,)ti-\o(t,\s\up6(-))2)=eq\f(14,28)=0.5,eq\o(a,\s\up6(^))=eq\o(y,\s\up6(-))-eq\o(b,\s\up6(^))eq\o(t,\s\up6(-))=4.3-0.5×4=2.3,所求回归方程为eq\o(y,\s\up6(^))=0.5t+2.3.(2)由(1)知,eq\o(b,\s\up6(^))=0.5>0,故2007至2021年该地区农村居民家庭人均纯收入逐年增加,平均每年增加0.5千元.将2021年的年份代号t=9代入(Ⅰ)中的回归方程,得eq\o(y,\s\up6(^))=0.5×9+2.3=6.8,故猜测该地区2021年农村居民家庭人均纯收入为6.8千元.【规律方法】进行线性回归分析时应留意的问题(1)正确理解计算b,a的公式和精确 的计算,是求回归直线方程的关键.(2)在分析两个变量的相关关系时,可依据样本数据作出散点图来确定两个变量之间是否具有相关关系,若具有线性相关关系,则可通过线性回归方程估量和猜测变量的值.(3)在散点图中,若全部点大部分都集中在斜向上(自左向右看)的直线的四周,则为正相关;若大部分都集中在斜向下(自左向右看)的直线的四周,则为负相关.[创新猜测]3.(2021·重庆高考)从某居民区随机抽取10个家庭,获得第i个家庭的月收入xi(单位:千元)与月储蓄yi(单位:千元)的数据资料,算得eq\i\su(i=1,10,x)i=80,eq\i\su(i=1,10,y)i=20,eq\i\su(i=1,10,x)iyi=184,eq\i\su(i=1,10,x)eq\o\al(2,i)=720.(1)求家庭的月储蓄y对月收入x的线性回归方程y=bx+a;(2)推断变量x与y之间是正相关还是负相关;(3)若该居民区某家庭月收入为7千元,猜测该家庭的月储蓄.附:线性回归方程y=bx+a中,b=eq\f(\i\su(i=1,n,x)iyi-n\x\to(x)\x\to(y),\i\su(i=1,n,x)\o\al(2,i)-n\x\to(x)2),a=eq\x\to(y)-beq\x\to(x),其中eq\x\to(x),eq\x\to(y)为样本平均值.线性回归方程也可写为eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^)).【解】(1)由题意知n=10,eq\x\to(x)=eq\f(1,n)eq\i\su(i=1,n,x)i=eq\f(80,10)=8,eq\x\to(y)=eq\f(1,n)eq\i\su(i=1,n,y)i=eq\f(20,10)=2,又lxx=eq\i\su(i=1,n,x)eq\o\al(2,i)-neq\x\to(x)2=720-10×82=80,lxy=eq\i\su(i=1,n,x)iyi-neq\x\to(x)eq\x\to(y)=184-10×8×2=24,由此得b=eq\f(lxy,lxx)=eq\f(24,80)=0.3,a=eq\x\to(y)-beq\x\to(x)=2-0.3×8=-0.4,故所求线性回归方程为y=0.3x-0.4.(2)由于变量y的值随x值的增加而增加(b=0.3>0),故x与y之间是正相关.(3)将x=7代入回归方程可以猜测该家庭的月储蓄为y=0.3×7-0.4=1.7(千元).eq\a\vs4\al(独立性检验)【例4】(2022·辽宁高考)某高校餐饮中心为了解新生的饮食习惯,在全校一班级同学中进行了抽样调查,调查结果如下表所示:宠爱甜品不宠爱甜品合计南方同学602080北方同学101020合计7030100(1)依据表中数据,问是否有95%的把握认为“南方同学和北方同学在选用甜品的饮食习惯方面有差异”;(2)已知在被调查的北方同学中有5名数学系的同学,其中2名宠爱甜品.现在从这5名同学中随机抽取3人,求至多有1人宠爱甜品的概率.附:χ2=eq\f(nn11n22-n12n212,n1+n2+n+1n+2),P(χ2≥k)0.1000.0500.010k2.7063.8416.635【解】(1)将2×2列联表中的数据代入公式计算,得χ2=eq\f(nn11n22-n12n212,n1+n2+n+1n+2)=eq\f(100×60×10-20×102,70×30×80×20)=eq\f(100,21)≈4.762.由于4.762>3.841,所以有95%的把握认为“南方同学和北方同学在选用甜品的饮食习惯方面有差异”.(2)从5名数学系同学中任取3人的一切可能结果所组成的基本大事空间Ω={(a1,a2,b1),(a1,a2,b2),(a1,a2,b3),(a1,b1,b2),(a1,b2,b3),(a1,b1,b3),(a2,b1,b2),(a2,b2,b3),(a2,b1,b3),(b1,b2,b3)}.其中ai表示宠爱甜品的同学,i=1,2.bj表示不宠爱甜品的同学,j=1,2,3.Ω由10个基本大事组成,且这些基本大事的消灭是等可能的.用A表示“3人中至多有1人宠爱甜品”这一大事,则A={(a1,b1,b2),(a1,b2,b3),(a1,b1,b3),(a2,b1,b2),(a2,b2,b3),(a2,b1,b3),(b1,b2,b3)}.大事A是由7个基本大事组成,因而P(A)=eq\f(7,10).【规律方法】1.独立性检验的关键是精确 计算K2(χ2),而计算k2(χ2)时,要正确绘制2×2列联表.2.两个变量的独立性检验,在统计学中有着广泛的应用,学习时肯定要结合实际问题,从现实中查找例子,增加学习数学的动力.[创新猜测]4.(2022·安徽高考)某高校共有同学15000人,其中男生10500人,女生4500人.为调查该校同学每周平均体育运动时间的状况,接受分层抽样的方法,收集300位同学每周平均体育运动时间的样本数据(单位:小时).(1)应收集多少位女生的样本数据?(2)依据这300个样本数据,得到同学每周平均体育运动时间的频率分布直方图(如图所示),其中样本数据的分组区间为:[0,2],(2,4],(4,6],(6,8],(8,10],(10,12].估量该校同学每周平均体育运动时间超过4小时的概率;(3)在样本数据中,有60位女生的每周平均体育运动时间超过4小时,请完成每周平均体育运动时间与性别列联表,并推断是否有95%的把握认为“该校同学的每周平均体育运动时间与性别有关”.附:K2=eq\f(nad-bc2,a+bc+da+cb+d)P(K2≥k0)0.100.050.0100.005k02.7063.8416.6357.879【解】(1)300×eq\f(4500,15000)=90,所以应收集90位女生的样本数据.(2)由题中频率分布直方图得1-2×(0.100+0.025)=0.75,所以该校同学每周平均体育运动时间超过4小时的概率的估量值为0.75.(3)由(2)知,300位同学中有300×0.75=225人的每周平均体育运动时间超过4小时,75人的每周平均体育运动时间不超过4小时.又由于样本数据中有210份是关于男生的,90份是关于女生的.所以每周平均体育运动时间与性别列联表如下:每周平均体育运动时间与性别列联表男生女生总计每周平均体育运动时间不超过4小时453075每周平均体育运动时间超过4小时16560225总计21090300结合列联表可算得K2=eq\f(300×22502,75×225×210×90)=eq\f(100,21)≈4.762>3.841.所以,有95%的把握认为“该校同学的每周平均体育运动时间与性别有关”.[总结提升]失分盲点(1)混淆简洁随机抽样、系统抽样、分层抽样的区分,不能正确地选择抽样方法.(2)不能正确地从频率分布直方图中提取相关的信息,混淆了频数与频率的差异.答题指导(1)看到抽样问题,想到三种抽样的定义以及适用范围和三者的区分.(2)看到频率分布直方图,想到频数与频率的区分以及计算方法.方法规律(1)分层抽样:①抽样原则:分层抽样时,每层抽取的个体可以不一样多,但必需满足抽取n=n·eq\f(N,N)(i=1,2,…,k)个个体:②分层原则:层内样本的差异要小,两层之间的样本差异要大,且互不重叠.(2)利用统计量K2进
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 华为职业性格测试题及答案
- 2025至2031年中国淋浴节水装置行业投资前景及策略咨询研究报告
- 2025至2030年中国纱线测湿仪数据监测研究报告
- 2025至2030年中国玉山薄雪草数据监测研究报告
- 二零二五年度个人租赁车辆保险合同2篇
- 2025版个人合伙退伙协议书纠纷处理指南4篇
- 房东房屋出租合同模板
- 重庆市农村住房租赁合同
- 2025-2030全球低矮型叉车行业调研及趋势分析报告
- 2025-2030全球油漆搅拌器行业调研及趋势分析报告
- 《openEuler操作系统》考试复习题库(含答案)
- 《天润乳业营运能力及风险管理问题及完善对策(7900字论文)》
- 医院医学伦理委员会章程
- xx单位政务云商用密码应用方案V2.0
- 北师大版五年级上册数学期末测试卷及答案共5套
- 2024-2025学年人教版生物八年级上册期末综合测试卷
- 2025年九省联考新高考 语文试卷(含答案解析)
- 全过程工程咨询投标方案(技术方案)
- 心理健康教育学情分析报告
- 农民专业合作社财务报表(三张报表)
- 安宫牛黄丸的培训
评论
0/150
提交评论