版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
统考版2024届高考数学一轮复习第十一章11.3随机抽样学案理含解析20230423146第三节随机抽样【知识重温】一、必记3个知识点1.简单随机抽样(1)简单随机抽样:一般地,设一个总体含有N个个体,从中逐个①________地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会②________,就把这种抽样方法叫做简单随机抽样.(2)最常用的简单随机抽样方法有两种——③________法和④______________法.(3)一般地,抽签法就是总体中的N个个体编号,把号码写在号签上,将号签放在一个容器中,⑤______________后,每次从中抽取一个号签,连续抽取n次,就得到一个容量为n的样本.(4)随机数表法就是利用随机数表、随机数骰子或计算机产生的随机数进行抽样.(5)简单随机抽样有操作简便易行的优点,在总体个数不多的情况下是行之有效的.2.系统抽样(1)一般地,假设要从容量为N的总体中抽取容量为n的样本,我们可以按下列步骤进行系统抽样:(ⅰ)先将总体的N个个体编号.有时可直接利用个体自身所带的号码,如学号、准考证号、门牌号等;(ⅱ)确定分段间隔k,对编号进行分段.当eq\f(N,n)(n是样本容量)是整数时,取k=⑥________;(ⅲ)在第1段用⑦________确定第一个个体编号l(l≤k);(ⅳ)按照一定的规则抽取样本.通常是将l⑧________得到第2个个体编号(l+k),再加k得到第3个个体编号⑨________,依次进行下去,直到获取整个样本.(2)当总体中元素个数较少时,常采用简单随机抽样,当总体中元素个数较多时,常采用⑩________.3.分层抽样(1)分层抽样的概念:一般地,在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样.(2)当总体是由⑪________的几个部分组成时,往往选用分层抽样的方法.(3)分层抽样时,每个个体被抽到的机会是⑫________的.二、必明2个易误点1.认清简单随机抽样、系统抽样、分层抽样三者间的区别与联系,是正确选择抽样方法的前提.2.在系统抽样中,应先确定分段间隔,然后再确定入样个体编号间的关系.【小题热身】一、判断正误1.判断下列说法是否正确(请在括号中打“√”或“×”).(1)在简单随机抽样中,某一个个体被抽到的可能性与第几次抽取有关,第一次被抽到的可能性最大.()(2)从100件玩具中随机拿出一件,放回后再拿出一件,连续拿5次,是简单随机抽样.()(3)系统抽样适用于元素个数很多且均衡的总体.()(4)要从1002个学生中用系统抽样的方法选取一个容量为20的样本,需要剔除2个学生,这样对被剔除者不公平.()(5)分层抽样中,每个个体被抽到的可能性与层数及分层有关.()(6)某校即将召开学生代表大会,现从高一、高二、高三共抽取60名代表,则可用分层抽样方法抽取.()二、教材改编2.老师在班级50名学生中,依次抽取学号为5,10,15,20,25,30,35,40,45,50的学生进行作业检查,这种抽样方法是()A.随机抽样B.分层抽样C.系统抽样D.以上都不是3.一个公司共有N名员工,下设一些部门,要采用等比例分层随机抽样的方法从全体员工中抽取样本量为n的样本.如果某部门有m名员工,那么从该部门抽取的员工人数是________.三、易错易混4.某公司有员工500人,其中不到35岁的有125人,35~49岁的有280人,50岁以上的有95人,为了调查员工的身体健康状况,从中抽取100名员工,则应在这三个年龄段分别抽取人数为()A.33,34,33B.25,56,19C.30,40,30D.30,50,205.利用简单随机抽样从含有8个个体的总体中抽取一个容量为4的样本,则总体中每个个体被抽到的概率是()A.eq\f(1,2)B.eq\f(1,3)C.eq\f(1,6)D.eq\f(1,4)四、走进高考6.[2017·江苏卷]某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为200,400,300,100件.为检验产品的质量,现用分层抽样的方法从以上所有的产品中抽取60件进行检验,则应从丙种型号的产品中抽取________件.eq\x(考点一)简单随机抽样[自主练透型]1.下列抽样试验中,适合用抽签法的有()A.从某厂生产的5000件产品中抽取600件进行质量检验B.从某厂生产的同一批次的两箱(每箱18件)产品中抽取6件进行质量检验C.从甲、乙两厂生产的两箱(每箱18件)产品中抽取6件进行质量检验D.从某厂生产的5000件产品中抽取10件进行质量检验2.利用简单随机抽样,从n个个体中抽取一个容量为10的样本.若第二次抽取时,余下的每个个体被抽到的概率为eq\f(1,3),则在整个抽样过程中,每个个体被抽到的概率为()A.eq\f(1,3)B.eq\f(5,14)C.eq\f(1,4)D.eq\f(10,27)3.[2021·贵阳市适应性考试]为了保障人民群众的身体健康,在预防新型冠状病毒期间,贵阳市市场监督管理局加强了对市场的监管力度,为了考察生产口罩的某工厂生产的600个口罩是否合格,利用随机数表进行抽样测试,先将600个口罩进行编号,编号分别为001,002,…,599,600,再从中抽取60个样本,如下提供随机数表的第4行到第6行:322118342978645407325242064438122343567735789056428442125331345786073625300732862345788907236896080432567808436789535577348994837522535578324577892345若从表中第6行第6列开始向右依次读取3个数据,则得到的第5个样本编号为()A.578B.324C.535D.522悟·技法解决简单随机抽样应注意的问题(1)一个抽样试验能否用抽签法,关键看两点:一是抽签是否方便;二是号签是否易搅匀.一般地,当总体容量和样本容量都较小时可用抽签法.(2)在使用随机数表时,如遇到三位数或四位数时,可从选择的随机数表中的某行某列的数字计起,每三个或四个作为一个单位,自左向右选取,有超过总体号码或出现重复号码的数字舍去.考点二系统抽样[自主练透型]4.[2021·湖南永州模拟]现从已编号(1~50)的50位同学中随机抽取5位以了解他们的数学学习状况,用选取的号码间隔一样的系统抽样方法确定所选取的5位同学的编号可能是()A.5,10,15,20,25B.3,13,23,33,43C.1,2,3,4,5D.2,10,18,26,345.[2021·湖北重点中学模拟]某校高三年级共有30个班,学校心理咨询室为了了解同学们的心理状况,将每个班编号,依次为1到30,现用系统抽样的方法抽取5个班进行调查,若抽到的编号之和为75,则抽到的最小的编号为________.6.[2019·全国卷Ⅰ]某学校为了解1000名新生的身体素质,将这些学生编号为1,2,…,1000,从这些新生中用系统抽样方法等距抽取100名学生进行体质测验.若46号学生被抽到,则下面4名学生中被抽到的是()A.8号学生B.200号学生C.616号学生D.815号学生悟·技法1.系统抽样又称等距抽样,所以依次抽取的样本对应的号码就是一个等差数列,首项就是第1组所抽取样本的号码,公差为间隔数,根据等差数列的通项公式就可以确定每一组内所要抽取的样本号码.2.系统抽样时,如果总体中的个数不能被样本容量整除时,可以先用简单随机抽样从总体中剔除几个个体,然后再按系统抽样进行.考点三分层抽样[自主练透型]7.[2018·全国卷Ⅲ]某公司有大量客户,且不同年龄段客户对其服务的评价有较大差异.为了解客户的评价,该公司准备进行抽样调查,可供选择的抽样方法有简单随机抽样、分层抽样和系统抽样,则最合适的抽样方法是________.8.[2021·五省六校(K12联盟)联考]某中学有高中生960人,初中生480人,为了了解学生的身体状况,采用分层抽样的方法,从该校学生中抽取容量为n的样本,其中高中生有24人,那么n=()A.12B.18C.24D.369.[2021·重庆中山外国语学校模拟]如饼图,某学校共有教师120人,从中选出一个30人的样本.其中被选出的青年女教师的人数为()A.12B.6C.4D.3第三节随机抽样【知识重温】①不放回②都相等③抽签④随机数表⑤搅拌均匀⑥eq\f(N,n)⑦简单随机抽样⑧加上间隔k⑨(l+2k)⑩系统抽样⑪差异明显⑫均等【小题热身】1.答案:(1)×(2)×(3)√(4)×(5)×(6)√2.解析:因为抽取学号是以eq\f(50,10)=5为公差的等差数列,故采用的抽样方法应是系统抽样.答案:C3.解析:由题意知每个个体被抽到的概率是eq\f(n,N),∵某部门有m个员工,设这个部门抽取了x个员工,又采用了等比例分层抽样的方法.∴eq\f(n,N)=eq\f(x,m),∴x=eq\f(nm,N).答案:eq\f(nm,N)4.解析:因为12528095=255619,所以抽取人数分别为25人,56人,19人,故选B.答案:B5.解析:总体个数为N=8,样本容量为M=4,则每一个个体被抽到的概率为P=eq\f(M,N)=eq\f(4,8)=eq\f(1,2),故选A.答案:A6.解析:∵eq\f(样本容量,总体个数)=eq\f(60,200+400+300+100)=eq\f(3,50),∴应从丙种型号的产品中抽取eq\f(3,50)×300=18(件).答案:18课堂考点突破考点一1.解析:A,D中的总体中个体总数较多,不适宜抽签法,C中甲、乙两厂的产品质量有区别,也不适宜抽签法,故选B.答案:B2.解析:由题意知eq\f(9,n-1)=eq\f(1,3),∴n=28.∴P=eq\f(10,28)=eq\f(5,14).答案:B3.解析:第6行的第6个数开始的三位数分别为808,436,789,535,577,348,994,837,522,…,符合条件的编号分别为436,535,577,348,522,…,第5个样本数据为522.答案:D考点二4.解析:抽样间隔为eq\f(50,5)=10,故选B.答案:B5.解析:系统抽样的抽取间隔为eq\f(30,5)=6.设抽到的最小编号为x,则x+(6+x)+(12+x)+(18+x)+(24+x)=75,所以x=3.答案:36.解析:将1000名学生分成100组,每组10人,则每组抽取的号码构成公差为10的等差数列{an},由题意知a5=46,则an=a5+(n-5)×10=10n-4,n∈N*,易知只有C选项满足题意.故选C.答案:C考点三7.解析:因为客户数量大,且不同年龄段客户对其服务的评价有较大差异,所以最合适的抽样方法是分层抽样.答案:分层抽样8.解析:由分层抽样知eq\f(n,960+480)=eq\f(24,960),解得n=36,故选D.答案:D9.解析:青年教师的人数为120×(1-40%-30%)=36,所以青年女教师为12人.故青年女教师被选出的人数为12×eq\f(30,120)=3.故选D.答案:D第四节用样本估计总体【知识重温】一、必记3个知识点1.频率分布直方图(1)通常我们对总体作出的估计一般分成两种.一种是用样本的①________估计总体的分布.另一种是用样本的②________估计总体的数字特征.(2)在频率分布直方图中,纵轴表示③________,数据落在各小组内的频率用各小长方形的④________表示.各小长方形的面积总和⑤________.(3)连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.随着⑥________的增加,作图时所分的⑦________增加,相应的频率分布折线图就会越来越接近于一条光滑的曲线,统计中称之为⑧________________,它能够更加精细地反映出总体在各个范围内取值的⑨________.(4)当样本数据较少时,用茎叶图表示数据的效果较好,它不但可以保留所有信息,而且可以随时记录,给数据的记录和表示都带来方便.2.众数,中位数,平均数(1)众数:在一组数据中,出现次数⑩________的数据叫做这组数据的众数.(2)中位数:将一组数据按大小依次排列,把处在⑪________位置的一个数据(或最中间两个数据的平均数)叫做这组数据的⑫________.(3)平均数:样本数据的算术平均数.即eq\x\to(x)=⑬__________.在频率分布直方图中,中位数左边和右边的直方图的面积应该⑭________.3.样本方差,标准差标准差s=eq\r(\f(1,n)[x1-\x\to(x)2+x2-\x\to(x)2+…+xn-\x\to(x)2]),其中xn是样本数据的第n项,n是样本容量,eq\x\to(x)是⑮________.标准差是反映总体波动大小的特征数,样本方差是标准差的平方.通常用样本方差估计总体方差,当样本容量⑯________总体容量时,样本方差越接近总体方差.二、必明1个易误点不要把直方图错认为条形图,两者的区别在于条形图是离散随机变量,纵坐标刻度为频数或频率,直方图是连续随机变量,纵坐标刻度为频率/组距,连续随机变量在某一点上是没有频率的.【小题热身】一、判断正误1.判断下列说法是否正确(请在括号中打“√”或“×”).(1)在频率分布直方图中,小矩形的高表示频率.()(2)频率分布直方图中各个长方形的面积之和为1.()(3)茎叶图中的数据要按从小到大的顺序写,相同的数据可以只记一次.()(4)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势.()(5)一组数据的方差越大,说明这组数据的波动越大.()二、教材改编2.四名同学各掷骰子5次,分别记录每次骰子出现的点数.根据四名同学的统计结果,可以判断出一定没有出现点数6的是()A.平均数为3,中位数为2B.中位数为3,众数为2C.平均数为2,方差为2.4D.中位数为3,方差为2.83.已知一组数据4.7,4.8,5.1,5.4,5.5,则该组数据的方差是________.三、易错易混4.把样本容量为20的数据分组,分组区间与频数如下:[10,20),2;[20,30),3;[30,40),4;[40,50),5;[50,60),4;[60,70],2,则在区间[10,50)上的数据的频率是()A.0.05B.0.25C.0.5D.0.75.若数据x1,x2,x3,…,xn的平均数eq\o(x,\s\up6(-))=5,方差s2=2,则数据3x1+1,3x2+1,3x3+1,…,3xn+1的平均数和方差分别为________.四、走进高考6.[2019·全国卷Ⅱ]演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是()A.中位数B.平均数C.方差D.极差eq\x(考点一)样本的数字特征[自主练透型]1.[2018·江苏卷]已知5位裁判给某运动员打出的分数的茎叶图如图所示,那么这5位裁判打出的分数的平均数为________.2.[2021·甘肃、青海、宁夏联考]从某小学随机抽取100名学生,将他们的身高(单位:厘米)分布情况汇总如下:身高(100,110](110,120](120,130](130,140](140,150]频数535302010由此表估计这100名小学生身高的中位数为(结果保留4位有效数字)()A.119.3B.119.7C.123.3D.126.73.[2021·惠州市调研考试试题]某工厂为了解产品的生产情况,随机抽取了100个产品为样本.若样本数据x1,x2,…,x100的方差为8,则数据2x1-1,2x2-1,…,2x100-1的方差为()A.8B.15C.16D.32悟·技法众数、中位数、平均数及方差的意义及计算公式(1)平均数与方差都是重要的数字特征,是对总体的一种简明地描述,平均数、中位数、众数描述数据集中趋势,方差和标准差描述波动的大小.(2)平均数、方差的公式推广.①若数据x1,x2,…,xn的平均数为eq\x\to(x),那么mx1+a,mx2+a,mx3+a,…,mxn+a的平均数是meq\o(x,\s\up6(-))+a.②数据x1,x2,…,xn的方差为s2.(ⅰ)数据x1+a,x2+a,…,xn+a的方差也为s2;(ⅱ)数据ax1,ax2,…,axn的方差为a2s2.(3)方差的简化计算公式.s2=eq\f(1,n)[(xeq\o\al(2,1)+xeq\o\al(2,2)+…+xeq\o\al(2,n))-neq\o(x,\s\up6(-))2]或写成s2=eq\f(1,n)(xeq\o\al(2,1)+xeq\o\al(2,2)+…+xeq\o\al(2,n))-eq\o(x,\s\up6(-))2,即方差等于原数据平方的平均数减去平均数的平方.考点二茎叶图[自主练透型]4.[2021·广东广雅中学、江西南昌二中联考]某市重点中学奥数培训班共有14人,分为两个小组,在一次阶段考试中两个小组成绩的茎叶图如图所示,其中甲组学生成绩的平均数是88,乙组学生成绩的中位数是89,则m+n的值是()A.10B.11C.12D.135.[2021·陕西商洛质检]在一次53.5千米的自行车个人赛中,25名参赛选手成绩(单位:分钟)的茎叶图如图所示,现将参赛选手按成绩由好到差编为1~25号,再用系统抽样的方法从中选取5人,已知选手甲的成绩为85分钟,若甲被选取,则被选取的其余4名选手的成绩的平均数为()A.95B.96C.97D.98悟·技法茎叶图的应用(1)茎叶图中的“茎”上的数字代表十位上的数字,“叶”上的数字代表个位上的数字(若没有则表示该数据不存在);(2)解题时,可把茎叶图中的数字按大小顺序转化为总体的个体数字再求解.考点三频率分布直方图[互动讲练型][例1][2020·天津卷]从一批零件中抽取80个,测量其直径(单位:mm),将所得数据分为9组:[5.31,5.33),[5.33,5.35),…,[5.45,5.47),[5.47,5.49],并整理得到如下频率分布直方图,则在被抽取的零件中,直径落在区间[5.43,5.47)内的个数为()A.10B.18C.20D.36悟·技法1.绘制频率分布直方图时的2个注意点(1)制作好频率分布表后,可以利用各组的频率之和是否为1来检验该表是否正确.(2)频率分布直方图的纵坐标是eq\f(频率,组距),而不是频率.2.由频率分布直方图进行相关计算时,需掌握的2个关系式(1)eq\f(频率,组距)×组距=频率.(2)eq\f(频数,样本容量)=频率,此关系式的变形为eq\f(频数,频率)=样本容量,样本容量×频率=频数.[变式练]——(着眼于举一反三)1.[2021·长沙市统一模拟考试]某学校对本校高三500名学生的视力进行了一次调查,随机抽取了100名学生的体检表,得到的频率分布直方图如图所示,若频率分布直方图后四组的频数成等差数列,则估计本校高三这500名学生中视力在4.8以上(含4.8)的人数为()A.185B.180C.195D.200eq\x(考点四)扇形图与折线图[互动讲练型][例2](1)[2018·全国卷Ⅰ]某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如下饼状图:则下面结论中不正确的是()A.新农村建设后,种植收入减少B.新农村建设后,其他收入增加了一倍以上C.新农村建设后,养殖收入增加了一倍D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半(2)[2021·山东济宁模拟]如图为某市国庆节7天假期的楼房认购量与成交量的折线图,小明同学根据折线图对这7天的认购量(单位:套)与成交量(单位:套)作出如下判断,其中判断正确的是()A.日成交量的中位数是26B.日成交量超过日平均成交量的有2天C.认购量与日期正相关D.10月7日认购量的增幅大于10月7日成交量的增幅悟·技法(1)通过扇形统计图可以很清楚的表示出各部分数量同总数之间的关系.(2)折线图可以显示随时间(根据常用比例放置)而变化的数据,因此非常适用于显示在相等时间间隔下数据的变化趋势.[变式练]——(着眼于举一反三)2.[2021·开封市第一次模拟考试]某省普通高中学业水平考试成绩由高分到低分按人数所占比例依次分为A,B,C,D,E五个等级,A等级15%,B等级30%,C等级30%,D,E等级共25%.其中E等级为不合格,原则上比例不超过5%.该省某校高二年级学生都参加学业水平考试,先从中随机抽取了部分学生的考试成绩进行统计,统计结果如图所示.若该校高二年级共有1000名学生,则估计该年级拿到C等级及以上级别的学生人数为()A.45B.660C.880D.9003.某市气象部门根据2018年各月的每天最高气温平均值与最低气温平均值(单位:℃)数据,绘制如下折线图:那么,下列叙述不正确的是()A.各月最高气温平均值与最低气温平均值总体呈正相关B.全年中,2月份的最高气温平均值与最低气温平均值的差值最大C.全年中各月最低气温平均值不高于10℃的月份有5个D.从2018年7月至12月该市每天最高气温平均值与最低气温平均值呈下降趋势第四节用样本估计总体【知识重温】①频率分布②数字特征③eq\f(频率,组距)④面积⑤等于1⑥样本容量⑦组数⑧总体密度曲线⑨百分比⑩最多⑪最中间⑫中位数⑬eq\f(1,n)(x1+x2+…+xn)⑭相等⑮平均数⑯接近【小题热身】1.答案:(1)×(2)√(3)×(4)√(5)√2.答案:C3.解析:5个数的平均数eq\o(x,\s\up6(-))=eq\f(4.7+4.8+5.1+5.4+5.5,5)=5.1,所以它们的方差s2=eq\f(1,5)[(4.7-5.1)2+(4.8-5.1)2+(5.1-5.1)2+(5.4-5.1)2+(5.5-5.1)2]=0.1.答案:0.14.解析:由题意知,在区间[10,50)上的数据的频数是2+3+4+5=14,故其频率为eq\f(14,20)=0.7.答案:D5.解析:∵x1,x2,x3,…,xn的平均数为5,∴eq\f(x1+x2+x3+…+xn,n)=5,∴eq\f(3x1+3x2+3x3+…+3xn,n)+1=3×5+1=16,∵x1,x2,x3,…,xn的方差为2,∴3x1+1,3x2+1,3x3+1,…,3xn+1的方差是32×2=18.答案:16,186.解析:记9个原始评分分别为a,b,c,d,e,f,g,h,i(按从小到大的顺序排列),易知e为7个有效评分与9个原始评分的中位数,故不变的数字特征是中位数,故选A.答案:A课堂考点突破考点一1.解析:这5位裁判打出的分数分别是89,89,90,91,91,因此这5位裁判打出的分数的平均数为eq\f(89+89+90+91+91,5)=90.答案:902.解析:本题考查中位数,体现了数学运算的核心素养.由题意知身高在(100,110],(110,120],(120,130]的频率依次为0.05,0.35,0.3,前两组频率和为0.4,组距为10,设中位数为x,则(x-120)×eq\f(0.3,10)=0.1,解得x≈123.3.故选C.答案:C3.解析:样本数据x1,x2,…,x100的方差为8,则数据2x1-1,2x2-1,…,2x100-1的方差为22×8=32,故选D.答案:D考点二4.解析:∵甲组学生成绩的平均数是88,∴由茎叶图可知78+86+84+88+95+90+m+92=88×7,∴m=3,∵乙组学生成绩的中位数是89,∴n=9,∴m+n=12.故选C.答案:C5.解析:由系统抽样法及已知条件可知被选中的其他4人的成绩分别是88,94,99,107,故平均数为eq\f(88+94+99+107,4)=97,故选C.答案:C考点三例1解析:由题知[5.43,5.45)与[5.45,5.47)所对应的小矩形的高分别为6.25,5.00,所以[5.43,5.47)的频率为(6.25+5.00)×0.02=0.225,所以直径落在区间[5.43,5.47)内的个数为80×0.225=18,故选B.答案:B变式练1.解析:由题意得频率分布直方图前三组的频率依次为0.03,0.07,0.27,所以前三组的频数依次为3,7,27,则后四组的频数和为90,又后四组的频数成等差数列,所以后四组的频数依次为27,24,21,18,所以视力在4.8以上(含4.8)的频率为39%,故本校高三这500名学生中视力在4.8以上(含4.8)的人数约为500×39%=195.选C.答案:C考点四例2解析:(1)设新农村建设前,农村的经济收入为a,则新农村建设后,农村的经济收入为2a.新农村建设前后,各项收入的对比如下表:新农村建设前新农村建设后新农村建设后变化情况结论种植收入60%a37%×2a=74%a增加A错其他收入4%a5%×2a=10%a增加了一倍以上B对养殖收入30%a30%×2a=60%a增加了一倍C对养殖收入+第三产业收入(30%+6%)a=36%a(30%+28%)×2a=116%a超过经济收入2a的一半D对故选A.(2)7天假期楼房的成交量从小到大依次为8,13,16,26,32,38,166,所以日成交量的中位数为26,所以A正确;日平均成交量为eq\f(8+13+16+26+32+38+166,7)≈42.7,只有一天日成交量超过日平均成交量,所以B错误;由折线图的起伏变化可知,认购量与日期不是正相关,所以C错误;10月7日认购量的增幅为eq\f(276-112,112)×100%≈146.4%,10月7日成交量的增幅为eq\f(166-38,38)≈336.8%,显然10月7日认购量的增幅小于10月7日成交量的增幅,所以D错误,故选A.答案:(1)A(2)A变式练2.解析:由题中两图可知C等级所占比例为12÷eq\f(10,20%)=24%,所以C等级及以上级别所占比例为20%+24%+46%=90%,所以C等级及以上级别的学生人数为1000×90%=900.故选D.答案:D3.解析:对于A,根据折线图可以发现除2月份外,各月最低气温平均值越高,最高气温平均值也越高,总体呈正相关,A正确;对于B,通过折线图观察,2月份的两个点距离最大,B正确;对于C,各月最低气温平均值不高于10℃的有1月,2月,3月,11月,12月,共有5个月,C正确;对于D,观察折线图可知,7月份到8月份气温在上升,D错误.答案:D第五节变量间的相关关系与统计案例【知识重温】一、必记4个知识点1.两个变量的线性相关(1)正相关在散点图中,点散布在从左下角到右上角的区域,对于两个变量的这种相关关系,我们将它称为正相关.(2)负相关在散点图中,点散布在从左上角到右下角的区域,两个变量的这种相关关系称为负相关.(3)线性相关关系、回归直线如果散点图中点的分布从整体上看大致在①__________附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.2.回归方程(1)最小二乘法求回归直线,使得样本数据的点到它的距离的平方和最小的方法叫做最小二乘法.(2)回归方程方程eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^))是两个具有线性相关关系的变量的一组数据(x1,y1),(x2,y2),…,(xn,yn)的回归方程,其中eq\o(a,\s\up6(^)),eq\o(b,\s\up6(^))是待定参数.eq\b\lc\{\rc\(\a\vs4\al\co1(\o(b,\s\up6(^))=\f(\o(∑,\s\up6(n),\s\do4(i=1))xi-\x\to(x)yi-\x\to(y),\o(∑,\s\up6(n),\s\do4(i=1))xi-\x\to(x)2)=\f(\o(∑,\s\up6(n),\s\do4(i=1))xiyi-n\o(x,\s\up6(-))\o(y,\s\up6(-)),\o(∑,\s\up6(n),\s\do4(i=1))x\o\al(2,i)-n\o(x,\s\up6(-))2),,\o(a,\s\up6(^))=\x\to(y)-\o(b,\s\up6(^))\x\to(x).))3.回归分析(1)定义:对具有相关关系的两个变量进行统计分析的一种常用方法.(2)样本点的中心对于一组具有线性相关关系的数据(x1,y1),(x2,y2),…,(xn,yn)中②____________称为样本点的中心.(3)相关系数当r>0时,表明两个变量③________________;当r<0时,表明两个变量④________________.r的绝对值越接近于1,表明两个变量的线性相关性⑤________.r的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系.通常|r|大于⑥________时,认为两个变量有很强的线性相关性.4.独立性检验(1)分类变量:变量的不同“值”表示个体所属的不同类别,像这类变量称为分类变量.(2)列联表:列出两个分类变量的频数表,称为列联表.假设有两个分类变量X和Y,它们的可能取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为:y1y2总计x1aba+bx2cdc+d总计a+cb+da+b+c+d构造一个随机变量K2=eq\f(nad-bc2,a+bc+da+cb+d),其中n=a+b+c+d为样本容量.(3)独立性检验利用随机变量K2来判断“两个分类变量有关系”的方法称为独立性检验.二、必明4个易误点1.回归分析是对具有相关关系的两个变量进行统计分析的方法,只有在散点图大致呈线性时,求出的回归直线方程才有实际意义,否则,求出的回归直线方程毫无意义.2.根据回归方程进行预报,仅是一个预报值,而不是真实发生的值.3.r的大小只说明是否相关,并不能说明拟合效果的好坏,R2才是判断拟合效果好坏的依据,必须将二者区分开来.4.独立性检验的随机变量K2=2.706是判断是否有关系的临界值,K2<2.706应判断为没有充分依据显示X与Y有关系,而不能作为小于90%的量化值来作出判断.【小题热身】一、判断正误1.判断下列说法是否正确(请在括号中打“√”或“×”).(1)散点图是判断两个变量是否相关的一种重要方法和手段.()(2)回归直线方程eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^))至少经过点(x1,y1),(x2,y2),…,(xn,yn)中的一个点.()(3)若事件X,Y关系越密切,则由观测数据计算得到的K2的观测值越小.()(4)两个变量的相关系数的绝对值越接近于1,它们的相关性越强.()二、教材改编2.下面是2×2列联表:y1y2总计x1a2173x2222547总计b46120则表中a,b的值分别为()A.94,72B.52,50C.52,74D.74,523.某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验.根据收集到的数据(如下表),由最小二乘法求得回归方程eq\o(y,\s\up6(^))=0.67x+54.9.零件数x(个)1020304050加工时间y(min)62758189现发现表中有一个数据看不清,请你推断出该数据的值为________.三、易错易混4.某医疗机构通过抽样调查(样本容量n=1000),利用2×2列联表和K2统计量研究患肺病是否与吸烟有关.计算得K2=4.453,经查阅临界值表知P(K2≥3.841)≈0.05,现给出四个结论,其中正确的是()A.在100个吸烟的人中约有95个人患肺病B.若某人吸烟,那么他有95%的可能性患肺病C.有95%的把握认为“患肺病与吸烟有关”D.只有5%的把握认为“患肺病与吸烟有关”5.恩格尔系数是食品支出总额占个人消费支出总额的比重,恩格尔系数越小,消费结构越完善,生活水平越高.某学校社会调查小组得到如下数据:年个人消费支出总额x/万元11.522.53恩格尔系数y0.90.80.50.20.1若y与x之间有线性相关关系,老张年个人消费支出总额为2.8万元,据此估计其恩格尔系数为________.参考数据:eq\i\su(i=1,5,x)iyi-5eq\o(x,\s\up6(-))·eq\o(y,\s\up6(-))=-1.1,eq\i\su(i=1,5,x)eq\o\al(2,i)-5eq\o(x,\s\up6(-))2=2.5.参考公式:对于一组数据(x1,y1),(x2,y2),…,(xn,yn),其回归直线eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^))的斜率和截距的最小二乘估计分别为eq\o(b,\s\up6(^))=eq\f(\i\su(i=1,n,x)iyi-n\o(x,\s\up6(-))·\o(y,\s\up6(-)),\i\su(i=1,n,x)\o\al(2,i)-n\o(x,\s\up6(-))2),eq\o(a,\s\up6(^))=eq\o(y,\s\up6(-))-eq\o(b,\s\up6(^))eq\o(x,\s\up6(-)).四、走进高考6.[2020·全国卷Ⅰ]某校一个课外学习小组为研究某作物种子的发芽率y和温度x(单位:℃)的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据(xi,yi)(i=1,2,…,20)得到下面的散点图:由此散点图,在10℃至40℃之间,下面四个回归方程类型中最适宜作为发芽率y和温度x的回归方程类型的是()A.y=a+bxB.y=a+bx2C.y=a+bexD.y=a+blnxeq\x(考点一)相关关系的判断[自主练透型]1.已知变量x和y满足关系y=-0.1x+1,变量y与z正相关.下列结论中正确的是()A.x与y正相关,x与z负相关B.x与y正相关,x与z正相关C.x与y负相关,x与z负相关D.x与y负相关,x与z正相关2.[2021·云南昆明诊断]某商家今年上半年各月的人均销售额(单位:千元)与利润率统计表如下:月份123456人均销售额658347利润率(%)12.610.418.53.08.116.3根据表中数据,下列说法正确的是()A.利润率与人均销售额成正相关关系B.利润率与人均销售额成负相关关系C.利润率与人均销售额成正比例函数关系D.利润率与人均销售额成反比例函数关系悟·技法判定两个变量正、负相关性的方法(1)画散点图:点的分布从左下角到右上角,两个变量正相关;点的分布从左上角到右下角,两个变量负相关.(2)相关系数:r>0时,正相关;r<0时,负相关.(3)线性回归方程中:eq\o(b,\s\up6(^))>0时,正相关;eq\o(b,\s\up6(^))<0时,负相关.考点二线性回归方程[互动讲练型][例1][2020·全国卷Ⅱ]某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据(xi,yi)(i=1,2,…,20),其中xi和yi分别表示第i个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得eq\i\su(i=1,20,x)i=60,eq\i\su(i=1,20,y)i=1200,eq\i\su(i=1,20,)(xi-eq\o(x,\s\up6(-)))2=80,eq\i\su(i=1,20,)(yi-eq\o(y,\s\up6(-)))2=9000,eq\i\su(i=1,20,)(xi-eq\o(x,\s\up6(-)))(yi-eq\o(y,\s\up6(-)))=800.(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);(2)求样本(xi,yi)(i=1,2,…,20)的相关系数(精确到0.01);(3)根据现有统计资料,各地块间植物覆盖面积差异很大.为提高样本的代表性以获得该地区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由.附:相关系数r=eq\f(\i\su(i=1,n,)xi-\o(x,\s\up6(-))yi-\o(y,\s\up6(-)),\r(\i\su(i=1,n,)xi-\o(x,\s\up6(-))2\i\su(i=1,n,)yi-\o(y,\s\up6(-))2)),eq\r(2)≈1.414.悟·技法求线性回归方程的基本步骤(1)先把数据制成表,从表中计算出eq\o(x,\s\up6(-))、eq\o(y,\s\up6(-)),xeq\o\al(2,1)+xeq\o\al(2,2)+…+xeq\o\al(2,n)、x1y1+x2y2+…+xnyn的值.(2)计算回归系数eq\o(a,\s\up6(^)),eq\o(b,\s\up6(^)).(3)写出线性回归方程eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^)).注:回归方程一定过点(eq\o(x,\s\up6(-)),eq\o(y,\s\up6(-))).[变式练]——(着眼于举一反三)1.[2021·大同市高三学情调研测试试题]下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(单位:吨)与相应的生产能耗y(单位:吨标准煤)的几组对照数据.x3456y2.5344.5(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法,求出y关于x的线性回归方程eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^));(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤,试根据(2)求出的线性回归方程预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤.参考数据及公式:3×2.5+4×3+5×4+6×4.5=66.5,eq\o(b,\s\up6(^))=eq\f(\i\su(i=1,n,)xi-\o(x,\s\up6(-))yi-\o(y,\s\up6(-)),\i\su(i=1,n,)xi-\o(x,\s\up6(-))2)=eq\f(\i\su(i=1,n,x)iyi-n\o(x,\s\up6(-))\o(y,\s\up6(-)),\i\su(i=1,n,x)\o\al(2,i)-n\o(x,\s\up6(-))2),eq\o(a,\s\up6(^))=eq\o(y,\s\up6(-))-eq\o(b,\s\up6(^))eq\o(x,\s\up6(-)).考点三独立性检验[互动讲练型][例2][2020·全国卷Ⅲ]某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据得到下表(单位:天):锻炼人次空气质量等级[0,200](200,400](400,600]1(优)216252(良)510123(轻度污染)6784(中度污染)720(1)分别估计该市一天的空气质量等级为1,2,3,4的概率;(2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表);(3)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好”.根据所给数据,完成下面的2×2列联表,并根据列联表,判断是否有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关.人次≤400人次>400空气质量好空气质量不好附:K2=eq\f(nad-bc2,a+bc+da+cb+d),P(K2≥k)0.0500.0100.001k3.8416.63510.828悟·技法解独立性检验的应用问题的关注点(1)两个明确:①明确两类主体;②明确研究的两个问题.(2)两个关键:①准确画出2×2列联表;②准确理解K2.提醒:准确计算K2的值是正确判断的前提.[变式练]——(着眼于举一反三)2.[2021·惠州市高三调研考试试题]某品牌汽车4S店,对该品牌旗下的A型、B型、C型汽车进行维修保养,汽车4S店记录了100辆该品牌三种类型汽车的维修情况,整理得下表:车型A型B型C型频数204040假设该店采用分层抽样的方法从上述维修的100辆该品牌三种类型汽车中随机取10辆进行问卷回访.(1)分别求抽取A型、B型、C型汽车的问卷数量.(2)维修结束后这100辆汽车的司机采用“100分制”打分的方式表示对4S店的满意度,按照大于等于80分为优秀,小于80分为合格,得到如下列联表:优秀合格合计男司机103848女司机252752合计3565100问能否在犯错误的概率不超过0.01的前提下认为司机对4S店的满意度与性别有关系?请说明原因.eq\b\lc\(\rc\)(\a\vs4\al\co1(参考公式:K2=\f(nad-bc2,a+bc+da+cb+d)))附表:P(K2≥k)0.1000.0500.0100.001k2.7063.8416.63510.828第五节变量间的相关关系与统计案例【知识重温】①一条直线②(eq\x\to(x),eq\x\to(y))③正相关④负相关⑤越强⑥0.75【小题热身】1.答案:(1)√(2)×(3)×(4)√2.解析:∵a+21=73,∴a=52.又a+22=b,∴b=74.答案:C3.解析:由eq\o(x,\s\up6(-))=30,得eq\o(y,\s\up6(-))=0.67×30+54.9=75.设表中的“模糊数字”为a,则62+a+75+81+89=75×5,∴a=68.答案:684.解析:由已知数据可得,有1-0.05=95%的把握认为“患肺病与吸烟有关”.答案:C5.解析:eq\o(b,\s\up6(^))=eq\f(-1.1,2.5)=-0.44,eq\o(y,\s\up6(-))=0.5,eq\o(x,\s\up6(-))=
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 金融服务工程承诺书
- 环保设备采购招投标合同范本
- 建筑工程脚手架租赁合同范本
- 律师协会财务风险管理规范
- 资金运用监控规范
- 眼镜生产厂房租赁合同
- 非营利组织安全责任区管理办法
- 体育产业招投标领导小组启动
- 垃圾处理安全事故防范指南
- 施工合同纠纷调解机制
- 茶园管理服务合同范例
- 药剂科工作人员的专业提升计划
- 2024-2025学年度第一学期二年级语文寒假作业第二十一天
- 贷款用设备购销合同范例
- 公务员行测真题题库及答案
- 2025支部会议记录范文
- 部队保密安全课件
- 园林施工技术创新-洞察分析
- 湖北省黄冈市2023-2024学年高二上学期期末调研考试 地理 含解析
- 医院窗帘、隔帘采购 投标方案(技术方案)
- 期末检测卷(试题)-2024-2025学年三年级上册数学人教版
评论
0/150
提交评论