版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、高考数学精品复习资料 2019.5第二讲统 计1 随机抽样抽样方法主要有简单随机抽样、系统抽样、分层抽样三种,这三种抽样方法各自适用不同特点的总体,但无论哪种抽样方法,每一个个体被抽到的概率都是相等的,都等于样本容量和总体容量的比值2 总体分布的估计在研究总体时,常用样本的频率分布去估计总体分布一般地,样本容量越大,这种估计就越精确3 线性回归方程(1)对n个样本数据(x1,y1),(x2,y2),(xn,yn),其线性回归方程为 x ,其中 , ,、分别是、的平均数(2)相关系数r0,表明两个变量正相关;r0,表明两个变量负相关;|r|越接近于1,表明两个变量的线性相关性越强;|r|越接近于
2、0,表明两个变量之间几乎不存在线性相关关系;|r|0.75时,认为两变量有很强的线性相关关系1 (20xx·陕西)某单位有840名职工,现采用系统抽样方法抽取42人做问卷调查,将840人按1,2,840随机编号,则抽取的42人中,编号落入区间481,720的人数为()a11 b12 c13 d14答案b解析由20,即每20人抽取1人,所以抽取编号落入区间481,720的人数为12(人)2 (20xx·福建)某校从高一年级学生中随机抽取部分学生,将他们的模块测试成绩分成6组:40,50),50,60),60,70),70,80),80,90),90,100加以统计,得到如图所
3、示的频率分布直方图已知高一年级共有学生600名,据此估计,该模块测试成绩不少于60分的学生人数为()a588 b480 c450 d120答案b解析少于60分的学生人数600×(0.050.15)120(人),不少于60分的学生人数为480人3 (20xx·重庆)以下茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分)甲组乙组909x215y87424已知甲组数据的中位数为15,乙组数据的平均数为16.8,则x,y的值分别为()a2,5 b5,5 c5,8 d8,8答案c解析由于甲组中有5个数,比中位数小的有两个数为9,12,比中位数大的也有两个数24,2
4、7,所以10x15,x5.又因16.8,所以y8,故选c.4 (20xx·湖南)设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(xi,yi)(i1,2,n),用最小二乘法建立的回归方程为0.85x85.71,则下列结论中不正确的是()ay与x具有正的线性相关关系b回归直线过样本点的中心(,)c若该大学某女生身高增加1 cm,则其体重约增加0.85 kgd若该大学某女生身高为170 cm,则可断定其体重必为58.79 kg答案d解析由于线性回归方程中x的系数为0.85,因此y与x具有正的线性相关关系,故a正确又线性回归方程必过样本点中心(,)
5、,因此b正确由线性回归方程中系数的意义知,x每增加1 cm,其体重约增加0.85 kg,故c正确当某女生的身高为170 cm时,其体重估计值是58.79 kg,而不是具体值,因此d不正确5 (20xx·江苏)抽样统计甲、乙两位射击运动员的5次训练成绩(单位:环),结果如下:运动员第1次第2次第3次第4次第5次甲8791908993乙8990918892则成绩较为稳定(方差较小)的那位运动员成绩的方差为_答案2解析甲(8791908993)90,乙(8990918892)90,s(8790)2(9190)2(9090)2(8990)2(9390)24,s(8990)2(9090)2(9
6、190)2(8890)2(9290)22.题型一抽样方法例1(1)采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9.抽到的32人中,编号落入区间1,450的人做问卷a,编号落入区间451,750的人做问卷b,其余的人做问卷c.则抽到的人中,做问卷b的人数为()a7 b9 c10 d15(2)某学校高一、高二、高三三个年级共有学生3 500人,其中高三学生数是高一学生数的两倍,高二学生数比高一学生数多300人,现在按的抽样比用分层抽样的方法抽取样本,则应抽取高一学生数为()a8 b11 c16 d10审题破题
7、系统抽样的特点是“等距”,分层抽样最重要的是“比例”答案(1)c(2)a解析(1)由系统抽样的特点知:抽取号码的间隔为30,抽取的号码依次为9,39,69,939.落入区间451,750的有459,489,729,这些数构成首项为459,公差为30的等差数列,设有n项,显然有729459(n1)×30,解得n10.所以做问卷b的有10人(2)若设高三学生数为x,则高一学生数为,高二学生数为300,所以有x3003 500,解得x1 600,故高一学生数为800,因此应抽取高一学生数为8.反思归纳(1)在系统抽样的过程中,要注意分段间隔,需要抽取几个个体,样本就需要分成几个组,则分段间
8、隔即为(n为样本容量),首先确定在第一组中抽取的个体的号码数,再从后面的每组中按规则抽取每个个体(2)在分层抽样中,要求各层在样本中和总体中所占比例相同变式训练1(1)要完成下列两项调查:从某社区125户高收入家庭、280户中等收入家庭、95户低收入家庭中选出100户调查社会购买力的某项指标;某中学的15名艺术特长生中选出3人调查学习负担情况宜采用的抽样方法依次为()a简单随机抽样法,系统抽样法b分层抽样法,简单随机抽样法c系统抽样法,分层抽样法d都用分层抽样法答案b(2)防疫站对学生进行身体健康调查,采用分层抽样法抽取,某中学高三有学生1 600人,抽取一个容量为200的样本,已知女生比男生
9、少抽10人,则该校的女生人数应该有_答案760解析设该校的女生为x人,男生为(1 600x)人,则按照分层抽样,各层的比例为,所以女生抽取,男生抽取,所以10,解得x760.题型二用样本估计总体例2(20xx·广东)某校100名学生期中考试语文成绩的频率分布直方图如图所示,其中成绩分组区间是50,60),60,70),70,80),80,90),90,100(1)求图中a的值;(2)根据频率分布直方图,估计这100名学生语文成绩的平均分;(3)若这100名学生语文成绩某些分数段的人数(x)与数学成绩相应分数段的人数(y)之比如下表所示,求数学成绩在50,90)之外的人数.分数段50,
10、60)60,70)70,80)80,90)xy11213445审题破题(1)根据样本频率之和为1,求出参数a的值;(2)根据频率分布直方图和平均值的计算公式,求出样本平均值;(3)由直方图可计算语文成绩在每分段上的频数,再根据语文和数学成绩在同一段上的人数比,便可计算数学成绩在50,90)之间的人数,进而求解解(1)由频率分布直方图知(2a0.020.030.04)×101,解得a0.005.(2)由频率分布直方图知这100名学生语文成绩的平均分为55×0.005×1065×0.04×1075×0.03×1085×
11、0.02×1095×0.005×1073(分)(3)由频率分布直方图知语文成绩在50,60),60,70),70,80),80,90)各分数段的人数依次为0.005×10×1005,004×10×10040,0.03×10×10030,0.02×10×10020.由题中给出的比例关系知数学成绩在上述各分数段的人数依次为5,40×20,30×40,20×25.故数学成绩在50,90)之外的人数为100(5204025)10(人)反思归纳频率分布直方图直观形象
12、地表示了样本的频率分布,从这个直方图上可以求出样本数据在各个组的频率分布根据频率分布直方图估计样本(或者总体)的平均值时,一般是采取组中值乘以各组的频率的方法方差和标准差都是用来描述一组数据波动情况的特征数,常用来比较两组数据的波动大小方差较大的波动较大,方差较小的波动较小变式训练2(1)从甲、乙两个城市分别随机抽取16台自动售货机,对其销售额进行统计,统计数据用茎叶图表示(如图所示)设甲乙两组数据的平均数分别为甲,乙,中位数分别为m甲,m乙,则()a.甲<乙,m甲>m乙 b.甲<乙,m甲<m乙c.甲>乙,m甲>m乙 d.甲>乙,m甲<m乙答案b
13、解析由茎叶图可知甲数据集中在10至20之间,乙数据集中在20至40之间,明显甲乙,甲的中位数为20,乙的中位数为29,即m甲m乙(2)某校举行了由全部学生参加的校园安全知识考试,从中抽出60名学生,将其成绩分成六段40,50),50,60),90,100)后,画出如图所示的频率分布直方图观察图形的信息,回答下列问题:估计这次考试的及格率(60分及以上为及格)为_;平均分为_答案75%71解析及格的各组的频率是(0.0150.030.0250.005)×100.75,即及格率约为75%;样本的均值为45×0.155×0.1565×0.1575×0
14、.385×0.2595×0.0571,以这个分数估计总体的分数即得总体的平均分数约为71.题型三两个变量的线性相关例3某产品的广告费用x与销售额y的统计数据如下表:广告费用x(万元)4235销售额y(万元)49263954根据上表可得线性回归方程 x 中的 为9.4,据此模型预报广告费用为6万元时销售额为()a63.6万元 b65.5万元c67.7万元 d72.0万元审题破题可以通过回归直线过(,)求出 ,然后进行预报答案b解析,42,又 x 必过(,),42×9.4 , 9.1.线性回归方程为 9.4x9.1.当x6时, 9.4×69.165.5(万元
15、)反思归纳线性回归分析中,回归直线过(,)是解决问题的核心变式训练3某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:单价x(元)88.28.48.68.89销量y(件)908483807568(1)求线性回归方程x,其中20,;(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润销售收入成本)解(1)由于(88.28.48.68.89)8.5,(908483807568)80,又20,所以8020×8.5250,从而线性回归方程为20x250.(2)设工厂
16、获得的利润为l元,依题意得lx(20x250)4(20x250)20x2330x1 00020(x8.25)2361.25.当且仅当x8.25时,l取得最大值故当单价定为8.25元时,工厂可获得最大利润典例(12分)在“20xx魅力新安江”青少年才艺表演评比活动中,参赛选手成绩的茎叶图和频率分布直方图都受到不同程度的破坏,可见部分如图,据此回答以下问题:(1)求参赛总人数和频率分布直方图中80,90)之间的矩形的高,并完成直方图;(2)若要从分数在80,100之间任取两份进行分析,在抽取的结果中,求至少有一份分数在90,100之间的概率解(1)由茎叶图知,分数在50,60)之间的频数为2.由频
17、率分布直方图知,分数在50,60)之间的频率为0008×100.08.所以参赛总人数为25(人)2分分数在80,90)之间的人数为25271024(人),分数在80,90)之间的频率为0.16,得频率分布直方图中80,90)间矩形的高为0.016.4分完成直方图,如图 7分(2)将80,90)之间的4个分数编号为1,2,3,4;90,100之间的2个分数编号为5和6.8分则在80,100之间任取两份的基本事件为(1,2),(1,3),(1,4),(1,5),(1,6),(2,3),(2,4),(2,5),(2,6),(3,4),(3,5),(3,6),(4,5),(4,6),(5,6
18、),共15个,10分其中至少有一个在90,100之间的基本事件为(1,5),(1,6),(2,5),(2,6),(3,5),(3,6),(4,5),(4,6),(5,6),共9个故至少有一份分数在90,100之间的概率是.12分评分细则(1)计算出参赛总人数给2分,画出频率分布直方图给3分;(2)列举基本事件不全扣1分,不写最后结论扣1分阅卷老师提醒频率分布直方图和概率的结合是高考考查的热点,解题时要审清题意,把握频率分布直方图所体现的频率分布或数字特征1 某校共有学生2 000名,各年级男、女生人数如表所示已知在全校学生中随机抽取1名,抽到二年级女生的概率是0.19.现用分层抽样的方法在全校
19、抽取64名学生,则应在三年级抽取的学生人数为()一年级二年级三年级女生373xy男生377370za.24 b18 c16 d12答案c解析由2 000×0.19380知二年级的学生人数为380370750,由于一年级的学生人数为373377750,于是三年级的学生人数为2 000750750500,那么三年级应抽取的人数为500×16(人)2 (20xx·山东)在某次测量中得到的a样本数据如下:82,84,84,86,86,86,88,88,88,88.若b样本数据恰好是a样本数据每个都加2后所得数据,则a,b两样本的下列数字特征对应相同的是()a众数 b平均数
20、 c中位数 d标准差答案d解析对样本中每个数据都加上一个非零常数时不改变样本的方差和标准差,众数、中位数、平均数都发生改变3 高三(1)班共有56人,学号依次为1,2,3,56,现用系统抽样的方法抽取一个容量为4的样本已知学号为6,34,48的同学在样本中,那么还有一个同学的学号应为_答案20解析由题意可知,可将学号依次为1,2,3,56的56名同学分成4组,每组14人,抽取的样本中,若将他们的学号按从小到大的顺序排列,彼此之间会相差14.故还有一个同学的学号应为61420.4 (20xx·湖北)从某小区抽取100户居民进行月用电量调查,发现其用电量都在50至350度之间,频率分布直
21、方图如图所示(1)直方图中x的值为 _;(2)在这些用户中,用电量落在区间100,250)内的户数为_答案(1)0.004 4(2)70解析(1)(0.002 40.003 60.006 0x0.002 40.001 2)×501,x0.004 4.(2)(0.003 60.004 40.006 0)×50×10070.5 (20xx·辽宁)为了考察某校各班参加课外书法小组的人数,从全校随机抽取5个班级,把每个班级参加该小组的人数作为样本数据,已知样本平均数为7,样本方差为4,且样本数据互不相同,则样本数据中的最大值为_答案10解析设5个班级中参加的人数
22、分别为x1,x2,x3,x4,x5,则由题意知7,(x17)2(x27)2(x37)2(x47)2(x57)220,五个整数的平方和为20,则必为0119920,由|x7|3可得x10或x4.由|x7|1可得x8或x6.由上可知参加的人数分别为4,6,7,8,10,故最大值为10.专题限时规范训练一、选择题1 (20xx·安徽)某班级有50名学生,其中有30名男生和20名女生,随机询问了该班五名男生和五名女生在某次数学测验中的成绩,五名男生的成绩分别为86,94,88,92,90,五名女生的成绩分别为88,93,93,88,93.下列说法一定正确的是()a这种抽样方法是一种分层抽样b
23、这种抽样方法是一种系统抽样c这五名男生成绩的方差大于这五名女生成绩的方差d该班男生成绩的平均数小于该班女生成绩的平均数答案c解析男(8694889290)90,女(8893938893)91,s(8690)2(9490)2(8890)2(9290)2(9090)28,s(8891)2(9391)2(9391)2(8891)2(9391)26.2 (20xx·湖南)某学校有男、女学生各500名,为了解男、女学生在学习兴趣与业余爱好方面是否存在显著差异,拟从全体学生中抽取100名学生进行调查,则宜采用的抽样方法是()a抽签法 b随机数法c系统抽样法 d分层抽样法答案d解析总体(100名学
24、生)中的个体(男、女学生)有明显差异,应采用分层抽样3 为了解一片大约10 000株树木的生长情况,随机测量了其中100株树木的底部周长(单位:cm)根据所得数据画出的样本频率分布直方图如图所示,那么在这片树木中,底部周长小于110 cm的树木大约有()a3 000株 b6 000株c7 000株 d8 000株答案c解析底部周长小于110 cm的频率为(0.010.020.04)×100.7,所以底部周长小于110 cm的树木大约有10 000×0.77 000株,故选c.4 如图是歌手大奖赛中,七位评委为甲、乙两名选手打出的分数的茎叶图(其中m为数字09中的一个),去掉
25、一个最高分和一个最低分后,甲、乙两名选手得分的平均数分别为a1、a2,则一定有()a.a1>a2 ba2>a1ca1a2 da1,a2大小与m的值有关答案b解析去掉一个最高分和一个最低分后,甲选手叶上的数字之和是20,乙选手叶上的数字之和是25,故a2>a1.5 假设学生初一和初二数学成绩是线性相关的若10个学生初一(x)和初二(y)的数学分数如下:x74717268767367706574y76757170767965776272则初一和初二数学分数间的线性回归方程是()a.1.218 2x14.192b.14.192x1.218 2c.1.218 2x14.192d.14
26、.192x1.218 2答案a解析因为71,50 520,72.3,iyi51 467,所以, 1.218 2. 72.31.218 2×7114.192 2,线性回归方程是: 1.218 2x14.192 2.6 (20xx·江西)总体由编号为01,02,19,20的20个个体组成,利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为()7816657208026314070243699728019832049234493582003623486969387481a.08 b07 c02
27、d01答案d解析从第1行第5列、第6列组成的数65开始由左到右依次选出的数为:08,02,14,07,01,所以第5个个体编号为01.7 在发生某公共卫生事件期间,有专业机构认为该事件在一段时间内没有发生大规模群体感染的标志为“连续10天,每天新增疑似病例不超过7人”根据过去10天甲、乙、丙、丁四地新增疑似病例数据,一定符合该标志的是()a甲地:总体均值为3,中位数为4b乙地:总体均值为1,总体方差大于0c丙地:中位数为2,众数为3d丁地:总体均值为2,总体方差为3答案d解析逐项验证,由0,0,0,2,4,4,4,4,4,8可知,a错;由0,0,0,0,0,0,0,0,2,8可知,b错;由0,
28、0,1,1,2,2,3,3,3,8可知,c错d中2.3.即(x12)2(x22)2(x102)230.显然(xi2)230(i1,2,10),xin*即xi7.8 有一个容量为200的样本,其频率分布直方图如图所示根据样本的频率分布直方图估计,样本数据落在区间10,12)内的频数为()a18 b36 c54 d72答案b解析由0.020.050.150.190.41,落在区间2,10)内的频率为0.41×20.82.落在区间10,12)内的频率为10.820.18.样本数据落在区间10,12)内的频数为0.18×20036.二、填空题9 (20xx·山东改编)将某
29、选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91.现场作的9个分数的茎叶图后来有1个数据模糊,无法辨认,在图中以x表示:则7个剩余分数的方差为_答案解析由题意知91,解得x4.所以s2(8791)2(9491)2(9091)2(9191)2(9091)2(9491)2(9191)2(16910190).10如图是根据部分城市某年6月份的平均气温(单位:)数据得到的样本频率分布直方图,其中平均气温的范围是20.5,26.5,样本数据的分组为20.5,21.5),21.5,22.5),22.5,23.5),23.5,24.5),24.5,25.5),25.5,26.5已知样
30、本中平均气温低于22.5 的城市个数为11,则样本中平均气温不低于25.5 的城市个数为_答案9解析最左边两个矩形面积之和为0.10×10.12×10.22,总城市数为11÷0.2250,最右面矩形面积为0.18×10.18,50×0.189.11甲、乙两人在10天中每天加工零件的个数用茎叶图表示如下图,中间一列的数字表示零件个数的十位数,两边的数字表示零件个数的个位数,则这10天甲、乙两人日加工零件的平均数分别为_和_答案2423解析甲×(19182021232220313135)24.乙×(19171121242224303230)23.12已知总体的各个体的值由小到大依次为2,3,3,7,a,b,12,13.7,18.3,20,且总体的中位数为10.5,若要使该总体的方差最小,则a、b的取值分别是_、_.答案10.510.5解析中位数为10.5,10.5,ab21,10,s2(210)2(310)2(310)2(710)2(a10)2(b10)2(1210)2(13.710)2(18.310)2(2010)2令y(10a)2(10b)22a242a22122,当a10.5时,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年度年福建省高校教师资格证之高等教育心理学模拟考试试卷B卷含答案
- 2024年度山西省高校教师资格证之高等教育法规考前练习题及答案
- 历史教师培训心得体会
- 2024年度茶叶批发销售协议范本
- 2024年私人贷款协议样式
- 房产买卖居间服务协议2024全攻略
- 2024年家庭装修协议
- 2024游乐场设施租赁协议模板
- 2024年居间合作项目协议精简
- 2024年跨境资本贷款协议示例
- 简述孤儿学生的心理特点与教育方法
- 中国石油天然气股份有限公司股权处置实施细则
- 慢性支气管炎讲稿
- 常用钢制管件弯头三通异径管管帽理论重量体积表
- 柴油购销合同
- 高炉矿渣粉的生产、成本及其应用
- MD380总体技术方案重点讲义
- 天车道轨施工方案
- 城建档案馆资料归档目录
- 酒店流水单模版
- 开盘八法概述
评论
0/150
提交评论