(数学文)精选历年真题及名校模拟试题汇编提分训练:统计、统计案例_第1页
(数学文)精选历年真题及名校模拟试题汇编提分训练:统计、统计案例_第2页
(数学文)精选历年真题及名校模拟试题汇编提分训练:统计、统计案例_第3页
(数学文)精选历年真题及名校模拟试题汇编提分训练:统计、统计案例_第4页
(数学文)精选历年真题及名校模拟试题汇编提分训练:统计、统计案例_第5页
已阅读5页,还剩26页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 统计、统计案例高考试题考点一 抽样的方法1.(2013年江西卷,文5)总体由编号为01,02,19,20的20个个体组成.利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为()7816657208026314070243699728019832049234493582003623486969387481(A)08(B)07(C)02(D)01解析:从左到右第1行的第5列和第6列数字是65,依次选取符合条件的数字分别是08,02,14,07,01,故选出来的第5个个体的编号为01.答案:D2.(2013年湖南

2、卷,文3)某工厂甲、乙、丙三个车间生产了同一种产品,数量分别为120件,80件,60件.为了解它们的产品质量是否存在显著差异,用分层抽样方法抽取了一个容量为n的样本进行调查,其中从丙车间的产品中抽取了3件,则n=()(A)9 (B)10(C)12(D)13解析:因为甲乙丙=1208060=643,所以 QUOTE = QUOTE ,得n=13.故选D.答案:D3.(2012年四川卷,文3)交通管理部门为了解机动车驾驶员(简称驾驶员)对某新法规的知晓情况,对甲、乙、丙、丁四个社区做分层抽样调查.假设四个社区驾驶员的总人数为N,其中甲社区有驾驶员96人.若在甲、乙、丙、丁四个社区抽取驾驶员的人数分

3、别为12,21,25,43,则这四个社区驾驶员的总人数N为()(A)101(B)808(C)1212(D)2012解析:根据分层抽样的特点可知 QUOTE N=96,解得N=808,故选B.答案:B4.(2011年福建卷,文4)某校选修乒乓球课程的学生中,高一年级有30名,高二年级有40名.现用分层抽样的方法在这70名学生中抽取一个样本.已知在高一年级的学生中抽取了6名,则在高二年级的学生中应抽取的人数为()(A)6 (B)8 (C)10 (D)12解析:设在高二年级的学生中应抽取的人数为x.由分层抽样的特点有3040=6x,则x=8,即在高二年级的学生中应抽取8人.故选B.答案:B5.(20

4、12年浙江卷,文11)某个年级有男生560人,女生420人,用分层抽样的方法从该年级全体学生中抽取一个容量为280的样本,则此样本中男生人数为.解析:本题主要考查分层抽样,因为560+420=980,所以560 QUOTE =160.答案:1606.(2012年江苏卷,2)某学校高一、高二、高三年级的学生人数之比为334,现用分层抽样的方法从该校高中三个年级的学生中抽取容量为50的样本,则应从高二年级抽取名学生.解析:因为高二年级学生人数占总数的 QUOTE ,样本容量为50,所以50 QUOTE =15.答案:15考点二 统计图表1.(2013年重庆卷,文6)如图是某公司10个销售店某月销售

5、某产品数量(单位:台)的茎叶图,则数据落在区间22,30)内的频率为()(A)0.2(B)0.4(C)0.5(D)0.6解析:由茎叶图可知落在22,30)内的数据有4个,频率为 QUOTE =0.4.故选B.答案:B2.(2013年辽宁卷,文5)某班的全体学生参加英语测试,成绩的频率分布直方图如图,数据的分组依次为:20,40),40,60),60,80),80,100.若低于60分的人数是15,则该班的学生人数是()(A)45(B)50(C)55(D)60解析:设该班人数为n,则20(0.005+0.01)n=15,n=50,故选B.答案:B3.(2013年四川卷,文7)某学校随机抽取20个

6、班,调查各班中有网上购物经历的人数,所得数据的茎叶图如图所示.以组距为5将数据分组成0,5),5,10),30,35),35,40时,所作的频率分布直方图是()解析:由茎叶图知,各组频数统计如下表:分组0,5)5,10)10,15)15,20)20,25)25,30)30,35)35,40频数11424332上表对应的频率分布直方图为A,故选A.答案:A4.(2012年陕西卷,文3)对某商店一个月内每天的顾客人数进行了统计,得到样本的茎叶图(如图所示),则该样本的中位数、众数、极差分别是()(A)46,45,56(B)46,45,53(C)47,45,56(D)45,47,53解析:由概念知中

7、位数是中间两数的平均数,即 QUOTE =46,众数是45,极差为68-12=56.所以选A.答案:A5.(2011年湖北卷,文5)有一个容量为200的样本,其频率分布直方图如图所示.根据样本的频率分布直方图估计,样本数据落在区间10,12)内的频数为()(A)18(B)36(C)54(D)72解析:样本数据在10,12)内的频率为1-2(0.02+0.05+0.15+0.19)=0.18.样本数据在10,12)内的频数为2000.18=36,故选B.答案:B6.(2012年山东卷,文14)如图是根据部分城市某年6月份的平均气温(单位:)数据得到的样本频率分布直方图,其中平均气温的范围是20.

8、5,26.5,样本数据的分组为20.5,21.5),21.5,22.5),22.5,23.5),23.5,24.5),24.5,25.5),25.5,26.5.已知样本中平均气温低于22.5 的城市个数为11,则样本中平均气温不低于25.5 的城市个数为.解析:设样本容量为n,则(0.1+0.12)n=11,解得n=50,故气温不低于25.5 的城市个数为:500.18=9.答案:97.(2010年浙江卷,文11)在如图所示的茎叶图中,甲、乙两组数据的中位数分别是,.解析:甲组数据为:28,31,39,42,45,55,57,58,66,中位数为45.乙组数据为:29,34,35,42,46,

9、48,53,55,67,中位数为46.答案:45468.(2013年新课标全国卷,文18)为了比较两种治疗失眠症的药(分别称为A药,B药)的疗效,随机地选取20位患者服用A药,20位患者服用B药,这40位患者在服用一段时间后,记录他们日平均增加的睡眠时间(单位:h).试验的观测结果如下:服用A药的20位患者日平均增加的睡眠时间:0.61.22.71.52.81.82.22.33.23.52.52.61.22.71.52.93.03.12.32.4服用B药的20位患者日平均增加的睡眠时间:3.21.71.90.80.92.41.22.61.31.41.60.51.80.62.11.12.51.2

10、2.70.5(1)分别计算两组数据的平均数,从计算结果看,哪种药的疗效更好?(2)根据两组数据完成下面茎叶图,从茎叶图看,哪种药的疗效更好?解:(1)设A药观测数据的平均数为 QUOTE ,B药观测数据的平均数为 QUOTE .由观测结果可得 QUOTE = QUOTE (0.6+1.2+1.2+1.5+1.5+1.8+2.2+2.3+2.3+2.4+2.5+2.6+2.7+2.7+2.8+2.9+3.0+3.1+3.2+3.5)=2.3, QUOTE = QUOTE (0.5+0.5+0.6+0.8+0.9+1.1+1.2+1.2+1.3+1.4+1.6+1.7+1.8+1.9+2.1+2.

11、4+2.5+2.6+2.7+3.2)=1.6.由以上计算结果可得 QUOTE QUOTE ,由此可看出A药的疗效更好.(2)由观测结果可绘制如下茎叶图:从以上茎叶图可以看出,A药疗效的试验结果有 QUOTE 的叶集中在茎“2.”,“3.”上,而B药疗效的试验结果有 QUOTE 的叶集中在茎“0.”,“1.”上,由此可看出A药的疗效更好.9.(2013年新课标全国卷,文19)经销商经销某种农产品,在一个销售季度内,每售出1 t该产品获利润500元,未售出的产品,每1 t亏损300元.根据历史资料,得到销售季度内市场需求量的频率分布直方图,如图所示.经销商为下一个销售季度购进了130 t该农产品.

12、以X(单位:t,100X150)表示下一个销售季度内的市场需求量,T(单位:元)表示下一个销售季度内经销该农产品的利润.(1)将T表示为X的函数;(2)根据直方图估计利润T不少于57000元的概率.解:(1)当X100,130)时,T=500X-300(130-X)=800X-39000.当X130,150时,T=500130=65000.所以T= QUOTE (2)由(1)知利润T不少于57000元当且仅当120X150.由直方图知需求量X120,150的频率为0.7,所以下一个销售季度内的利润T不少于57000元的概率的估计值为0.7.10.(2013年广东卷,文17)从一批苹果中,随机抽

13、取50个,其重量(单位:克)的频数分布表如下:分组(重量)80,85)85,90)90,95)95,100)频数(个)5102015(1)根据频数分布表计算苹果的重量在90,95)的频率;(2)用分层抽样的方法从重量在80,85)和95,100)的苹果中共抽取4个,其中重量在80,85)的有几个?(3)在(2)中抽出的4个苹果中,任取2个,求重量在80,85)和95,100)中各有1个的概率.解:(1)由题意知苹果的样本总数n=50,在90,95)的频数是20,苹果的重量在90,95)的频率是 QUOTE =0.4.(2)设从重量在80,85)的苹果中抽取x个,则从重量在95,100)的苹果中

14、抽取(4-x)个.表格中80,85),95,100)的频数分别是5,15,515=x(4-x),解得x=1.即重量在80,85)的有1个.(3)在(2)中抽出的4个苹果中,重量在80,85)的有1个,记为a,重量在95,100)的有3个,记为b1,b2,b3,任取2个,有ab1、ab2、ab3、b1b2、b1b3、b2b3共6种不同方法.记基本事件总数为n,则n=6,其中重量在80,85)和95,100)中各有1个的事件记为A,事件A包含的基本事件为ab1、ab2、ab3,共3个,由古典概型的概率计算公式得P(A)= QUOTE = QUOTE .11.(2013年安徽卷,文17)为调查甲、乙

15、两校高三年级学生某次联考数学成绩情况,用简单随机抽样,从这两校中各抽取30名高三年级学生,以他们的数学成绩(百分制)作为样本,样本数据的茎叶图如图所示:(1)若甲校高三年级每位学生被抽取的概率为0.05,求甲校高三年级学生总人数,并估计甲校高三年级这次联考数学成绩的及格率(60分及60分以上为及格);(2)设甲、乙两校高三年级学生这次联考数学平均成绩分别为 QUOTE , QUOTE ,估计 QUOTE - QUOTE 的值.解:(1)设甲校高三年级学生总人数为n.由题意知, QUOTE =0.05,即n=600.样本中甲校高三年级学生数学成绩不及格人数为5,据此估计甲校高三年级此次联考数学成

16、绩及格率为1- QUOTE = QUOTE .(2)设甲、乙两校样本平均数分别为, .根据样本茎叶图可知,30(-)=30-30=(7-5)+(55+8-14)+(24-12-65)+(26-24-79)+(22-20)+92=2+49-53-77+2+92=15.因此-=0.5.故 QUOTE - QUOTE 的估计值为0.5分.12.(2012年陕西卷,文19)假设甲乙两种品牌的同类产品在某地区市场上销售量相等,为了解他们的使用寿命,现从这两种品牌的产品中分别随机抽取100个进行测试,结果统计如图所示:(1)估计甲品牌产品寿命小于200小时的概率;(2)这两种品牌产品中,某个产品已使用了2

17、00小时,试估计该产品是甲品牌的概率.解:(1)根据题意知:甲品牌产品寿命小于200小时的频率为 QUOTE = QUOTE ,用频率估计概率,所以甲品牌产品寿命小于200小时的概率为 QUOTE .(2)根据抽样结果,寿命大于200小时的产品有75+70=145(个),其中甲品牌产品75个,因而在样本中寿命大于200小时的产品是甲品牌的频率是 QUOTE = QUOTE ,由此估计概率为 QUOTE .考点三 样本的数字特征1.(2013年山东卷,文10)将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91,现场作的9个分数的茎叶图后来有1个数据模糊,无法辨认,在图中

18、以x表示:则7个剩余分数的方差为()(A) QUOTE (B) QUOTE (C)36 (D) QUOTE 解析:由题知去掉两个数为87,99.剩余数的平均数为 QUOTE =91.得x=4,即剩余7个数为87,94,90,91,90,94,91.方差s2= QUOTE (87-91)2+(94-91)2+(90-91)2+(91-91)2+(90-91)2+(94-91)2+(91-91)2= QUOTE .故选B.答案:B2.(2012年山东卷,文4)在某次测量中得到的A样本数据如下:82,84,84,86,86,86,88,88,88,88.若B样本数据恰好是A样本数据每个都加2后所得数

19、据,则A,B两样本的下列数字特征对应相同的是()(A)众数 (B)平均数(C)中位数 (D)标准差解析:根据标准差的性质,易知答案为D.答案:D3.(2013年辽宁卷,文16)为了考察某校各班参加课外书法小组的人数,从全校随机抽取5个班级,把每个班级参加该小组的人数作为样本数据.已知样本平均数为7,样本方差为4,且样本数据互不相同,则样本数据中的最大值为.解析:设5个班级的数据分别为0abcd0,则判别式0,解得-4tb, QUOTE a(B) QUOTE b, QUOTE a(C) QUOTE a(D) QUOTE b, QUOTE a解析:由两组数据(1,0)和(2,2)可求b= QUOT

20、E =2,a=0-21=-2.利用线性回归方程的公式与已知表格中的数据,可求得 QUOTE = QUOTE = QUOTE = QUOTE , QUOTE = QUOTE - QUOTE = QUOTE - QUOTE QUOTE =- QUOTE ,所以 QUOTE a.故选C.答案:C2.(2013年湖北卷,文4)四名同学根据各自的样本数据研究变量x,y之间的相关关系,并求得回归直线方程,分别得到以下四个结论:y与x负相关且 QUOTE =2.347x-6.423;y与x负相关且 QUOTE =-3.476x+5.648;y与x正相关且 QUOTE =5.437x+8.493;y与x正相关

21、且 QUOTE =-4.326x-4.578.其中一定不正确的结论的序号是()(A)(B)(C)(D)解析:若y与x正相关,则回归直线的斜率为正,若y与x负相关,则回归直线的斜率为负,因此一定不正确,故选D.答案:D3.(2012年新课标全国卷,文3)在一组样本数据(x1,y1),(x2,y2),(xn,yn)(n2,x1,x2,xn不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,n)都在直线y= QUOTE x+1上,则这组样本数据的样本相关系数为()(A)-1(B)0 (C) QUOTE (D)1解析:由所有样本点都在直线y= QUOTE x+1上,即相关性最强,且为正相关,

22、故相关系数为1,故选D.答案:D4.(2011年山东卷,文8)某产品的广告费用x与销售额y的统计数据如下表:广告费用x(万元)4235销售额y(万元)49263954根据上表可得回归方程 QUOTE = QUOTE x+ QUOTE 中的 QUOTE 为9.4,据此模型预报广告费用为6万元时销售额为()(A)63.6万元(B)65.5万元(C)67.7万元(D)72.0万元解析:据表可得 QUOTE = QUOTE = QUOTE , QUOTE = QUOTE =42,回归直线过样本中心点,且 QUOTE =9.4, QUOTE =9.1.即回归方程为 QUOTE =9.4x+9.1,当x=

23、6时, =65.5,故选B.答案:B5.(2011年陕西卷,文9)设(x1,y1),(x2,y2),(xn,yn)是变量x和y的n个样本点,直线l是由这些样本点通过最小二乘法得到的线性回归直线(如图),以下结论正确的是()(A)直线l过点( QUOTE , QUOTE )(B)x和y的相关系数为直线l的斜率(C)x和y的相关系数在0到1之间(D)当n为偶数时,分布在l两侧的样本点的个数一定相同解析:样本点的中心( QUOTE , QUOTE )必在回归直线上.故选A.答案:A6.(2010年湖南卷,文3)某商品销售量y(件)与销售价格x(元/件)负相关,则其回归方程可能是()(A) QUOTE

24、 =-10 x+200(B) QUOTE =10 x+200(C) QUOTE =-10 x-200(D) QUOTE =10 x-200解析:销售量y(件)与销售价格x(元/件)负相关,x的系数为负.又y不能为负值,常数项必须是正值.故选A.答案:A7.(2013年重庆卷,文17)从某居民区随机抽取10个家庭,获得第i个家庭的月收入xi(单位:千元)与月储蓄yi(单位:千元)的数据资料,算得 QUOTE =80, =20, =184, =720.(1)求家庭的月储蓄y对月收入x的线性回归方程y=bx+a;(2)判断变量x与y之间是正相关还是负相关;(3)若该居民区某家庭月收入为7千元,预测该

25、家庭的月储蓄.附:线性回归方程y=bx+a中,b= QUOTE ,a= QUOTE -b QUOTE ,其中 QUOTE , QUOTE 为样本平均值,线性回归方程也可写为 QUOTE = QUOTE x+ QUOTE .解:(1)由题意知n=10, QUOTE = QUOTE =8, QUOTE = QUOTE = QUOTE =2,又=720-1082=80, =184-1082=24,由此得b= QUOTE = QUOTE =0.3,a= QUOTE -b QUOTE =2-0.38=-0.4,故所求回归方程为y=0.3x-0.4.(2)由于变量y的值随x值的增加而增加(b=0.30),

26、故x与y之间是正相关.(3)将x=7代入回归方程可以预测该家庭的月储蓄为y=0.37-0.4=1.7(千元).8.(2012年福建卷,文18)某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:单价x(元)88.28.48.68.89销量y(件)908483807568(1)求回归直线方程 QUOTE =bx+a,其中b=-20,a= QUOTE -b QUOTE ;(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)解:(1) QUOTE = QUO

27、TE (x1+x2+x3+x4+x5+x6)= QUOTE (8+8.2+8.4+8.6+8.8+9)=8.5, QUOTE = (y1+y2+y3+y4+y5+y6)= QUOTE (90+84+83+80+75+68)=80.a= QUOTE -b QUOTE =80+208.5=250,回归直线方程为 QUOTE =-20 x+250.(2)设工厂获得的利润为L元,依题意得:L=x(-20 x+250)-4(-20 x+250)=-20 x2+330 x-1000=-20+361.25,当且仅当x= QUOTE =8.25时,L取得最大值,故当单价定为8.25元时,工厂可获得最大利润.考

28、点五 独立性检验1.(2011年湖南卷,文5)通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:男女总计爱好402060不爱好203050总计6050110由K2= QUOTE 算得,K2= QUOTE 7.8.附表:P(K2k)0.0500.0100.001k3.8416.63510.828参照附表,得到的正确结论是()(A)有99%以上的把握认为“爱好该项运动与性别有关”(B)有99%以上的把握认为“爱好该项运动与性别无关”(C)在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”(D)在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关

29、”解析:K27.86.635,有99%以上的把握认为“爱好该项运动与性别有关”.故选A.答案:A2.(2013年福建卷,文19)某工厂有25周岁以上(含25周岁)工人300名,25周岁以下工人200名.为研究工人的日平均生产量是否与年龄有关,现采用分层抽样的方法,从中抽取了100名工人,先统计了他们某月的日平均生产件数,然后按工人年龄在“25周岁以上(含25周岁)”和“25周岁以下”分为两组,再将两组工人的日平均生产件数分为5组:50,60),60,70),70,80),80,90),90,100分别加以统计,得到如图所示的频率分布直方图.(1)从样本中日平均生产件数不足60件的工人中随机抽取

30、2人,求至少抽到一名“25周岁以下组”工人的概率;(2)规定日平均生产件数不少于80件者为“生产能手”,请你根据已知条件完成22列联表,并判断是否有90%的把握认为“生产能手与工人所在的年龄组有关”?P(2k)0.1000.0500.0100.001k2.7063.8416.63510.828附:2= QUOTE (注:此公式也可以写成K2= QUOTE )解:(1)由已知得,样本中有25周岁以上组工人60名,25周岁以下组工人40名.所以,样本中日平均生产件数不足60件的工人中,25周岁以上组工人有600.05=3(人),记为A1,A2,A3;25周岁以下组工人有400.05=2(人),记为

31、B1,B2.从中随机抽取2名工人,所有的可能结果共有10种,它们是(A1,A2),(A1,A3),(A2,A3),(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(B1,B2).其中,至少有1名“25周岁以下组”工人的可能结果共有7种,它们是(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(B1,B2).故所求的概率P= QUOTE .(2)由频率分布直方图可知,在抽取的100名工人中,“25周岁以上组”中的生产能手有600.25=15(人),“25周岁以下组”中的生产能手有400.375=15(人

32、),据此可得22列联表如下:生产能手非生产能手合计25周岁以上组15456025周岁以下组152540合计3070100所以得K2= QUOTE = QUOTE = QUOTE 1.79.因为1.792.706,所以没有90%的把握认为“生产能手与工人所在的年龄组有关”.3.(2012年辽宁卷,文19)电视传媒公司为了解某地区观众对某类体育节目的收视情况,随机抽取了100名观众进行调查,其中女性有55名.下面是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图:将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”,已知“体育迷”中有10名女性.(1)根据已知条件完成下面的22列

33、联表,并据此资料你是否认为“体育迷”与性别有关?非体育迷体育迷合计男女合计(2)将日均收看该体育节目不低于50分钟的观众称为“超级体育迷”,已知“超级体育迷”中有2名女性,若从“超级体育迷”中任意选取2人,求至少有1名女性观众的概率.附:2= QUOTE .P(2k)0.050.01k3.8416.635解:(1)由频率分布直方图可知,在抽取的100人中,“体育迷”为25人,从而完成22列联表如下:非体育迷体育迷合计男301545女451055合计7525100将22列联表中的数据代入公式计算,得2= QUOTE = QUOTE = QUOTE 3.030.因为3.030 QUOTE ,s1s

34、2(B) QUOTE = QUOTE ,s1=s2(C) = QUOTE ,s1s2解析:由样本中数据可知=15, QUOTE =15,由茎叶图得s12.706,由此可知,有90%以上的把握认为对这一问题的看法与性别有关.(2)记题设事件为A,则所求概率P(A)= QUOTE = QUOTE .根据题意,P(X=m)= QUOTE ,m=0,1,2,3.X的分布列为:X0123PX的均值E(X)=0 QUOTE +1 QUOTE +2 QUOTE +3 QUOTE =1.综合检测1.(2011汕头期末)下表提供了某厂节能降耗技术改造后在生产A产品过程中记录的产量x(吨)与相应的生产能耗y(吨)的几组对

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论