高中数学知识点之统计及统计案例分析_第1页
高中数学知识点之统计及统计案例分析_第2页
高中数学知识点之统计及统计案例分析_第3页
高中数学知识点之统计及统计案例分析_第4页
高中数学知识点之统计及统计案例分析_第5页
已阅读5页,还剩18页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第十一编 统计、统计案例11.1 抽样方法1.为了了解所加工的一批零件的长度,抽取其中200个零件并测量了其长度,在这个问题中,总体的一个样本是 .答案 200个零件的长度2.某城区有农民、工人、知识分子家庭共计2 004户,其中农民家庭1 600户,工人家庭303户,现要从中抽取容量为40的样本,则在整个抽样过程中,可以用到下列抽样方法:简单随机抽样,系统抽样,分层抽样中的 .答案 3.某企业共有职工150人,其中高级职称15人,中级职称45人,初级职称90人.现采用分层抽样抽取容量为30的样本,则抽取的各职称的人数分别为 .答案 3,9,184.(2008广东理)某校共有学生2 000名,

2、各年级男、女生人数如下表.已知在全校学生中随机抽取1名,抽到二年级女生的概率是0.19.现用分层抽样的方法在全校抽取64名学生,则应在三年级抽取的学生人数为 .一年级二年级三年级女生373xy男生377370z答案 165.某工厂生产A、B、C三种不同型号的产品,其相应产品数量之比为235,现用分层抽样方法抽出一个容量为n的样本,样本中A型号产品有16件,那么此样本的容量n= .答案 80例1 某大学为了支援我国西部教育事业,决定从2007应届毕业生报名的18名志愿者中,选取6人组成志愿小组.请用抽签法和随机数表法设计抽样方案.解 抽签法:第一步:将18名志愿者编号,编号为1,2,3,18.第

3、二步:将18个号码分别写在18张外形完全相同的纸条上,并揉成团,制成号签;第三步:将18个号签放入一个不透明的盒子里,充分搅匀;第四步:从盒子中逐个抽取6个号签,并记录上面的编号;第五步:所得号码对应的志愿者,就是志愿小组的成员.随机数表法:第一步:将18名志愿者编号,编号为01,02,03,18.第二步:在随机数表中任选一数作为开始,按任意方向读数,比如第8行第29列的数7开始,向右读;第三步:从数7开始,向右读,每次取两位,凡不在0118中的数,或已读过的数,都跳过去不作记录,依次可得到12,07,15,13,02,09.第四步:找出以上号码对应的志愿者,就是志愿小组的成员.例2 某工厂有

4、1 003名工人,从中抽取10人参加体检,试用系统抽样进行具体实施.解 (1)将每个人随机编一个号由0001至1003.(2)利用随机数法找到3个号将这3名工人剔除. (3)将剩余的1 000名工人重新随机编号由0001至1000.(4)分段,取间隔k=100将总体均分为10段,每段含100个工人.(5)从第一段即为0001号到0100号中随机抽取一个号l.(6)按编号将l,100+l,200+l,,900+l共10个号码选出,这10个号码所对应的工人组成样本.例3 (14分)某一个地区共有5个乡镇,人口3万人,其中人口比例为32523,从3万人中抽取一个300人 的样本,分析某种疾病的发病率

5、,已知这种疾病与不同的地理位置及水土有关,问应采取什么样的方法?并写出具体过程.解 应采取分层抽样的方法.3分过程如下:(1)将3万人分为五层,其中一个乡镇为一层.5分(2)按照样本容量的比例随机抽取各乡镇应抽取的样本.300=60(人);300=40(人);300=100(人);300=40(人);300=60(人),10分因此各乡镇抽取人数分别为60人,40人,100人,40人,60人.12分(3)将300人组到一起即得到一个样本.14分例4 为了考察某校的教学水平,将抽查这个学校高三年级的部分学生本年度的考试成绩.为了全面反映实际情况,采取以下三种方式进行抽查(已知该校高三年级共有20个

6、班,并且每个班内的学生已经按随机方式编好了学号,假定该校每班学生的人数相同):从高三年级20个班中任意抽取一个班,再从该班中任意抽取20名学生,考察他们的学习成绩;每个班抽取1人,共计20人,考察这20名学生的成绩;把学生按成绩分成优秀、良好、普通三个级别,从其中共抽取100名学生进行考察(已知该校高三学生共1 000人,若按成绩分,其中优秀生共150人,良好生共600人,普通生共250人).根据上面的叙述,试回答下列问题:(1)上面三种抽取方式的总体、个体、样本分别是什么?每一种抽取方式抽取的样本中,样本容量分别是多少?(2)上面三种抽取方式各自采用的是何种抽取样本的方法?(3)试分别写出上

7、面三种抽取方式各自抽取样本的步骤.解 (1)这三种抽取方式的总体都是指该校高三全体学生本年度的考试成绩,个体都是指高三年级每个学生本年度的考试成绩.其中第一种抽取方式的样本为所抽取的20名学生本年度的考试成绩,样本容量为20;第二种抽取方式的样本为所抽取的20名学生本年度的考试成绩,样本容量为20;第三种抽取方式的样本为所抽取的100名学生本年度的考试成绩,样本容量为100.(2)三种抽取方式中,第一种采用的是简单随机抽样法;第二种采用的是系统抽样法和简单随机抽样法;第三种采用的是分层抽样法和简单随机抽样法.(3)第一种方式抽样的步骤如下:第一步,首先用抽签法在这20个班中任意抽取一个班.第二

8、步,然后从这个班中按学号用随机数表法或抽签法抽取20名学生,考察其考试成绩.第二种方式抽样的步骤如下:第一步,首先用简单随机抽样法从第一个班中任意抽取一名学生,记其学号为a.第二步,在其余的19个班中,选取学号为a的学生,加上第一个班中的一名学生,共计20人.第三种方式抽样的步骤如下:第一步,分层,因为若按成绩分,其中优秀生共150人,良好生共600人,普通生共250人,所以在抽取样本时,应该把全体学生分成三个层次.第二步,确定各个层次抽取的人数.因为样本容量与总体的个体数之比为:1001 000=110,所以在每个层次中抽取的个体数依次为,即15,60,25.第三步,按层次分别抽取.在优秀生

9、中用简单随机抽样法抽取15人;在良好生中用简单随机抽样法抽取60人;在普通生中用简单随机抽样法抽取25人.1.有一批机器,编号为1,2,3,112,为调查机器的质量问题,打算抽取10台入样,问此样本若采用简单随机抽样方法将如何获得?解 方法一 首先,把机器都编上号码001,002,003,112,如用抽签法,则把112个形状、大小相同的号签放在同一个箱子里,进行均匀搅拌,抽签时,每次从中抽出1个号签,连续抽取10次,就得到一个容量为10的样本.方法二 第一步,将原来的编号调整为001,002,003,112.第二步,在随机数表中任选一数作为开始,任选一方向作为读数方向.比如:选第9行第7个数“

10、3”,向右读.第三步,从“3”开始,向右读,每次读取三位,凡不在001112中的数跳过去不读,前面已经读过的也跳过去不读,依次可得到074,100,094,052,080,003,105,107,083,092.第四步,对应原来编号74,100,94,52,80,3,105,107,83,92的机器便是要抽取的对象.2.某单位在岗职工共624人,为了调查工人用于上班途中的时间,该单位工会决定抽取10%的工人进行调查,请问如何采用系统抽样法完成这一抽样?解 (1)将624名职工用随机方式编号由000至623.(2)利用随机数表法从总体中剔除4人.(3)将剩下的620名职工重新编号由000至619

11、.(4)分段,取间隔k=10,将总体分成62组,每组含10人.(5)从第一段,即为000到009号随机抽取一个号l.(6)按编号将l,10+l,20+l,,610+l,共62个号码选出,这62个号码所对应的职工组成样本.3.某电台在因特网上就观众对某一节目的喜爱程度进行调查,参加调查的总人数为12 000人,其中持各种态度的人数如下表:很喜爱喜爱一般不喜爱2 4354 5673 9261 072电视台为进一步了解观众的具体想法和意见,打算从中抽取60人进行更为详细的调查,应当怎样进行抽样?解 可用分层抽样方法,其总体容量为12 000.“很喜爱”占,应取6012(人);“喜爱”占,应取6023

12、(人);“一般”占,应取6020(人);“不喜爱”占,应取605(人).因此采用分层抽样在“很喜爱”、“喜爱”、“一般”和“不喜爱”的2 435人、4 567人、3 926人和1 072人中分别抽取12人、23人、20人和5人.4.某初级中学有学生270人,其中一年级108人,二、三年级各81人,现要利用抽样方法抽取10人参加某项调查,考虑选用简单随机抽样、分层抽样和系统抽样三种方案,使用简单随机抽样和分层抽样时,将学生按一、二、三年级依次统一编号为1,2,270,使用系统抽样时,将学生统一随机编号为1,2,270,并将整个编号依次分为10段,如果抽得号码有下列四种情况:7,34,61,88,

13、115,142,169,196,223,250;5,9,100,107,111,121,180,195,200,265;11,38,65,92,119,146,173,200,227,254;30,57,84,111,138,165,192,219,246,270.关于上述样本的下列结论中,正确的是 (填序号).(1)、都不能为系统抽样(2)、都不能为分层抽样(3)、都可能为系统抽样(4)、都可能为分层抽样 答案 (4)一、填空题1.(2008安庆模拟)某校高中生共有900人,其中高一年级300人,高二年级200人,高三年级400人,现分层抽取容量为45的样本,那么高一、高二、高三年级抽取的人

14、数分别为 .答案 15,10,202.某牛奶生产线上每隔30分钟抽取一袋进行检验,则该抽样方法为;从某中学的30名数学爱好者中抽取3人了解学习负担情况,则该抽样方法为.那么,分别为 .答案 系统抽样,简单随机抽样3.下列抽样实验中,最适宜用系统抽样的是 (填序号).某市的4个区共有2 000名学生,且4个区的学生人数之比为3282,从中抽取200人入样某厂生产的2 000个电子元件中随机抽取5个入样从某厂生产的2 000个电子元件中随机抽取200个入样从某厂生产的20个电子元件中随机抽取5个入样答案 4.(2008重庆文)某校高三年级有男生500人,女生400人,为了解该年级学生的健康情况,从

15、男生中任意抽取25人,从女生中任意抽取20人进行调查,这种抽样方法是 .答案 分层抽样法5.某中学有高一学生400人,高二学生300人,高三学生200人,学校团委欲用分层抽样的方法抽取18名学生进行问卷调查,则下列判断不正确的是 (填序号).高一学生被抽到的概率最大高三学生被抽到的概率最大高三学生被抽到的概率最小每名学生被抽到的概率相等答案 6.某商场有四类食品,其中粮食类、植物油类、动物性食品类及果蔬类分别有40种、10种、30种、20种,现从中抽取一个容量为20的样本进行食品安全检测,若采用分层抽样的方法抽取样本,则抽取的植物油类与果蔬类食品种数之和是 .答案 67.(2008天津文,11

16、)一个单位共有职工200人,其中不超过45岁的有120人,超过45岁的有80人.为了调查职工的健康状况,用分层抽样的方法从全体职工中抽取一个容量为25的样本,应抽取超过45岁的职工 人.答案 108.将参加数学竞赛的1 000名学生编号如下0001,0002,0003,1000,打算从中抽取一个容量为50的样本,按系统抽样的方法分成50个部分,如果第一部分编号为0001,0002,0020,从第一部分随机抽取一个号码为0015,则第40个号码为 .答案 0795二、解答题9.为了检验某种作业本的印刷质量,决定从一捆(40本)中抽取10本进行检查,利用随机数表抽取这个样本时,应按怎样的步骤进行?

17、分析 可先对这40本作业本进行统一编号,然后在随机数表中任选一数作为起始号码,按任意方向读下去,便会得到10个号码.解 可按以下步骤进行:第一步,先将40本作业本编号,可编为00,01,02,39.第二步,在附录1随机数表中任选一个数作为开始.如从第8行第4列的数78开始.第三步,从选定的数78开始向右读下去,得到一个两位数字号码59,由于5939,将它去掉;继续向右读,得到16,由于1639,将它取出;继续读下去,可得到19,10,12,07,39,38,33,21,后面一个是12,由于在前面12已经取出,将它去掉;再继续读,得到34.至此,10个样本号码已经取满,于是,所要抽取的样本号码是

18、16,19,10,12,07,39,38,33,21,34.10.某政府机关有在编人员100人,其中副处级以上干部10人,一般干部70人,工人20人,上级机关为了了解政府机构改革意见,要从中抽取一个容量为20的样本,试确定用何种方法抽取,如何抽取?解 用分层抽样抽取.(1)20100=15,=2,=14,=4从副处级以上干部中抽取2人,一般干部中抽取14人,从工人中抽取4人.(2)因副处级以上干部与工人人数较少,可用抽签法从中分别抽取2人和4人;对一般干部可用随机数表法抽取14人.(3)将2人、4人、14人编号汇合在一起就得到了容量为20的样本.11.从某厂生产的10 002辆电动自行车中随机

19、抽取100辆测试某项性能,请合理选择抽样方法进行抽样,并写出抽样过程.解 因为总体容量和样本容量都较大,可用系统抽样.抽样步骤如下:第一步,将10 002辆电动自行车用随机方式编号;第二步,从总体中剔除2辆(剔除法可用随机数表法),将剩下的10 000辆电动自行车重新编号(分别为00001,00002,10000)并分成100段;第三步,在第一段00001,00002,00100这100个编号中用简单随机抽样抽出一个作为起始号码(如00006);第四步,把起始号码依次加间隔100,可获得样本.12.某单位有工程师6人,技术员12人,技工18人,要从这些人中抽取一个容量为n的样本.如果采用系统抽

20、样法和分层抽样法抽取,不用剔除个体;如果样本容量增加一个,则在采用系统抽样时,需要在总体中先剔除1个个体,求样本容量n.解 总体容量为6+12+18=36.当样本容量是n时,由题意知,系统抽样的间隔为,分层抽样的比例是,抽取工程师6=(人),抽取技术人员12=(人),抽取技工18=(人).所以n应是6的倍数,36的约数即n=6,12,18,36.当样本容量为(n+1)时,在总体中剔除1人后还剩35人,系统抽样的间隔为,因为必须是整数,所以n只能取6,即样本容量为6.11.2 总体分布的估计与总体特征数的估计1.一个容量为20的样本,已知某组的频率为0.25,则该组的频数为 .答案 52.(20

21、08山东理)右图是根据山东统计年鉴2007中的资料作成的1997年至2006年我省城镇居民百户家庭人口数的茎叶图.图中左边的数字从左到右分别表示城镇居民百户家庭人口数的百位数字和十位数字,右边的数字表示城镇居民百户家庭人口数的个位数字.从图中可以得到1997年至2006年我省城镇居民百户家庭人口数的平均数为 .答案 303.63.在抽查产品的尺寸过程中,将其尺寸分成若干组,a,b)是其中的一组,抽查出的个体在该组上的频率为m,该组在频率分布直方图的高为h,则|a-b|= .答案 4.(2008山东文,9)从某项综合能力测试中抽取100人的成绩,统计如表,则这100人成绩的标准差为 .分数543

22、21人数2010303010答案 5.为了了解某地区高三学生的身体发育情况,抽查了该地区100名年龄为17.5岁18岁的男生体重(kg),得到频率分布直方图如下:根据上图可得这100名学生中体重在56.5,64.5)的学生人数是 .答案 40例1 在学校开展的综合实践活动中,某班进行了小制作评比,作品上交时间为5月1日至30日,评委会把同学们上交 作品的件数按5天一组分组统计,绘制了频率分布直方图(如图所示),已知从左到右各长方形高的比为234641,第三组的频数为12,请解答下列问题:(1)本次活动共有多少件作品参加评比?(2)哪组上交的作品数量最多?有多少件?(3)经过评比,第四组和第六组

23、分别有10件、2件作品获奖,问这两组哪组获奖率高?解 (1)依题意知第三组的频率为=,又因为第三组的频数为12,本次活动的参评作品数为=60.(2)根据频率分布直方图,可以看出第四组上交的作品数量最多,共有60=18(件).(3)第四组的获奖率是=,第六组上交的作品数量为60=3(件),第六组的获奖率为=,显然第六组的获奖率高.例2 对某电子元件进行寿命追踪调查,情况如下:寿命(h)100200200300300400400500500600个数2030804030(1)列出频率分布表;(2)画出频率分布直方图;(3)估计电子元件寿命在100 h400 h以内的概率;(4)估计电子元件寿命在4

24、00 h以上的概率.解 (1)样本频率分布表如下:寿命(h)频数频率100200200.1020030030040400500400.20500600300.15合计2001(2)频率分布直方图(3)由频率分布表可以看出,寿命在100 h400 h的电子元件出现的频率为0.65,所以我们估计电子元件寿命在100 h400 h的概率为0.65.(4)由频率分布表可知,寿命在400 h以上的电子元件出现的频率为0.20+0.15=0.35,故我们估计电子元件寿命在400 h以上的概率为0.35.例3 为了解A,B两种轮胎的性能,某汽车制造厂分别从这两种轮胎中随机抽取了8个

25、进行测试,下面列出了每一个轮胎行驶的最远里程数(单位:1 000 km)轮胎A96,112,97,108,100,103,86,98轮胎B108,101,94,105,96,93,97,106(1)分别计算A,B两种轮胎行驶的最远里程的平均数,中位数;(2)分别计算A,B两种轮胎行驶的最远里程的极差、标准差;(3)根据以上数据你认为哪种型号的轮胎性能更加稳定?解 (1)A轮胎行驶的最远里程的平均数为:=100,中位数为: =99; B轮胎行驶的最远里程的平均数为:=100,中位数为:=99.(2)A轮胎行驶的最远里程的极差为:112-86=26,标准差为:s=7.43;B轮胎行驶的最远里程的极

26、差为:108-93=15,标准差为:s= =5.43.(3)由于A和B的最远行驶里程的平均数相同,而B轮胎行驶的最远里程的极差和标准差较小,所以B轮胎性能更加稳定.例4(14分)某化肥厂甲、乙两个车间包装肥料,在自动包装传送带上每隔30 min抽取一包产品,称其重量,分别记录抽查数据如下:甲:102,101,99,98,103,98,99;乙:110,115,90,85,75,115,110.(1)这种抽样方法是哪一种?(2)将这两组数据用茎叶图表示;(3)将两组数据比较,说明哪个车间产品较稳定.解 (1)因为间隔时间相同,故是系统抽样.2分(2)茎叶图如下:5分(3)甲车间:平均值:=(10

27、2+101+99+98+103+98+99)=100,7分方差:s12=(102-100)2+(101-100)2+(99-100)23.428 6.9分乙车间:平均值:=(110+115+90+85+75+115+110)=100,11分方差:s22=(110-100)2+(115-100)2+(110-100)2228.571 4.13分=,s12s22,甲车间产品稳定.14分1.为了了解小学生的体能情况,抽取了某小学同年级部分学生进行跳绳测试,将所得数据整理后,画出频率分布直方图如图所示,已知图中从左到右前三个小组的频率分别是0.1,0.3,0.4,第一小组的频数为5.(1)求第四小组的

28、频率;(2)参加这次测试的学生人数是多少?(3)在这次测试中,学生跳绳次数的中位数落在第几小组内?解 (1)第四小组的频率=1-(0.1+0.3+0.4)=0.2.(2)设参加这次测试的学生人数是n,则有n=50.1=50(人).(3)因为0.150=5,0.350=15,0.450=20,0.250=10,即第一、第二、第三、第四小组的频数分别为5、15、20、10,所以学生跳绳次数的中位数落在第三小组内.2.从高三学生中抽取50名同学参加数学竞赛,成绩的分组及各组的频数如下:(单位:分)40,50),2;50,60),3;60,70),10;70,80),15;80,90),12;90,1

29、00,8.(1)列出样本的频率分布表;(2)画出频率分布直方图;(3)估计成绩在60,90)分的学生比例;(4)估计成绩在85分以下的学生比例.解 (1)频率分布表如下:成绩分组频数频率40,50)50,60)60,70)70,80)80,90)90,1002310151280.040.060.200.300.240.16合计501.00(2)频率分布直方图如图所示.(3)成绩在60,90)的学生比例即为学生成绩在60,90)的频率,即为(0.20+0.30+0.24)100%=74%.(4)成绩在85分以下的学生比例即为学生成绩不足85分的频率.设相应的频率为b.由=,故b=0.72.估计成

30、绩在85分以下的学生约占72%.3.有甲、乙两位射击运动员在相同条件下各射击10次,记录各次命中环数;甲:8,8,6,8,6,5,9,10,7,4乙:9,5,7,8,7,6,8,6, 8,7(1)分别计算他们环数的标准差;(2)谁的射击情况比较稳定.解 (1)甲=(8+8+6+8+6+5+9+10+7+4)=7.1,乙=(9+5+7+8+7+6+8+6+8+7)=7.1,=(8-7.1)2+(8-7.1)2+(6-7.1)2+(8-7.1)2+(6-7.1)2+(5-7.1)2+(9-7.1)2+(10-7.1)2+(7-7.1)2+(4-7.1)2=3.09,s甲1.76.=(9-7.1)2

31、+(5-7.1)2+(7-7.1)2+(8-7.1)2+(7-7.1)2+(6-7.1)2+(8-7.1)2+(6-7.1)2+(8-7.1)2+(7-7.1)2=1.29,s乙1.14.(2)甲=乙,s乙s甲,乙射击情况比较稳定.4.(2008海南、宁夏理,16)从甲、乙两品种的棉花中各抽测了25根棉花的纤维长度(单位:mm),结果如下:甲品种:271273280285285287292294295301303303307308310314319323325325328331334337352乙品种:2842922953043063073123133153153163183183203223

32、22324327329331333336337343356由以上数据设计了如下茎叶图:根据以上茎叶图,对甲、乙两品种棉花的纤维长度作比较,写出两个统计结论: ; .答案 乙品种棉花的纤维平均长度大于甲品种棉花的纤维平均长度(或:乙品种棉花的纤维长度普遍大于甲品种棉花的纤维长度).甲品种棉花的纤维长度较乙品种棉花的纤维长度更分散.(或:乙品种棉花的纤维长度较甲品种棉花的纤维长度更集中(稳定).甲品种棉花的纤维长度的分散程度比乙品种棉花的纤维长度的分散程度更大).甲品种棉花的纤维长度的中位数为307 mm,乙品种棉花的纤维长度的中位数为318 mm.乙品种棉花的纤维长度基本上是对称的,而且大多集中

33、在中间(均值附近).甲品种棉花的纤维长度除一个特殊值(352)外,也大致对称,其分布较均匀.一、填空题1.下列关于频率分布直方图的说法中不正确的是 .直方图的高表示取某数的频率直方图的高表示该组上的个体在样本中出现的频率直方图的高表示该组上的个体数与组距的比值直方图的高表示该组上的个体在样本中出现的频率与组距的比值答案 2.甲、乙两名新兵在同样条件下进行射击练习,每人打5发子弹,命中环数如下:甲:6,8,9,9,8;乙:10,7,7,7,9.则这两人的射击成绩 比 稳定.答案 甲 乙3.某校为了了解学生的课外阅读情况,随机调查了50名学生,得到他们在某一天各自课外阅读所用时间的数据,结果用条形

34、图表示如下:根据条形图可得这50名学生这一天平均每人的课外阅读时间为 h.答案 0.94.某班50名学生在一次百米测试中,成绩全部介于13秒与19秒之间,将测试结果按如下方式分 成六组:第一组,成绩大于等于13秒且小于14秒;第二组,成绩大于等于14秒且小于15秒; 第六组,成绩大于等于18秒且小于等于19秒.右图是按上述分组方法得到的频率分布直方图.设成绩小于17秒的学生人数占全班总人数的百分比为x,成绩大于等于15秒且小于17秒的学生人数为y,则从频率分布直方图中可分析出x和y分别为 .答案 0.9,355.(2009启东质检)为了解某校高三学生的视力情况,随机地抽查了该校100名高三学生

35、的视力情况,得到频率分布直方图如图所示,由于不慎,部分数据丢失,但知道前四组的频数成等比数列,后六组的频数成等差数列,设最大频率为a,视 力在4.6到5.0之间的学生数为b,则a,b的值分别为 .答案 0.27,786.甲、乙两名同学在5次体育测试中的成绩统计的茎叶图如图所示,若甲、乙两人的平均成绩分别是x甲、x乙,则x甲 x乙, 比 稳定.答案 乙 甲 7.(2008上海理,9)已知总体的各个体的值由小到大依次为2,3,3,7,a,b,12,13.7,18.3,20,且总体的中位数为10.5.若要使该总体的方差最小,则a、b的取值分别是 .答案 10.5、10.58.某教师出了一份共3道题的

36、测试卷,每道题1分,全班得3分,2分,1分,0分的学生所占比例分别为30%,40%,20%,10%,若全班30人,则全班同学的平均分是 分.答案 1.9二、解答题9.在育民中学举行的电脑知识竞赛中,将九年级两个班参赛的学生成绩(得分均为整数)进行整理后分成五组,绘制如图所示的频率分布直方图.已知图中从左到右的第一、第三、第四、第五小组的频率分别是0.30,0.15,0.10,0.05,第二小组的频数是40.(1)求第二小组的频率,并补全这个频率分布直方图;(2)求这两个班参赛的学生人数是多少?(3)这两个班参赛学生的成绩的中位数应落在第几小组内?(不必说明理由)解 (1)各小组的频率之和为1.

37、00,第一、三、四、五小组的频率分别是0.30,0.15,0.10,0.05.第二小组的频率为:1.00-(0.30+0.15+0.10+0.05)=0.40.落在59.569.5的第二小组的小长方形的高=0.04.则补全的直方图如图所示.(2)设九年级两个班参赛的学生人数为x人.第二小组的频数为40人,频率为0.40,=0.40,解得x=100(人).所以九年级两个班参赛的学生人数为100人.(3)因为0.3100=30,0.4100=40,0.15100=15,0.10100=10,0.05100=5,即第一、第二、第三、第四、第五小组的频数分别为30,40,15,10,5,所以九年级两个

38、班参赛学生的成绩的中位数应落在第二小组内.10.为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图所示),图中从左到右各小长方形面积之比为24171593,第二小组频数为12.(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110次)为达标,试估计该学校全体高一学生的达标率是多少?(3)在这次测试中,学生跳绳次数的中位数落在哪个小组内?请说明理由.解 (1)由于频率分布直方图以面积的形式反映了数据落在各小组内的频率大小,因此第二小组的频率为: =0.08.又因为频率=,所以样本容量=150.(2)由图可估计该学

39、校高一学生的达标率约为100%=88%.(3)由已知可得各小组的频数依次为6,12,51,45,27,9,所以前三组的频数之和为69,前四组的频数之和为114,所以跳绳次数的中位数落在第四小组内.11.观察下面表格:(1)完成表中的频率分布表;(2)根据表格,画出频率分布直方图;(3)估计数据落在10.95,11.35)范围内的概率约为多少?分组频数频率10.75,10.85)310.85,10.95)910.95,11.05)1311.05,11.15)1611.15,11.25)2611.25,11.35)2011.35,11.45)711.45,11.55)411.55,11.65)2合

40、计100解 (1)频率依次为:0.03,0.09,0.13,0.16,0.26,0.20,0.07,0.04,0.02,1.00.(2)频率分布直方图如图所示(3)数据落在10.95,11.35)范围的频率为0.13+0.16+0.26+0.20=0.75.12.某赛季甲、乙两名篮球运动员每场比赛得分情况如下:甲的得分:12,15,24,25,31,31,36,36,37,39,44,49,50;乙的得分:8,13,14,16,23,26,28,33,38,39,59.(1)制作茎叶图,并对两名运动员的成绩进行比较;(2)计算上述两组数据的平均数和方差,并比较两名运动员的成绩和稳定性;(3)能

41、否说明甲的成绩一定比乙好,为什么?解 (1)制作茎叶图如下:从茎叶图上可看出,甲运动员发挥比较稳定,总体得分情况比乙好.(2)甲=33,127.23,乙=27,199.09,甲乙, ,甲运动员总体水平比乙好,发挥比乙稳定.(3)不能说甲的水平一定比乙好,因为上述是甲、乙某赛季的得分情况,用样本估计总体也有一定的偶然性,并不能说一定准确反映总体情况.11.3 线性回归方程基础自测1.下列关系中,是相关关系的为 (填序号).学生的学习态度与学习成绩之间的关系;教师的执教水平与学生的学习成绩之间的关系;学生的身高与学生的学习成绩之间的关系;家庭的经济条件与学生的学习成绩之间的关系.答案 2.为了考察

42、两个变量x、y之间的线性相关关系,甲、乙两同学各自独立地做10次和15次试验,并利用最小二乘法求得回归直线分别为l1和l2.已知在两人的试验中发现变量x的观测数据的平均值恰好相等,都为s,变量y的观测数据的平均值也恰好相等,都为t,那么下列说法中正确的是 (填序号).直线l1,l2有交点(s,t)直线l1,l2相交,但是交点未必是(s,t)直线l1,l2由于斜率相等,所以必定平行直线l1,l2必定重合答案 3.下列有关线性回归的说法,正确的是 (填序号).相关关系的两个变量不一定是因果关系散点图能直观地反映数据的相关程度回归直线最能代表线性相关的两个变量之间的关系任一组数据都有回归直线方程答案

43、 4.下列命题:线性回归方法就是由样本点去寻找一条贴近这些样本点的直线的数学方法;利用样本点的散点图可以直观判断两个变量的关系是否可以用线性关系表示;通过回归直线=+及回归系数,可以估计和预测变量的取值和变化趋势.其中正确命题的序号是 .答案 5.已知回归方程为=0.50 x-0.81,则x=25时,的估计值为 .答案 11.69例1 下面是水稻产量与施化肥量的一组观测数据:施化肥量15202530354045水稻产量320330360410460470480(1)将上述数据制成散点图;(2)你能从散点图中发现施化肥量与水稻产量近似成什么关系吗?水稻产量会一直随施化肥量的增加而增长吗?解 (1

44、)散点图如下: (2)从图中可以发现施化肥量与水稻产量具有线性相关关系,当施化肥量由小到大变化时,水稻产量由小变大,图中的数据点大致分布在一条直线的附近,因此施化肥量和水稻产量近似成线性相关关系,但水稻产量只是在一定范围内随着化 肥施用量的增加而增长.例2 (14分)随着我国经济的快速发展,城乡居民的生活水平不断提高,为研究某市家庭平均收入与月平均生活支出 的关系,该市统计部门随机调查了10个家庭,得数据如下:家庭编号12345678910 xi(收入)千元0.81.11.31.51.51.82.02.22.42.8yi(支出)千元0.71.01.21.01.31.51.31.72.02.5(

45、1)判断家庭平均收入与月平均生活支出是否相关?(2)若二者线性相关,求回归直线方程.解 (1)作出散点图: 5分观察发现各个数据对应的点都在一条直线附近,所以二者呈线性相关关系. 7分(2)= (0.8+1.1+1.3+1.5+1.5+1.8+2.0+2.2+2.4+2.8)=1.74,=(0.7+1.0+1.2+1.0+1.3+1.5+1.3+1.7+2.0+2.5)=1.42, 9分=0.813 6,=1.42-1.740.813 60.004 3,13分回归方程=0.813 6x+0.004 3.14分例3 下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能

46、耗y(吨)标准煤的几组对照数据. x3456y2.5344.5(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程=x+;(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?(参考数值:32.5+43+54+64.5=66.5)解 (1)散点图如下图: (2)=4.5,=3.5=32.5+43+45+64.5=66.5. =32+42+52+62=86=0.7 =-=3.5-0.74.5=0.35.所求的线性回归方程为=0.7x+0.35.(3)现在生产

47、100吨甲产品用煤y=0.7100+0.35=70.35,降低90-70.35=19.65(吨)标准煤.1.科研人员为了全面掌握棉花新品种的生产情况,查看了气象局对该地区年降雨量与年平均气温的统计数据(单位分别是mm,),并作了统计.年平均气温12.5112.8412.8413.6913.3312.7413.05年降雨量748542507813574701432(1)试画出散点图;(2)判断两个变量是否具有相关关系.解 (1)作出散点图如图所示,(2)由散点图可知,各点并不在一条直线附近,所以两个变量是非线性相关关系.2.在研究硝酸钠的可溶性程度时,对于不同的温度观测它在水中的溶解度,得观测结

48、果如下: 温度(x)010205070溶解度(y)66.776.085.0112.3128.0由资料看y与x呈线性相关,试求回归方程.解 =30,=93.6. =0.880 9.=-=93.6-0.880 930=67.173.回归方程为=0.880 9x+67.173.3.某企业上半年产品产量与单位成本资料如下:月份产量(千件)单位成本(元)127323723471437354696568(1)求出线性回归方程;(2)指出产量每增加1 000件时,单位成本平均变动多少?(3)假定产量为6 000件时,单位成本为多少元?解 (1)n=6,=21,=426,=3.5,=71, =79,=1 48

49、1,=-1.82. =-=71+1.823.5=77.37.回归方程为=+x=77.37-1.82x.(2)因为单位成本平均变动=-1.820,且产量x的计量单位是千件,所以根据回归系数b的意义有:产量每增加一个单位即1 000件时,单位成本平均减少1.82元.(3)当产量为6 000件时,即x=6,代入回归方程:=77.37-1.826=66.45(元)当产量为6 000件时,单位成本为66.45元.一、填空题1.观察下列散点图,则正相关;负相关;不相关.它们的排列顺序与图形对应顺序是 .答案 a,c,b2.回归方程=1.5x-15,则下列说法正确的有 个.=1.5-1515是回归系数a1.

50、5是回归系数ax=10时,y=0答案 13.(2009.湛江模拟)某地区调查了29岁儿童的身高,由此建立的身高y(cm)与年龄x(岁)的回归模型为=8.25x+60.13,下列叙述正确的是 .该地区一个10岁儿童的身高为142.63 cm该地区29岁的儿童每年身高约增加8.25 cm该地区9岁儿童的平均身高是134.38 cm利用这个模型可以准确地预算该地区每个29岁儿童的身高答案 4.三点(3,10),(7,20),(11,24)的回归方程是 .答案 =1.75x+5.755.某人对一地区人均工资x(千元)与该地区人均消费y(千元)进行统计调查,y与x有相关关系,得到回归直线方程=0.66x

51、+1.562.若该地区的人均消费水平为7.675千元,估计该地区的人均消费额占人均工资收入的百分比约为 .答案 83%6.某化工厂为预测产品的回收率y,需要研究它和原料有效成分含量x之间的相关关系,现取8对观测值,计算,得=52, =228, =478, =1 849,则其线性回归方程为 .答案 =11.47+2.62x7.有下列关系:人的年龄与他(她)拥有的财富之间的关系;曲线上的点与该点的坐标之间的关系;苹果的产量与气候之间的关系;森林中的同一种树木,其断面直径与高度之间的关系.其中,具有相关关系的是 .答案 8.已知关于某设备的使用年限x与所支出的维修费用y(万元),有如下统计资料:使用

52、年限x23456维修费用y2.23.85.56.57.0若y对x呈线性相关关系,则回归直线方程=x+表示的直线一定过定点 .答案 (4,5)二、解答题9.期中考试结束后,记录了5名同学的数学和物理成绩,如下表: 学生学科ABCDE数学8075706560物理7066686462(1)数学成绩和物理成绩具有相关关系吗?(2)请你画出两科成绩的散点图,结合散点图,认识(1)的结论的特点.解 (1)数学成绩和物理成绩具有相关关系.(2)以x轴表示数学成绩,y轴表示物理成绩,可得相应的散点图如下:由散点图可以看出,物理成绩和数学成绩对应的点不分散,大致分布在一条直线附近.10.以下是某地搜集到的新房屋

53、的销售价格y和房屋的面积x的数据:房屋面积x(m2)11511080135105销售价格y(万元)24.821.618.429.222(1)画出数据对应的散点图;(2)求线性回归方程,并在散点图中加上回归直线.解 (1)数据对应的散点图如图所示:(2)=109,=23.2,=60 975,=12 952,=0.196 2 =-1.814 2 所求回归直线方程为=0.196 2x+1.814 2.11.某公司利润y与销售总额x(单位:千万元)之间有如下对应数据:x10151720252832y11.31.822.62.73.3(1)画出散点图;(2)求回归直线方程;(3)估计销售总额为24千万元

54、时的利润.解 (1)散点图如图所示:(2)=(10+15+17+20+25+28+32)=21,=(1+1.3+1.8+2+2.6+2.7+3.3)=2.1, =102+152+172+202+252+282+322=3 447, =101+151.3+171.8+202+252.6+282.7+323.3=346.3, =0.104,=-=2.1-0.10421=-0.084,=0.104x-0.084.(3)把x=24(千万元)代入方程得,=2.412(千万元).估计销售总额为24千万元时,利润为2.412千万元.12.某种产品的广告费支出x与销售额y(单位:百万元)之间有如下对应数据:x

55、24568y3040605070(1)画出散点图;(2)求回归直线方程;(3)试预测广告费支出为10百万元时,销售额多大?解 (1)根据表中所列数据可得散点图如下:(2)列出下表,并用科学计算器进行有关计算:i12345xi24568yi3040605070 xiyi60160300300560因此,=5,= =50,=145, =13 500, =1 380.于是可得:=6.5;=-=50-6.55=17.5.因此,所求回归直线方程为:=6.5x+17.5.(3)根据上面求得的回归直线方程,当广告费支出为10百万元时,=6.510+17.5=82.5(百万元),即这种产品的销售收入大约为82

56、.5百万元.11.4 统计案例基础自测1.对有线性相关关系的两个变量建立的回归直线方程=+x中,回归系数与0的大小关系为 .(填序号)大于或小于大于小于不小于答案 2.如果有90%的把握说事件A和B有关系,那么具体计算出的数据2 2.706.(用“”,“”,“=”填空)答案 3.对两个变量y与x进行回归分析,分别选择不同的模型,它们的相关系数r如下,其中拟合效果最好的模型是 .模型的相关系数r为0.98模型的相关系数r为0.80模型的相关系数r为0.50模型的相关系数r为0.25答案 4.下列说法中正确的有:若r0,则x增大时,y也相应增大;若r0,则x增大时,y也相应增大;若r=1或r=-1

57、,则x与y的关系完全对应(有函数关系),在散点图上各个点均在一条直线上 .答案 例1 (14分)调查339名50岁以上人的吸烟习惯与患慢性气管炎的情况,获数据如下:患慢性气管炎未患慢性气管炎总计吸烟43162205不吸烟13121134合计56283339试问:(1)吸烟习惯与患慢性气管炎是否有关?(2)用假设检验的思想给予证明.(1)解 根据列联表的数据,得到2=2分=7.4696.6356分所以有99%的把握认为“吸烟与患慢性气管炎有关”.9分(2)证明 假设“吸烟与患慢性气管炎之间没有关系”,由于事件A=26.6350.01,即A为小概率事件,而小概率事件发生了,进而得假设错误,这种推断

58、出错的可能性约有1%.14分例2 一台机器使用时间较长,但还可以使用.它按不同的转速生产出来的某机械零件有一些会有缺点,每小时生产有 缺点零件的多少,随机器运转的速度而变化,下表为抽样试验结果:转速x(转/秒)1614128每小时生产有缺点的零件数y(件)11985(1)对变量y与x进行相关性检验;(2)如果y与x有线性相关关系,求回归直线方程;(3)若实际生产中,允许每小时的产品中有缺点的零件最多为10个,那么,机器的运转速度应控制在什么范围内?解 (1)=12.5, =8.25,=438,4=412.5,=660,=291,所以r=0.995 4.因为rr0.05,所以y与x有很强的线性相

59、关关系.(2)=0.728 6x-0.857 1.(3)要使100.728 6x-0.857 110,所以x14.901 3.所以机器的转速应控制在14.901 3转/秒以下.例3 下表是某年美国旧轿车价格的调查资料,今以x表示轿车的使用年数,y表示相应的年均价格,求y关于x的回归 方程.使用年数x12345678910年均价格y(美元)2 6511 9431 4941 087765538484290226204解 作出散点图如图所示.可以发现,各点并不是基本处于一条直线附近,因此,y与x之间应是非线性相关关系.与已学函数图象比较,用=e 来刻画题中模型更为合理,令=ln,则=x+,题中数据变

60、成如下表所示:x12345678910z7.8837.5727.3096.9916.6406.2886.1825.6705.4215.318相应的散点图如图所示,从图中可以看出,变换的样本点分布在一条直线附近,因此可以用线性回归方程拟合.由表中数据可得r-0.996.|r|r0.05.认为x与z之间具有线性相关关系,由表中数据得-0.298,8.165,所以=-0.298x+8.165,最后回代=ln,即=e-0.298x+8.165为所求.1.某班主任对全班50名学生学习积极性和对待班级工作的态度进行了调查,统计数据如下表所示: 积极参加班级工作不太主动参加班级工作合计学习积极性高18725

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论