统计案例分析及典型例题_第1页
统计案例分析及典型例题_第2页
统计案例分析及典型例题_第3页
统计案例分析及典型例题_第4页
统计案例分析及典型例题_第5页
已阅读5页,还剩34页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

统计案例分析及典型例题§11。1抽样方法基础基础自测1。为了了解所加工的一批零件的长度,抽取其中200个零件并测量了其长度,在这个问题中,总体的一个样本是。答案200个零件的长度2。某城区有农民、工人、知识分子家庭共计2004户,其中农民家庭1600户,工人家庭303户,现要从中抽取容量为40的样本,则在整个抽样过程中,可以用到下列抽样方法:①简单随机抽样,②系统抽样,③分层抽样中的。答案①②③3.某企业共有职工150人,其中高级职称15人,中级职称45人,初级职称90人。现采用分层抽样抽取容量为30的样本,则抽取的各职称的人数分别为.答案3,9,184。某工厂生产A、B、C三种不同型号的产品,其相应产品数量之比为2:3:5,现用分层抽样方法抽出一个容量为n的样本,样本中A型号产品有16件,那么此样本的容量n=.答案80——典例剖析一^——例1某大学为了支援我国西部教育事业,决定从2007应届毕业生报名的18名志愿者中,选取6人组成志愿小组.请用抽签法和随机数表法设计抽样方案。解抽签法:第一步:将18名志愿者编号,编号为1,2,3,…,18。第二步:将18个号码分别写在18张外形完全相同的纸条上,并揉成团,制成号签;第三步:将18个号签放入一个不透明的盒子里,充分搅匀;第四步:从盒子中逐个抽取6个号签,并记录上面的编号;第五步:所得号码对应的志愿者,就是志愿小组的成员。随机数表法:第一步:将18名志愿者编号,编号为01,02,03,…,18。第二步:在随机数表中任选一数作为开始,按任意方向读数,比如第8行第29列的数7开始,向右读;第三步:从数7开始,向右读,每次取两位,凡不在01—18中的数,或已读过的数,都跳过去不作记录,依次可得到12,07,15,13,02,09。第四步:找出以上号码对应的志愿者,就是志愿小组的成员。例2某工厂有1003名工人,从中抽取10人参加体检,试用系统抽样进行具体实施.解(1)将每个人随机编一个号由0001至1003.(2)利用随机数法找到3个号将这3名工人剔除。(3)将剩余的1000名工人重新随机编号由0001至1000.(4)分段,取间隔k=3=100将总体均分为10段,每段含100个工人。10(5)从第一段即为0001号到0100号中随机抽取一个号1.(6)按编号将1,100+1,200+1,-,900+1共10个号码选出,这10个号码所对应的工人组成样本.例3 (14分)某一个地区共有5个乡镇,人口3万人,其中人口比例为3:2:5:2:3,从3万人中抽取一个300人的样本,分析某种疾病的发病率,已知这种疾病与不同的地理位置及水土有关,问应采取什么样的方法?并写出具体过程。TOC\o"1-5"\h\z解应采取分层抽样的方法。 3分过程如下:(1)将3万人分为五层,其中一个乡镇为一层。 5分(2)按照样本容量的比例随机抽取各乡镇应抽取的样本。300X&=60(人);300X2=40(人);15 15300Xf=100(人);300X2=40(人);15 15300X&=60(人), 10分15因此各乡镇抽取人数分别为60人,40人,100人,40人,60人。 12分(3)将300人组到一起即得到一个样本。 14分练习:一、填空题1。(安庆模拟)某校高中生共有900人,其中高一年级300人,高二年级200人,高三年级400人,现分层抽取容量为45的样本,那么高一、高二、高三年级抽取的人数分别为。答案15,10,202。某牛奶生产线上每隔30分钟抽取一袋进行检验,则该抽样方法为①;从某中学的30名数学爱好者中抽取3人了解学习负担情况,则该抽样方法为②。那么①,②分别为.答案系统抽样,简单随机抽样3。下列抽样实验中,最适宜用系统抽样的是(填序号)。①某市的4个区共有2000名学生,且4个区的学生人数之比为3:2:8:2,从中抽取200人入样②某厂生产的2000个电子元件中随机抽取5个入样③从某厂生产的2000个电子元件中随机抽取200个入样④从某厂生产的20个电子元件中随机抽取5个入样答案③4.(2013•重庆文)某校高三年级有男生500人,女生400人,为了解该年级学生的健康情况,从男生中任意抽取25人,从女生中任意抽取20人进行调查,这种抽样方法是.答案分层抽样法5。某中学有高一学生400人,高二学生300人,高三学生200人,学校团委欲用分层抽样的方法抽取18名学生进行问卷调查,则下列判断不正确的是(填序号)。①高一学生被抽到的概率最大②高三学生被抽到的概率最大③高三学生被抽到的概率最小④每名学生被抽到的概率相等答案①②③6。某商场有四类食品,其中粮食类、植物油类、动物性食品类及果蔬类分别有40种、10种、30种、20种,现从中抽取一个容量为20的样本进行食品安全检测,若采用分层抽样的方法抽取样本,则抽取的植物油类与果蔬类食品种数之和是.答案67.(天津文,11)一个单位共有职工200人,其中不超过45岁的有120人,超过45岁的有80人.为了调查职工的健康状况,用分层抽样的方法从全体职工中抽取一个容量为25的样本,应抽取超过45岁的职工人。答案108.将参加数学竞赛的1000名学生编号如下0001,0002,0003,-\1000,打算从中抽取一个容量为50的样本,按系统抽样的方法分成50个部分,如果第一部分编号为0001,0002,・-,0020,从第一部分随机抽取一个号码为0015,则第40个号码为。答案07959。某政府机关有在编人员100人,其中副处级以上干部10人,一般干部70人,工人20人,上级机关为了了解政府机构改革意见,要从中抽取一个容量为20的样本,试确定用何种方法抽取,如何抽取?解用分层抽样抽取。(1)720:100=1:5,・•・10=2,70=14,20=45 5 5・•・从副处级以上干部中抽取2人,一般干部中抽取14人,从工人中抽取4人。(2)因副处级以上干部与工人人数较少,可用抽签法从中分别抽取2人和4人;对一般干部可用随机数表法抽取14人。(3)将2人、4人、14人编号汇合在一起就得到了容量为20的样本.10.某单位有工程师6人,技术员12人,技工18人,要从这些人中抽取一个容量为n的样本。如果采用系统抽样法和分层抽样法抽取,不用剔除个体;如果样本容量增加一个,则在采用系统抽样时,需要在总体中先剔除1个个体,求样本容量n。解总体容量为6+12+18=36。当样本容量是n时,由题意知,系统抽样的间隔为36,分层抽样的比例n是n,抽取工程师nX6=n(人),TOC\o"1-5"\h\z36 36 6抽取技术人员旦X12=n(人),36 3抽取技工旦X18=n(人)。36 2所以n应是6的倍数,36的约数即n=6,12,18,36。当样本容量为(n+1)时,在总体中剔除1人后还剩35人,系统抽样的间隔为王,因为工必须是整n+1 n+1数,所以n只能取6,即样本容量为6.总体分布的估计与总体特征数的估计基基础自测1。一个容量为20的样本,已知某组的频率为0.25,则该组的频数为答案529I]582。(2008•山东理)右图是根据《山东统计年鉴2007》中的资料作成的1997年至2006年我3026省城镇居民百户家庭人口数的茎叶图。图中左边的数字从左到右分别表示城镇居民百户310247家庭人口数的百位数字和十位数字,右边的数字表示城镇居民百户家庭人口数的个位数字。从图中可以得到1997年至2006年我省城镇居民百户家庭人口数的平均数为。答案303。63。在抽查产品的尺寸过程中,将其尺寸分成若干组,[a,b)是其中的一组,抽查出的个体在该组上的频率为m,该组在频率分布直方图的高为h,则|a—b1=。答案mh4。(2008•山东文,9)从某项综合能力测试中抽取100人的成绩,统计如表,则这100人成绩的标准差为。分数54321人数2010303010答案2,1055.为了了解某地区高三学生的身体发育情况,抽查了该地区100名年龄为17。5岁〜18岁的男生体重(kg),得到频率分布直方图如下:根据上图可得这100名学生中体重在[56。5,64。5)的学生人数是答案40典型例题:例1在学校开展的综合实践活动中,某班进行了小制作评比,作品上交时间为5月1日至30日,评委会把同学们上交作品的件数按5天一组分组统计,绘制了频率分布直方图(如图所示),已知从左到右各长方形高的比为2:3:4:6:4:1,第三组的频数为「物组距12,请解答下列问题: —(1)本次活动共有多少件作品参加评比? rT1611152]2631I[期

(2)哪组上交的作品数量最多?有多少件?(3)经过评比,第四组和第六组分别有10件、2件作品获奖,问这两组哪组获奖率高?解⑴第三组的频率为:^二;又因为第三组的频数为12,・・・参评作品数为12=60。15(2)根据频率分布直方图,可以看出第四组上交的作品数量最多,共有^乂二:口改件)。(3)第四组的获奖率是18二;,第六组上交的作品数量为^乂丁彳一二以件),・・・第六组的获奖率为2=%显然第六组的获奖率高.39例4(14分)某化肥厂甲、乙两个车间包装肥料,在自动包装传送带上每隔30min抽取一包产品,称其重量,分别记录抽查数据如下:甲:102, 101, 99, 98, 103, 98, 99;乙:110,115, 90, 85, 75, 115, 110。(1)这种抽样方法是哪一种?(2)将这两组数据用茎叶图表示;(3)将两组数据比较,说明哪个车间产品较稳定。解(1)因为间隔时间相同,故是系统抽样。(2)茎叶图如下:卜:|。『工 K:|3:■! 1 I:'II(3)甲车间:平均值:TOC\o"1-5"\h\z-=1(102+101+99+98+103+98+99)=100, 7分哲7方差:s2=1((102-100)2+(101-100)2+…+(99-100)2]心3。4286. 9分7乙车间:平均值:-=1(110+115+90+85+75+115+110)=100, 11分“27方差:s2=1[(110—100)2+(115—100)2+…+(110—100)2]心228.5714。 13分7,:“J12,s12Vs/,・,•甲车间产品稳定。 14分练习:1。为了了解小学生的体能情况,抽取了某小学同年级部分学生进行跳绳测试,将所得数据整理后,画出频率分布直方图如图所示,已知图中从左到右前三个小组的频率分别是0.1,0。3,0。4,第一小组的频数为5.代016-组跑 0.012- O.OOK- 0.004. ।74.599,5124.5(1)求第四小组的频率;(2)参加这次测试的学生人数是多少?(3)在这次测试中,学生跳绳次数的中位数落在第几小组内?解(1)第四小组的频率=1—(0。1+0.3+0.4)=0.2。(2)设参加这次测试的学生人数是n,则有n二第一小组频数=5+0。1=50(人)。第一小组频率(3)因为0.1X50=5,0.3X50=15,0。4X50=20,0。2X50=10,即第一、第二、第三、第四小组的频数分别为5、15、20、10,所以学生跳绳次数的中位数落在第三小组内。练习:一、填空题1。下列关于频率分布直方图的说法中不正确的是。

①直方图的高表示取某数的频率②直方图的高表示该组上的个体在样本中出现的频率③直方图的高表示该组上的个体数与组距的比值④直方图的高表示该组上的个体在样本中出现的频率与组距的比值答案①②③2。甲、乙两名新兵在同样条件下进行射击练习,每人打5发子弹,命中环数如下:甲:6,8,9,9,8;乙:10,7,7,7,9.则这两人的射击成绩比稳定.答案甲乙4.某班50名学生在一次百米测试中,成绩全部介于13秒与19秒之间,将测试结果分成六组:右图是得到的频率分布直方图.设成绩小于17秒的学生人数占全班总人数的百分比为x,成绩大于等于15秒且小于17秒的学生人数为y,则从频率分布直方图中可分析出x和y分别为。答案0。9,356。甲、乙两名同学在5次体育测试中的成绩统计的茎叶图如图所示,若甲、 甲||乙乙两人的TOC\o"1-5"\h\z一,,、,+ 8727 8平均成绩68 28分别是x甲、乂乙,则x甲X/比稳定. 29 15答案(乙甲7.(上海,9)已知总体的各个体的值由小到大依次为2,3,3,7,a,b,12,13.7,18.3,20,且总体的中位数为10.5。若要使该总体的方差最小,则a、b的取值分别是.答案10.5、10。5二、解答题10。为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图所示),图中从左到右各小长方形面积之比为2:4:17:15:9:3,第二小组频数为12。

痂率坦距痂率坦距(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110次)为达标,试估计该学校全体高一学生的达标率是多少?⑶在这次测试中,学生跳绳次数的中位数落在哪个小组内?请说明理由。解(1)由于频率分布直方图以面积的形式反映了数据落在各小组内的频率大小,因此第二小组的频率为: 4 二0。08。2+4+17+15+9+3又因为频率二第二小组频数,样本容量所以样本容量二第二小组频数=皿=150。第二小组频率0.08(2)由图可估计该学校高一学生的达标率约为17+15+9+3 X100%=88%。2+4+17+15+9+3(3)由已知可得各小组的频数依次为6,12,51,45,27,9,所以前三组的频数之和为69,前四组的频数之和为114,所以跳绳次数的中位数落在第四小组内.基基础自测线性回归方程基基础自测1.下列关系中,是相关关系的为(填序号).①学生的学习态度与学习成绩之间的关系;②教师的执教水平与学生的学习成绩之间的关系;③学生的身高与学生的学习成绩之间的关系;④家庭的经济条件与学生的学习成绩之间的关系。答案①②2。为了考察两个变量x、y之间的线性相关关系,甲、乙两同学各自独立地做10次和15次试验,并利用最小二乘法求得回归直线分别为11和12.已知在两人的试验中发现变量x的观测数据的平均值恰好相等,都为S,变量y的观测数据的平均值也恰好相等,都为t,那么下列说法中正确的是(填序号)。①直线11,12有交点(s,t)②直线11,12相交,但是交点未必是03)③直线11,12由于斜率相等,所以必定平行④直线11,12必定重合答案①3。下列有关线性回归的说法,正确的是(填序号).①相关关系的两个变量不一定是因果关系②散点图能直观地反映数据的相关程度③回归直线最能代表线性相关的两个变量之间的关系④任一组数据都有回归直线方程答案①②③4.下列命题:①线性回归方法就是由样本点去寻找一条贴近这些样本点的直线的数学方法;②利用样本点的散点图可以直观判断两个变量的关系是否可以用线性关系表示;③通过回归直线亍=b*+0及回归系数b,可以估计和预测变量的取值和变化趋势.其中正确命题的序号是。答案①②③5.已知回归方程为y=0.50x-0.81,则x=25时,y的估计值为.答案11。69典例剖析例1下面是水稻产量与施化肥量的一组观测数据:施化肥量15202530354045水稻产量320330360410460470480(1)将上述数据制成散点图;(2)你能从散点图中发现施化肥量与水稻产量近似成什么关系吗?水稻产量会一直随施化肥量的增加而增长吗?解(1)散点图如下:

TOC\o"1-5"\h\z5W .・・400- ,*3如 ..20010()0-5161520253035 4550x(2)从图中可以发现施化肥量与水稻产量具有线性相关关系,当施化肥量由小到大变化时,水稻产量由小变大,图中的数据点大致分布在一条直线的附近,因此施化肥量和水稻产量近似成线性相关关系,但水稻产量只是在一定范围内随着化肥施用量的增加而增长。例2(14分)随着我国经济的快速发展,城乡居民的生活水平不断提高,为研究某市家庭平均收入与月平均生活支出的关系,该市统计部门随机调查了10个家庭,得数据如下:家庭编号12345678910xi(收入)千元0。81.11。31.51.51.82.02。22。42。8yi(支出)千元0。71。01.21。01。31。51。31.72.02.5⑴判断家庭平均收入与月平均生活支出是否相关?(2)若二者线性相关,求回归直线方程。解(1)作出散点图:¥332,51,5O2¥332,51,5O2LO.月支出/千元平均收入/千兀观察发现各个数据对应的点都在一条直线附近,所以二者呈线性相关关系.(2)x=-1(0。8+1.1+1。3+1。5+1。5+1.8+2。0+2.2+2.4+2.8)=1。74,x107=±(0.7+1.0+1。2+1。0+1。3+1。5+1。3+1。7+2.0+2。5)=1。42,10分X--x^x.y.一nx•yb= '0.8136,x2jx2-nx2ii=1

a=1。42-1。74X0。8136'0。0043, 13分・••回归方程小=0.8136x+0。0043。 14分例3下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨)标准煤的几组对照数据。x3456y2。5344。5(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程亍=bx+a;(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤。试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?(参考数值:3X2。5+4X3+5X4+6X4.5=66。5)解(1)散点图如下图:TOC\o"1-5"\h\zH(吨)4$ *4 •353' •2.5 •T1.5I-0.52.5+3+4+4.52.5+3+4+4.5=3。5(2)x=3+4+5+6=4.5,y=4Xxy=3X2。5+4X3+4X5+6X4。5=66.5。iii=1Xx2=32+42+52+62=86ii=1X--x-^x.y.一4x•yi=111=66.5—4义3.5义4.5=0.7X 86-4x4.52X2xi-4x2i=1a=y—bx=3。5-0。7X4。5=0。35。・••所求的线性回归方程为y=0。7x+0.35。

(3)现在生产100吨甲产品用煤y=0。7X100+0。35=70。35,・•・降低90—70。35=19.65(吨)标准煤。 知能迁移一1。科研人员为了全面掌握棉花新品种的生产情况,查看了气象局对该地区年降雨量与年平均气温的统计数据(单位分别是mm,℃),并作了统计。年平均气温12。5112。8412。8413。6913.3312。7413.05年降雨量748542507813574701432(1)试画出散点图;(2)判断两个变量是否具有相关关系。解 (1)作出散点图如图所示,y900孔)(卜7()()6005tX)51心1313.5’14年平居气温(2)由散点图可知,各点并不在一条直线附近,所以两个变量是非线性相关关系。2。在研究硝酸钠的可溶性程度时,对于不同的温度观测它在水中的溶解度,得观测结果如下:温度仪)010205070溶解度(y)66.776.085.0112.3128。0由资料看y与x呈线性相关,试求回归方程。=66.7+76.0+85.0+112.3+128.0=93。6.£8809。乙匕一5x•y8809。4=1 —0。£乙x2-5x2i=1a=;—b-=93.6—0o8809X30=67。173。ay x

・•・回归方程为$=0。8809x+67。173.3.某企业上半年产品产量与单位成本资料如下:月份产量(千件)单位成本(元)127323723471437354696568(1)求出线性回归方程;(2)指出产量每增加1000件时,单位成本平均变动多少?(3)假定产量为6000件时,单位成本为多少元?解(1)n=6,£xi=21,£匕=426,x=3.5,厂71,i=1 i=1£6xi2=79,£6xi$i=1481,i=1 i=1/\ b=£/\ b=£x"$xiyx-6x•yi=1 =£^-^x2-6x2i1481-6义3.5义7179-6x3.52=—1。82。i=1£=Lb?=71+1o82X3。5=77。37。ayx回归方程为y=/bx=77。37-1。82x.(2)因为单位成本平均变动b=-1.82<0,且产量x的计量单位是千件,所以根据回归系数b的意义有:产量每增加一个单位即1000件时,单位成本平均减少1.82元。(3)当产量为6000件时,即乂=6,代入回归方程:y=77。37—1.82X6=66.45(元)当产量为6000件时,单位成本为66.45元.活页作业一一、填空题1。观察下列散点图,则①正相关;②负相关;③不相关。它们的排列顺序与图形对应顺序是答案a,c,b2。回归方程『1。5x-15,则下列说法正确的有个.①-二1。5--15②15是回归系数a③1。5是回归系数a④x=10时,y=0答案13。(2009.湛江模拟)某地区调查了2〜9岁儿童的身高,由此建立的身高y(cm)与年龄x(岁)的回归模型为R=8。25x+60.13,下列叙述正确的是.①该地区一个10岁儿童的身高为142。63cm②该地区2〜9岁的儿童每年身高约增加8.25cm③该地区9岁儿童的平均身高是134.38cm④利用这个模型可以准确地预算该地区每个2~9岁儿童的身高答案②4.三点(3,10),(7,20),(11,24)的回归方程是。答案小=1。75x+5。755。某人对一地区人均工资x(千元)与该地区人均消费y(千元)进行统计调查,y与x有相关关系,得到回归直线方程『0.66x+1.562。若该地区的人均消费水平为7.675千元,估计该地区的人均消费额占人均工资收入的百分比约为。答案83%6.某化工厂为预测产品的回收率y,需要研究它和原料有效成分含量x之间的相关关系,现取8对观测值,计算,得8x=52, 8y =228, 8x2=478, 8xy =1849,则其线性回归方程为。TOC\o"1-5"\h\zi i i iii1 i1 i1 i1答案y=11。47+2。62x7。有下列关系:①人的年龄与他(她)拥有的财富之间的关系;②曲线上的点与该点的坐标之间的关系;③苹果的产量与气候之间的关系;④森林中的同一种树木,其断面直径与高度之间的关系。其中,具有相关关系的是 .答案①③④8.已知关于某设备的使用年限x与所支出的维修费用y(万元),有如下统计资料:使用年限x23456维修费用y2。23.85。56。57.0若y对x呈线性相关关系,则回归直线方程y=bx+a表示的直线一定过定点.答案(4,5)二、解答题9.期中考试结束后,记录了5名同学的数学和物理成绩,如下表:学科\ABCDE数学8075706560物理7066686462(1)数学成绩和物理成绩具有相关关系吗?(2)请你画出两科成绩的散点图,结合散点图,认识(1)的结论的特点。解 (1)数学成绩和物理成绩具有相关关系。(2)以乂轴表示数学成绩,y轴表示物理成绩,可得相应的散点图如下:尸物理成填.,处-506Q7GWiF故学成绩

由散点图可以看出,物理成绩和数学成绩对应的点不分散,大致分布在一条直线附近。10。以下是某地搜集到的新房屋的销售价格y和房屋的面积x的数据:房屋面积X(m2)11511080135105销售价格y(万元)24。821。618。429。222(1)画出数据对应的散点图;(2)求线性回归方程,并在散点图中加上回归直线。解 (1)数据对应的散点图如图所示:V 2X+L8I42(2)-二109,-=23o2,25X2V 2X+L8I42(2)-二109,-=23o2,25X2=60975,i=125%V=12952,xiyii=12 --x-^x.y.-5x•ybT 2X^x,2-5x2

i心0.1962i=1a二y—bx-1.8142・•・所求回归直线方程为y=0。1962x+1。8142.11.某公司利润y与销售总额x(单位:千万元)之间有如下对应数据:X10151720252832y11.31。822.62.73。3(1)画出散点图;⑵求回归直线方程;(3)估计销售总额为24千万元时的利润。解(1)散点图如图所示:2 L,I*白510152025(2)-=1(10+15+17+20+25+28+32)=21,7=1(1+1。3+1。8+2+2.6+2。7+3。3)=2.1,7X%2=102+152+172+202+252+282+322=3447,ii=1X%y=10X1+15X1.3+17X1。8+20X2+25X2.6+28X2。7+32X3。3=346.3,i,ii=1X-%-yx.y.一7x•y104,,='=346.3—7x21x2.1〜0。104,X_ 3447-7x212^■^x?-7x2i=1£=;—br=2o1-0.104X21=—0.084,ay x・・y=0。104x-0.084。(3)把x=24(千万元)代入方程得,y=2.412(千万元)。••估计销售总额为24千万元时,利润为2。412千万元。12。某种产品的广告费支出x与销售额y(单位:百万元)之间有如下对应数据:x24568y3040605070(1)画出散点图;(2)求回归直线方程;(3)试预测广告费支出为10百万元时,销售额多大?解(1)根据表中所列数据可得散点图如下:7Q-TOC\o"1-5"\h\z60- *30-4fl- *30- •

(2)列出下表,并用科学计算器进行有关计算:i12345xi24568yi3040605070xiyi60160300300560因此,x=25=5,~=,250=50,x5y5£x2=145,Xy2=13500,寸xy=1380.i i iii=1 i=1 i=1£「一x-yx.y.一5x•y=6.5;于是可得:b=i=1,, =1380一5*5*50=6.5;1 _ 145-5*5*5x^x2-5x2

ii=1a=y—bx=50-6。5X5=17。5.因此,所求回归直线方程为:y=6。5x+17.5。(3)根据上面求得的回归直线方程,当广告费支出为10百万元时,y=6.5X10+17.5=82。5(百万元),即这种产品的销售收入大约为82。5百万元.§11.4统计案例基基础自测1。对有线性相关关系的两个变量建立的回归直线方程 y=a+bx中,回归系数b与0的大小关系为。(填序号)①大于或小于②大于③小于①大于或小于②大于③小于 ④不小于答案①2。如果有90%的把握说事件A和B有关系,那么具体计算出的数据为22。706.(用“>”“<”,“二”填空)答案>3.对两个变量y与x进行回归分析,分别选择不同的模型,它们的相关系数r如下,其中拟合效果最好的模型是。①模型I的相关系数r为0。98②模型H的相关系数r为0。80③模型HI的相关系数r为0。50④模型W的相关系数r为0.25答案①4。下列说法中正确的有:①若r>0,则x增大时,y也相应增大;②若r<0,则x增大时,y也相应增大;③若r=1或r=—1,则x与y的关系完全对应(有函数关系),在散点图上各个点均在一条直线上。答案①③ 典例剖析一^* 例1 (14分)调查339名50岁以上人的吸烟习惯与患慢性气管炎的情况,获数据如下:患慢性气管炎未患慢性气管炎总计吸烟43162205不吸烟13121134合计56283339试问:(1)吸烟习惯与患慢性气管炎是否有关?(2)用假设检验的思想给予证明.(1)解根据列联表的数据,得到TOC\o"1-5"\h\z2=n(ad-bc)2 2分(a+b)(a+c)(d+b)(d+c)=339x(43x⑵-162X13)2=7。469〉6。635 6分205x56x283x134所以有99%的把握认为“吸烟与患慢性气管炎有关”。 9分

(2)证明假设“吸烟与患慢性气管炎之间没有关系”,由于事件A={X2三6。635}心0。01,即A为小概率事件,而小概率事件发生了,进而得假设错误,这种推断出错的可能性约有1%。14分例2一台机器使用时间较长,但还可以使用.它按不同的转速生产出来的某机械零件有一些会有缺点,每小时生产有缺点零件的多少,随机器运转的速度而变化,下表为抽样试验结果:转速x(转/秒)1614128每小时生产有缺点的零件数y(件)11985(1)对变量y与x进行相关性检验;(2)如果y与x有线性相关关系,求回归直线方程;(3)若实际生产中,允许每小时的产品中有缺点的零件最多为10个,那么,机器的运转速度应控制在什么范围内?解(1)-二12。5,-二8。25,243=438,4--=412.5,i=124x2二660,24y2二291,iii=1 i=12-所以r=Jx.y.-4x•所以r=i=1'(£x2_4x438-412.5<(660-625)x(291-272.25)二25438-412.5<(660-625)x(291-272.25)二25.5心25.50心0.9954。<656,25 25.62因为r>r°005,所以y与x有很强的线性相关关系。y=0。7286x—0。8571。(3)要使y<10=0。7286x-0。8571W10,所以x<14.9013。所以机器的转速应控制在14.9013转/秒以下.'i=1 i=1

例3下表是某年美国旧轿车价格的调查资料,今以x表示轿车的使用年数,y表示相应的年均价格,求y关于x的回归解作出散点图如图所示.解作出散点图如图所示.使用年数x12345678910年均价格y(美元)2651194314941087765538484290226204了碑均彷格30002000I500I0005州5 10 15炉使用年数可以发现,各点并不是基本处于一条直线附近,因此,y与x之间应是非线性相关关系。与已学函数图象比较,用q=ebxa来刻画题中模型更为合理,令z=lnq,则z=bx+a,题中数据变成如下表所示:y zyzax12345678910z7.8837.5727。3096.9916。6406。2886。1825。6705。4215。318相应的散点图如图所示,从图中可以看出,变换的样本点分布在一条直线附近,因此可以用线性回归方程拟合。4W年均价格的对数»*・5 …43-5 10 15Jt/使用洋数由表中数据可得r\—00996。|r|>r .认为x与z之间具有线性相关关系,由表中数据得b\一0。0。05298,a'8.165,所以f=—0。298x+8。165,最后回代f=ln”即q=e-o.298x+8.i65为所求。a z zyy知能迁移1。某班主任对全班50名学生学习积极性和对待班级工作的态度进行了调查,统计数据如下表所示:积极参加班级工作不太主动参加班级工作合计学习积极性高18725学习积极性一般61925合计242650(1)如果随机抽查这个班的一名学生,那么抽到积极参加班级工作的学生的概率是多少?抽到不太主动参加班级工作且学习积极性一般的学生的概率是多少?(2)试运用独立性检验的思想方法分析:学生的学习积极性与对待班级工作的态度是否有关系?说明理由.解(1)随机抽查这个班的一名学生,有50种不同的抽查方法,由于积极参加班级工作的学生有18+6=24人,所以有24种不同的抽法,因此由古典概型的计算公式可得抽到积极参加班级工作的学生的概率是P=皂=12,又因为不太主动参加班级工作且学习积极性一般的学生有19人,所以抽到不太15025主动参加班级工作且学习积极性一般的学生的概率是P=19.250(2)由浮统计量的计算公式得浮=50x(18X19-6X7)2\11.538,由于11.538>10。828,所以可以有99.9%24x26x25x25的把握认为“学生的学习积极性与对待班级工作的态度有关系〃。2.某个体服装店经营某种服装,一周内获纯利y(元)与该周每天销售这种服装的件数x之间的一组数据如下:x3456789y66697381899091已知X42=280,X,2=45309,Sxiyi=3487,此时r005=00754。i=1 i=1 i=1(1)求x,y;(2)判断一周内获纯利润y与该周每天销售件数x之间是否线性相关,如果线性相关,求出回归直

线方程.解(1)-=1(3+4+5+6+7+8+9)=6,7-=1(66+69+73+81+89+90+91)\79。86。7(2)根据已知Xx2=280, Xy2=45309,E^y=3487,i=1 i=1 i=1得相关系数r= 3487—7x6x79.86-0.973。・v'(280—7x62)(45309—7x79.862)由于0。973>0.754,所以纯利润y与每天销售件数x之间具有显著线性相关关系。利用已知数据可求得回归直线方程为y=4.746x+51。386.3。某种书每册的成本费y(元)与印刷册数x(千册)有关,经统计得到数据如下:x123510203050100200y10.155.524。082.852。111。621.411。301。211。15检验每册书的成本费y与印刷册数的倒数1之间是否具有线性相关关系,如有,求出y对x的回归方x程。解首先作变量置换,令u二工,题目所给数据变成如下表所示的10对数据:然后作相关性检验。经计算得r然后作相关性检验。经计算得r-0.9998>0性相关关系.由公式得a-1。125,b-8。973,所以y=1.125+8。973u,最后回代u=1,x可得y=1.125+8973,x这就是题目要求的y对x的回归曲线方程。。75,从而认为u与y之.. 间具有线卜一•0246B10X回归曲线的图形如图所示,它是经过平移的反比例函数图xu10.50.330。20.10。050.030。020。010O005y10。155。524。082.852。111.621.411。301。211.15象的一个分支.—活页作业—-—一、填空题1。对于独立性检验,下列说法中正确的是.①%2的值越大,说明两事件相关程度越大②%2的值越小,说明两事件相关程度越小③%2W2。706时,有90%的把握说事件A与B无关④%2>6.635时,有99%的把握说事件A与B有关答案①②④2.工人月工资y(元)依劳动生产率x(千元)变化的回归方程为亍=50+80x,下列判断正确的是①劳动生产率为1000元时,工资为130元②劳动生产率提高1000元时,工资平均提高80元③劳动生产率提高1000元时,工资平均提高130元④当月工资为210元时,劳动生产率为2000元答案②3。下面是2X2列联表:y1y2合计x1a2173x2222547合计b46120则表中a,b的值分别为.答案52,744。实验测得四组(x,y)的值为(1,2),(2,3),(3,4),(4,5),则y与x之间的回归直线方程为。答案『x+15。在一次试验中,当变量x的取值分别为1,1,1,1时,变量y的值分别为2,3,4,5,则y与1的回归23 4 x曲线方程为。答案广1+1x6。在一次对性别与说谎是否有关的调查中,得到如下数据:说谎不说谎合计男6713女8917合计141630根据表中数据,得到如下结论中不正确的是.①在此次调查中有95%的把握认为是否说谎与性别有关②在此次调查中有99%的把握认为是否说谎与性别有关③在此次调查中有99。5%的把握认为是否说谎与性别有关④在此次调查中没有充分的证据显示说谎与性别有关答案①②③7。为了判断高中三年级学生是否选修文科与性别的关系,现随机抽取50名学生,得到如下2X2列联表:理科文科男1310女720已知P(12三3。841)心0。05,P(%2三5。024)心0。025。根据表中数据,得到%2=50X。3X20-1°X7)2'4。844。23x27x20x30则认为选修文科与性别有关系出错的可能性为。答案5%8。为了探究电离辐射的剂量与人体的受损程度是否有关,用两种不同剂量的电离辐射照射小白鼠,在照射后14天的结果如下表所示:死亡存活合计第一种剂量141125第二种剂量61925合计203050进行统计分析时的统计假设是:答案小白鼠的死亡与剂量无关二、解答题9.在一次飞机航程中调查男女乘客的晕机情况,其二维条形图如图:(1)写出2X2列联表;(2)判断晕机与性别是否有关?解⑴晕机不晕机合计男107080女102030合计2090110(2)X2=110x(10X20-70x10)2'6。366>5.024,故有97。5%的把握认为“晕机与性别有关”。20x90x30x8010。某地10户家庭的年收入和年饮食支出的统计资料如下表:年收入x(万元)24466677810年饮食支出y(万元)0.91。41。62。02。11。91。82。12。22。3(1)根据表中数据,确定家庭的年收入和年饮食支出之间是否具有相关关系;若具有相关关系求出y与x的回归直线方程;(2)如果某家庭年收入为9万元,预测其年饮食支出。 口4-解(1)由题意知,年收入x为解释变量,年饮食支出y为预报变量,作散3-点图(如图所示).从图中可以看出,样本点呈条状分布,年收入和年饮食支..匕,■,TOC\o"1-5"\h\z出有比较好的线性相关关系,因此可以用回归直线方程刻画它们之间的关系。1 _o12345678孑mX:-=6,-=1.83,£%2=406,£y2=35。13,£%丫=117.7,i i iii=1 i=1 i=1・•・b\0。172,a=v—b7=1。83-0.172X6=0.798。ay 人从而得到回归直线方程为y=0。172x+0。798。(2)当x=9时,y=2.346。因此,某家庭年收入9万元,其年饮食支出大约为2.346万元。11.测得某国家10对父子身高(单位:英寸)如下:父亲身高(x)60626465666768707274儿子身高(y)63。665。26665。566.967。167。468。370。170(1)对变量y与x进行相关性检验;(2)如果y与x之间具有线性相关关系,求回归直线方程;(3)如果父亲的身高为73英寸,估计儿子的身高。解(1)-二66。8,厂67。01,£%2=44794,£y2=44941.93,iii=1 i=1%y=4476。268,%2=4462。24,y2-4490.34, £%iyi=44842。4。i=1£/— %-^x.y.一10%•y所以r=,i=ii昌一10%2)(£y2_10y2)*i=1 i=1=_ 44842.4—10x4476.27y;(44794—44622.4)(44941.93—44903.4)=79.72 -0。9804.66611.748因为r>%05,所以y与x之间具有线性相关关系。(2)设回归直线方程为y=b%+a.£/1-%iyi—10%•y由八.1' =44842.4—44762.7由b=十匕 F_ 44794—44622.40%2一10%2ii=1=S-0。4646。171.6a=y—b%=67。01-0.4646X66。8-35.9747.故所求的回归直线方程为y=0.4646x+35.9747.(3)当x=73英寸时,y=0.4646X73+35。9747-69。9,所以当父亲身高为73英寸时,估计儿子的身高约为69.9英寸。12.在调查的480名男人中有38名患有色盲,520名女人中有6名患有色盲,分别利用图形和独立性检验的方法来判断色盲与性别是否有关?你所得到的结论在什么范围内有效?解根据题目所给的数据作出如下的列联表:色盲不色盲合计男38442480女6514520合计449561000根据列联表作出相应的二维条形图:600-色盲不色百400200-从二维条形图来看,在男人中患色盲的比例为至,要比女人中患色盲的比例上大。480 520其差值为到__6_'0。068,差值较大。480520因而,我们可以认为“患色盲与性别是有关的〃.根据列联表所给的数据可以有a=38,b=442,c=6,d=514,a+b=480,c+d=520,a+c=44,b+d=956,n=1000,n(ad-bc)2(a+b)(c+d)(a+c)(b+d)=1000x(38x514-6x442)2\27。1.480x520x44x956由27.1>10。828,所以我们有99。9%的把握认为患色盲与性别有关系,这个结论只对所调查的480名男人和520名女人有效。单元检测十一一、填空题(本大题共14小题,每小题5分,共70分)1。某班的78名同学已编号1,2,3,…,78,为了解该班同学的作业情况,老师收取了学号能被5整除的15名同学的作业本,这里运用的抽样方法是.答案系统抽样法2.一组数据的方差为S2,将这组数据中的每个数据都扩大3倍,所得到的一组数据的方差是.答案9s23。某地区有300家商店,其中大型商店有30家,中型商店有75家,小型商店有195家,为了掌握各商店的营业情况,要从中抽取一个容量为20的样本,若采用分层抽样的方法,抽取的中型商店数有家.答案54.下图是某中学高一年级1200名学生身高的频率分布直方图的一部分,则身高在[160,170]的学生大约有名。物率答案5105。某人5次上班途中所花的时间(单位:分钟)分别为x,y,10,11,9。已知这组数据的平均数为10,方差为2,则|x—y1的值为。答案46。有以下两个问题:(1)某社区有1000个家庭,其中高收入家庭有250户,中等收入家庭有560户,低收入家庭有190户,为了了解社会购买力的某项指标,要从中抽取一个容量为200的样本;(2)从20人中抽取6人参加座谈会,给出下列抽样方法:a随机抽样;b系统抽样;c分层抽样.上述两个问题应采用的抽样方法分别为(填代号).答案c,a7.下图为甲、乙两名篮球运动员每场比赛得分情况的茎叶图,则甲和乙得分的中位数的和是分。甲甲4445495662195答案578。下列说法:①将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变;②设有一个回归方程亍=3-5x,变量x增加一个单位时,y平均增加5个单位;③线性回归方程f=bx+a必过(XT)④曲线上的点与该点的坐标之间具有相关关系;⑤在一个2X2列联表中,由计算得/=13.079,则其两个变量间有关系的可能性是90%。其中错误的个数是。答案39.(2008•陕西文)某林场有树苗30000棵,其中松树苗4000棵,为调查树苗的生长情况,采用分层抽样的方法抽取一个容量为150的样本,则样本中松树苗的数量为。答案2010。甲、乙、丙三名射箭运动员在某次测试中各射箭20次,三人的测试成绩如下表甲的成绩环数78910频数5555乙的成绩环数78910频数6446丙的成绩环数78910频数4664s1、s/s3分别表示甲、乙、丙三名运动员这次测试成绩的标准差 ,则有s1,s2,s3的大小关系为。答案S2>S1>S311。在样本的频率分布直方图中,一共有4个小长方形,这4个小长方形的面积由小到大构成等差数列{an},且a2=2a1,若样本容量为400,则小长方形中面积最大的一组的频数等于。答案16012。(2008•广东文,11)为了调查某厂工人生产某种产品的能力,随机抽查了20位工人某天生产该产品的数量,产品数量的分组区间为[45,55),[55,65),[65,75),[75,85),[85,95).由此得到频率分布直方图如图所示,则这20名工人中一天生产该产品数量在[55,75)的人数是。频率产品数量频率产品数量答案1313。如果数据x1,x2,…,xn的平均数为-,方差为S2,则2x1+3,2x2+3,…,2xn+3的平均数和方差为,。答案2-+34s214。(2008•湖南文,12)从某地区15000位老人中随机抽取500人,其生活能否自理的情况如下表所示。人、别生活能否自』理数'\男女能一178278不能2321则该地区生活不能自理的老人中男性比女性约多人.答案60二、解答题(本大题共6小题,共90分)15。(14分)一次科技知识竞赛,两组学生成绩统计如下:分数5060708090100人数甲组251013146乙组441621212已经算得两个组的平均分都是80分,请你根据所学过的统计知识,进一步判断两个组在这次竞赛中的成绩谁优谁次?并说明理由。解(1)从众数看,甲为90分,乙为70分,甲组成绩较好;(2)从中位数看,两组中位数都为80分,但在80分(含80分)以上,甲组有33人,乙组有26人,甲组人数多于乙组人数,甲组成绩较好;(3)从方差看,=172,§乙=256,甲组成绩波动较小,较稳定;(3)从方差看,(4)从得满分情况来看,甲组人数6人,乙组人数12人,成绩较好者应为乙组。16.(14分)某重点中学高中各班级学生人数如下表所示:\ 年级'、班\高一年级高二年级高三年级1班4546482班4854553班525052学校计划召开学生代表座谈会。请根据上述基本数据,设计一个容量为总体容量的-1的抽样方案。20解由表中基本数据可知,高一学生总数为145人,高二学生总数为150人,高三学生总数为155人,第一步:

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论