第九篇统计与统计案例分析_第1页
第九篇统计与统计案例分析_第2页
第九篇统计与统计案例分析_第3页
第九篇统计与统计案例分析_第4页
第九篇统计与统计案例分析_第5页
已阅读5页,还剩50页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第九篇统计与统计案例A A第九篇统计与统计案例第1讲随机抽样最新考纲.理解随机抽样的必要性和重要性.会用简单随机抽样方法从总体中抽取样本;了解分层抽样和系统抽样方法 . 诊断基础知识南浅入濯分基固本知识梳理.简单随机抽样(1)定义:从元素个数为N的总体中不放回地抽取容量为 n的样本,如果每一次 抽取时总体中的各个个体有粗皿5可能性被抽到, 这种抽样方法叫做简单随机抽 样.(2)最常用的简单随机抽样的方法:抽签法和随机数表法.系统抽样的步骤假设要从容量为N的总体中抽取容量为n的样本.先将总体的N个个体编号:(2)确定分段间隔k,对编号进行分段,当N(n是样本容量)是整数时,取k=N;当NN不是整

2、数时,可随机地从总体中剔除余数,再确定分段间隔;在第1段用简单随机抽样确.定第一个个体编号 s(s k);按照一定的规则抽取样本,通常是将s加上间隔k得到第2个个体编号(s+ k), 再加k得到第3个个体编号(s+2k),依次进行下去,直到获取整个样本.分层抽样分层抽样的定义:在抽样时,将总体中各个个体按某种特征分成若干个互不重叠的几部分,每一部分叫做层,在各层中按层在总体中所占比例进行简单随机抽样或系统抽样,这种抽样方法叫做分层抽样.分层抽样的应用范围:当总体由明显差异的几部分组成时,往往选用分层抽样. 辨析感悟.对简单随机抽样的认识(1)(教材思考问题改编)在简单随机抽样中,某一个个体被抽

3、到的可能性与第几次 TOC o 1-5 h z 抽取有关,第一次抽到的可能性最大.( X )从100件玩具中随机拿出一件,放回后再拿出一件,连续拿 5次,是简单随机抽样.(X ).对系统抽样的理解(3)系统抽样适用于元素个数较多且分布均衡的总体.(,)(4)要从1 002个学生中用系统抽样的方法选取一个容量为 20的样本,需要剔除2个学生,这样对被剔除者不公平.( X ).对分层抽样的理解(5)分层抽样中,每个个体被抽到的可能性与层数及分层有关.(X )(6)(2014郑州模:?K改编)某校即将召开学生代表大会,现从高一、高二、高三共抽取60名代表,则可用分层抽样方法抽取.(,)(2013湖南

4、卷改编)某学校有男、女学生各 500名.为了解男、女学生在学习兴趣与业余爱好方面是否存在显著差异,拟从全体学生中抽取100名学生进行调查,则宜采用的抽样方法是分层抽样.(,)感悟提升两点提醒一是简单随机抽样(抽签法和随机数法)都是从总体中逐个地进行抽取,都是不放回抽样,如(2).二是三种抽样方法在抽样过程中每个个体被抽到的可能性都相等,如(1)、(4)、(5).突破高频考点以何求法考点一简单随机抽样【例1】下列抽取样本的方式是否属于简单随机抽样?(1)从无限多个个体中抽取100个个体作为样本.盒子里共有80个零件,从中选出5个零件进行质量检验.在抽样操作时,从 中任意拿出一个零件进行质量检验后

5、再把它放回盒子里.从20件玩具中一次性抽取3件进行质量检验.某班有56名同学,指定个子最高的5名同学参加学校组织的篮球赛.解(1)不是简单随机抽样.由于被抽取的样本总体的个体数是无限的,而不是 有限的.不是简单随机抽样.由于它是放回抽样.(3)不是简单随机抽样.因为这是“一次性”抽取,而不是“逐个”抽取.不是简单随机抽样.因为指定个子最高的5名同学是56名中特指的,不存在随机性,不是等可能抽样.规律方法(1)简单随机抽样需满足;抽取的个体数有限;逐个抽取;是不 放回抽取;是等可能抽取.简单随机抽样常有抽签法(适用总体中个体数较少的情况)、随机数表法(适用 于个体数较多的情况).【训练1】 下列

6、抽样试验中,适合用抽签法的有().A.从某厂生产的5 000件产品中抽取600件进行质量检验B.从某厂生产的两箱(每箱18件)产品中抽取6件进行质量检验C.从甲、乙两厂生产的两箱(每箱18件)产品中抽取6件进行质量检验D.从某厂生产的5 000件产品中抽取10件进行质量检验答案 B考点二系统抽样【例2】 采用系统抽样方法从960人中抽取32人做问卷调查.为此将他们随机 编号为1,2,,960,分组后在第一组采用简单随机抽样的方法抽到的号码为 9.抽到的32人中,编号落入区间1,450的人做问卷A,编号落入区间451,750 的人做问卷B,其余的人做问卷C.则抽到的人中,做问卷B的人数为().A

7、. 7 B. 9 C. 10 D. 15 解析 从960人中用系统抽样方法抽取32人,则每30人抽取一人,因为第一组 抽到的号码为9,则第二组抽到的号码为39,第n组抽到的号码为an=9+30(n 1)=30n 21,由 4510 30n 21 0 750,得236& n xb,因此 A 药的疗效更好.鼻药B药 9 5 fi 5 792346S124 6 L 5 7由观测结果绘制如下茎叶图:5 2 K 5 24 3976532g710 3 2从茎叶图可以看出,A药疗效的试验结果有 毛的叶集中在茎2,3上;B药疗效的 试验结果有170的叶集中在茎0,1上.由上述可看出A药的疗效更好.规律方法 茎

8、叶图的绘制需注意:(1) “叶”的位置只有一个数字,而 “茎”的位 置的数字位数一般不需要统一;(2)重复出现的数据要重复记录,不能遗漏,特 别是“叶”的位置的数据.【训练2】(2013重庆卷)以下茎叶图记录了甲、乙两组各五名学生在一次英语 听力测试中的成绩(单位:分)甲组乙组909x215y87424已知甲组数据的中位数为15,乙组数据的平均数为16.8,则x, y的值分别为().A. 2,5 B. 5,5 C. 5,8 D. 8,8解析 由茎叶图及已知得x=5,又乙组数据的平均数为16.8,即9+15+10+ y+ 18+24互力/日5: 16.8,解得 y=8.答案 C考点三样本的数字特

9、征【例3】甲乙二人参加某体育项目训练,近期的五次测试成绩得分情况如图.分别求出两人得分的平均数与方差;(2)根据图和上面算得的结果,对两人的训练成绩作出评价.解(1)由图象可得甲、乙两人五次测试的成绩分别为甲:10分,13分,12分,14分,16分;乙:13分,14分,12分,12分,14分.10+13+12+14+16 _x 甲=Z:13,13+14+12+12+14Xl 5s2 = 1(10-13)2+(13-13)2+(12-13)2+(14- 13)2+(16-13)2 =4,5s2 = 1(13 13)2+(1413)2+(1213)2+(12 13)2+(1413)2 = 0.8.

10、5由s2s2可知乙的成绩较稳定.从折线图看,甲的成绩基本呈上升状态,而乙的成绩上下波动,可知甲的成绩在 不断提高,而乙的成绩则无明显提高.规律方法 平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它 们所反映的情况有着重要的实际意义,平均数、中位数、众数描述其集中趋势,方差和标准差描述其波动大小.【训练3】将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分 数的平均分为91.8 7 70 4 0 1 (:现场作的9个分数的茎叶图后来有1个数据模糊,无法辨认,在图中以x表示:则7个剩余分数的方差为().A.116Vc 36B.尸C. 36D.6,77解析由题意知87+ 94+

11、 90+ 91 + 90+ 90+ x+ 91791,解得 x= 4.所以 S2 =;(87 91)2 + (94 91)2+(90 91)2+(9191)2 + (90 91)2+(94 91)2+(9191)2 =736(16+ 9+1 + 0+1 + 9+0)=亍答案 B|课堂小结|.茎叶图、频率分布表和频率分布直方图都是用来描述样本数据的分布情况 的.茎叶图由所有样本数据构成,没有损失任何样本信息,可以随时记录;而频 率分布表和频率分布直方图则损失了样本的一些信息,必须在完成抽样后才能制 作.众数、中位数、平均数的异同(1)众数、中位数及平均数都是描述一组数据集中趋势的量,平均数是最重

12、要的 量.(2)平均数的大小与一组数据里每个数据均有关系,任何一个数据的变动都会引 起平均数的变动,而中位数和众数都不具备此性质.(3)众数体现各数据出现的频率,当一组数据中有若干数据多次出现时,众数往 往更能反映问题.(4)中位数仅与数据的排列位置有关,中位数可能出现在所给数据中,也可能不在所给数据中,当一组数据中的个别数据变动较大时, 可用中位数描述其集中趋 势.培养,解题能力教你解题提升能力易错辨析8统计图表识图不准致误【典例】 从某校高三年级随机抽取一个班,对该班50名学生的高校招生体检表 中的视力情况进行统计,其频率分布直方图如图所示:若某高校A专业对视力的要求在0.9以上,则该班学

13、生中能报A专业的人数为解析该班学生视力在0.9以上的频率为(1.00+0.75+ 0.25) X 0.2= 0.4,故能报A专业的人数为0.4X 50= 20.答案20易错警示解题中易出现审题不仔细,又对所给图形没有真正理解清楚,将矩 形的高误认为频率或者对 “0.9以上”的含义理解有误.防范措施求解频率分布直方图中的数据问题,最容易出现的问题就是把纵轴,,一 , 频率 ,,误以为是频率导致错误.在频率分布直方图中,纵轴表示京肃,我们用各个小矩形的面积表示该段数据的频率,所以各组数据的频率等于小矩形的高对应的数据 与小矩形的宽(样本数据的组距)的乘积.【自主体验】(2013福建卷)某校从高一年

14、级学生中随机抽取部分学生, 将他们的模块测试成绩 分成 6 组:40,50), 50,60), 60,70), 70,80), 80,90), 90,100加以统计,得到如图所示的频率分布直方图.已知高一年级共有学生600名,据此估计,该模块 测试成绩不少于60分的学生人数为().A. 588 B. 480 C. 450 D. 120解析 从频率分布直方图可以看出:分数大于或等于60分的频率为(0.030+ 0.025 + 0.015+ 0.010)X 10=0.8,故频数为 600X 0.8=480.答案 B课时题组训练附施训赛臻出高分基础巩固题组(建议用时:40分钟)一、选择题. (201

15、2 山东卷)在某次测量中得到的 A 样本数据如下: 82,84,84,86,86,86,88,88,88,8的B样本数据恰好是A样本数据每个都加2后所得 数据.则A, B两样本的下列数字特征对应相同的是().A.众数 B.平均数 C.中位数 D.标准差解析对样本中每个数据都加上一个非零常数时不改变样本的方差和标准差,众数、中位数、平均数都发生改变.答案 D.在样本频率分布直方图中,共有11个小长方形,若中间一个小长方形的面积1等于其他10个小长方形面积和的4,且样本容量为160,则中间一组的频数为().A. 32 B. 0.2 C. 40 D. 0.25解析由频率分布直方图的性质,可设中间一组

16、的频率为x,则x+ 4x=1,x= 0.2,故中间一组的频数为 160X 0.2=32,选A.答案 A(2014潮州二模)有两位射击运动员在一次射击测试中各射靶10次,每次命中的环数如下:甲 7879549 10 74乙 9578768677则下列判断正确的是().A.甲射击的平均成绩比乙好B.乙射击的平均成绩比甲好C.甲比乙的射击成绩稳定D.乙比甲的射击成绩稳定解析 甲、乙的平均成绩分别为 7甲=7, 7乙=7,故排除A, B项;甲、乙的1成绩的万差分别为 S2=而(7 7)2 + (8 7)2 + (7 7)2 + (9 7)2 + (5 7)2 + (4 7)2+ (9-7)2 + (1

17、0 7)2+ (7-7)2+(4-7)2 = 4, S2 = 110(9 - 7)2+ (5 7)2+ (7 - 7)2+(87)2+(77)2 + (67)2 + (8 7)2 + (67)2+(7 7)2+(7 7)2 = 1.2,则 s2s2, 所以乙比甲的射击成绩稳定,故选 D.答案 D(2014临沂一模)某中学高三从甲、乙两个班中各选出7名学生参加数学竞赛,他 们取得的成绩(满分100分)的茎叶图如图,其中甲班学生成绩的众数是85,乙班学生成绩的中 位数是83,则x+ y的值为().A. 7 B. 8 C. 9 D. 10解析 由茎叶图可知,甲班学生成绩的众数是85,所以x=5.乙班

18、学生成绩的中位数是83,所以y= 3,所以x+y= 5+3=8.答案 B5.甲、乙两人在一次射击比赛中各射靶 5次,两人成绩的条形统计图如图所示,贝心 ).t贝数t班数I H I口W 11? 10环数 0 34 5 A.甲的成绩的平均数小于乙的成绩的平均数 B.甲的成绩的中位数等于乙的成绩的中位数 C.甲的成绩的方差小于乙的成绩的方差D.甲的成绩的极差小于乙的成绩的极差 解析由条形统计图知:甲射靶5次的成绩分别为:4,5,6,7,8; 乙射靶5次的成绩分别为:5,5,5,6,9;4+5+6+7+8=6;5+5+5+6+ 9 八x 乙=5: 6.所以、甲=又乙.故A不正确.甲的成绩的中位数为 6

19、,乙的成绩白中位数为5, 故B不正确.s2 = 11(4 6)2 + (5 6)2 + (6 6)2 + (7 6)2 + (8 6)2 = 5 X 10= 2,s2 = 11(5 6)2+(56)2+(56)2+(66)2 + (9 6)2=5*12=呆 因为 21, 所以s2 s2.故C正确.甲的成绩的极差为:8 4 = 4,乙的成绩的极差为:9 5 = 4, 故D不正确.故选C.答案 C二、填空题.在如图所示的茎叶图中,甲、乙两组数据的中位数分别是 ,解析 根据茎叶图所给数据,易知两组数据的中位数分别为45,46.答案 45 46. (2013湖北卷)从某小区抽取100户居民进行月用电量

20、调查,发现其用电量都 在50至350度之间,频率分布直方图如图所示.直方图中x的值为;(2)在这些用户中,用电量落在区间100,250内的户数为.解析 (1)根据频率和为 1,得(0.002 4+0.003 6+0.006 0 + x +0.002 4+0.0012)X50= 1,解得 x= 0.004 4.(2)(0.003 6+ 0.004 4+ 0.006 0) X 50 X 100= 70.答案 0.004 4 70.某人5次上班途中所花的时间(单位:分钟)分别为x, y,10,11,9.已知这组数据 的平均数为10,方差为2,则|x y|的值为.解析 由题意可得:x+ y=20, (

21、x- 10)2+(y 10)2 = 8,设 x= 10+1, y=10t,|x-y|=2|t|=4.答案4三、解答题.某校高一某班的某次数学测试成绩(满分为100分)的茎叶图和频率分布直方 图都受了不同程度的破坏,但可见部分如图,据此解答下列问题:(1)求分数在50,60的频率及全班人数;(2)求分数在80,90之间的频数,并计算频率分布直方图中80,90间的矩形的高.解 (1)分数在50,60的频率为0.008X 10=0.08.由茎叶图知,分数在50,60之间的频数为2,所以全班人数为 % = 25.0.08(2)分数在80,90之间的频数为 25 2-7-10-2 = 4,频率分布直方图

22、中80,90 4间的矩形的图为-10 = 0.016.10. (2014大连模拟)从某校高三年级800名男生中随机抽取50名学生测量其身 高,据测量,被测学生的身高全部在155 cm到195 cm之间.将测量结果按如下 方式分成8组:第一组155,160),第二组160,165),,第八组190,195,下图 是按上述分组得到的频率分布直方图的一部分.已知第一组与第八组的人数相 同,第七组与第六组的人数差恰好为第八组与第七组的人数差.求下列频率分布表中所标字母的值,并补充完成频率分布直方图.频率分布表:分组频数频率/组距180,185)xyz185,190)mnP解由频率分布直方图可知前五组的

23、频率和是(0.008+ 0.016+ 0.04+ 0.04+0.06)X5=0.82,第八组的频率是0.008X 5=0.04,所以第六、七组的频率和是1 -0.82-0.04 = 0.14,所以第八组的人数为50X0.04= 2,第六、七组的总人数为 50X0.14= 7.由已知得 x+ m=7, mx=2m,解得 x=4, m=3,所以 y=0.08, n=0.06, z=0.016, p = 0.012.补充完成频率分布直方图如图所示.就率,机距能力提升题组(建议用时:25分钟)一、选择题1 . (2014长春调研)如图是依据某城市年龄在 20岁到45岁的居民上网情况调查 而绘制的频率分

24、布直方图,现已知年龄在30,35), 35,40)、40,45的上网人数呈 现递减的等差数列分布,则年龄在35,40)的网民出现的频率为().小A. 0.04 B. 0.06 C. 0.2 D. 0.3解析由频率分布直方图可知,年龄在20,25)的频率为0.01X5 = 0.05, 25,30)的频率为0.07X 5= 0.35,又年龄在30,35), 35,40), 40,45的频率成等差数列分 布,所以年龄在35,40)的网民出现的频率为0.2.答案 C(2012陕西卷)从甲乙两个城市分别随机抽取16台自动售货机,对其销售额进 行统计,统计数据用茎叶图表示(如图所示).设甲乙两组数据的平均

25、数分别为 7甲,x乙,中位数分别为m甲,m乙,则().人.乂甲乂乙, m甲m乙 8.乂甲乂乙, m甲m乙乂甲乂乙,m甲m乙 口.乂甲乂乙,m甲m乙1解析x 甲= 16(41+43+ 30+30+38+22+25+27+ 10+ 10+ 14+ 18+18+5+3456+8)-1x 乙=否(42+ 43 + 48+ 31 + 32+ 34+ 34+38 + 20+ 22+23 + 23+ 27+ 10+ 12 +18)=45776.又. m甲= 20, m乙二 29,m甲m乙答案 B二、填空题(2014西安一检)由正整数组成的一组数据x1, x2, x3, x4,其平均数和中位数 都是2,且标准

26、差等于1,则这组数据为.解析 不妨设x1&x20 x30 x4,由中位数及平均数均为 2,得x1+x4=x2 + x3=4, 故这四个数只可能为1,1,3,3或1,2,2,3或2,2,2,2,由标准差为1可得这四个数只 能为 1,1,3,3.答案 1,1,3,3三、解答题(2014西安模拟)某校从参加高三模拟考试的学生中随机抽取 60名学生,将其 数学成绩(均为整数)分成六组90,100), 100,110),,140,150后得到如下部分 频率分布直方图.观察图形的信息,回答下列问题:触率收1距0.030T0.020 -rv rrwa nn a ! ib ,rirn0.015新+唱卜鼻+.0

27、+4|,+.詈+y+口.+干0D.O1D r- - -TT 0.005 _J- 090 100 lin 120 no 14O 150 分敷求分数在120,130)内的频率;(2)若在同一组数据中,将该组区间的中点值(如:组区间100,110)的中点值为100+110,;105.)作为这组数据的平均分,据此,估计本次考试的平均分;(3)用分层抽样的方法在分数段为110,130)的学生中抽取一个容量为6的样本,将 该样本看成一个总体,从中任取2人,求至多有1人在分数段120,130)内的概率.解(1)分数在120,130)内的频率为1 (0.1 + 0.15+ 0.15+0.25+ 0.05)=

28、1 0.7= 0.3.(2)估计平均分为7 =95X 0.1+ 105X 0.15+ 115X 0.15+ 125X 0.3+ 135X 0.25+ 145X 0.05= 121.由题意,110,120)分数段的人数为60X0.15 = 9(人).120,130)分数段的人数为60X 0.3= 18(人).二.用分层抽样的方法在分数段为110,130)的学生中抽取一个容量为6的样本, 需在110,120价数段内抽取2人,并分别记为m, n;在120,130)分数段内抽取4人,并分别记为a, b, c, d;设“从样本中任取2 人,至多有1人在分数段120,130)内”为事件A,则基本事件共有(

29、m, n), (m, a),,(m, d), (n, a),,(n, d), (a, b),,(c, d)共 15种.则事件 A包含的基本事件有(m, n), (m, a), (m, b), (m, c), (m, d), (n, a), (n, b), (n, c), (n, d)共 9种.9 3.P(AF=5.第3讲变量的相关性、统计案例最新考纲会作两个相关变量的数据的散点图,会利用散点图认识变量间的相关关系.了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归 方程.了解独立性检验(只要求2X2列联表)的基本思想、方法及其简单应用.了解回归分析的基本思想、方法及其简单应用.

30、知识梳理诊断基础知识.两个变量的线性相关.散点图以一个变量的取值为横坐标,另一个变量的相应取值为纵坐标,在直角坐标系中 描点,这样的图形叫做散点图.回归直线方程与回归分析(1)直线方程y=a+bx,叫做Y对x的回归直线方程,b叫做回归系数.要确定回 归直线方程,只要确定a与回归系数b.(2)用最小二乘法求回归直线方程中的 a, b有下列公式na 百xyi - nxy人 人人人b=-n, a= y bx,其中a, b表小的是求得的 a, b的估计值.a xi2nx2(3)相关性检验计算相关系数r, r有以下性质:|r|0时,说明两个变量呈正相关关系;当回归 系数b0),故x与y之间是正相关.人(

31、3)将x= 7代入回归方程可以预测该家庭的月储蓄为 y = 0.3X 7 0.4= 1.7(千元).规律方法(1)正确理解计算b, a的公式和准确的计算是求线性回归方程的关键. 八 八 八(2)回归直线方程y =bx+ a必过样本点中心(x, y).(3)在分析两个变量的相关关系时,可根据样本数据作出散点图来确定两个变量之间是否具有相关关系,若具有线性相关关系,则可通过线性回归方程来估计和 预测.【训练2】(2014南昌模拟)以下是某地搜集到的新房屋的销售价格y和房屋的面积x的数据.房屋间积x/m211511080135105销售价格y/万元24.821.618.429.222(1)求线性回归

32、方程;(2)据(1)的结果估计当房屋面积为150 m2时的销售价格.解 (1)7 =1X(115+110+ 80+ 135+ 105)= 109, 5y =1X (24.8+21.6+ 18.4+ 29.2+22) = 23.2. 5设所求回归直线方程为y=bx+a,则x x yi y3081 5700.196 2,a - a -308.a=yb x=23.2T09x而1.816 6.所求回归直线方程为y=0.196 2x+1.816 6.(2)由第(1)问可知,当x=150 m2时,销售价格的估计值为,=0.196 2X 150+ 1.816 6 = 31.246 6 元).考点三独立性检验

33、【例3】 通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下n (nnn22n12n21)n1+n2+n+1n+2的列联表:男女总计爱好402060不爱好203050总计60501102-算得,2_110X (40X30 20X20) 2X =60X50X60X 50.附表:P(百 k)0.0500.010k3.8416.635参照附表,得到的正确结论是().A.有99%以上的把握认为“爱好该项运动与性别有关”B.有99%以上的把握认为“爱好该项运动与性别无关”C.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”D.在犯错误的概率不超过0.1%的前提下,认为“爱

34、好该项运动与性别无关” 解析 由7.86.635知,有1 0.010即99%以上的把握认为“爱好该项运动与 性别有关”.答案 A规律方法 利用独立性检验,能够帮助我们对日常生活中的实际问题作出合理的 推断和预测.独立性检验就是考察两个分类变量是否有关系,并能较为准确地给2n (n11 n22 n12n21)f . q出这种判断的可信度,具体做法是根据公式X =,计算 2的值,的值越大,说明“两个变量有关系”的可能性越大.【训练3】(2014东北三校联考)某学生对其亲属30人的饮食习惯进行了一次调 查,并用下图所示的茎叶图表示30人的饮食指数.(说明:图中饮食指数低于70 的人,饮食以蔬菜为主;

35、饮食指数高于 70的人,饮食以肉类为主)甲(5。岁以下)乙。岁以上)120 1 5 6 6 732 3 6 75 342 4 5858柝1S 7 6 475 S5 3 2K0q根据以上数据完成下列2X2列联表:主食蔬菜主食肉类合计50岁以下50岁以上合计(2)能否有99%的把握认为其亲属的饮食习惯与年龄有关?并写出简要分析.解(1)2X2列联表如下:主食蔬菜主食肉类合计50岁以下481250岁以上16218合计2010302 30X (8128) 2因为台 12X18X20X 10”635,所以有99%的把握认为其亲属的饮食习惯与年龄有关. I课堂小结I.求回归方程,关键在于正确求出系数a,

36、b,由于a, b的计算量大,计算时应 仔细谨慎,分层进行,避免因计算而产生错误.回归分析是处理变量相关关系的一种数学方法.主要解决: (1)确定特定量之 问是否有相关关系,如果有就找出它们之间贴近的数学表达式;(2)根据一组观察值,预测变量的取值及判断变量取值的变化趋势; (3)求线性回归方程.根据声的值可以判断两个分类变量有关的可信程度.教你解题培养,解题能力方法优化8求回归直线方程的方法技巧【典例】(2011安徽卷)某地最近十年粮食需求量逐年上升,下表是部分统计数 据:年份20022004200620082010需求量/万吨236246257276286利用所给数据求年需求量与年份之间的回

37、归直线方程y=bx+ a;(2)利用中所求出的直线方程预测该地 2012年的粮食需求量.优美解法(1)由所给数据看出,年需求量与年份之间是近似直线上升,下面来求 回归直线方程,先将数据处理如下:年份2006一 4-2024需求量257-21-1101929对处理的数据,容易算得x=0, y =3.2,a_ 4 X 21 + 2 X 11 +2X19+4X29 5X0X3.2b-4 2+ -2 2 + 22+42-5X02260=40=6.5,A - A . .一一 .Aa= y -b x =32由上述计算结果,知所求回归直线方程为y257 = 6.5(x2006)+32即丫= 6.5(x- 2

38、 006) + 260.2.(2)利用所求得的直线方程,可预测 2012年的粮食需求量为6.5X (2 012-2 006) + 260.2= 6.5X6 + 260.2= 299.2(万吨).反思感悟求回归直线方程时,重点考查的是计算能力.若本题用一般法去解, 计算更繁琐(如年份、需求量不做如上处理),所以平时训练时遇到数据较大的要 考虑有没有更简便的方法解决.【自主体验】为了解儿子身高与其父亲身高的关系,随机抽取5对父子的身高数据如下:父亲身局x(cm)174176176176178儿子身高y(cm)175175176177177则y对x的线性回归方程为. 解析数据处理如下:x=父亲身高一

39、176-20002y=儿子身图一176-1-1011、f匕一 _ 八 4 1八 八计算得: x =0, y =0.- b=g=2a= y b x =0,所求回归直线方程为:y 176= 2(x 176),2 1即丫= 2x+88.答案 y=,+ 88课时题组训练阶播训赛练出喜分基础巩固题组(建议用时:40分钟)、选择题.下列两个变量之间的关系是相关关系的是().A.速度一定时,位移与时间B.单位面积的产量为常数时,土地面积与总产量C.身高与体重D.电压一定时,电流与电阻解析 A、B、D中两个变量间的关系都是确定的,所以是函数关系;C中的两个变量间是相关关系,对于身高一样的人,体重仍可以不同,故

40、选 C.答案 C.设(x1, y1), (x2, y2),,(xn, yn)是变量x和y的n个样本点,直线样本点通过最小二乘法得到的线性回归直线(如图),以下结论正确的是A.直线l过点(x , y)x和y的相关系数为直线l的斜率x和y的相关系数在0到1之间D.当n为偶数时,分布在l两侧的样本点的个数一定相同解析 由样本的中心(x, y)落在回归直线上可知A正确;x和y的相关系数表 示为x与y之间的线性相关程度,不表示直线l的斜率,故B错;x和y的相关 系数应在-1到1之间,故C错;分布在回归直线两侧的样本点的个数并不绝对 平均,即无论样本点个数是奇数还是偶数,故 D错.答案 A3.在一组样本数

41、据(xl , yi), (x2, y2),,(xn, yn)(n2, xl , x2,,xn 不全相1等)的目攵点图中,右所有样本点(xi, yi)(i = 1, 2,,n)都在直线y= /x+1上,则 这组样本数据的样本相关系数为().-1 1 B. 0C.2 D. 1解析 所有点均在直线上,则样本相关系数最大即为1,故选D.答案 D(2014兰州调研)对具有线性相关关系的变量x, y,测得一组数据如下x24568y2040607080根据上表,利用最小二乘法得它们的回归直线方程为y= 10.5x+a,据此模型来预测当x= 20时,y的估计值为().A. 210 B. 210.5 C. 21

42、1.5 D. 212.5解析 由数据中可知x =5, y =54,代入回归直线方程得a= 1.5,所以丫= 10.5x+ 1.5,当 x= 20 时,y=10.5X20+ 1.5=211.5.答案 C(2014临沂一模)某校为了研究学生的性别和对待某一活动的态度 (支持与不支 持)的关系,运用2X2列联表进行独立性检验,经计算长=7.069,则有多大把握 认为“学生性别与支持该活动有关系”.A. 0.1% B. 1% C. 99% D. 99.9%解析 因为g=7.0696.635,所以P(声6.635)= 0.010,所以说有99%的把握认为“学生性别与支持该活动有关系答案 C.已知施化肥量

43、x与水稻产量y的试验数据如下表,则变量x与变量y是相关(填“正”或“负”).施化肥量x15202530354045水稻产量y330345365405445450455解析 因为散点图能直观地反映两个变量是否具有相关关系, 所以画出散点图如 图所示:5瑞水相产量。10 20 30 4A 50、通过观察图象可知变量x与变量y是正相关.答案正(2014济南模拟)为了均衡教育资源,加大对偏远地区的教育投入,调查了某 地若干户家庭的年收入x(单位:万元)和年教育支出y(单位:万元),调查显示年 收入x与年教育支出y具有线性相关关系,并由调查数据得到y对x的回归直线 方程:y=0.15x+0.2.由回归直

44、线方程可知,家庭年收入每增加1万元,年教育支出平均增加万元.解析 回归直线的斜率为0.15,所以家庭年U入每增加1万元,年教育支出平均 增加0.15万元.答案 0.15(2014嘉兴联考)为了判断高中三年级学生是否选修文科与性别的关系,现随 机抽取50名学生,得到如下2X2列联表:理科文科男1310女720已知 P(/3.841)0.05, P(/5.024)0.025.,Q 50X ( 13X 20-10X 7) 2根据表中数据,得到声=一”丁n-4.844.23 A 2 7 A 20 入 30则认为选修文科与性别有关系出错的可能性为应该断定“是否选修文科与性别解析 :1=4.844,根据假

45、设检验的基本原理,之间有关系”成立,并且这种判断出错的可能性约为 5%.答案 5%解答题下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据.x3456y2.5344.5(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程y = bx+a; (3)已知该厂技改前生产100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出 的线性回归方程,预测生产 100吨甲产品的生产能耗比技改前降低多少吨标准煤? (参考数值:3X2.5 + 4X3+5X4+6X4.5=66.5)解:(1)由题设所给数据,可得

46、散点图如图所示.4.54则能耗:I电标推煤) SB IM .ilI VV i *i i4(2)由对照数据,计算得:x2 = 86,i=13+4+5+61x =4= 4.5(吨),2.5+3 + 4+4.5y =4= 3.5(吨).4已知xiyi = 66.5,i= 1所以,由最小二乘法确定的回归方程的系数为:4xiyi 4 x ya i = 166.5 4X4.5X 3.5b=1864X4.52乙x2-4 x 2i = 1A a a= y b x =3.5 0.7X4.5=0.35.因此,所求的线性回归方程为y=0.7x+ 0.35.(3)由(2)的回归方程及技改前生产100吨甲产品的生产能耗

47、,得降低的生产能耗 为:90(0.7X 100+0.35)= 19.65(吨标准煤).(2012辽宁卷)电视传媒公司为了解某地区观众对某类体育节目的收视情况, 随机抽取了 100名观众进行调查,其中女性有55名.下面是根据调查结果绘制 的观众日均收看该体育节目时间的频率分布直方图:将日均收看该体育节目时间不低于 40分钟的观众称为“体育迷”,已知“体育 迷”中有10名女性.(1)根据已知条件完成下面的2X2列联表,并据此资料你是否认为“体育迷”与 性别有关?非体育迷体育迷合计男女合计将日均收看该体育节目不低于50分钟的观众称为“超级体育迷”,已知“超 级体育迷”中有2名女性.若从“超级体育迷”

48、中任意选取 2人,求至少有1 名女性观众的概率.附:x =2n (n11n22n12n21)n1+n2+n+1n+2P(xk)0.050.01k3.8416.635解(1)由频率分布直方图可知,在抽取的100人中,“体育迷”为25人,从而 完成2X2列联表如下:非体育迷体育迷合计男301545女451055合计7525100将2 X 2列联表中的数据代入公式计算,得22 n (niin22n12n2i)x ni+n2+n+in+2100X (30X10 45X15) 2 I00二 75X 25X45X 55= 33= 3.030.因为3.0303.841,所以我们没有理由认为“体育迷”与性别有

49、关.由频率分布直方图可知,“超级体育迷”为 5人,从而一切可能结果所组成 的基本事件空间为Q=(ai, a2), (a1,a3), (a2, a3), (a,b),(a1,b2), (a2, b1), (a2, b2), (a3, bi), (a3, b2), (bi, b2),其中ai表小男性,i=1, 2, 3.bj表小女性,j = 1, 2.Q由10个基本事件组成,而且这些基本事件的出现是等可能的.用A表示“任选2人中,至少有1人是女性”这一事件,则A=(ai, bi), (ai, A), (a2, bi), (a2, b2), (a3, bi), (a3, b2), (bi, b2),

50、事件A由7个基本事件组成,因而P(A) = 17y能力提升题组(建议用时:25分钟)一、选择题.以下四个命题,其中正确的是().从匀速传递的产品生产流水线上,质检员每20分钟从中抽取一件产品进行某项指标检测,这样的抽样是分层抽样;两个随机变量相关性越强,则相关系数的绝对值越接近于1;在线性回归方程y= o.2x+12中,当解释变量x每增加一个单位时,预报变量y 平均增加0.2个单位;对分类变量X与Y,它们的随机变量K2的观测值k越小,“X与Y有关系” 的把握程度越大.A . B.C . D.解析 是系统抽样;对于,随机变量K2的观测值k越小,说明两个相关变量有关系的把握程度越小.答案 D.变量

51、 X 与 Y相对应的一组数据为(10,1), (11.3,2), (11.8,3), (12.5,4), (13,5); 变量 U 与 V 相对应的一组数据为(10,5), (11.3,4), (11.8,3), (12.5,2), (13,1). r1 表示变量Y与X之间的线性相关系数,r2表示变量V与U之间的线性相关系数, 贝心 ).A, 2门0 B. 021C. r20(门 D. 2=门解析 对于变量Y与X而言,Y随X的增大而增大,故Y与X正相关,即10; 对于变量V与U而言,V随U的增大而减小,故V与U负相关,即20,所 以选C.答案 C二、填空题3. (2014江西重点中学联考)某车

52、间为了规定工时定额,需要确定加工零件所花 费的时间,为此进行了 5次试验.根据收集到的数据(如下表),由最小二乘法求 、- A得回归万程y= 0.67X+54.9.零件数x(个)1020304050加工时间y(min)62缪758189现发现表中有一个数据看不清,请你推断出该数据的值为 . 解析 由已知可计算求出 7 = 30,而回归直线方程必过点(7,0.67X30+ 54.9= 75,设模糊数字为a,则a + 62+75+ 81 + 89_5;75,计算得a=68.答案 68三、解答题4. (2012福建)某工厂为了对新研发的一种产品进行合理定价,将该产品按事先 拟定的价格进行试销,得到如

53、下数据:单价x(元)88.28.48.68.89销量y(件)908483807568(1)求回归直线方程y=bx+ a,其中b= 20, a=y bx;(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4 元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入一成本) 解 (1)由于 X=6(Xl + X2 + X3+X4+X5 + X6)=8.5,1,y= 6(y1 + y2+y3 + y4+ y5+ y6) = 80,所以2 = 丫bX= 80+ 20X8.5 = 250,从而回归直线方程为y=-20X+250.设工厂获得的利润为L元,依题意得L

54、 = x( 20X + 250) 4( 20X + 250)=20X2+330X 1 000= 20 X- 33 2+361.25.当且仅当x= 8.25时,L取得最大值.故当单价定为8.25元时,工厂可获得最大利润.基础回扣练一一统计与统计案例(建议用时:60分钟)、选择题(2014石家庄调研)某校高三年级有男生500人,女生400人,为了解该年级 学生的健康情况,从男生中任意抽取25人,从女生中任意抽取20人进行调查.这种抽样方法是().A.简单随机抽样法B.抽签法C.随机数表法 D.分层抽样法解析 总体由差异明显的几部分组成、按比例抽样,为分层抽样.答案 D(2014广州月考)某射手在一

55、次射击中,射中10环,9环,8环的概率分别是 0.20, 0.30,0.10,则此射手在一次射击中不够 8环的概率为().A. 0.40 B. 0.30 C. 0.60 D. 0.90解析 一次射击不够8环的概率为:10.20.3 0.1 = 04答案 A(2012湖北卷)容量为20的样本数据,分组后的频数如下表:分组10,20)20,30)30,40)40,50)50,60)60,70)频数234542则样本数据落在区间10,40)的频率为().A. 0.35 B. 0.45 C. 0.55 D. 0.65 9解析 数据落在区间10,40)内的频数为9,样本容量为20,所求频率为20 = 0.45.答案 B 八

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论