版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第十一篇统计与概率③
•MATHEMATICS1
第十一篇
统计与概率
第1讲抽样方决与总体分布的估计
【2014年高考会这样考】
1.考查三种抽样方法及其应用.
2.考查频率分布直方图中的相关计算(求解频率、频数等).
3.考查用样本估计总体中的样本数据的数字特征(平均数、方差、标准差等).
。1」_抓住乏个考点必考必记夯基固本
对应学生
-162~
考点梳理
1.三种抽样方法的比较
类别共同点各自特点相互联系适用范围
简单随从总体中逐个抽总体中的个
机抽样取体数较少
抽样过程中每个
个体被抽取的概
将总体均分成几在起始部
率相等,均属于不
系统部分,按事先确定分抽样时总体中的个
放回抽样
抽样的规则在各部分采用简单体数较多
中抽取随机抽样
各层抽样
时采用简总体由差异
分层将总体分成几层,
单随机抽明显的几部
抽样分层进行抽样
样或系统分组成
抽样
2.频率分布直方图与茎叶图
(1)当总体很大或不便获得时一,可以用样本的频率分布去估计总体的频率分布,
我们把反映样本频率分布的表格称为频率分布表.绘制频率分布表的步骤为:
①求极差;②决定组距和组数;③将数据分组;④列频率分布袤.
(2)利用直方图反映样本的频率分布,这样的直方图称为频率分布直方图.画频
率分布直方图的一般步骤是:①绘制频率分布表;②作直角坐标系,把横轴分
成若干段,每一段对应一个组的组距;③在上面标出的各点中,分别以相邻两
点为端点的线段为底作矩形,它的高等于该组的频磊率.此时,每个矩形的面积
组距
恰好就是该组的频率,显然所有矩形的面积之和为1.
3.样本的数字特征
(1)众数
在样本数据中,出现次数最多的那个数据.
(2)中位数
样本数据中,将数据按大小排列,位于最中间的数据.如果数据的个数为偶数,
就取中间两个数据的平均数作为中位数.
(3)平均数
样本数据的算术平均数,即x=:(制+应+…+/).
(4)方差与标准差
,22—22
方差:5=-[(Xl-X)+(%2X)4---------\~(Xn—X)].
标准差:S=A~[(X\—X)2+(X2—Xf-l---------HQ"—XyJ.
【助学・微博】
一条规律
三种抽样方法的共同点都是等概率抽样,即抽样过程中每个个体被抽到的概率
相等,体现了这三种抽样方法的客观性和公平性.若样本容量为〃,总体的个
体数为M则用这三种方法抽样时,每个个体被抽到的概率都是5
两个特性
(1)在频率分布表中,频数的和等于样本容量,每一小组的频率等于这一组的频
数除以样本容量,各小组频率的和等于1;
(2)在频率分布直方图中,小矩形的高等于每一组的频率/组距,每个小矩形的
面积等于该组的频率,所有小矩形的面积之和为1.
考点自测
1.(2012.山东)采用系统抽样方法从960人中抽取32人做问卷调查.为此将他
们随机编号为1,2,…,960,分组后在第一组采用简单随机抽样的方法抽到的
号码为9.抽到的32人中,编号落入区间[1,450]的人做问卷A,编号落入区间
[451,750]的人做问卷其余的人做问卷C.则抽到的人中,做问卷8的人数为
().
A.7B.9C.10D.15
解析从960人中用系统抽样方法抽取32人,则每30人抽取一人,因为第一
组抽到的号码为9,则第二组抽到的号码为39,第〃组抽到的号码为斯=9+
30(n-1)=30〃-21,由451<30〃-21<750,得-^W.〃=16,17,,,,,
25,共有25-16+1=10人,选C.
答案C
2.(2013.临沂模拟)甲校有3600名学生,乙校有5400名学生,丙校有1800
名学生.为统计三校学生某方面的情况,计划采用分层抽样法,抽取一个容量
为90的样本,应该在这三校分别抽取的学生人数是().
A.30,30,30B.30,45,15
C.20,30,10D.30,50,10
Of)1
解析抽取比例是—„=看,故三校分别抽取的学生人数为3
J0UU+J4UU+1oUU
600X-j^r=30,5400X-7^7=45,1800XT^T=15.
答案B
3.10名工人某天生产同一零件,生产的件数分别是
15,17,14,10,15,19,17,16,14,12,则这一天10名工人生产的零件的中位数是
().
A.14B.16C.15D.17
解析将这组数据从小到大排列得10,12,14,14,15,15,16,17,17,19.故中位数为
答案C
4.(2013•西北工大附中测试)如图是容量为150的样本的频率分布直方图,则
样本数据落在[6,10)内的频数为().
A.12B.48C.60D.80
解析落在[6,10)内的频率为0.08X4=0.32,故频数为0.32X150=48.
答案B
5.(2013.长沙模拟)
089
1035
如图是某学校一名篮球运动员在五场比赛中所得分数的茎叶图,则该运动员在
这五场比赛中得分的方差为.
(注:方差s2=%(XLX尸+。2—x----|-(x„—X)2],其中X为X1,X2,
X”的平均数)
解析=1(8+9+10+13+15)=11,52=1x(9+4+1+4+16)=6.8.
答案6.8
02突破3个考向则i案例考向突破
对应学生
~163~
考向一抽样方法
[例1]>从某厂生产的802辆轿车中抽取80辆测试某项性能.请合理选择抽
样方法进行抽样,并写出抽样过程.
[审题视点]因为802不能整除80,为了保证“等距”分段,应先剔除2个个
体.
解由于总体及样本中的个体数较多,且无明显差异,因此采用系统抽样的方
法,步骤如下:
第一步:先从802辆轿车中剔除2辆轿车(剔除方法可用随机数法);
第二步:将余下的800辆轿车编号为1,2,…,800,并均匀分成80段,每段
含攵=鬻=10个个体;
OV
第三步:从第1段即1,2,…,10这10个编号中,用简单随机抽样的方法抽
取一个编号(如5)作为起始编号;
第四步:从5开始,再将编号为15,25,…,795的个体抽出,得到一个容量
为80的样本.
方法最费»解决系统抽样问题的两个关键步骤为:
(1)分段的方法应依据抽取的样本容量而定,即根据定义每段抽取一个样本.
(2)起始编号的确定应用简单随机抽样的方法,一旦起始编号确定,其他编号便
随之确定了.
【训练1】(2012•天津)某地区有小学150所,中学75所,大学25所.现采用
分层抽样的方法从这些学校中抽取30所学校对学生进行视力调查,应从小学
中抽取所学校,中学中抽取所学校.
解析根据分层抽样的特点求解.从小学中抽取30X明+=18所学
75
校;从中学中抽取30X条+,=9所学校.
答案189
考向二频率分布直方图的绘制及应用
[例2]»某班同学利用国庆节进行社会实践,对[25,551岁的人群随机抽取n
人进行了一次生活习惯是否符合低碳观念的调查,若生活习惯符合低碳观念,
称为“低碳族”,否则称为“非低碳族”,得到如下统计表和各年龄段人数频
率分布直方图:
组数分组低碳族的人数占本组的频率
第一组[25,30)1200.6
第二组[30,35)195P
第三组[35,40)1000.5
第四组140,45)a0.4
第五组[45,50)300.3
第六组[50,55]150.3
续表
(1)补全频率分布直方图:
(2)求〃,a,p的值.
[审题视点](1)要补全频率分布直方图,关键是计算出第二组的频率;(2)灵活
运用关系式:募频率X组距=频率,择频磊数量=频率求解・
解(1)第二组的频率为1-(0.04+0.04+0.03+0.02+0.01)X5=0.3,所以小长
方形的高为W=0Q6.频率分布直方图如图所示.
频率/组距
(2)第一组的人数为族"二?。。,频率为0.04X5=0.2,
所以zz=Q2—1000.
由(1)知,第二组的频率为0.3,所以第二组的人数为1000X0.3=300,所以夕
195
荻=0.65.第四组的频率为0.03X5=0.15,所以第四组的人数为1000X0.15
=150,所以a=150X0.4=60.
方法锦*》(1)绘制频率分布直方图时需注意:①制作好频率分布表后可以利用
各组的频率之和是否为1来检验该表是否正确;②频率分布直方图的纵坐标是
瞿,而不是频率.
(2)由频率分布直方图进行相关计算时,需掌握下列关系式:煞X组距=频率.
组ME
【训练2】(2013•烟台四校联考)据悉2012年山东省高考要将体育成绩作为参
考,为此,济南市为了了解今年高中毕业生的体能状况,从本市某校高中毕业
班中抽取一个班进行铅球测试,成绩在80m(精确到0.1m)以上的为合格.把
所得数据进行整理后,分成6组,并画出频率分布直方图的一部分如图所示.已
知从左到右前5个小组对应矩形的高分别为0.04,0.10,0.14,0.28,0.30,且第6
小组的频数是7.
(1)求这次铅球测试成绩合格的人数;
(2)若由直方图来估计这组数据的中位数,指出该中位数在第几组内,并说明理
由.
解⑴由题易知,第6小组的频率为1-(0.04+0.10+0.14+0.28+0.30)X1=
0.14,
7
•••此次测试的总人数为万y=50.
,这次铅球测试成绩合格的人数为(0.28XI+0.30X1+0.14X1)X50=36.
(2)直方图中中位数两侧的矩形面积和相等,即频率和相等,前三组的频率和为
0.28,前四组的频率和为0.56,
中位数位于第4组内.
考向三用样本的数字特征估计总体的数字特征
【例3】A甲乙二人参加某体育项目训练,近期的五次测试成绩得分情况如图.
得分
甲:―
乙:―.
。第磐期第,第次数
次前正次次
(1)分别求出两人得分的平均数与方差;
(2)根据图和上面算得的结果,对两人的训练成绩作出评价.
[审题视点](1)先通过图象统计出甲、乙二人的成绩;
(2)利用公式求出平均数、方差,再分析两人的成绩,作出评价.
解(1)由图象可得甲、乙两人五次测试的成绩分别为
甲:10分,13分,12分,14分,16分;
乙:13分,14分,12分,12分,14分.
—10+13+12+14+16、
x甲==13,
—13+14+12+12+14
x乙==13,
S^=|[(10-13)2+(13-13)2+(12-13)2+(14-13)2+(16-13)2]=4,
^=1[(13-13)2+(14-13)2+(12-13)2+(12-13)2+(14-13)2]=0.8.
(2)由s小〉s?可知乙的成绩较稳定.
从折线图看,甲的成绩基本呈上升状态,而乙的成绩上下波动,可知甲的成绩
在不断提高,而乙的成绩则无明显提高.
方法锦*2(1)用样本估计总体时,样本的平均数、标准差只是总体的平均数、
标准差的近似.实际应用中,当所得数据平均数不相等时,需先分析平均水平,
再计算标准差(方差)分析稳定情况.
(2)若给出图形,一方面可以由图形得到相应的样本数据,再计算平均数、方差
(标准差);另一方面,可以从图形直观分析样本数据的分布情况,大致判断平
均数的范围,并利用数据的波动性大小反映方差(标准差)的大小.
【训练3】
88400028
75202337
80012448
238
(2012.陕西)从甲乙两个城市分别随机抽取16台自动售货机,对其销售额进行
统计,统计数据用茎叶图表示(如图所示).设甲乙两组数据的平均数分别为工
甲,x乙,中位数分别为加甲,mz,,贝1」().
A.x甲<x乙,m\\\>m乙B.x甲<x乙,m甲乙
C.x甲〉x乙,加甲乙D.x甲,x乙,m甲〈加乙
解析二甲=表(41+43+30+30+38+22+25+27+10+10+14+18+18+5
x乙=T7(42+43+48+31+32+34+34+38+20+22+23+23+27+10+12
一x甲<x乙
又根甲=20,m29,m甲乙,
答案B
。3»揭秘3年高考权威解读真题展示
对应学生
~164-
方法优化15——快速掌握抽样方法的技巧
【命题研究】通过近三年的高考试题分析,考查分层抽样方法的题目较多,
其次是系统抽样.题型多为选择题、填空题,有的与统计的其它知识或概率综
合考查,常以解答题的形式出现,难度较低.
【真题探究】A(2012.江苏)某学校高一、高二、高三年级的学生人数之比为3:
3:4,现用分层抽样的方法从该校高中三个年级的学生中抽取容量为50的样
本,则应从高二年级抽取名学生.
[教你审题]等比例性质;
二审抽取的样本容量.
[优美解法]高二年级学生人数占总数的看百=孱.样本容量为50,则高二年
3
级抽取:50X行=15(名)学生.
[答案]15
[反思]用分层抽样抽样时,分成的各层标准要一致,互不重叠,各层抽取的比
例都等于样本容量在总体中的比例,即?
【试一试】(2013•徐州模拟)从某小学随机抽取100名同学,这些同学身高都
不低于100厘米,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如
图).现用分层抽样的方法从身高在[120,130),[130,140),[140,150]三组学生中,
选取18人参加一项活动,则从身高在[140,150]内的学生中选取的人数应为
解析由(0.005+0.010+0.020+0.035+a)X10=1,得a=0.030,因此
[120,130),[130,140),[140,150]三组学生人数分别为:0.3X100=30,0.20X100
=20,0.10X100=10,所以,从身高在[140,150]内的学生中选取的人数应为
30+20+10X18=3,
答案3
“J限时规范训练阶梯训练能力提升
对应学生
-329~
A级基础演练(时间:30分钟满分:55分)
一、选择题(每小题5分,共20分)
1.(2013・西安质检)对某商店一个月内每天的顾客人数进行了统计,125
得到样本的茎叶图(如图所示),则该样本的中位数、众数、极差分20233
3124489
别是().455577889
A.46,45,56B.46,45,5350011479
6178
C.47,45,56D,45,47,53
45+47
解析样本共30个,中位数为二y一=46;显然样本数据出现次数最多的为
45,故众数为45;极差为68-12=56,故选A.
答案A
2.(2013・南昌模拟)小波一星期的总开支分布如图⑶所示,,星期的食品开支如
图(b)所示,则小波一星期的鸡蛋开支占总开支的百分比为().
图⑷
图(b)
A.30%B.10%C.3%D.不能确定
解析由题图(b)可知小波一星期的食品开支共计300元,其中鸡蛋开支30
元.又由题图(a)知,一周的食品开支占总开支的30%,则可知一周总开支为
1000元,所以鸡蛋开支占总开支的百分比为丁丽X100%=3%.
答案C
3.(2013•成都模拟)交通管理部门为了解机动车驾驶员(简称驾驶员)对某新法规的
知晓情况,对甲、乙、丙、丁四个社区做分层抽样调查.假设四个社区驾驶员
的总人数为N,其中甲社区有驾驶员96人.若在甲、乙、丙、丁四个社区抽
取驾驶员的人数分别为12,21,25,43,则这四个社区驾驶员的总人数"为().
A.101B.808C.1212D.2012
解析甲社区驾驶员的抽样比例为1公7J1,四个社区驾驶员总人数的抽样比例
VOo
,12+21+25+43101,1011公
为------R------=斤,由丁=+何N=808.
答案B
4.(2012.安徽)甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图
如图所示,贝IJ().
甲
A.甲的成绩的平均数小于乙的成绩的平均数
B.甲的成绩的中位数等于乙的成绩的中位数
C.甲的成绩的方差小于乙的成绩的方差
D.甲的成绩的极差小于乙的成绩的极差
解析由题意可知,甲的成绩为4,5,6,7,8,乙的成绩为5,5,5,6,9.所以甲、乙的
成绩的平均数均为6,A错;甲、乙的成绩的中位数分别为6,5,B错;甲、乙
的成绩的方差分别为1X[(4-6)2+(5-6)2+(6-+(7-6)2+(8-6)2]=2,1
X[(5-6)2+(5-6)2+(5-6)2+(6-6)2+(9-6)2]=y,C对;甲、乙的成绩的
极差均为4,D错.
答案C
二、填空题(每小题5分,共10分)
5.(2013・武夷模拟)用系统抽样法要从160名学生中抽取容量为20的样本,将160
名学生随机地从1〜160编号,按编号顺序平均分成20组(1〜8号,9〜16号,…,
153〜160号),若第16组抽出的号码为126,则第1组中用抽签的方法确定的
号码是.
解析设第1组抽取的号码为4则第八组抽取的号码为8(〃-1)+6••・8X(16
-1)+6=126,「力=6,故第1组抽取的号码为6.
答案6
6.(2013.苏州一中月考)某学校为了解学生数学课程的学习情况,在1000名学生
中随机抽取200名,并统计这200名学生的某次数学考试成绩,得到了样本的
频率分布直方图(如图).根据频率分布直方图可估计这1000名学生在该次数
学考试中成绩不低于60分的学生人数是.
解析低于60分学生所占频率为(0.002+0.006+0.012)X10=0.2,故低于60
分的学生人数为1000X0.2=200,所以不低于60分的学生人数为1000-200
=800.
答案800
三、解答题(共25分)
7.(12分)某政府机关有在编人员100人,其中副处级以上干部10人,--般干部
70人,工人20人.上级机关为了了解政府机构改革意见,要从中抽取一个容
量为20的样本,试确定用何种方法抽取,请具体实施抽取.
解用分层抽样方法抽取.
具体实施抽取如下:
(1)720:100=1:5,Ay=2,y=14,y=4,
•••从副处级以上干部中抽取2人,从一般干部中抽取14人,从工人中抽取4
人.
(2)因副处级以上干部与工人的人数较少,他们分别按1〜10编号与1〜20编号,
然后采用抽签法分别抽取2人和4人;对一般干部70人采用00,01,02,…,
69编号,然后用随机数表法抽取14人.
(3)将2人,4人,14人的编号汇合在一起就取得了容量为20的样本.
8.(13分)(2012.揭阳调研)某校高一某班的某次数学测试成绩(满分为100分)的茎
叶图和频率分布直方图都受了不同程度的破坏,但可见部分如图,据此解答下
列问题:
荃叶
~5~68
62335689
71223456789
8_____缺失_____
958
⑴求分数在[50,60]的频率及全班人数;
(2)求分数在[80,90]之间的频数,并计算频率分布直方图中[80,90]间的矩形的
信]・
解⑴分数在[50,60]的频率为0.008X10=0.08.
2
由茎叶图知,分数在[50,60]之间的频数为2,所以全班人数为品=25.
U.UO
(2)分数在[80,90]之间的频数为25—2—7—10—2=4,频率分布直方图中[80,90]
4
间的矩形的高为W10=0.016.
B级能力突破
(时间:30分钟满分:45分)
一、选择题(每小题5分,共10分)
1.(2013•哈尔滨模拟)一个样本容量为10的样本数据,它们组成一个公差不为0
的等差数列{斯},若田=8,且勾,的,劭成等比数列,则此样本的平均数和中
位数分别是().
A.13,12B.13,13
C.12,13D.13,14
解析设等差数列{斯}的公差为d(dWO),a3=8,.。7=(。3)2=64,(8-2d)(8
+44)=64,(4-d)(2+d)=8,2d-/=0,又—#(),故〃=2,故样本数据为
4,6,8,10,12,14,16,18,20,22,样本的平均数为乒苛一=13,中位数为气耳=
13,故选B.
答案B
2.(2012.江西)样本8,X2,…,X”)的平均数为工,样本3,竺,…,%,)的平均
数为y(xWy).若样本(xi,X2,…,xn,y\,加…,y”)的平均数z=ax+
—1
(1—a)y,其中Ovav/,贝lj〃,机的大小关系为().
A.n<mB.n>m
C.n=mD.不能确定
解析依题意得©+应+…+%〃=〃x,yi+为+…+%=my,
+
+%2+/+yi+,2++ytn=(m+〃)z=(加+屋)ax+(加+〃)(1~a)y,
•,-nx+my=(m+n)ax+(m+-a)y,
n=(m+n)a,
m=(m+“)(1-a),
于是有n-m=(m+n)[a-(1-a)]=(jn+n)(2a-1),
0<ct<^,-'-2a_l<0,n-m<Q,即m>”.
答案A
二、填空题(每小题5分,共10分)
3.(2013・沈阳质检)沈阳市某高中有高一学生600人,高二学生500人,高三学生
550人,现对学生关于消防安全知识了解情况进行分层抽样调查,若抽取了一
个容量为〃的样本,其中高三学生有11人,则〃的值等于.
n11
解析由600+500+550=550'得〃=33(A),
答案33
4.(2013•北京西城一模)某年级120名学生在一次百米测试中,成绩全部介于13
秒与18秒之间.将测试结果分成5组:[13,14),[14,15),[15,16),[16,17),[17,18],
得到如图所示的频率分布直方图.如果从左到右的5个小矩形的面积之比为
1:3:7:6:3,那么成绩在[16,18]的学生人数是
6+3Q
解析成绩在[16,网的学生的人数所占比例为7T煮所以成绩
I+3+/+6+3ZU
9
在[16,18]的学生人数为120X元=54.
答案54
三、解答题(共25分)
5.(12分)汽车行业是碳排放量比较大的行业之一,欧盟规定,从2012年开始,
对C02排放量超过130g/km的MI型新车进行惩罚(视为排放量超标),某检测
单位对甲、乙两类MI型品牌的新车各抽取了5辆进行CO2排放量检测,记录
如下(单位:g/km):
甲80110120140150
乙100120Xy160
经测算发现,乙类品牌车CO2排放量的均值为x乙=120g/km.
(1)求甲类品牌汽车的排放量的平均值及方差;
(2)若乙类品牌汽车比甲类品牌汽车CO2的排放量稳定性好,求x的取值范围.
.rz.0八&fij—80+110+120+140+150
解⑴甲m类J品n牌汽车的CO2排放量的平均值Xk----------------5----------------
120(g/km),
甲类品牌汽车的CO2排放量的方差
2(80-120)2+(110-120)2+(120-120)2+(140-120)2+(150-120)2
5甲=]
=600.
100+120+x+y+160
(2)由题意知乙类品牌汽车的CO2排放量的平均值x乙=
5
=120(g/km),得x+y=220,故尸220—x,所以乙类品牌汽车的CO2排放量
的方差
2(100-120)2+(120-120)2+(X-120)2+(220-X-120)2+(160-120)2
5乙=三'
因为乙类品牌汽车比甲类品牌汽车CO2的排放量稳定性好,所以日解得
900yl30.
6.(13分)已知某单位有50名职工,现要从中抽取10名
81
职工,将全体职工随机按1〜50编号,并按编号顺序
平均分成10组,按各组内抽取的编号依次增加5进行703689
系统抽样.6257
(1)若第5组抽出的号码为22,写出所有被抽出职工59
(2)的号码;
(2)分别统计这10名职工的体重(单位:公斤),获得体重数据的茎叶图如图
所示,求该样本的方差;
(3)在(2)的条件下,从这10名职工中随机抽取两名体重不轻于73公斤(273
公斤)的职工,求体重为76公斤的职工被抽取到的概率.
解(1)由题意,第5组抽出的号码为22.
因为k+5X(5—1)=22,所以第1组抽出的号码应该为2,抽出的10名职
工的号码分别为2,7,12,17,22,27,32,37,42,47.
(2)因为10名职工的平均体重为
1=-^(81+70+73+76+78+79+62+65+67+59)=71,
所以样本方差为:?=J5(102+l2+22+52+72+82+92+62+42+122)=52.
⑶从10名职工中随机抽取两名体重不轻于73公斤的职工,共有10种不同
的取法:(73,76),(73,78),(73,79),(73,81),(76,78),(76,79),(76,81),(78,79),
(78,81),(79,81).
记“体重为76公斤的职工被抽取”为事件A,它包括的事件有(73,76),
(76,78),(76,79),(76,81)共4个.
42
故所求概率为尸(4)=证=亍
特别提醒:教师配赠习题、课件、视频、图片、文档等各种电子资源见《创新设
计•高考总复习》光盘中内容.
第2讲变量间的相关关条与统计案例
【2014年高考会这样考】
1.考查利用散点图判断变量之间的关系.
2.考查线性回归方程的计算或回归分析的思想与方法的应用问题.
3.考查独立性检验的基本思想及应用.
抓住2仝考点必考必记夯基固本
对应学生
~165~
考点梳理
1.相关关系的判断
(1)散点图直观反映了两变量的成对观测值之间存在的某种关系,利用散点图可
以初步判断两个变量之间是否线性相关.如果散点图中点的分布从整体上看大
致在一条直线的附近,我们说变量x和y具有线性相关关系.
Z(X—x)8—y)
i=1
(2)相关系数r=一/,当r>0时,两变量正相关,当
/n_n_
A/Z(x-xyZ(y,—y)2
i=li=l
r<0时、两变量负相关,当IrlWl且H越接近于1,相关程度越高,当且Irl
越接近于0,相关程度越低.
2.最小二乘法求回归直线方程
⑴设线性回归方程为,=©+£,其中,含是回归方程的斜率,二是截距.
n__n__
Z(X-x)(y-y)»i%一〃xy
Ai=li=1
b=
<n_n_
Z(x—x)2》;一〃x2
i=1
A一A——
、a=y—bx.
⑵回归直线一定经过样本的中心点(x,y),据此性质可以解决有关的计算问
题.
3.独立性检验
(1)独立性检验的有关概念
①分类变量
可用变量的不同“值”表示个体所属的不同类别的变量称为分类变量.
②2X2列联表
假设有两个分类变量X和匕它们的值域分别为{制,超}和{)“,g},其样本频
数列联表(称为2X2列联表)为:
y2总计
X\ah
X2cdc+d
总计a+cb+da+/7+c+d
(2)独立性检验
2
利用随机变量心〒工得册,空:工_大其中〃=。+匕+。+1为样本容量)
来判断“两个变量有关系”的方法称为独立性检验.
步骤如下:
“x与丫有关系”.
【助学彳散博】
一个区别
函数关系是一种确定的关系,相关关系是一种非确定的关系.事实上,函数关
系是两个非随机变量的关系,而相关关系是非随机变量与随机变量的关系.
三个特征
(1)回归方程y=bx+a中的匕表示x增加■—个单位时,y的变化量约为3.
⑵川越大,残差平方和越小,即模型的拟合效果越好;川越小,残差平方和
越大,即模型的拟合效果越差.
(3)当Y23.841时,则有95%的把握说事件A与8有关;
当代26.635时,则有99%的把握说事件A与8有关;
当犬W2.706时,则认为事件A与8无关.
考点自测
1.下列两个变量之间的关系是相关关系的是().
A.正方体的棱长与体积
B.单位面积的产量为常数时,土地面积与总产量
C.日照时间与水稻的亩产量
D.电压一定时,电流与电阻
解析A,B,D中两个变量间的关系都是确定的,所以是函数关系;C中的
两个变量间是相关关系,对于日照时间一定的水稻,仍可以有不同的亩产量,
故选C.
答案c
2.对变量x,y有观测数据(为,如。=1,2,…,10),得散点图(1);对变量〃,
。有观测数据(唐,^,■)(/=1,2,10),得散点图(2).由这两个散点图可以判断
A.变量x与y正相关,“与0正相关
B.变量x与y正相关,〃与。负相关
C.变量x与y负相关,〃与。正相关
D.变量x与y负相关,a与0负相关
解析由图(1)可知,各点整体呈递减趋势,x与y负相关;由图(2)可知,各点
整体呈递增趋势,,,与。正相关.
答案C
3.(2012.湖南)设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性
相关关系,根据一组样本数据(x”y)(i=l,2,…,〃),用最小二乘法建立的回
归方程为£=0.85*一85.71,则下列结论中不正确的是().
A.y与x具有正的线性相关关系
B.回归直线过样本点的中心(T,7)
C.若该大学某女生身高增加1cm,则其体重约增加0.85kg
D.若该大学某女生身高为170cm,则可断定其体重必为58.79kg
解析根据线性回归方程中各系数的意义求解.由于线性回归方程中x的系数
为0.85,因此y与x具有正的线性相关关系,故A正确.又线性回归方程必过
样本中心点(工,7),因此B正确.由线性回归方程中系数的意义知,x每增
加1cm,其体重约增加0.85kg,故C正确.当某女生的身高为170cm时,其
体重估计值是58.79kg,而不是具体值,因此D不正确.
答案D
4.为了评价某个电视栏目的改革效果,在改革前后分别从居民点抽取了100
位居民进行调查,经过计算犬心0.99,根据这一数据分析,下列说法正确的是
().
A.有99%的人认为该栏目优秀
B.有99%的人认为该栏目是否优秀与改革有关系
C.有99%的把握认为电视栏目是否优秀与改革有关系
D.没有理由认为电视栏目是否优秀与改革有关系
解析只有犬>6.635才能有99%的把握认为电视栏目是否优秀与改革有关
系,而即使K226.635也只是对“电视栏目是否优秀与改革有关系”这个论断
成立的可能性大小的结论,与是否有99%的人等无关.故D正确.
答案D
5.(2011.辽宁)调查了某地若干户家庭的年收入x(单位:万元)和年饮食支出y(单
位:万元),调查显示年收入x与年饮食支出y具有线性相关关系,并由调查
数据得到y对x的线性回归方程:f=0.254x+0.321.由线性回归方程可知,家
庭年收入每增加1万元,年饮食支出平均增加万元.
解析由题意,知其回归系数为0.254,故家庭年收入每增加1万元,年饮食
支出平均增加0.254万元.
答案0.254
023突破岂个考向则i案例考向突破
对应学生
~166~
考向一线性相关关系的判断
【例11»下表是某小卖部6天卖出的热茶的杯数与当天气温的对比表.
气温/℃261813104-1
杯数y202434385064
⑴将表中的数据画成散点图;
⑵你能依据散点图指出气温与热茶杯数的关系吗?
(3)如果气温与卖出热茶杯数近似成线性相关关系的话,请画出一条直线来近似
地表示这种线性相关关系.
[审题视点](1)用x轴表示气温,y轴表示杯数,逐一画点;(2)根据散点图分析
两个变量是否存在相关关系.
解(1)画出的散点图如图.
杯数
70
60
50
40
30
20
105
2030
(2)从图中可以发现气温和热茶杯数具有相关关系,气温和热茶杯数成负相关,
图中的各点大致分布在一条直线的附近,因此气温和杯数近似成线性相关关
系
⑶根据不同的标准,可以画出不同的直线来近似表示这种线性相关关系,如让
画出的直线上方的点和下方的点数目相等.如图.
方法锦囊»利用散点图判断两个变量是否有相关关系是比较简便的方法.在散
点图中如果所有的样本点都落在某一函数的曲线上,就用该函数来描述变量之
间的关系.即变量之间具有函数关系.如果所有的样本点落在某一函数的曲线
附近,变量之间就有相关关系;如果所有的样本点都落在某一直线附近,变量
之间就有线性相关关系.
【训练1]5个学生的数学和物理成绩如下表:
\学生
学小\ABCDE
数学8075706560
物理7066686462
画出散点图,并判断它们是否有相关关系.
解把数学成绩作为横坐标,把相应的物理成绩作为纵坐标,在直角坐标系中
描点(即,%)(i=l,2,…,5),作出散点图如图.
丁
70
60
50
40
30
20
10,数学成绩
。1020304050607080x
从图中可以直观地看出数学成绩和物理成绩具有相关关系,且当数学成绩增大
时,物理成绩也在由小变大,即它们正相关.
考向二线性回归方程及其应用
[例2]»(2012.福建)某工厂为了对新研发的一种产品进行合理定价,将该产
品按事先拟定的价格进行试销,得到如下数据:
单价x/元88.28.48.68.89
销量y/件908483807568
AAAAA-----A-----
(1)求回归直线方程^=板+4,其中b=-20,a—y-bx;
(2)预计在今后的销售中,销量与单价仍然服从⑴中的关系,且该产品的成本
是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销
售收入一成本)
[审题视点](1)分别计算7,利用线性回归方程过点(1,7),代入方程
可得解;
(2)将已知条件代入可得关于单价x的二次函数,配方可得最大值.
--1
解(1)由于X=5(8+8.2+8.4+8.6+8.8+9)=8.5,
-1A
y=7(90+84+83+80+75+68)=80,又匕二一20,
A—A一
所以“=y—6x=80+20X8.5=250,
从而回归直线方程为y=-20x+250.
⑵设工厂获得的利润为L元,依题意得
L=x(-20x+250)-4(-20x+250)
=-20?+330x-l000
=-20(X-8.25)2+361.25.
当且仅当x=8.25时,L取得最大值.
故当单价定为8.25元时,工厂可获得最大利润.
互迭蝇2求回归直线方程的步骤:
(1)依据样本数据画出散点图,确定两个变量具有线性相关关系;(2)计算出
y,EXM的值;(3)计算回归系数a,b;(4)写出回归直线方程y=嬴+a.
i=1i=1
【训练2】(2013.南昌模拟)以下是某地搜集到的新房屋的销售价格y和房屋的
面积x的数据.
房屋面积x/m211511080135105
销售价格w万元24.821.618.429.222
(1)求线性回归方程;
(2)据⑴的结果估计当房屋面积为150m2时的销售价格.
解(1)^=^X(115+110+80+135+105)=109,
-1
y=5X(24.8+21.6+18.4+29.2+22)=23.2.
设所求回归直线方程为£=源+2,则
5__
Z(%,—x)8-y)
Ai=l308
b-=]570心0」962,
2
z(x(—X)
i=\
A-A-308
:.a=y~bx=23.2-109XYyzr^l.8166.
,所求回归直线方程为£=0.1962x+1.8166.
(2)由第(1)问可知,当x=150
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 高效授课服务合同
- 酒店用品招标采购流程
- 苗木种植购销合同
- 土地使用权流转协议书修改
- 唯一住房保证书范本
- 智能化船舶监控系统招标
- 国内购销合同书版
- 石粉购销合同范本
- 饲料青贮采购平台
- 优化劳务分包合同制度
- 【MOOC】英文技术写作-东南大学 中国大学慕课MOOC答案
- 电气工程及其自动化职业规划课件
- 辐射与防护学习通超星期末考试答案章节答案2024年
- 大学生助农直播创业计划书
- 2-05SFG04 防空地下室室外出入口部钢结构装配式防倒塌棚架结构设计
- 石灰窑烘炉及开炉方案
- 复苏囊的使用PPT
- 教学论文】《自制教具应用于初中物理有效教学的研究》课题研究报告【教师职称评定】
- 串宫压运推算表
- 《电力拖动与运动控制系统》课程设计双闭环直流调速系统的设计
- 毕业设计(论文)RLC测量仪设计
评论
0/150
提交评论