高考数学一轮复习第十一篇统计与概率(考点梳理+考点自测+揭秘高考+集训)理新人教A版_第1页
高考数学一轮复习第十一篇统计与概率(考点梳理+考点自测+揭秘高考+集训)理新人教A版_第2页
高考数学一轮复习第十一篇统计与概率(考点梳理+考点自测+揭秘高考+集训)理新人教A版_第3页
高考数学一轮复习第十一篇统计与概率(考点梳理+考点自测+揭秘高考+集训)理新人教A版_第4页
高考数学一轮复习第十一篇统计与概率(考点梳理+考点自测+揭秘高考+集训)理新人教A版_第5页
已阅读5页,还剩138页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第十一篇统计与概率③

第1讲抽样方法与总体分布的估计

【2014年高考会这样考】

1.考查三种抽样方法及其应用.

2.考查频率分布直方图中的相关计算(求解频率、频数等).

3.考查用样本估计总体中的样本数据的数字特征(平均数、方差、标准差等).

»抓住31考点必考必记夯基场

对应学生

162

考点梳理

1.三种抽样方法的比较

类别共同点各自特点相互联系适用范围

简单随总体中的个体

从总体中逐个抽取

机抽样数较少

在起始部

将总体均分成几部

系统抽样过程中每个个分抽样时总体中的个体

分,按事先确定的规

抽样体被抽取的概率相采用简单数较多

则在各部分中抽取

等,均属于不放回抽随机抽样

各层抽样

时采用简总体由差异明

分层将总体分成几层,分

单随机抽显的几部分组

抽样层进行抽样

样或系统成

抽样

2.频率分布直方图与茎叶图

(D当总体很大或不便获得时,可以用样本的频率分布去估计总体的频率分布,我们把反

映样本频率分布的表格称为频率分布表.绘制频率分布表的步骤为:①求极差;②决定组

距和组数;③将数据分组;⑷列频率分布表.

(2)利用直方图反映样本的频率分布,这样的直方图称为频率分布直方图.画频率分布直

方图的•般步骤是:①绘制频率分布表;②作直角坐标系,把横轴分成若干段,每一段对

应一个组的组距;③在上面标出的各点中,分别以相邻两点为端点的线段为底作矩形,它

的高,等于该组的频薪率.此时,每个矩形的面积恰好就是该组的频率.,显然所有矩形的面积

之和为1.

3.样本的数字特征

(1)众数

在样本数据中,出现次数最多的那个数据.

⑵中位数

样本数据中,将数据按大小排列,位于最中间的数据.如果数据的个数为偶数,就取中间

两个数据的平均数作为中位数.

(3)平均数

一1

样本数据的算术平均数,即>=-(小+生+~+为).

n

(4)方差与标准差

I———

方差:s,=-[(为一★)'+(及-----1-(x„—x)1.

n

【助学•微博】

一条规律

三种抽样方法的共同点都是等概率抽样,即抽样过程中每个个体被抽到的概率相等,体现

了这三种抽样方法的客观性和公平性.若样本容量为",总体的个体数为爪则用这三种

方法抽样时,每个个体被抽到的概率都是§

/V

两个特性

(1)在频率分布表中,频数的和等于样本容量,每一小组的频率等于这一组的频数除以样

本容量,各小组频率的和等于1;

(2)在频率分布直方图中,小矩形的高等于每一组的频率/组距,每个小矩形的面积等于该

组的频率,所有小矩形的面枳之和为L

考点自测

1.(2012•山东)采用系统抽样方法从960人中抽取32人做问卷调查.为此将他们随机编

号为1,2,…,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9.抽到的32

人中,编号落入区间[1,450]的人做问卷4编号落入区间[451,750]的人做问卷且其余

的人做问卷C则抽到的人中,做问卷8的人数为().

A.7B.9C.10D.15

解析从960人中用系统抽样方法抽取32人,则每30人抽取一人,因为第一组抽到的号

码为9,则第二组抽到的号码为39,第〃组抽到的号码为品=9+30(〃-1)=30〃-21,

236257

由451W30/?—21W750,得所以〃=16,17,…,25,共有25—16+1=10

1510

人,选C.

答案C

2.(2013•临沂模拟)甲校有3600名学生,乙校有5400名学生,丙校有1800名学生.为

统计三校学生某方面的情况,计划采用分层抽样法,抽取一个容量为90的样本,应该在

这三校分别抽取的学生人数是().

A.30,30,30B.30,45,15

C.20,30,10D.30,50,10

解析抽取比例是了■访冗故三校分别抽取的学生人数为3600x-^-

6bUU十34UU-r1oUUIZUIZU

=30,5400X^=45,1800XT1T=15.

J.乙UX乙U

答案B

3.10名工人某天生产同一零件,生产的件数分别是15,17,14,10,15,19,17,16,14,12,

则这一天10名工人生产的零件的中位数是().

A.14B.16C.15D.17

15+15

解析将这组数据从小到大排列得10,12,14,14,15,15,16,17,17,19.故中位数为一^―

=15.

答案C

4.(2013•西北工大附中测试)如图是容量为150的样本的频率分布直方图,则样本数据

落在[6,10)内的频数为().

频率/组距

。26101418样本数据

A.12B.48C.60D.80

解析落在[6,10)内的频率为0.08X4=0.32,故频数为0.32X150=48.

答案B

5.(2013•长沙模拟)

如图是某学校一名篮球运动员在五场比赛中所得分数的茎叶图,则该运动员在这五场比赛

中得分的方差为.

(注:方差J=L[(xi-/>+(用-x)2H------F{x—x)1,其中x为x\,xi,—,X”的平

n

均数)

一11

解析x=T(8+9+10+13+15)=11,s=rX(9+4+1+4+16)=6.8.

55

答案6.8

02^突破土住考包研析案里有包娶破

对应学生

-163

考向一抽样方法

【例1]»从某厂生产的802辆轿车中抽取80辆测试某项性能.请合理选择抽样方法进行

抽样,并写出抽样过程.

[审题视点]因为802不能整除80,为了保证“等距”分段,应先剔除2个个体.

解由于总体及样本中的个体数较多,且无明显差异,因此采用系统抽样的方法,步骤如

下:

第一步:先从802辆轿车中剔除2辆轿车(剔除方法可用随机数法);

第二步:将余下的800辆轿车编号为1,2,…,800,并均匀分成80段,每段含力=嘤=

oU

10个个体;

第三步:从第1段即1,2,…,10这10个编号中,用简单随机抽样的方法抽取一个编号(如

5)作为起始编号;

第四步:从5开始,再将编号为15,25,…,795的个体抽出,得到一个容量为80的样本.

方法锦囊》解决系统抽样问题的两个关键步骤为:

(1)分段的方法应依据抽取的样本容量而定,即根据定义每段抽取一个样本.

(2)起始编号的确定应用简单随机抽样的方法,一旦起始编号确定,其他编号便随之确定

了.

【训练1】(2012•天津)某地区有小学150所,中学75所,大学25所.现采用分层抽

样的方法从这些学校中抽取30所学校对学生进行视力调查,应从小学中抽取所

学校,中学中抽取所学校.

150

解析根据分层抽样的特点求解.从小学中抽取30X77ETT^=18所学校;从中学中

75

抽取3°X而为萌=9所学校.

答案189

考向二频率分布直方图的绘制及应用

[例2]»某班同学利用国庆节进行社会实践,对[25,55]岁的人群随机抽取〃人进行了'

次生活习惯是否符合低碳观念的调查,若生活习惯符合低碳观念,称为“低碳族”,否则

称为“非低碳族”,得到如下统计表和各年龄段人数频率分布直方图:

组数分组低碳族的人数占本组的频率

第一组[25,30)1200.6

第二组[30,35)195P

第三组[35,40)1000.5

第四组[40,45)a0.4

第五组[45,50)300.3

第六组[50,55]150.3

续表

8_--二

O..O7_--

O8..O6_--

.O5_--二

O6..O4_---

.03_--'

O8...0O2_--

1_--

O._

.0O5-

55年龄/岁

⑴补全频率分布直方图;

⑵求a,夕的值.

[审题视点](1)要补全频率分布直方图,关键是计算出第二组的频率;(2)灵活运用关系

式:器频率X组距=频率,避频数金=频率求解.

解(1)第二组的频率为1-<0.04+0.04+0.03+0.02+0.01)X5=0.3,所以小长方形

03

的高为答=0.06.频率分布直方图如图所示.

0

120

⑵第一组的人数为森=2。。,频率为0.04X5=0.2,

~200

所以t〃=丁万=1°00-

195

由(1)知,第二组的频率为0.3,所以第二组的人数为1000X0.3=300,所以夕=荻

0.65.第四组的频率为0.03X5=0.15,所以第四组的人数为1000X0.15=150,所以a

=150X0.4=60.

方法锦囊》(1)绘制频率分布直方图时需注意:①制作好频率分布表后可以利用各组的频

频率

率之和是否为1来检验该表是否正确;②频率分布直方图的纵坐标是林,而不是频率.

频率

⑵由频率分布直方图进行相关计算时,需掌握下列关系式:猫;X组距=频率.

【训练2】(2013•烟台四校联考)据悉2012年山东省高考要将体育成绩作为参考,为此,

济南市为了了解今年高中毕业生的体能状况,从本市某校高中毕业班中抽取一个班进行铅

球测试,成绩在8.0m(精确到0.1m)以上的为合格.把所得数据进行整理后,分成6组,

并画出频率分布直方图的一部分如图所示.已知从左到右前5个小组对应矩形的高分别为

0.04,0.10,0.14,0.28,0.30,且第6小组的频数是7.

(1)求这次铅球测试成绩合格的人数;

(2)若由直方图来估计这组数据的中位数,指出该中位数在第几组内,并说明理由.

解⑴由题易知,第6小组的频率为1一(0.04+0.10+0.14+0.28+0.30)X1=0.14,

7

,此次测试的总人数为万一%=50.

,这次铅球测试成绩合格的人数为(0.28X1+0.30X1+0.14X1)X50=36.

(2)直方图中中位数两侧的矩形面积和相等,即频率和相等,前三组的频率和为0.28,前

四组的频率和为0.56,

.♦•中位数位于第4组内.

考向三用样本的数字特征估计总体的数字特征

【例3】》甲乙二人参加某体育项目训练,近期的五次测试成绩得分情况如图.

得分

16

15甲:—

14

13乙:―

12

II

10

第次数

(1)分别求出两人得分的平均数与方差;

(2)根据图和上面算得的结果,对两人的训练成绩作出评价.

[审题视点](1)先通过图象统计出甲、乙二人的成绩;

(2)利用公式求出平均数、方差,再分析两人的成绩,作出评价.

解(1)由图象可得甲、乙两人五次测试的成绩分别为

甲:10分,13分,12分,14分,16分;

乙:13分,14分,12分,12分,14分.

—10+13+12+14+16=-

x甲=z13,

—13+14+12+12+14

/乙=~~13,

22222

s?f.=1[(10-13)+(13-13)+(12-13)+(14-13)+(16-13)]=4,

5

sl=1[(13-13)2+(14-13)2+(12-13)2+(12-13)2+(14-13)2]=0.8.

o

(2)由晶〉s之可知乙的成绩较稳定.

从折线图看,甲的成绩基本呈上升状态,而乙的成绩上下波动,可知甲的成绩在不断提高,

而乙的成绩则无明显提高.

方法锦囊》(1)用样本估计总体时,样本的平均数、标准差只是总体的平均数、标准差的

近似.实际应用中,当所得数据平均数不相等时,需先分析平均水平,再计算标准差(方

差)分析稳定情况.

(2)若给出图形,一方面可以由图形得到相应的样本数据,再计算平均数、方差(标准差);

另一方面,可以从图形直观分析样本数据的分布情况,大致判断平均数的范围,并利用数

据的波动性大小反映方差(标准差)的大小.

【训练3】

88400028

752202337

800312448

4238

(2012•陕西)从甲乙两个城市分别随机抽取16台自动售货机,对其销售额进行统计,统

计数据用茎叶图表示(如图所示).设甲乙两组数据的平均数分别为二甲,工乙,中位数分

别为加甲,/〃乙,贝1J().

A.x甲<x乙,小甲〉扭乙B.x甲乙,加甲〈加乙

C.x甲〉x乙,加甲〉卬乙D.x甲〉x乙,加甲</乙

—1

解析x甲=77(41+43+30+30+38+22+25+27+10+10+14+18+18+5+6+8)=

345

--1

xz.=—(42+43+48+31+32+34+34+38+20+22+23+23+27+10+12+18)=

457

IF,

/.X甲<X乙.

又,加甲=20,加乙=29,,/甲〈加乙.

答案B

03»揭秘3年高考权威解读真题展示

对应学生

方法优化15——快速掌握抽样方法的技巧

【命题研究】通过近三年的高考试题分析,考查分层抽样方法的题目较多,其次是系统

抽样.题型多为选择题、填空题,有的与统计的其它知识或概率综合考查,常以解答题的

形式出现,难度较低.

【真题探究】a(2012•江苏)某学校高「高二、高三年级的学生人数之比为3:3:4,

现用分层抽样的方法从该校高中三个年级的学生中抽取容量为50的样本,则应从高二年

级抽取名学生.

[教你审题]4等比例性质;

二审抽取的样本容量.

[优美解法]高二年级学生人数占总数的3二=卷.样本容量为50,则高二年级抽取:

oIJ।41V

3

50Xjj=15(名)学生.

[答案]15

[反思]用分层抽样抽样时,分成的各层标准要一致,互不重叠,各层抽取的比例都等于

样本容量在总体中的比例,即今

【试一试】(2013•徐州模拟)从某小学随机抽取100名同学,这些同学身高都不低于100

厘米,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图).现用分层抽样的方

法从身高在[120,130),[130,140),[140,150]三组学生中,选取18人参加一项活动,则

从身高在[140,150]内的学生中选取的人数应为.

解析由(0.005+0.010+0.020+0.035+a)X10=1,得a=0.030,因此[120,130),

[130,140),[140,150]三组学生人数分别为:0.3X100=30,0.20X100=20,0.10X100

=10,所以,从身高在[140,150]内的学生中选取的人数应为4nxi8=3.

JUI乙UI1.v

答案3

041限时规范业练阶梯训练能力提升

对应学生

329

A级基础演练(时间:30分钟满分:55分)

一、选择题(每小题5分,共20分)

1.(2013•西安质检)对某商店一个月内每天的顾客人数进行了统计,得到样

125

本的茎叶图(如图所示),则该样本的中位数、众数、极差分别是20233

().3124489

455577889

A.46,45,56B.46,45,53

50011479

C.47,45,56D.45,47,536178

解析样本共30个,中位数为45三4-4一7=46;显然样本数据出现次数最多的为

45,故众数为45;极差为68—12=56,故选A.

答案A

2.(2013•南昌模拟)小波一星期的总开支分布如图(a)所示,•星期的食品开支如图(b)所示,

则小波一星期的鸡蛋开支占总开支的百分比为().

其他

人“"5%

储蓄

食品开支

30%

30%

通讯开支

5%娱乐开支日常开支

10%20%

图(b)

A.30%B.10%C.3%D.不能确定

解析由题图(b)可知小波一星期的食品开支共计300元,其中鸡蛋开支30元.又由题图

(a)知,一周的食品开支占总开支的30%,则可知一周总开支为

30

1000元,所以鸡蛋开支占总开支的百分比为丁丽X100%=3%.

答案C

3.(2013•成都模拟)交通管理部门为了解机动车驾驶员(简称驾驶员)对某新法规的知晓情

况,对甲、乙、丙、丁四个社区做分层抽样调查.假设四个社区驾驶员的总人数为从其

中甲社区有驾驶员96人.若在甲、乙、丙、丁四个社区抽取驾驶员的人数分别为

12,21,25,43,则这四个社区驾驶员的总人数N为().

A.101B.808C.1212D.2012

191

解析甲社区驾驶员的抽样比例为族=『四个社区驾驶员总人数的抽样比例为

968

12+21+25+43101

N=丁由一得八—808.

答案B

4.(2012•安徽)甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,

频数

3

2

A.甲的成绩的平均数小于乙的成绩的平均数

B.甲的成绩的中位数等于乙的成绩的中位数

C.甲的成绩的方差小于乙的成绩的方差

D.甲的成绩的极差小于乙的成绩的极差

解析山题意可知,甲的成绩为4,5,6,7,8,乙的成绩为5,5,5,6,9.所以甲、乙的成绩的

平均数均为6,A错;甲、乙的成绩的中位数分别为6,5,B错;甲、乙的成绩的方差分别

2

为《X[(4—6)2+(5-6产+(6-6尸+(7-6/+(8_6)2j=2)lx[(5-6)+(5—6尸+(5

55

19

-6)2+(6-6)2+(9-6)2]C对;甲、乙的成绩的极差均为4,D错.

答案C

二、填空题(每小题5分,共10分)

5.(2013•武夷模拟)用系统抽样法要从160名学生中抽取容量为20的样本,将160名学生

随机地从1〜160编号,按编号顺序平均分成20组(1〜8号,9〜16号,…,153〜160号),

若第16组抽出的号码为126,则第1组中用抽签的方法确定的号码是.

解析设第1组抽取的号码为则第〃组抽取的号码为8(〃-1)+6,,8X(16—1)+6

=126,.-.A=6,故第1组抽取的号码为6.

答案6

6.(2013•苏州一中月考)某学校为了解学生数学课程的学习情况,在1000名学生中随机抽

取200名,并统计这200名学生的某次数学考试成绩,得到了样本的频率分布直方图(如

图).根据频率分布直方图可估计这1000名学生在该次数学考试中成绩不低于60分的学

生人数是_______.

解析低于60分学生所占频率为(0.002+0.006+0.012)X10=0.2,故低于60分的学生

人数为1000X0.2=200,所以不低于60分的学生人数为1000-200=800.

答案800

三、解答题(共25分)

7.(12分)某政府机关有在编人员100人,其中副处级以上干部10人,一般干部70人,工

人20人.上级机关为了了解政府机构改革意见,要从中抽取个容量为20的样本,试确

定用何种方法抽取,请具体实施抽取.

解用分层抽样方法抽取.

具体实施抽取如下:

,、107020

(1)V20:100=1:5,.".——2,——14,­=4,

555

,从副处级以上干部中抽取2人,从一般干部中抽取14人,从工人中抽取4人.

(2)因副处级以上干部与工人的人数较少,他们分别按1〜10编号与1〜20编号,然后采

用抽签法分别抽取2人和4人;对一般干部70人采用00,01,02,…,69编号,然后用随

机数表法抽取14人.

(3)将2人,4人,14人的编号汇合在一起就取得了容量为20的样本.

8.(13分)(2012•揭阳调研)某校高一某班的某次数学测试成绩(满分为100分)的茎叶图和

频率分布直方图都受了不同程度的破坏,但可见部分如图,据此解答下列问题:

T68

62335689

71223456789

8缺失一

958

(1)求分数在[50,60]的频率及全班人数;

(2)求分数在[80,90]之间的频数,并计算频率分布直方图中[80,90]间的矩形的高.

解(1)分数在[50,60]的频率为0.008X10=0.08.

2

由茎叶图知,分数在[50,60]之间的频数为2,所以全班人数为"=25.

U.Uo

(2)分数在[80,90]之间的频数为25—2—7—10—2=4,频率分布直方图中[80,90]间的矩

4

形的高为芯+10=0-016.

B级能力突破

(时间:30分钟满分:45分)

一、选择题(每小题5分,共10分)

1.(2013•哈尔滨模拟)一个样本容量为10的样本数据,它们组成一个公差不为0的等差数

列{a.},若a=8,且a”a,&成等比数列,则此样本的平均数和中位数分别是

().

A.13,12B.13,13

C.12,13D.13,14

解析设等差数列{a}的公差为d(挣0),&=8,ai-=(aj)2=64,(8—2协(8+44=64,

(4-中(2+血=8,2d——=0,又,故d=2,故样本数据为

4,6,8,10,12,14,16,18,20,22,样本的平均数为一"%一义”=13,中位数为"/=13,

故选B.

答案B

2.(2012•江西)样本(E,如…,幻的平均数为x,样本(y,为…,%)的平均数为y(x

Wy).若样本(xi,如…,Xmyi,j2,•­­,%)的平均数z=。x+(1—a)y,其中

0<<1,则〃,勿的大小关系为().

A.n</nB.n>m

C.n=mD.不能确定

解析依题意得XI+EH-----\-xn=nx,----卜外=初y,

生+热+・,・+为+----F/=(勿+〃)z=(加+〃)ox+(加+〃)(1—o)y,

:.nx+/ny=(m+n)ax+(/zz+z?)(1—<?)y,

n=m+na,

・<

[zff=m+n1—a,

于是有n—m=(m+n)[c—(1—)]=(m+n)(2。-1),

a<T,.,.2a—KO,:.n—nKO,即勿>〃.

答案A

二、填空题(每小题5分,共10分)

3.(2013•沈阳质检)沈阳市某高中有高一学生600人,高二学生500人,高三学生550人,

现对学生关于消防安全知识了解情况进行分层抽样调查,若抽取了一个容量为〃的样本,

其中高三学生有11人,则n的值等于.

n11

解析由600+500+550=嬴'得"=33(人).

答案33

4.(2013•北京西城一模)某年级120名学生在一次百米测试中,成绩全部介于13秒与18

秒之间.将测试结果分成5组:[13,14),[14,15),[15,16),[16,17),[17,18],得到

如图所示的频率分布直方图.如果从左到右的5个小矩形的面积之比为1:3:7:6:3,

那么成绩在[16,18]的学生人数是

解析成绩在[16,18]的学生的人数所占比例为所以成绩在[16,18]

1IoIIIOIo乙U

9

的学生人数为120Xh=54.

答案54

三、解答题(共25分)

5.(12分)汽车行业是碳排放量比较大的行业之一、欧盟规定,从2012年开始,对C02排放

量超过130g/km的MI型新车进行惩罚(视为排放量超标),某检测单位对甲、乙两类MI

型品牌的新车各抽取了5辆进行CO2排放量检测,记录如下(单位:g/km):

甲80110120140150

乙100120Xy160

经测算发现,乙类品牌车C02排放量的均值为x4=120g/km.

(1)求甲类品牌汽车的排放量的平均值及方差;

(2)若乙类品牌汽车比甲类品牌汽车CO?的排放量稳定性好,求x的取值范围.

80+110+120+140+150

解(1)甲类品牌汽车的CO2排放量的平均值x甲=

5

120(g/km),

甲类品牌汽车的CO2排放量的方差

,80-1202+110-1202+120-1202+140-1202+150-120

=600.

100+120+x+y+160

⑵由题意知乙类品牌汽车的C02排放量的平均值X乙=

5

120(g/km),得x+y=220,故y=220—x,所以乙类品牌汽车的CO2排放量的方差

100-1202+120-1202+x-1202+220-^-1202+160-1202

5

因为乙类品牌汽车比甲类品牌汽车CO2的排放量稳定性好,所以s汶晶,解得90<K130.

6.(13分)已知某单位有50名职工,现要从中抽取10名

职工,将全体职工随机按1〜50编号,并按编号顺序81

平均分成10组,按各组内抽取的编号依次增加5进行703689

系统抽样.

6257

(1)若第5组抽出的号码为22,写出所有被抽出职工

59

(2)的号码;

(2)分别统计这10名职工的体重(单位:公斤),获得体重数据的茎叶图如图所示,求

该样本的方差;

(3)在(2)的条件下,从这10名职工中随机抽取两名体重不轻于73公斤(273公斤)

的职工,求体重为76公斤的职工被抽取到的概率.

解(1)由题意,第5组抽出的号码为22.

因为4+5X(5—1)=22,所以第1组抽出的号码应该为2,抽出的10名职工的号码

分别为2,7,12,17,22,27,32,37.42,47.

(2)因为10名职工的平均体重为

—1

x=—(81+70+73+76+78+79+62+65+67+59)=71,

所以样本方差为:52=-^-(102+12+22+52+72+82+92+62+42+122)=52.

(3)从10名职工中随机抽取两名体重不轻于73公斤的职工,共有10种不同的取法:

(73,76),(73,78),(73,79),(73,81),(76,78),(76,79),(76,81),(78,79),(78,81),

(79,81).

记“体重为76公斤的职工被抽取”为事件4它包括的事件有(73,76),(76,78),

(76,79),(76,81)共4个.

42

故所求概率为

P(A)--10--b

特别提醒:教师配赠习题、课件、视频、图片、文档等各种电子资源见《创新设计•高考

总复习》光盘中内容.

第2讲变量间的相关关系与统计案例

【2014年高考会这样考】

1.考查利用散点图判断变量之间的关系.

2.考查线性回归方程的计算或回归分析的思想与方法的应用问题.

3.考查独立性检验的基本思想及应用.

»抓住3工考点必考必记夯基固本

对应学生

165

考点梳理

1.相关关系的判断

(1)散点图直观反映了两变量的成对观测值之间存在的某种关系,利用散点图可以初步判

断两个变量之间是否线性相关.如果散点图中点的分布从整体上看大致在一条直线的附

近,我们说变量x和y具有线性相关关系.

n__

zX-xy,-y

2=1

(2)相关系数r=-I=,当r>0时,两变量正相关,当

/n_n_

A/XXLxX必_y

Yi—i/=i

r<0时•,两变量负相关,当口〈1且|r|越接近于1,相关程度越直,当|r|Wl且|r|越接

近于0,相关程度越低.

2.最小二乘法求回归直线方程

(1)设线性回归方程为y=bx+a,其中,b是回归方程的斜率,a是截距.

n__n__

XXLx匕­y£xiyi-nxy

-7=1/=1

b==

n_n

T2V(22

),X-X乙£一〃X

2=12=1

a=y—bx.

(2)回归直线一定经过样本的中心点(x,y),据此性质可以解决有关的计算问题.

3.独立性检验

(1)独立性检验的有关概念

①分类变量

可用变量的不同“值”表示个体所属的不同类别的变量称为分类变量.

②2X2列联表

假设有两个分类变量乃和K它们的值域分别为5”热}和5,%},其样本频数列联表(称

为2X2列联表)为:

71Y2总计

X\aba+b

X2Cdc+d

总计a+cb+da-\-b+c+d

(2)独立性检验

利用随机变量*=-T7〃旷―一——拉丁(其中片a+计c+d为样本容量)

a+bc+da-\-cb+d

来判断“两个变量有关系”的方法称为独立性检验.

步骤如下:

①计算随机变量长的观测值k,查下表确定临界值A,:

0.50.40.20.1

**》A)0.10

0055

0.40.71.32.02.70

ko

550823726

0.00.00.00.00.00

**》A)

52510051

3.85.06.67.810.8

ko

4124357928

②如果杉"就推断"才与r有关系”,这种推断犯错误的概率不超过尸(片》A。);否贝ij,

就认为在犯错误的概率不超过汽芯》的的前提下不能推断“才与n有关系”.

【助学•微博】

一个区别

函数关系是一种确定的关系,相关关系是一种非确定的关系.事实上,函数关系是两个非

随机变量的关系,而相关关系是非随机变量与随机变量的关系.

三个特征

⑴回归方程尸-+a中的减示x增加一个单位时,而变化量约为4

(2)〃越大,残差平方和越小,即模型的拟合效果越好;〃越小,残差平方和越大,即模

型的拟合效果越差.

(3)当423.841时,则有95%的把握说事件A与8有关;

当*26.635时,则有99%的把握说事件{与B有关:

当*W2.706时,则认为事件[与6无关.

考点自测

1.下列两个变量之间的关系是相关关系的是().

A.正方体的棱长与体积

B.单位面积的产量为常数时,土地面积与总产量

C.日照时间与水稻的亩产量

D.电压一定时,电流与电阻

解析A,B,D中两个变量间的关系都是确定的,所以是函数关系;C中的两个变量间是

相关关系,对于日照时间一定的水稻,仍可以有不同的亩产量,故选C.

答案C

2.对变量x,y有观测数据(必,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论