2021届高考数学解答题挑战满分专项13 回归分析、独立性检验(理)(解析版)_第1页
2021届高考数学解答题挑战满分专项13 回归分析、独立性检验(理)(解析版)_第2页
2021届高考数学解答题挑战满分专项13 回归分析、独立性检验(理)(解析版)_第3页
2021届高考数学解答题挑战满分专项13 回归分析、独立性检验(理)(解析版)_第4页
2021届高考数学解答题挑战满分专项13 回归分析、独立性检验(理)(解析版)_第5页
已阅读5页,还剩20页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2021届高考数学(理)解答题挑战满分专项

专题L3回归分析、独立性检验

考向解读

(1)频率分布直方图、茎叶图、平均数、方差,离散型随机变量的分布列与期望仍然

是考查的热点,同时应注意和概率、平均数、分布列,期望,二项分布,正态分布等知识的

结合,同时应注意独立性检验在实际生活中的应用.

(2)求回归直线方程的一般步骤

①作出散点图,依据问题所给的数据在平面直角坐标系中描点,观察点的分布是否呈

条状分布,即是否在一条直线附近,从而判断两变量是否具有线性相关关系.

②当两变量具有线性相关关系时,求回归系数a、写出回归直线方程.

③根据方程进行估计.

(3)独立性检验的一般步骤

①根据样本数据列出2x2列联表;

②计算随机变量K?的观测值鼠查下表确定临界值例:

0.250.150.1000.0500.0250.0100.0050.001

%1.3232.0722.7063.8415.0246.6357.87910.828

③如果就推断“X与丫有关系”,这种推断犯错误的概率不超过尸(K?N%);

否则,就认为在犯错误的概率不超过尸(长22七)的前提下不能推断“X与丫有关系”.

注意:①通常认为2.706时,样本数据就没有充分的证据显示“X与丫有关系”.

②独立性检验得出的结论是带有概率性质的,只能说结论成立的概率有多大,而不能

完全肯定一个结论,因此才出现了临界值表,在分析问题时一定要注意这点,不可对

某个问题下确定性结论,否则就可能对统计计算的结果作出错误的解释.

③独立性检验是对两个变量有关系的可信程度的判断,而不是对其是否有关系的判断.

最新模拟题赏析

1.随着互联网的飞速发展,我国智能手机用户不断增加,手机在人们日常生活中也占据着

越来越重要的地位.某机构做了一项调查,对某市使用智能手机人群的年龄、口使用时长情

况做了统计,将18〜40岁的人群称为“青年人”(引用青年联合会对青年人的界定),其余人

群称为“非青年人根据调查发现"青年人''使用智能手机占比为60%,“非青年人”使用智

能手机占比为40%;日均使用时长情况如下表:

时长2小时以内2〜3小时3小时以上

频率0.40.30.3

将日均使用时长在2小时以上称为“频繁使用人群”,使用时长在2小时以内称为“非频繁使

3

用人群已知“频繁使用人群''中有:是“青年人

现对该市“日均使用智能手机时长与年龄的关系”进行调查,采用随机抽样的方法,抽取一个

容量为200的样本,请你根据上面提供的数据.

(1)补全下列2x2列联表;

青年人非青年人合计

频繁使用人群

非频繁使用人群

合计

(2)根据列联表的独立性检验,判断有多大把握认为“日均使用智能手机时长与年龄有关”?

„n(ad-bc)2“一,,

附:K~2=-----------------------------,其中〃=a+〃+c+d.

(a+b)(c+d)(a+c)(b+d)

以参考数据:独立性检验界值表

Pg.K。)0.150.100.0500.0250.010

K。2.0722.7063.8415.0246.635

【试题来源】陕西省咸阳市2020-2021学年高三上学期高考模拟检测(一)

【答案】(1)列联表见解析;(2)有99%的把握认为“日均使用智能于机时长与年龄有关”.

【分析】(1)根据已知条件可计算青年人数、非青年人数、出频繁使用人数,中青年人频繁

使用人数,将2x2列联表补充完整即可;(2)利用公式计算K2的观测值与临界值比较即可

求解.

【解析】(1)200人中青年人有200x0.6=120人,非青年人有200x0.4=80人,

3

频繁使用人群有200x°.6=120人’频繁使用人群中青年人有“°'厂90人,

2x2列联表为

青年人非青年人合计

频繁使用人群9030120

非频繁使用人群305080

合计12080200

⑵不二00(90x5。-30x亚-28.125A6.635,

120x80x120x80

故有99%的把握认为“日均使用智能手机时长与年龄有关”.

2.某线上学习平台为保证老学员在此平台持续报名学习,以便吸引更多学员报名,从用户

系统中随机选出200名学员,对该学习平台的教学成效评价和课后跟踪辅导评价进行了统计,

并用以估计所有学员对该学习平台的满意度.其中对教学成效满意率为0.9,课后跟踪辅导

的满意率为0.8,对教学成效和课后跟踪辅导都不满意的有10人.

(1)完成下面2x2列联表,并分析是否有99.9%把握认为教学成效满意度与跟踪辅导满意

度有关.

对教学成效满意对教学成效不满意合计

对课后跟踪辅导满意

对课后跟踪辅导不满意

合计

(2)若用频率代替概率,假设在学习服务协议终止时对教学成效和课后跟踪辅导都满意学

员的续签率为90%,只对其中一项不满意的学员续签率为60%,对两项都不满意的续签率

为10%.从该学习平台中任选10名学员,估计在学习服务终止时续签学员人数.

附:2x2列联表参考公式:k2=—,I:),~~…+b+c+d.临界值:

(a+b)(c+d)(a+c)(b+d)

P(K2..&O)0.1000.0500.0250.0100.001

&02.7063.8415.0246.63510.828

【试题来源】新疆维吾尔自治区2021届高三第二次联考数学能力测试试题

【答案】(1)列联表答案见解析,有99.9%把握认为教学成效满意度与跟踪辅导满意度有

关;(2)平台续签人数为8人.

【解析】(1)依题意有

对教学成效满意对教学成效不满意合计

对课后跟踪辅导满意15010160

对课后跟踪辅导不满意301040

合计18020200

22

算得k的观测值为k=200x(150x10-30x10)2=[25>10828

180x20x160x40

故有99.9%把握认为教学成效满意度与跟踪辅导满意度有关.

(2)在200人中对平台的双满意的续签人数为150x90%=135,仅•项满意的续签人数为

40x60%=24,都不满意的续签人数为10xl0%=l,所以该平台的续签率为

“5+?+।=0.8依题意有X~8(10,0.8),所以任选10人,该平台续签人数为8人.

3.从集市上买回来的蔬菜仍存有残留农药,食用时需要清洗数次,统计表中的x表示清洗

的次数,y表示清洗x次后1千克该蔬菜残留的农药量(单位:微克).

(1)在如图的坐标系中,描出散点图,并根据散点图判断,夕=去+4与夕=应"'+力哪

一个适宜作为清洗x次后1千克该蔬菜残留的农药量的回归方程类型:(给出判断即可不必

说明理由)

(2)根据判断及下面表格中的数据,建立y关于x的回归方程:

X12345

y4.52.21.41.30.6

之®一5『£(七-工)(丫-方

Xy0)之UH-⑹3-方

i11=1i=l

320.12100.09-8.70.9

[3

表中例=«F,近@

5i=i

:-可一田

附:①线性回归方程9=b+a中系数计算公式分别为匕=2(%(K

Z"(七一五y

A

a=y-bx;

【试题来源】江西省新余市第一中学2020-2021学年高二年级第六次考试

【答案】(1)散点图见解析,y=me~x+n^(2)y=[Oxe-x+O.S

【分析】1)画出散点图,判断即可;

(2)根据所给参考数据利用最小二次方求出回归方程即可;

【解析】(1)散点图如图,

用勺=应"'+8作为清洗X次后1丁克该蔬菜残留的农药量的回归方程类型.

ZQ-硼丫-加09

(2)由题知向-----------=^TT=10,方=亍一版=2-10x0.12=0.8,

1>i)2009

f-1

故所求的回归方程为》=10xeT+0.8.

4.垃圾是人类日常生活和生产中产生的废弃物,由于排出量大,成分复杂多样,且具有污

染性,所以需要无害化、减量化处理.某市为调查产生的垃圾数量,采用简单随机抽样的方

法抽取20个县城进行了分析,得到样本数据(大,y)(i=l,2,…,20),其中为和片分别表示

第i个县城的人口(单位:万人)和该县年垃圾产生总量(单位:吨),并计算得W>』=80,

2020_220_220

£y=4000,£(%-X)-=80,-y)=8000,七-1)(丫-丁)=700.

r=lr=l;=1

(i)请用相关系数说明该组数据中y与x之间的关系可用线性回归模型进行拟合;

(2)求y关于x的线性回归方程,用所求回归方程预测该市io万人口的县城年垃圾产生总

量约为多少吨?

参考公式:相关系数厂二,对于一组具有线性相关关系的数据

(xpy,.)(/=1,2,3,­••,«),其回归直线》二鼠+济的斜率和截距的最小二乘估计分别为

y-^x-

【试题来源】广西梧州市2021届高三3月联考

【答案】⑴答案见解析;(2)252.5吨.

【分析】(1)利用相关系数r二代入数据求出r=0.875,相

2卜,7)b,7)

关系数绝对值越大,相关性越强即可判断.(2)由务=「------:—,》一》7,

2")一

f=l

代入系数即可求出回归直线方程,再将x=10代入即可求解.

【解析】(1)由题意知,相关系数7=J2。20

因为y与x的相关系数接近1,

所以y与%之间具有较强的线性相关关系,可用线性回归模型进行拟合.

a=y-Sx=8.75x—=200-8.75x4=165,

2020

所以y=8.75x+165・

当x=10时,y=8.75x10+165=252.5,

所以该市10万人口的县城年垃圾产生总量约为252.5吨.

5.针对偏远地区因交通不便、消息闭塞导致优质农产品藏在山中无人识的现象,各地区开始

尝试将电商扶贫作为精准扶贫的重要措施.为了解电商扶贫的效果,某部门随机就100个贫

困地区进行了调查,其当年的电商扶贫年度总投入(单位:万元)及当年人均可支配年收入(单

位:元)的贫困地区数目的数据如下表:

人均可支配年收入(元)

(5000,10000](10000,15000](15000,20000]

电商扶贫年度总投入(万元)

(0,500]532

(500,1000]3216

(1000,3000)23424

(1)估计该年度内贫困地区人均可支配年收入过万的概率,并求本年度这100个贫困地区

的人均可支配年收入的平均值的估计值(同一组数据用该组数据区间的中间值代表);

(2)根据所给数据完成下面的列联表,并判断是否有99%的把握认为当地的人均可支配年

收入是否过万与当地电商扶贫年度总投入是否超过千万有关.

人均可支配年收入W10000元人均可支配年收入>10000元

电商扶贫年度总投入不超过1()0()万

电商扶贫年度总投入超过1000万

n(ad-bey

其中n=a+b+c+d.

(a+b)(c+d)(a+c)(b+d)

P(K2>k)0.0500.010.005

k3.8416.6357.879

【试题来源】云南西南名校2021届高三下学期联考

【答案】(1)概率为0.9,平均值的估计值为13600(元);(2)列联表答案见解析,有99%

的把握认为当地的人均可支配年收入是否过万与当地电商扶贫年度总投入是否超过千万有

关.

【分析】(1)利用频率估计概率,再利用平均数公式估计平均值;

(2)根据题干完成2x2联表,再根据公式计算K"对照参数得出结论.

【解析】(1)由所给数据可得,该年度内贫困地区人均可支配年收入过万的概率的估计值为

5+3+2

=0.9.

100

本年度这100个贫困地区的人均可支配年收入的平均值的估计值为

5+3+2race3+21+34tcucc2+6+24ir/cc—

-------x7500+----------x12500+----------x17500=13600(兀).

100100100

(2)列联表如下:

人均可支配年收入R0000元人均可支配年收入>10000元

电商扶贫年度总投入不超过1000万832

电商扶贫年度总投入超过1000万258

因为2_100x(8x58-2x32)2_200

一—10x90x40x60—-方

所以有99%的把握认为当地的人均可支配年收入是否过万与当地电商扶贫年度总投入是否

超过千万有关.

6.2020年,全球爆发了新冠肺炎疫情,为了预防疫情蔓延,某校推迟2020年的春季线下

开学,并采取了“停课不停学”的线上授课措施.为了解学生对线上课程的满意程度,随机抽

取了该校的100名学生(男生与女生的人数之比为1:1)对线上课程进行评价打分,若评分不

低于80分视为满意.其得分情况的频率分布直方图如图所示,若根据频率分布直方图得到

的评分不低于70分的频率为0.85.

5s率

(1)求b的值,并估计100名学生对线上课程评分的平均值;(每组数据用该组的区间中点

值为代表)

(2)结合频率分布直方图,请完成以下2x2列联表,并回答能否有99%的把握认为对“线

上教学是否满意与性别有关

性别

满意不满意合计

态度

男生

女生15

合计100

—bc'Y

附:随机变量K'=

(a+/)(c+d)(a+c)(b+d)

P/”。)0.250.150.100.050.0250.010.0050.001

%1.3232.0722.7063.8415.0246.6357.87910.828

【试题来源】黑龙江省哈尔滨市第三中学2020-2021学年上学期高三1月线上学习阶段性考

【答案】(1)6=0.04,80;(2)表格见解析,能仃99%的把握认为对“线上教学是否满意

与性别有关

【分析】(1)先由题中条件,求出。,b的值,再由频率分布白:方图,根据组的中间值乘以

该组的频率,再求和,即可得出平均数;

(2)由题中先完善列联表,再由计算公式,求出K'进而可判断出结果.

【解析】(1)由已知得(O.O15+Z?+O.O3)xlO=O.85,解得力=0.04,

又(0.005+4)x10=1-0.85,解得4=0.01,

所以评分的平均值为55x0.05+65x0.1+75x0.3+85x0.4+95x0.15=80

(2)由题意可得,2x2列联表如下表:

性别

满意不满意合计

态度

男生203050

女生351550

合计5545100

因此i_100X(20X15-35X30)2

K«9.091>6.635

、55x45x50x50

二.能有99%的把握认为对“线上教学是否满意与性别有关”

7.在关研究表明,正确佩戴安全头盔,规范使用安全带能够将交通事故死亡风险大幅降低,

对保护群众生命安全具有重要作用.2020年4月,“一盔一带”安全守护行动在全国各地开

展.行动期间,公安交管部门将加强执法管理,依法查纠摩托车和电动自行车骑乘人员不佩

戴安全头盔,汽车驾乘人员不使用安全带的行为,助推养成安全习惯.该行动开展一段时间

后,某市针对电动自行车骑乘人员是否佩戴安全头盔问题进行调查,在随机调查的1000名

骑行人员中,记录其年龄和是否佩戴头盔情况,得到如下的统计图表:

203040506070年龄/周岁°年龄低于40岁年龄不低于40岁

(1)估算该市电动自行车骑乘人员的平均年龄;

(2)根据所给的数据,完成下面的列联表:

是否佩戴头盔

是行

年龄

[20,40)

[40,70]

(3)根据(2)中的列联表,判断是否有99%把握认为遵守佩戴安全头盔与年龄有关?

n^ad-bcy

(a+b)(c+d)(a+c)(b+d)

P(K2>k)0.0500.0100.001

k3.8416.63510.828

【试题来源】湖北省武汉市2021届高三下学期3月质量检测

【答案】(1)39;(2)列联表见解析;(3)没有把握.

【分析】(1)根据频率分布直方图,利用平均数公式求解..

(2)根据统计表完成列联表.

(3)根据列联表,利用公式求得K?的值,然后与临界值表对照下结论.

【解析】(1)该市电动自行车骑行人员平均年龄为

25x0.25+35x0.35+45x0.2+55x0.15+65x0.05=39.

(2)

是否佩戴头盔

是否

年龄

[20,40)54060

[40,70]34060

⑶2二1000x(60x540-60x340)2125

、600x400x880x1205.682<6.635.

故而没有99%的把握认为遵守佩戴安全头盔与年龄有关.

8.在一次模拟考试中,某校共有100名学生参加考试,其中语文考试成绩低于130的占95%,

如果成绩不低于130的为特别优秀,数学成绩的频率分布直方图如图.

Si率

(1)求数学成绩特别优秀的人数及数学成绩的平均分;

(2)如果语文和数学两科都特别优秀的共有3人.根据以上数据,完成2x2列联表,并分

析是否有99%的把握认为语文特别优秀的同学,

数学也特别优秀.

语文特别优秀语文不特别优秀合计

数学特别优秀

数学不特别优秀

合计

n(ad-bc)2

参考数据:①K?

(〃+b)(c+d)(a+c)(h+d)

网*人)0.500.40•••0.0100.0050.001

0.4550.708•.•6.6357.87910.828

【试题来源】百师联盟2020-2021学年高三下学期开年摸底联考考试卷(全国口卷)

【答案】(1)90;(2)列联表见解析,有99%的把握认为语文特别优秀的同学,数学也特

别优秀.

【分析】(1)由频率分布直方图可得数学成绩特别优秀的概率为g=0.002x20=0.04,

从而可得数学特别优秀的人数,利用频率分布直方图直接求解平均数;

(2)由题意可得语文成绩特别优秀的概率为《=1-0.95=0.05,语文特别优秀的同学有

100x0.05=5人,而语文和数学两科都特别优秀的共有3人,再结合(1)中求出数学成绩

特别优秀的人数为4人,进而可填出2x2列联表,再求出K?与临界值比较可得结果

【解析】(1)数学成绩特别优秀的概率为£=0.002x20=0.04,

数学特别优秀的同学有100x0.04=4人.

工=0.14x6()+0.36x8()+0.4x100+0.06x120+0.04x140=90分.

(2)共有100名学生参加考试,其中语文考试成绩低于130的占95%,语文成绩特别优秀

的概率为6=1—0.95=0.05,论文特别优秀的同学仃100x0.05=5人,

2x2列联表:

语文特别优秀语文不特别优秀合计

数学特别优秀314

数学不特别优秀29496

合计595100

所以父」笠然5联)"Z982>6.635.

所以有99%的把握认为语文特别,’尤秀的同学,数学也特别优秀.

9.随着互联网行业、传统行业和实体经济的融合不断加深,互联网对社会经济发展的推动

效果日益显著,某大型超市计划在不同的线上销售平台开设网店,为确定开设网店的数量,

该超市在对网络上相关店铺做了充分的调查后,得到下列信息,如图所示(其中x表示开设

网店数量,)'表示这x个分店的先销售额总和),现已知£>J=8850,=2000,求

i=i»=1

解下列问题;

年销售额r(TJ7L)

12356分店数量'

(1)经判断,可利用线性回归模型拟合y与x的关系,求解)‘关于大的回归方程;

(2)按照经验,超市每年在网上销售获得的总利润w(单位:万元)满足w=y-5x2-140,

请根据(1)中的线性回归方程,估算该超市在网上开设多少分店时,才能使得总利润最大.

5―

__2>戊一办了

参考公式;线性回归方程§=去+"其中。=y一菽4二上!----------

•02-2

工岑一〃X

/=1

【试题来源】吉林省长春市2021届高三质量监测(二)

【答案】(1)y=85x+60;(2)开设8或9个分店时,才能使得总利润最大.

【分析】(1)先求得汽%2=90,7=4,再根据提供的数据求得务,〃,写III回归直线方程;

(2)由(1)结合w=y—5/-140,得到卬=一5—+85%—80,再利用二次函数的性质

求解.

【解析】(1)由题意得>>:=90,=45=要=甯巴=85,

j=i90—oU

々=400-85x4=60,所以y=85x+60・

1125

(2)由(1)知,W=-5X2+85X-80=5+-------

所以当x=8或x=9时能获得总利润最大.

10.我国为全面建设社会主义现代化国家,制定了从2021年到2025年的“十四五”规划某企

业为响应国家号召,汇聚科研力量,加强科技创新,准备增加研发资金.现该企业为了了解

年研发资金投入额x(单位:亿元)对年盈利额乂单位:亿元)的影响,研究了“十二五”和“十三

五”规划发展期间近10年年研发资金投入额占和年盈利额X的数据通过对比分析,建立了

两个函数模型:①y=a+月/,②y二6^",其中均为常数,e为自然对数的底数.令

%=片,v.=lny.(i=l,2,...,10),经计算得如下数据:

10一S10(z-y).

£(%-元y

XyuV

»=i*=i

262156526805.36

10.1010.10

£(-w)(y.-y)5(xf.-x)(v.-v)

之®一正)-M/f

»=1f=l1=1/=1

112501302.612

(1)请从相关系数的角度,分析哪一个模型拟合程度更好?

(2)(1)根据(1)的选择及表中数据,建立y关于x的回归方程;(系数精确到0.01)

(2)若希望2021年盈利额y为200亿元,请预测2021年的研发资金投入额x为多少亿元?

(结果精确到().01)

♦(—)(一)

附:①相关系数r=~j=--------:----------,回归直线y=a+bx中:

-可力(凹-“

V»=1/=1

人2(毛-可(乂一方

b=-------------,a=y-bx^②参考数据:In2«0.693,In5kl.609.

f(一)2

1=1

【试题来源】江西省上饶市横峰中学2020-2021学年高二(统招班)下学期入学考试

【答案】(1)模型y=e"+'的拟合程度更好;(2)(1)9=e°J8ao汽(2)2021年的研发

资金投入量约为26.32亿元.

【分析】(1)通过换元对变量进行变换,模型①令〃=/可变为y=/?〃+a,②两边取自

然对数可变为lny=;U+f,UPv=Ax+Z,再根据参考数据可求两个方程的相关系数,再

比较大小即可得哪一个模型拟合程度更好;(2)(1)根据(1)可选择函数模型②,通过变

化得以=忒+,,求出夕和3可得y关于x的线性回归方程,再将/用In》替换,即可得y

关于x的回归方程;(2)根据回归方程,令"200,求出尤即可.

【解析】(1)设{%}和{)1}的相关系数为小{%}和{匕}的相关系数为由题意,

2(%-")(%-刃

,1"2==上,。.87,

fio~io-711250x215

JEX%-江)之(弘一为

Vi=li=l

10

£(x,.-x)(vr.-v)

1212

=——«0.92,

765x2.613

博—塔(—)2

则用<|回,因此从相关系数的角度,模型y=的拟合程度更好.

(2)(1)先建立丫关于x的线性回归方程,

由y=6航+',得Iny=f+4%,即Iny=,+,

10

£(x..-x)(v/-v)

1=1

In------------=—,/=v-=5.36----x26=0.56,

ZU-)26565

1=1

所以丫关于X的线性回归方程为f=0.18x+0.56,

所以In夕=0.18x+0.56,则f=ea,8r+0-56.

(2)2021年盈利额y=200(亿元),

所以2021年的研发资金投入量约为26.32亿元.

【名师点睛】在两个变量的回归分析中要注意以下两点:

(1)求回归直线方程要充分利用已知数据,合理利用公式减少运算.

(2)借助散点图,观察两个变量之间的关系.若不是线性关系,可以通过对变量进行变换,

转化为线性回归问题去解决.

11.某机构为了解某大学中男生的体重单位:kg)与身高式单位:cm)是否存在较好的线性

关系,该机构搜集了7位该校男生的数据,得到如下表格:

序号1234567

身高(cm)161175169178173168180

体重(kg)52625470665773

根据表中数据计算得到)'关于x的线性同归方程为y=\.\5x+a

(1)求才;

-y,)

(2)已知斤=1一弋」——且当R2..0.9时,回归方程的拟合效果非常好;当

E(x-y)2

r=l

O.8<R2<o.9时,回归方程的拟合效果良好.试问该线性回归方程的拟合效果是非常好还

6

是良好?说明你的理由.参考数据:Z(y一无)=49.12

J=1

【试题来源】陕西省榆林市2021届高三下学期第二次高考模拟测试

【答案】(1)&=-135.8:(2)该线性回归方程的拟合效果是良好,理由见解析.

【分析】(1)先求三。代入回归方程即可求得;

(2)先根据题意求出灭2.根据参数范围进行判断即可.

⑹+175+169+178+173+168+180

【解析】(1)因为亍==172.

7

52+62+54+70+66+57+73

y=二62,

7

将(172,62)代入回归方程,a=y-1.15x=62-1.15xl72=-135.8;

(2)刃2=100+0+64+64+761+25+121=390,

1=1

y关于x的线性同归方程为9=1.15X-135.8,

所以(为一%)2=(73—1.15x180+135.8)2=3.24,

Z(X-%)2=z(凹-力F+3.24=52.36,

r=l;=l

,名3-犷5236

所以H?=1一号---------=1--j—«0.87e(0.8,0.9),

i=l

故该线性回归方程的拟合效果是良好.

【名师点睛】在线性回归中,求线性回归方程是常见题型:

方法【名师点睛】求线性回归方程的步骤:

(1)先求x.y的平均数k];

-可(凹-方__

(2)套公式求出右和&的值:b=上----------,a=y-^xx;

ZU--)2

(3)写出回归直线的方程.

12.机动车行经人行横道时,应当减速慢行:遇行人正在通过人行横道,应当停车让行,俗

称“礼让行人下表是某市一主干路口监控设备所抓拍的5个月内驾驶员不“礼让行人''行为

统计数据:

月份12345

违章驾驶员人数1201051009580

(1)请利用所给数据求违章人数y与月份工之间的回归直线方程$,=菽十2;

(2)预测该路口9月份的不“礼让行人”违章驾驶员人数;

(3)交警从这5个月内通过该路口的驾驶员中随机抽查70人,调查驾驶员不“礼让行人”

行为与驾龄的关系,得到下表:

不礼让行人礼让行人

驾龄不超过1年2416

驾龄1年以上1614

能否据此判断有97.5%的把握认为“礼让行人行为与驾龄有关?

A1>/一〃盯y(x,.-x)(y,-y)

参考公式:B一笠----------二上、-------------,a=y-bx.

之七2一加-元)2

J=lf=l

n(ad-bc)2

X2(其中〃=〃+Z?+c+d)

(a+b)(c+d)(a+c)(b+d)

P(/2)0.150.100.050.0250.010

k2.0722.7063.8415.0246.635

【试题来源】江苏省连云港市2021届高三下学期期初调研考试

【答案】(1)J=-9x+127;(2)46人;(3)没有97.5%的把握.

【分析】(1)由已知求得7,进一步套公式求出$和4的值,就求出线性回归方程;

(2)在(1)的回归方程,令x=9,即可预测该路n9月份的不“礼让行人”违章驾驶员人

数;(3)计算K'下结论.

1+2+3+4+51201051009580

【解析】(1)由表中数据知,x==3++++=100

55

^x^-rixy

1410-1500八

所以6---------------------=-9

f七2-庇255-45

/=|

所以6=歹一送=100—(—9)x3=127,

故所求回归直线方程为9=-9/+127;

(2)由(1)知,令x=9,则£=-9x9+127=46人.

(3)提出假设“。:”礼让行人”行为与驾龄无关,

由表中数据得K2=70Q4X14T6X16)2=^^。.311V2.706,

40x30x40x3045

根据统计知,没有97.5%的把握认为“礼让行人行为与驾龄有关.

【名师点睛】(1)求线性回归方程的步骤:

9

Az(%—可(m一到

①先求X、y的平均数覆y:②套公式求出6和。的值:6=占r------------,

6(—)2

1=1

a=y-^xx^③写出回归直线的方程.

(2)独立性检验的题目直接根据题意完成完成2x2列联表,直接套公式求出K?,对照参

数下结论.

13.宁夏西海固地区,在1972年被联合国粮食开发署确定为最不适宜人类生存的地区之

一.为改善这一地区人民生活的贫困状态,上世纪90年代,党中央和自治区政府决定开始

吊庄移民,将西海固地区的人口成批地迁移到更加适合生活的地区.为了帮助移民人口尽快

脱贫,党中央作出推进东西部对口协作的战略部署,其中确定福建对口帮扶宁夏,在福建人

民的帮助下,原西海固人民实现了快速脱贫,下表是对2016年以来近5年某移民村庄100

位移民的年人均收入的统计:

年份20162017201820192020

年份代码X12345

人均年收入y(千元)1.32.85.7&913.8

现要建立)关于X的回归方程,有两个不同回归模型可以选择,模型一去+&;模型

二»力=&2+2,即使画出》关于X的散点图,也无法确定哪个模型拟合效果更好,现用

最小二乘法原理,已经求得模型一的方程为f=3.Lv-2.8.

(1)请你用最小二乘法原理,结合下面的参考数据及参考公式求出模型二的方程(计算结

果保留到小数点后一位);

(2)用计算残差平方和的方法比较哪个模型拟合效果更好,已经计算出模型一的残差平方

和为它(M-%)2=3.7.

r=l

5__

附:参考数据:V---------"0.52,其中%=J^,i=l,2,3,4,5.

Z"5尸

r-l

参考公式:对于一组数据(%,K).(〃2,匕),…,(〃〃,乙),其回归直线£=0+/〃的斜率

和截距的最小二乘法估计公式分别为/=得-------,一狐.

i=l

【试题来源】黑龙江省哈尔滨市哈尔滨第三中学2020-2021学年高三下学期第一次模拟考试

【答案】(1),=0.5f+0.8:(2)模型二的拟合效果更好.

【分析】(1)令,=/,求出j,即可求出之和鼠得出模型二的方程;

(2)先利用模型二的回归方程求出必,再根据公式即可计算出残差平方和,作出判断.

【解析】(1)令f=d,则模型二可化为》关于,的线性回归问题,

-1+4+9+16+25,,-1.3+2.8+5.7+8.9+13.8-

则t1I/=---------------=11,y=----------------------=6.5,

5_

»戊-51y

则由参考数据可得6=弋--------«0.52«0.5,

?=1

j=y-Gr=6.5-0.52xll«0.8^则模型二的方程为+=0.5f+0.8;

(2)由模型二的回归方程可得,=0.5xl+0.8=L3,$;*=()5X4+().8=2.8,

=0.5x9+0.8=53,=0.5x16+0.8=8.8,=0.5x25+0.8=13.3,

/.汽(M-般))2=。2+()2+0.42+0.产+0.52=0.42<3.7,

故模型二的拟合效果更好.

【名师点睛】本题考查线性回归方程和残差平方和的计

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论