高中数学统计与统计案例全章复习总结_第1页
高中数学统计与统计案例全章复习总结_第2页
高中数学统计与统计案例全章复习总结_第3页
高中数学统计与统计案例全章复习总结_第4页
高中数学统计与统计案例全章复习总结_第5页
已阅读5页,还剩36页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第八章统计与统计案例

第1节随机抽样

最新考纲:1.理解随机抽样的必要性和重要性;2.会用简单随机抽样方法从总体中抽取样本;

3.了解分层抽样和系统抽样方法.会用随机抽样的基本方法解决一些简单的实际问题.

1知识梳理

1.简单随机抽样

(1)定义:设一个总体含有N个个体,从中逐个不放回地抽取"个个体作为样本SWM,如果每次抽取时

总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.

(2)最常用的简单随机抽样的方法:抽签法和随机数法.

2.系统抽样的步骤

假设要从容量为N的总体中抽取容量为n的样本.

(1)先将总体的N个个体编号.

(2)确定分段间隔K,对编号进行分段,当藁N是整数时,取&=,N当三N不是整数时,随机从总体中剔除余

数,再取左=N£'(乂为从总体中剔除余数后的总数).

(3)在第1段用简单随机抽样确定第一个个体编号l(l<k).

(4)按照一定的规则抽取样本,通常是将I加上间隔k得到第2个个体编号(/+«),再加k得到第3个个

体编号(/+2Q,依次进行下去,直到获取整个样本.

3.分层抽样

(1)定义:在抽样时:将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的

个体,将各层取出的个体合在一起作为样本,这种抽样方法叫做分层抽样.

(2)分层抽样的应用范围:

当总体由差异明显的几个部分组成时,往往选用分层抽样.

2题型分类

1例a下列抽取样本的方式属于简单随机抽样的个数为()

①从无限多个个体中抽取100个个体作为样本.

②盒子里共有80个零件,从中选出5个零件进行质量检验.在抽样操作时,从中任意拿出一个零件进

行质量检验后再把它放回盒子里.

③从20件玩具中一次性抽取3件进行质量检验.

④某班有56名同学,指定个子最高的5名同学参加学校组织的篮球赛.

A.0B.1C.2D.3

【例2】(2017•葫芦岛模拟)福利彩票“双色球”中红球的号码可以从01,02,03,....32,33这33个二

位号码中选取,小明利用如图所示的随机数表选取红色球的6个号码,选取方法是从第1行第9列和第10

列的数字开始从左到右依次选取两个数字,则第四个被选中的红色球号码为()

S1472368639317901269S6S16293506091337585613985

0632359246225410027849821S8670480546S815192049

A.12B.33C.06D.16

【例3】(教材习题改编)老师在班级50名学生中,依次抽取学号为5,10,15,20,25,30,35,40,45,50的学生进行

作业检查,这种抽样方法是()

A.随机抽样B.分层抽样C.系统抽样D.以上都不是

【例4】某地区有小学150所,中学75所,大学25所,现采用分层抽样的方法从这些学校中抽取30所学

校对学生进行视力调查,应从小学中抽取所学校,中学中抽取所学校.

【例5】哈六中2016届有.840名学生,现采用系统抽样方法,抽取42人做问卷调查,将840人按1,2,i,

840随机编号,则抽取的42人中,编号落入区间[481,720]的人数为.

【例6】(2017・西安质检)对一个容量为N的总体抽取容量为n的样本,当选取简单随机抽样、系统抽样和

分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为0,p2,0,则()

A.Pi=p2Vp3B,P2=P3vpic.Pi=p3Vp2D.?=P2=P3

【变式1](2017•大连二模)某单位员工按年龄分为A,B,C三组,其人数之比为5:4:1,现用分层抽

样的方法从总体中抽取一个容量为10的样本,已知C组中某个员工被抽到的概率是工,则该单位员工总数

9

为()

A.110B.10C.90D.80

【变式2】(2017•黄州区三模)某校为了解1000名高一新生的身体生长状况,用系统抽样法(按等距的规

则)抽取40名同学进行检查,将学生从1〜1000进行编号,现已知第18组抽取的号码为443,则第一组用

简单随机抽样抽取的号码为()

A.16B.17C.18D.19

【变式3](2017•宣城二模)一支田径队共有运动员98人,其中女运动员42人,用分层抽样的方法抽取

一个样本,每名运动员被抽到的概率都是4,则男运动员应抽取()

7

A.18人B.16人C.14人D.12人

3课后作业

i.为了了解某地区的中小学生视力情况,拟从该地区的中小学生中抽取部分学生进行调查,事先已了解到

该地区小学、初中、高中三个学段学生的视力情况有较大差异,而男女生视力情况差异不大,在下面的抽

样方法中,最合理的抽样方法是()

A.简单随机抽样B.按性别分层抽样C.按学段分层抽样D.系统抽样

2.从编号为1〜50的50枚最新研制的某种型号的导弹中随机抽取5枚来进行发射试验,若采用每部分选

取的号码间隔一样的系统抽样方法,则所选取5枚导弹的编号可能是()

A.5,10,15,20,25B.3,13,23,33,43C.1,2,3,4,5D.2,4,6,16,32

3.某工厂甲、乙、丙三个车间生产了同一种产品,数量分别为120件,80件,60件.为了解它们的产品

质量是否存在显著差异,用分层抽样方法抽取了一个容量为n的样本进行调查,其中从丙车间的产品中抽

取了3件,则〃=()

A.9B.10C.12D.13

4.将参加英语口语测试的1000名学生编号为000,001,002,…,999,从中抽取一个容量为50的样本,按

系统抽样的方法分为50组,如果第一组编号为000,001,002,…,019,且第一组随机抽取的编号为015,

则抽取的第35个编号为()

A.700B.669C.695D.676

5.某防疫站对学生进行身体健康调查,欲采用分层抽样的办法抽取样本.某中学共有学生2000名,抽取

了一个容量为200的样本,已知样本中女生比男生少6人,则该校共有女生()

A.1030人B.97人C.950人D.970人

第2节用样本估计总体

最新考纲:1.了解分布的意义与作用,能根据概率分布表画频率分布直方图、频率折线图、茎

叶图,体会它们各自的特点2理解样本数据标准差的意义和作用,会计算数据标准差3能从样

本数据中提取基本的数字特征(如平均数、标准差),并做出合理的解释4会用样本的频率分布

估计总体分布,会用样本的基本数字特征估计总体的基本数字

特征.理解用样本估计总体的思想,会用样本估计总体的思想

解决一些简单的实际问题.

1知识梳理

1.频率分布直方图

(1)频率分布表的画法:

第一步:求极差,决定组数和组距,组距=篇极差:

第二步:金组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间;

第三步:登记频数,计算频率,列出频率分布表.

(2)频率分布直方图:反映样本频率分布的直方图.

横轴表示样本数据,纵轴表示频赢率,每个小矩形的面积表示样本落在该组内的鲜一

2.茎叶图

统计中还有一种被用来表示数据的图叫做茎叶图,茎是指中间的一列数,叶是从茎的旁边生长出来的

3.样本的数字特征

数字特征定义

众数在一组数据中,出现次数最多的数据叫做这组数据的众数

将一组数据按大小依次排列,把处在最空间位置的一个数据(或最中间两个数

中位数据的平均数)叫做这组数据的中位数.

在频率分布直方图中,中位数左边和右边的直方图的面积相笠

样本数据的算术平均数,即噎=:廿三》-十上

平均数

方差S2=%(©—X尸+(》2—X)2+…+(X“一X)2],其中S为标准差

2题型分类

题型一茎叶图

【例1】(必修3P70改编)若某校高一年级8个班参加合唱比赛的得分茎叶图如图所示,则这组数据的中位

数和平均数分别是()

879

9012346

A.91.5和91.5B.91.5和92C.91和91.5D.92和92

【例2】(2016•唐山一模)为迎接即将举行的集体跳绳比赛,高一年级对甲、乙两个代表队各进行了6轮

测试,测试成绩(单位:次/分钟)如表:

轮次—二-四五六

甲736682726376

乙83756269756S

(1)补全茎叶图并指出乙队测试成绩的中位数和众数;

(2)试用统计学中的平均数、方差知识对甲乙两个代表队的测试成绩进行分析.

【变式1】如图,茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分).已知甲组

数据的中位数为15,乙组数据的平均数为16.8,则x,y的值分别为()

甲组乙组

909

x215v8

7424

A.2,5B.5,5C.5,8D.8,8

【变式2](2015秋•宣城期末)甲、乙两位学生参加数学竞赛培训,现分别从他们在培训期间参加的若干

次预赛成绩中随机抽取8次,记录如下:

甲S2S17978958S93S4

乙92958075S3809085

(1)用茎叶图表示这两组数据;

(2)现要从中选派一人参加数学竞赛,从统计学的角度(在平均数、方差或标准差中选两个)考虑,你

认为选派哪位学生参加合适?请说明理由.

题型二频率分布直方图

【例1】(教材习题改编)某校为了了解教科研工作开展状况与教师年龄之间的关系,将该校不小于35岁的

80名教师按年龄分组,分组区间为[35,40),[40,45),[45,50),[50,55),[55,60],由此得到频率分布直方图如

图,则这80名教师中年龄小于45岁的有人.

【例2】(2017・济南调研)为了研究某药品的疗效,选取若干名志愿者进行临床试验.所有志愿者的舒张压数

据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分

别编号为第一组,第二组,……,第五组.下图是根据试验数据制成的频率分布直方图.已知第一组与第二组

共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为.

【变式1】(2017•东台市模拟)从高三年级随机抽取100名学生,将他们的某次考试数学成绩绘制成频率

分布直方图.由图中数据可知成绩在[130,140)内的学生人数为.

【变式2](2016秋•威海期末)从某小学随机抽取100名同学,将他们的身高(单位:厘米)数据绘制成

频率分布直方图(如图).若要从身高在[100,110),[110,120),[120,130)三组内的学生中,用分

层抽样的方法选取28人参加一项活动,则从身高在[120,130)内的学生中选取的人数应为.

【例3】(2016•四川卷)我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居民用水情况进行

了调查.通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),....

[4,4.5]分成9组,制成了如图所示的频率分布直方图.

(1)求直方图中。的值;

(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,说明理由;

(3)估计居民月均用水量的中位数.

【变式3】(2017•灵丘县四模)为对考生的月考成绩进行分析,某地区随机抽查了10000名考生的成绩,

(1)求成绩在[600,650)的频率;

(2)根据频率分布直方图算出样本数据的中位数;

(3)为了分析成绩与班级、学校等方面的关系,必须按成绩再从这10000人中用分层抽样方法抽出20

人作进一步分析,则成绩在[550,600)的这段应抽多少人?

【例4】(2017•唐山二模)共享单车的出现方便了人们的出行,深受我市居民的喜爱.为调查某校大学生

对共享单车的使用情况,从该校8000名学生中按年级用分层抽样的方式随机抽取了100位同学进行调查,

得到这100名同学每周使用共享单车的时间(单位:小时)如表:

(1)已知该校大一学生由2400人,求抽取的100名学生中大一学生人数;

(2)作出这些数据的频率分布直方图;

(3)估计该校大学生每周使用共享单车的平均时间r(同一组中的数据用该组区间的中点值作代表).

【变式4](2014.全国I卷)从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测

量结果得如下频数分布表:

质量指标值[75,85)[85,95)[95,105)[105,115)[115,125]

分组

频数62638228

(1)作出这些数据的频率分布直方图:

(2)估计这种产品质量指标值的平均数及方差(同一组中的数据用该组区间的中点值作代表);

(3)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要

占全部产品80%”的规定?

【例5】(2017•肇庆三模)某市房产契税标准如下:

购房总价(万)(0,200](200,400](400,+oo]

税率1%1.5%3%

,整理得到了如下的频率分

购房总价(百万)

(1)假设该小区已经出售了2000套住房,估计该小区有多少套房子的总价在300万以上,说明理由.

(2)假设同组中的每个数据用该组区间的右端点值代替,估计该小区购房者缴纳契税的平均值.

【变式5](2016•北京卷)某市居民用水拟实行阶梯水价,每人月用水量中不超过w立方米的部分按4元/立

方米收费,超出w立方米的部分按10元/立方米收费.从该市随机调查了10000位居民,获得了他们某月的

用水量数据,整理得到如下频率分布直方图:

(1)如果W为整数,那么根据此次调查,为使80%以上居民在该月的用水价格为4元/立方米,W至少

定为多少?

(2)假设同组中的每个数据用该组区间的右端点值代替.当w=3时,估计该市居民该月的人均水费.

3课后作业

1.重庆市2016年各月的平均气温(℃)数据的茎叶图如图,则这组数据的中位数是()

089

1258

200338

312

A.19B.20C.21.5D.23

2.我国古代数学名著《数书九章》有“米谷粒分”题:粮仓开仓收粮,有人送来米1534石,验得米内夹谷,

抽样取米一把,数得254粒内夹谷28粒,则这批米内夹谷约为()

A.134石B.169石C.338石D.1365石

3.某班的全体学生参加英语测试,成绩的频率分布直方图如图,数据的分组依次为[20,40),[40,60),[60,80),

180J00J.若低于60分的人数是15,则该班的学生人数是()

A.45B.50C.55D.60

4.(2016•全国卷III)某旅游城市为向游客介绍本地的气温情况,绘制了一年中各月平均最高气温和平均最低

气温的雷达图.图9-3-11中A点表示十月的平均最高气温约为15°C,8点表示四月的平均最低气温约为5℃.

下面叙述不正确的是()

一月

A.各月的平均最低气温都在0℃以上B.七月的平均温差比一月的平均温差大

C.三月和十一月的平均最高气温基本相同D.平均最高气温高于20℃的月份有5个

5.(2015♦广东)某城市100户居民的月平均用电量(单位:度),以[160,180),[180,200),[200,220),

[220,240),[240,260),[260,280),[280,300)分组的频率分布直方图如图.

(1)求直方图中X的值;

(2)求月平均用电量的众数和中位数;

(3)在月平均用电量为,[220,240),[240,260),[260,280),[280,300)的四组用户中,用分层

抽样的方法抽取11户居民,则月平均用电量在[220,240)的用户中应抽取多少户?

第3节线性回归方程

最新考纲:1.会做两个有关联变量的数据的散点图,并利用散点图认识变量间的相关关系2

了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程(线性回归系

数公式不要求记忆).3.了解回归分析的基本思想、方法及其简单应用.

1知识梳理

1.变量间的关系

变量间的关系常见的有两类,一类是确定性关系,即函数关系;另一类是变量与变量之间的虽然确定存在

关系,但是却不具有函数关系所要求的确定性,它们的关系是当自变量取值一定时,因变量的取值带有一

定的随机性的两个变量间的关系,我们把这种关系称为相关关系。

2相关关系与函数关系的异同点

(1)相同点:两者均是指两个变量间的关系

(2)不同点:①函数关系是--种确定性的关系,如正方形的面积S与其边长a的关系;相关关系是一种非

确定的关系,如人的身高与体重的关系。②函数关系是一种因果关系,该关系是确定的,不受其他因素的

影响,而相关关系不一定是因果关系,也可能是伴随关系。

2.回归分析

回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法;判断相关性的常用统计图是散

点图;统计量有相关系数与相关指数.

(1)在散点图中,点散布在从左下角到右上角的区域,对于两个变量的这种相关关系,我们将它称为正

相关.

(2)在散点图中,点散布在从左上角到右下角的区域,两个变量的这种相关关系称为负相关.

(3)如果散点图中点的分布从整体上看大致在二»线附近,称两个变量具有线性相关关系.

3.线性回归方程

(1)最小二乘法:使得样本数据的点到回归直线的距离的平方和最小的方法叫做最小二乘法.

(2)回归方程:两个具有线性相关关系的变量的一组数据:(汨,y),(必,》),.・.,(为,%),其回归方

人人八-x)(y-y)-nxy人八

程为;=£+:,贝忖=上匕-------f----=与----------,。=亍-金"其中,;是回归方程的斜率,。是在y

£(X,-X)2^xf-nx2

i=li=\

轴上

的截距.

4.相关系数

_,1

Z(Xi-x)(y,-y)

«.计算公式:r=J“

£(占一方£(%一7)2

Vi=l/=1

h.当r>0时,表明两个变量正相关;当/<0时,表明两个变量负相关.

,•的绝对值越接近于1,表明两个变量的线性相关性越强.,•的绝对值越接近于0,表明两个变量之间相关性

越弱.通常仍大于0.75时,认为两个变量有很强的线性相关性.

2题型分类

题型一相关关系的判断

【例】某公司2010〜2015年的年利润x(单位:百万元)与年广告支出y(单位:百万元)的统计资料如

下表所示:

年份201020112012201320142015

利润X12.214.6161820.4223

支H1.V0.620.740.810.891.001.11

根据统计资料,则()

A.利润中位数是16,x与y有正线性相关.关系

B.利润中位数是17,x与y有正线性相关关系

C.利润中位数是17,x与y有负线性相关关系

D.利润中位数是18,x与y有负线性相关关系

【变式】对变量x,y有观测数据(为,%)(i=1,2....10),得散点图(1);对变量”,v有观测数据(跖,%•)«

=1,2,…,10),得散点图(2).由这两个散点图可以判断()

01234567«01234567u

图⑴图⑵

A.变量x与),正相关,“与v正相关

B.变量x与),正相关,〃与u负相.关

C.变量x与y负相关,〃与v正相关

D.变量x与y负相关,〃与v负相关

题型二线性回归分析

[例1](2017•延边州模拟)如表提供了某厂节能降耗改造后在生产A产品过程中记录的产量x(吨)与

相应的生产能耗y(吨)的几组对应数据,根据表中提供的数据,求出y关于x的线性回归方程为y=0.7x+0.35,

则下列结论错误的是()

X3456

y2.5t44.5

A.线性回归直线一定过点(4.5,3.5)

B.产品的生产能耗与产量呈正相关

C.f的取值必定是3.15

D.A产品每多生产1吨,则相应的生产能耗约增加0.7吨

【变式1](2017•南昌一模)设某中学的高中女生体重y(单位:侬)与身高x(单位:cm)具有线性相关

关系,根据一组样本数据(孙y)(i=l,2,3,…,"),用最小二乘法近似得到回归直线方程为=0.85x-85.71,

则下列结论中不正确的是()

A.),与x具有正线性相关关系

B.回归直线过样本的中心点注,亍)

C.若该中学某高中女生身高增加1cm,则其体重约增加0.85kg

D.若该中学某高中女生身高为160cm,则可断定其体重必为50.29kg

【例2】(2017•西青区模拟)为了解某社区居民的家庭年收入所年支出的关系,随机调查了该社区5户家

庭,得到如下统计数据表:

收入X(万

S.28.610.011.311.9

元)

支出y(万

6.27.58.08.59.8

元)

据上表得回归直线方程》=%+&,其中g=0.76,a=y-Q,据此估计,该社区一户收入为15万元家庭

年支出为()

A.11.4万元B.11.8万元C.12.0万元D.12.2万元

【变式2](2017•成都四模)广告投入对商品的销售额有较大影响.某电商对连续5个年度的

广告费和销售额进行统计,得到统计数据如表(单位:万元):

广告费X73456

销售额y2941505971

由表可得到回归方程为f=io.2x+a,据此模型,预测广告费为io万元时的销售额约为()

A.101.2B.108.8C.111.2D.118.2

题型三线性相关关系检验

【例1】(2017•广西一模)在两个变量y与x的回归模型中,分别选择了四个不同的模型,它们的相关指

数R2如下,其中拟合效果最好的为()

A.模型①的相关指数为0.976B.模型②的相关指数为0.776

C.模型③的相关指数为0.076D.模型④的相关指数为0.351

【例2】(2015春•祁县期中)某电脑公司有6名产品推销员,其工作年限与年推销金额数据如下表:

推销员编号12345

工作年限X,年35679

推销金额y万元93345

求年推销金额y与工作年限x之间的相关系数.

【变式】(2017•泉州模拟)关于衡量两个变量y与x之间线性相关关系的相关系数/■与相关指数R2中,下

列说法中正确的是()

A.r越大,两变量的线性相关性越强B.R?越大,两变量的线性相关性越强

C.厂的取值范围为(-00,+00)D.R?的取值范围为[0,+oo)

题型四线性回归方程

【例1】(2017•乐东县一模)某公司经营--批进价为每件4百元的商品,在市场调查时发现,此商品的销

售单价x(百元)与日销售量y(件)之间有如下关系:

X(百元)567S9

《件)108961

(1)求〉关于x的回归直线方程;

(2)借助回归直线方程请你预测,销售单价为多少百元(精确到个位数)时,日利润最大?

【变式1](2017•全国模拟)从某居民区随机抽取10个家庭,获得第i个家庭的月收入为(单位:千元)

10101010

与月储蓄M(单位:千元)的数据资料,算得[>=80,2>=20,2>旧=184,2>”720.

i=\i=lf=li=l

(1)求家庭的月储蓄y关于月收入x的线性回归方程》=&+&;

(2)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄.

【例2】(2017•甘肃一模)如图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图

3点

w姿

ls

iH

(1)由折线图看出,可用线性回归模型拟合y与,的关系,请用相关系数加以说明;

(2)建立y关于f的回归方程(系数精确到0.01),预测2017年我国生活垃圾无害化处理量.

777

参考数据:Zy,=9.32,X,*=40.17,^(y,,-y)2=0.55,V?®2.646.

i=li=lVi=l

Z&-7)(必一刃

参考公式:相关系数r=/=1,回归方程>^=4+比中斜率和截距的最小二乘估计公式

In"

吃(力-刃2

Vi=li=l

£(—)(­)

分别为:b=---------------,a=y—bt.

Z(—)2

i=\

【例3】(2017•河南一模)为了对2016年某校中考成绩进行分析,在60分以上的全体同学中随机抽出8

位,他们的数学分数(已折算为百分制)从小到大排是60、65、70、75、80、85、90、95,物理分数从小

到大排是72、77、80、84、88、90、93、95.

(1)若规定85分以上为优秀,求这8位同学中恰有3位同学的数学和物理分数均为优秀的概率;

(2)若这8位同学的数学、物理、化学分数事实上对应如下表:

学生编号1234567S

数学分数X6065707580S59095

物理分数y7277SOS488909395

化学分数z677276SO84S79092

①用变量y与x、z与x的相关系数说明物理与数学、化学与数学的相关程度;

②求y与x、z与x的线性回归方程(系数精确到0.01),当某同学的数学成绩为50分时,估计其物理、

化学两科的得分.

Z(七-x)(yt-y)Z(匹-X)(y/-y)

参考公式:相关系数r=f----------

1f(a-x)力

V1=1i=lT

__8_8_8

参考数据:x=77.5,亍=85,z=81,22(x,-x)2«1050,^(y,-y)2=456,^(z,--z)2-550,

i=li=lZ=1

8__8_______________

2(七一工)(必一y)才668,-x)(Zj-z)«755,Jl050—32.4,J456n21.4,J550k23.5.

/=1/=1

【变式2](2017•汕头一模)二手车经销商小王对其所经营的A型号二手汽车的使用年数x与销售价格)

(单位:万元/辆)进行整理,得到如下数据:

使用年数X734567

售价y2012S6.44.43

z=lny3.002.482.081.861.481.10

下面是z关于x的折线图:

(1)由折线图可以看出,可以用线性回归模型拟合z与x的关系,请用相关数加以说明;

(2)求y关于x的回归方程并预测某辆A型号二手车当使用年数为9年时售价约为多少?(公育小数点

后保留两位有效数字).

(3)基于成本的考虑,该型号二手车的售价不得低于7118元,请根据(2)求出的回归方程预测在收购

该型号二手车时车辆的使用年数不得超过多少年?

In1.46»0.38,ln0.7118»0.34.

【例4】(2015高考新课标1,文19)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x

(单位:千元)对年销售量y(单位:f)和年利润z(单位:千元)的影响,对近8年的宣传费占和年销售

量y(i=l,2,,8)数据作了初步处理,得到下面的散点图及一些统计量的值.

620

600

£r

58制0

二♦

540

520r♦

500,

480立

343840:4446485

年宫传费/F元

8_8__

之(玉-龙)2工(叱-卬fZ(玉一x)(y,•一y)Z(w-W)(K-y)

XW

1=1i=li=lZ=1

46.656.36.8289.81.61469108.8

表中叱=«',W=:之”・

U/=1

(1)根据散点图判断,y=。+"与y=c+dG,哪一个适宜作为年销售量y关于年宣传费x的回归.方

程类型(给出判断即可,不必说明理由);

(2)根据(I)的判断结果及表中数据,建立y关于x的回归方程.

附:对于一组数据(%,%),(%,均),……,(%,%)淇回归线叩a+例的斜率和截距的最小二乘估计分别为:

Z(%-“)(匕-V)

3=^4-------------------------

/=1

【变式3](2017•衡水金卷一模)某种新产品投放市场一段时间后,经过调研获得了时间x(天

数)与销售单价y(元)的一组数据,且做了一定的数据处理(如表),并作出了散点图(如

图).

10101010

XyZ仕厂工L⑴厂常)22(工「7)。"-亍)

/=17=1/=17—1

1.6337.80.895.150.92-20.618.40

表中“=—,w=—V'w,...

人•

(1)根据散点图判断,y=bx+a,亍=4+£哪一个更适宜作价格y关'■

X

于时间X的回归方程类型?(不必说明理由)

(2)根据判断结果和表中数据,建立y关于x的回归方程:R;

(3)若该产品的日销售量g(x)(件)与时间x的函数关系为8(X)=二@+120(xEN-),

X

求该产品投放市场第几天的销售额最高?最高为多少元?

3课后作业

1.(2015•全国卷H)根据下面给出的2004年至2013年我国二氧化硫年排放量(单位:万吨)柱形图,以下结论

中不正确的是()

A.逐年比较,2008年减少二氧化硫排放量的效果最显著

B.2007年我国治理二氧化硫排放显现成效

C.2006年以来我国二氧化硫年排放量呈减少趋势

D.2006年以来我国二氧化硫年排放量与年份正相关

2.(2017・贵阳检测)若8名学生的身高和体重数据如下表:

编号12345678

身高/cm165165157170175165155170

体重/kg48575464614359

第3名学生的体重漏填,但线性回归方程是y=0.849x-85.712,则第3名学生的体重估计为kg.

3.(2017•合肥三模)网络购物已经成为一种时尚,电商们为了提升知名度,加大了在媒体上的广告投入.经

统计,近五年某电商在媒体上的广告投入费用x(亿元)与当年度该电商的销售收入y(亿元)的数据如下

表:):

年份2012年2013年201420152016

广告投入X0.80.911.11.2

销售收入y1623252630

(1)求y关于x的回归方程;

(2)2017年度该电商准备投入广告费1.5亿元,利用(I)中的回归方程,预测该电商2017年的销售收

入.

2(占7)(乃7)„

附:回归直线的斜率和截距的最小二乘估计公式分别为:6=上匕-----------,选用数据:=123.1,

/=1

£*=5.1

i=\

4.(2017•包头一模)如图是某企业2010年至2016年污水净化量(单位:吨)的折线图.

A56

・55

¥

54

«-*53

52

!lc

注:年份代码1〜7分别对应年份2010〜2016.

(1)由折线图看出,可用线性回归模型拟合y和f的关系,请用相关系数加以说明;

(2)建立y关于f的回归方程,预测2017年该企业污水净化量;

(3)请用数据说明回归方程预报的效果.

7__7

附注:参考数据:亍=54,Z6」)(--亍)=21,V14»3.74,2(%

/=!i=l

ZG一。(为一)')Z亿—)(%-丫)

参考公式:相关系数,=_j=0--------------g----------.反映回归效果的公式为

1归&一黄⑵皆如孑

V/=ii=i,=|

网=1-%--------,其中R2越接近于1,表示回归的效果越好

/=1

第4节独立性检验

最新考纲:了解独立性检验(只要求2x2列联表)的思想、方法及其初步应用.

1知识梳理

一.2x2列联表

1.列联表

用表格列出的分类变量的频数表,叫做列联表。

2.2x2列联表

对于两个事件A,B,列出两个事件在两种状态下的数据,如下表所示:

事件B事件与合计

事件Aaba+b

事件]Cdc+d

合计a+cb+da+b+c+d

这样的表格称为2x2列联表。

二.卡方统计量公式

为了研究分类变量X与Y的关系,经调查得到一张2x2列联表,如下表所示

Yi丫2合计

X,aha+b

x2cdc+d

合计a+cb+dn=a+b+c+d

统计中有一个有用的(读做“卡方”)统计量,它的表达式是:看许

("=a+Z?+c+”为样本容量)。

【例1】(2017•甘肃模拟)某研究性学习小组调查研究性别对喜欢吃甜食的影响,部分统计数据如表:

女生男生合计

喜欢吃甜食8412

不喜欢吃甜食7161S

合计102030

附表:

P(K

0.150.100.050.0250.0100.0050.001

2

>k0)

ko2.0722.7063.8415.02

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论