数学高考总复习:统计_第1页
数学高考总复习:统计_第2页
数学高考总复习:统计_第3页
数学高考总复习:统计_第4页
数学高考总复习:统计_第5页
已阅读5页,还剩18页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数学高考总复习:统计知识网络

目标认知

考试大纲要求:

1.理解随机抽样的必要性和重要性;会用简单随机抽样方法从总体中抽取样本;了解分层抽样和系统

抽样方法.

2.了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率折线图、茎叶图,理解它们

各自的特点.

3.理解样本数据标准差的意义和作用,会计算数据标准差;能从样本数据中提取根本的数字特征〔如

平均数、标准差〕,并作出合理的解释.

4.会用样本的频率分布估计总体分布,会用样本的根本数字特征估计总体的根本数字特征,理解用样

本估计总体的思想.

5.会用随机抽样的根本方法和样本估计总体的思想,解决一些简单的实际问题.

6.会作两个有关联变量数据的散点图,会利用散点图认识变量间的相关关系;了解最小二乘法的思

想,能根据给出的线性回归方程系数公式建立线性回归方程.

7.利用实际问题的直方图,了解正态分布曲线的特点及曲线所表示的意义.

8.了解以下一些常见的统计方法〔独立性检验〔只要求2×2列联表〕、假设检验、聚类分析、回归〕

的根本思想、方法,并能应用这些方法解决一些实际问题;

重点:

1.会用简单随机抽样、系统抽样、分层抽样等常用的抽样方法从总体中抽取样本.

2.会用样本频率分布去估计总体分布.

3.频率分布表和频率分布直方图的绘制.

4.了解正态分布的意义及主要性质.

5.了解线性回归的方法和简单应用.

难点:

用样本频率分布去估计总体分布,频率分布表和频率分布直方图的绘制.正态分布的意义及主要性质,线性回归的方法和简单应用.

知识要点梳理

知识点一:抽样方法

从调查的对象中按照一定的方法抽取一局部,进行调查或观测,获取数据,并以此对调查对象的某项指标做出推断,这就是抽样调查.调查对象的全体称为总体,被抽取的一局部称为样本.

1.简单的随机抽样

简单随机抽样的概念:

设一个总体的个体数为N.如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率相等,就称这样的抽样为简单随机抽样.

①用简单随机抽样从含有N个个体的总体中抽取一个容量为n的样本时,每次抽取一个个体时,任一个

体被抽到的概率为;在整个抽样过程中各个个体被抽到的概率为;

②简单随机抽样的特点是:不放回抽样,逐个地进行抽取,各个个体被抽到的概率相等;

③简单随机抽样方法表达了抽样的客观性与公平性,是其他更复杂抽样方法的根底.

简单抽样常用方法:

①抽签法:先将总体中的所有个体(共有N个)编号(号码可从1到N),并把号码写在形状、大小相同的号

签上(号签可用小球、卡片、纸条等制作),然后将这些号签放在同一个箱子里,进行均匀搅拌,抽

签时每次从中抽一个号签,连续抽取n次,就得到一个容量为n的样本.

适用范围:总体的个体数不多.

优点:抽签法简便易行,当总体的个体数不太多时适宜采用抽签法.

②随机数表法:随机数表抽样“三步曲”:第一步,将总体中的个体编号;第二步,选定开始的数

字;第三步,获取样本号码.

2.系统抽样:

当总体中的个体数较多时,可将总体分成均衡的几个局部,然后按预先制定出的规那么,从每一局部抽取一个个体,得到需要的样本,这种抽样叫做系统抽样.

系统抽样的步骤:

①采用随机的方式将总体中的个体编号,为简便起见,有时可直接采用个体所带有的号码,如考生的

准考证号、街道上各户的门牌号等等.

②为将整个的编号分段(即分成几个局部),要确定分段的间隔.当是整数时(N为总体中的个体

的个数,n为样本容量),;当不是整数时,通过从总体中剔除一些个体使剩下的总体中

个体的个数能被n整除,这时.

③在第一段用简单随机抽样确定起始的个体编号.

④按照事先确定的规那么抽取样本(通常是将加上间隔,得到第2个编号,第3个编号,这

样继续下去,直到获取整个样本).

注意:

①系统抽样适用于总体中的个体数较多的情况,它与简单随机抽样的联系在于:将总体均分后的每一

局部进行抽样时,采用的是简单随机抽样;

②与简单随机抽样一样,系统抽样是等概率抽样,它是客观的、公平的

③总体中的个体数恰好能被样本容量整除时,可用它们的比值作为系统抽样的间隔;当总体中的个体

数不能被样本容量整除时,可用简单随机抽样先从总体中剔除少量个体,使剩下的个体数能被样本

容量整除再进行系统抽样.

3.分层抽样:

当总体由差异明显的几局部组成时,为了使样本更充分地反映总体的情况,常将总体分成几局部,然后按照各局部所占的比例进行抽样,这种抽样叫做分层抽样,所分成的局部叫做层.

4.常用的三种抽样方法的比拟:类别共同点不同点联系适用范围简单随机抽样抽样过程中每个个体被抽取的概率相等从总体中逐个抽取是后两种方法的根底总体个数较少系统抽样将总体均分成几局部,按事先确定的规那么在各部门抽取在起始局部抽样时用简单随机抽样总体个数较多分层抽样将总体分成几层,分层进行抽取各层抽样时采用简单随机抽样或系统抽样总体由差异明显的几局部组成注意:

〔1〕各种抽样的个体被抽到的概率相等;

〔2〕抽样过程中个体被抽到的概率相等.

5.不放回抽样和放回抽样:

在抽样中,如果每次抽出个体后不再将它放回总体,称这样的抽样为不放回抽样;如果每次抽出个体后再将它放回总体,称这样的抽样为放回抽样.

随机抽样、系统抽样、分层抽样都是不放回抽样.

知识点二:统计

1.统计图表包括条形图、折线图、饼图、茎叶图.

2.刻画一组数据集中趋势的统计量有平均数、中位数、众数.

平均数:

刻画一组数据离散程度的统计量有极差、方差、标准差.

方差:.

3.总体分布

(1)总体:在数理统计中,通常把被研究的对象的全体叫做总体.

(2)频率分布;用样本估计总体,是研究统计问题的根本思想方法,样本中所有数据(或数据组)的频数

和样本容量的比,就是该数据的频率.所有数据(或数据组)的频率的分布变化规律叫做样本的频率

分布.可以用样本频率表、样本频率分布条形图或频率分布直方图来表示.

(3)频率分布直方图中每个小矩形的宽度为(分组的宽度),小矩形的面积为相应的频率,高为

.

(4)频率折线图:在频率分布直方图中,按照分组原那么,再在左、右两边各加一个区间,从所加的左边

区间的中点开始,用线段依次连接各个矩形的顶端中点,直至右边所加区间的中点,所得到的折线

称为频率折线图.

(5)总体分布:从总体中抽取一个个体,就是一次随机试验,从总体中抽取一个容量为n的样本,就是

进行了n次试验,试验所出现的结果叫随机事件,所有这些事件的概率分布规律称为总体分布.

(6)总体密度曲线:样本容量越大,所分组数越多,各组的频率就越接近于总体在相应各组取值的概

率.设想样本容量无限增大,分组的组距无限缩小,那么频率分布直方图就会无限接近于一条光滑

曲线,这条曲线叫做总体密度曲线.

它反映了总体在各个范围内取值的概率.根据这条曲线,可求出总体在区间内取值的概率等

于总体密度曲线,直线、及轴所围图形的面积.

(7)总体分布密度曲线函数的两条根本性质:

①,;②由曲线与轴围成的总面积为1.

知识点三:正态分布

1.正态分布密度函数:

,〔σ>0,-∞<μ<+∞〕

其中π是圆周率;e是自然对数的底;x是随机变量的取值;μ为正态分布的均值;σ是正态分布的标准差.正态分布一般记为,它的密度曲线简称正态曲线

2.正态曲线:

函数的图象为正态分布密度函数曲线,简称正态曲线

3.正态曲线的性质:

正态分布由参数μ、σ唯一确定,如果随机变量~N(μ,σ2),根据定义有:μ=E,σ=D.

正态曲线具有以下性质:

〔1〕曲线在x轴上方,与x轴不相交.

〔2〕曲线关于直线对称.

〔3〕曲线在时位于最高点.

〔4〕当时,曲线上升;当时,曲线下降.并且当曲线向左、右两边无限延伸时,以x轴为

渐近线,向它无限靠近.

〔5〕当一定时,曲线的形状由确定.越大,曲线越“矮胖”,表示总体的分布越分散;越

小,曲线越“瘦高”,表示总体的分布越集中.

4.标准正态曲线:

当μ=0、σ=l时,正态总体称为标准正态总体,其相应的函数表示式是,其相应的曲线称为标准正态曲线

标准正态总体N〔0,1〕在正态总体的研究中占有重要的地位.任何正态分布的概率问题均可转化成标准正态分布的概率问题.

5.标准正态总体的概率问题:

对于标准正态总体N〔0,1〕,是总体取值小于的概率,即,其中,图中阴影局部的面积表示为概率.只要有标准正态分布表即可查表解决.从图中不难发现:当时,;而当时,Φ〔0〕=0.5;

标准正态总体在任意区间内取值的概率,即直线,与正态曲线、x轴所围成的曲边梯形的面积.

6.非标准正态总体在某区间内取值的概率:可以通过转化成标准正态总体,然后查标准正态分布表即可.在这里重点掌握如何转化,首先要掌握正态总体的均值和标准差,然后进行相应的转化.

知识点四:回归分析和独立性检验

1.散点图:将两个变量所对应的点描在直角坐标系中,这些点组成了变量之间的一个图,称为变量之间的散点图.散点图形象地反映了各对数据的密切程度.粗略地看,散点分布具有一定的规律.

如果变量之间存在某种关系,这些点会有一个集中趋势,这种趋势通常可以用一条光滑的曲线来近似表示,这样近似的过程称为曲线拟合.

2.相关关系:当自变量一定时,因变量的取值带有一定的随机性的两个变量之间的关系称为相关关系.

3.线性相关:假设两个变量的散点图中,所有点看上去都在一条直线附近波动,那么称变量间是线性相关的.假设所有点看上去都在某条曲线(不是直线)附近波动,那么称此相关为非线性相关的;如果所有的点在散点图中没有任何关系,那么称变量间是不相关的.

4.相关关系与函数关系的异同点如下:

相同点:均是指两个变量的关系.

不同点:函数关系是一种确定的关系;而相关关系是一种非确定关系;函数关系是自变量与因变量之间的关系,这种关系是两个非随机变量的关系;而相关关系是非随机变量与随机变量的关系.

5.回归分析一元线性回归分析:对具有相关关系的两个变量进行统计分析的方法叫做回归分析.通俗地讲,回归分析是寻找相关关系中非确定性关系的某种确定性.

对于线性回归分析,我们要注意以下几个方面:

(1)回归分析是对具有相关关系的两个变量进行统计分析的方法.两个变量具有相关关系是回归分析的

前提.

(2)散点图是定义在具有相关关系的两个变量根底上的,对于性质不明确的两组数据,可先作散点图,

在图上看它们有无关系,关系的密切程度,然后再进行相关回归分析.

(3)求回归直线方程,首先应注意到,只有在散点图大致呈线性时,求出的回归直线方程才有实际意

义,否那么,求出的回归直线方程毫无意义.

6.回归直线

设所求的直线方程为,其中a、b是待定系数.

,,

相应的直线叫做回归直线,对两个变量所进行的上述统计分析叫做回归分析.

7.相关系数:相关系数是因果统计学家皮尔逊提出的,对于变量y与x的一组观测值,把

=

叫做变量y与x之间的样本相关系数,简称相关系数,用它来衡量两个变量之间的线性相关程度.

8.相关系数的性质:≤1,且越接近1,相关程度越大;且越接近0,相关程度越小.

9.显著性水平:显著性水平是统计假设检验中的一个概念,它是公认的小概率事件的概率值,它必须在每一次统计检验之前确定.

10.显著性检验:(相关系数检验的步骤)由显著性水平和自由度查表得出临界值,显著性水平一般取0.01和0.05,自由度为n-2,其中n是数据的个数.在“相关系数检验的临界值表”查出与显著性水平0.05或0.01及自由度n-2〔n为观测值组数〕相应的相关数临界值r0.05或r0.01;例如n=7时,r0.05=0.754,r0.01=0.874.求得的相关系数r和临界值r0.05比拟,假设r>r0.05,上面y与x是线性相关的,当≤r0.05或r0.01,认为线性关系不显著

11.小概率事件的含义:发生概率一般不超过5%的事件,即事件在一次试验中几乎不可能发生.

假设检验方法的根本思想:首先,假设总体应是或近似为正态总体,然后,依照小概率事件几乎不可能在一次试验中发生的原理对试验结果进行分析.

假设检验方法的操作程序,即“三步曲”

一是提出统计假设,教科书中的统计假设总体是正态总体;

二是确定一次试验中的a值是否落入(μ-3σ,μ+3σ);

三是作出判断.

规律方法指导

解答正态分布问题,从考纲要求来看,只要掌握有关对称区间概率的计算.经典例题精析

类型一:随机抽样

1.某公司在甲、乙、丙、丁四个地区分别有150个、120个、180个、150个销售点.公司为了调查产品销售的情况,需从这600个销售点中抽取一个容量为100的样本,记这项调查为①;在丙地区中有20个特大型销售点,要从中抽取7个调查其销售收入和售后效劳情况,记这项调查为②.那么完成①、②这两项调查宜采用的抽样方法依次是()

A.分层抽样法,系统抽样法B.分层抽样法,简单随机抽样法

C.系统抽样法,分层抽样法D.简单随机抽样法,分层抽样法

思路点拨:此题为抽样方法的选取问题.当总体中个体较多而且差异又不大时宜采用系统抽样,采用系统抽样在每小组内抽取时应按规那么进行;当总体中的个体差异较大时,宜采用分层抽样;当总体中个体较少时,宜采用随机抽样.

解析:依据题意,第①项调查应采用分层抽样l法、第②项调查应采用简单随机抽样法.应选B.

总结升华:采用什么样的抽样方法要依据研究的总体中的个体情况来定.

举一反三:

【变式1】甲校有3600名学生,乙校有5400名学生,丙校有1800名学生,为统计三校学生某方面的情况,方案采用分层抽样法,抽取一个样本容量为90人的样本,应在这三校分别抽取学生〔〕

A.30人,30人,30人B.30人,45人,15人

C.20人,30人,10人D.30人,50人,10人

【答案】B;根据样本容量和总体容量确定抽样比,最终得到每层中学生人数.

【变式2】一个总体中有100个个体,随机编号为0,1,2,…,99,依编号顺序平均分成10个小组,组号依次为l,2,3,…,10.现用系统抽样方法抽取一个容量为10的样本,规定如果在第1组随机抽取的号码为m,那么在第最小组中抽取的号码个位数字与m+k的个位数字相同.假设m=6,那么在第7组中抽取的号码是________.

【答案】∵,,∴∴在第7小组中抽取的号码是63.

【变式3】某单位最近组织了一次健身活动,活动分为登山组和游泳组,且每个职工至多参加了其中一组.在参加活动的职工中,青年人占42.5%,中年人占47.5%,老年人占10%.登山组的职工占参加活动总人数的,且该组中,青年人占50%,中年人占40%,老年人占10%.为了了解各组不同的年龄层次的职工对本次活动的满意程度,现用分层抽样的方法从参加活动的全体职工中抽取一个容量为200的样本.试确定

〔Ⅰ〕游泳组中,青年人、中年人、老年人分别所占的比例;

〔Ⅱ〕游泳组中,青年人、中年人、老年人分别应抽取的人数.

【答案】

〔Ⅰ〕设登山组人数为,游泳组中,青年人、中年人、老年人各占比例分别为a、b、c,

那么有,解得

故a=100%-50%-10%=40%,

即游泳组中,青年人、中年人、老年人各占比例分别为40%、50%、10%.

〔Ⅱ〕游泳组中,抽取的青年人数为〔人〕;

抽取的中年人数为50%=75〔人〕;

抽取的老年人数为10%=15〔人〕.

类型二:用样本估计总体

2.对某电子元件进行寿命追踪调查,情况如下:寿命〔h〕100~200200~300300~400400~500500~600个数2030804030〔1〕列出频率分布表;

〔2〕画出频率分布直方图和累积频率分布图;

〔3〕估计电子元件寿命在100~400h以内的概率;

〔4〕估计电子元件寿命在400h以上的概率.

思路点拨:通过此题可掌握总体分布估计的各种方法和步骤.

解析:〔1〕频率分布表如下:寿命〔h〕频数频率累积频率100~200200.100.10200~300300.150.25300~400800.400.65400~500400.200.85500~600300.151合计2001〔2〕频率分布直方图如下:

〔3〕由累积频率分布图可以看出,寿命在100~400h内的电子元件出现的频率为0.65,所以我们估计

电子元件寿命在100~400h内的概率为0.65.

〔4〕由频率分布表可知,寿命在400h以上的电子元件出现的频率为0.20+0.15=0.35,故我们估计电

子元件寿命在400h以上的概率为0.35.

总结升华:画频率分布条形图、直方图时要注意纵、横坐标轴的意义.

举一反三:

【变式1】为了了解某地区高三学生的身体发育情况,抽查了该地区100名年龄为17.5岁-18岁的男生体重(kg),得到频率分布直方图如下:

根据上图可得这100名学生中体重在〔56.5,64.5〕的学生人数是〔〕

(A)20(B)30(C)40〔D〕50

【答案】C;根据运算的算式:体重在〔56.5,64.5〕学生的累积频率为2×0.03+2×0.05+2×0.05+2×0.07=0.4,那么体重在〔56.5,64.5〕学生的人数为0.4×100=40.

【变式2】某班学生在一次数学考试中成绩分布如下表:分数段[0,80〕[80,90〕[90,100〕人数256分数段[100,110〕[110,120)[120,130〕人数8126分数段[130,140〕[140,150〕人数42那么分数在[100,110〕中的频率和分数不满110分的累积频率分别是_____、______〔精确到0.01〕.

【答案】由频率计算方法知:总人数=45.

分数在[100,110〕中的频率为=0.178≈0.18.

分数不满110分的累积频率为=≈0.47

【变式3】为检测某种产品的质量,抽取了一个容量为30的样本,检测结果为一级品5件,二级品8件,三级品为13件,次品4件

〔1〕列出样本频率分布表;

〔2〕画出表示样本频率分布的条形图;

〔3〕根据上述结果,估计商品为二级品或三级品的概率约是多少?

【答案】(1)样本的频率分布表为产品频数频率一级品50.17二级品80.27三级品130.43次品40.13(2)样本频率分布的条形图为:

(3)此种产品为二级品或三级品的概率约为0.27+0.43=0.7.

【变式4】把容量为100的某个样本数据分为10组,并填写频率分布表,假设前七组的累积频率为0.79,而剩下三组的频数成公比大于2的整数等比数列,那么剩下三组中频数最高的一组的频数为__________.

【答案】由前七组的累积频数为:,

故后三组的共有频数为21,

依据题意

∵且、均为整数∴,

∴,

故剩下三组中频数最高的一组的频数为16.

3.甲、乙两小组各10名学生的英语口语测试成绩如下:(单位:分)

甲组76908486818786828583

乙组82848589798091897974

用茎叶图表示两小组的成绩,并判断哪个小组的成绩更整齐一些?

思路点拨:学会用茎叶图表示数据的方法;并会进行统计推断.

解析:用茎叶图表示两小组的成绩如图:

由图可知甲组成绩较集中,即甲组成绩更整齐一些.

总结升华:对各数据是二、三位数,且数据量不是很大时,用用茎叶图表示较为方便,也便于进行统计推断,否那么,应改用其他方法.

举一反三:

【变式】甲、乙两个学习小组各有10名同学,他们在一次数学测验中成绩的茎叶图如下图,那么他们在这次测验中成绩较好的是____________组.

【答案】甲小组

类型三:正态分布

4.在某校举行的数学竞赛中,全体参赛学生的竞赛成绩近似服从正态分布.成绩在90分以上〔含90分〕的学生有12名.

〔Ⅰ〕试问此次参赛学生总数约为多少人?

〔Ⅱ〕假设该校方案奖励竞赛成绩在80分以上〔含80分〕的学生,试问该校获奖人数约为多少人?

思路点拨:根据表示正态曲线函数的结构特征,对照函数求出μ和σ.利用一般正态总体与标准正态总体N〔0,1〕概率间的关系,将一般正态总体划归为标准正态总体来解决.

解析:

〔Ⅰ〕设参赛学生的分数为,因为~N(70,100),由条件知,

P(≥90)==.

这说明成绩在90分以上〔含90分〕的学生人数约占全体参赛人数的2.28%,

因此,参赛总人数约为≈526〔人〕.

〔Ⅱ〕P(≥80)==

故获奖人数约为0.1587×526≈83(人)

总结升华:本小题主要考查正态分布,对独立事件的概念,考查运用概率统计知识解决实际问题的能力.在解决数学问题的过程中,将未知的,不熟悉的问题转化为的、熟悉的、已解决了的问题,是我们常用的手段与思考问题的出发点.通过本例我们还可以看出一般正态分布与标准正态分布间的内在关联.

举一反三:

【变式1】设在一次数学考试中,某班学生的分数服从X~,且知总分值150分,这个班的学生共60人,求这个班在这次数学考试中及格〔不小于90分〕的人数和130分以上的人数.

【答案】

因为X~,,,

所以的概率为,

的概率为0.6826+0.1587=0.8413,

及格人数为〔人〕,

130分以上的人数为〔人〕.

【变式2】某人乘车从A地到B地,所需时间〔分钟〕服从正态分布,求此人在40分钟至50分钟内到达目的地的概率.

【答案】设某人乘车从A地到B地所需时间〔分钟〕为X,那么X~,

【变式3】在某项测量中,测量结果服从正态分布.假设在内取值的概率为0.4,那么在内取值的概率为________.

【答案】;由题知服从正态分布,

其密度曲线关于直线x=1对称,,

那么,有,

,所以

或者:

【变式4】设随机变量服从标准正态分布,,那么=〔〕

A.0.025B.0.050C.0.950D.0.975

【答案】C;由题知:,那么

【变式5】以表示标准正态总体在区间内取值的概率,假设随机变量服从正态分布,那么概率等于〔〕

A.B.C.D.

【答案】B;

.

【变式6】设,且总体密度曲线的函数表达式为:,x∈R.

〔1〕求μ,σ;

〔2〕求及的值.

【答案】

〔1〕由于,

根据一般正态分布的函数表达形式,可知μ=1,,故X~N〔1,2〕.

〔2〕

.

.

类型四:变量的相关性、回归分析和独立性检验

5.某地每单位面积菜地年平均使用氮肥量xkg与每单位面积蔬菜年平均产量yt之间的关系有如下数据:年份19851986198719881989199019911992x(kg)7074807885929095y(t)5.16.06.87.89.010.210.012.0年份1993199419951996199719981999x(kg)92108115123130138145y(t)11.511.011.812.212.512.813.0〔1〕求x与y之间的相关系数,并检验是否线性相关;

〔2〕假设线性相关,求蔬菜产量y与使用氮肥量之间的回归直线方程,并估计每单位面积施肥150kg时,

每单位面积蔬菜的年平均产量.

思路点拨:

〔1〕使用样本相关系数计算公式来完成;

〔2〕查表得出显著性水平0.05与自由度15-2相应的相关系数临界比拟,假设那么线性相关,

否那么不线性相关.

解析:

〔1〕列出下表,并用科学计算器进行有关计算:i1234567891011121314157074807885929095921081151231301381455.16.06.87.89.010.210.012.011.511.011.812.212.512.813.0357444544608.4765938.490011401058118813571500.616251766.41885,,

,,.

故蔬菜产量与放用氮肥量的相关系数

.

由于n=15,故自由度15-2=13.

由相关系数检验的临界值表查出与显著水平0.05及自由度13相关系数临界值,

那么,

从而说明蔬菜产量与氮肥量之间存在着线性相关关系.

〔2〕设所求的回归直线方程为

那么,

∴回归直线方程为.

总结升华:求解两个变量的相关系数及它们的回归直线方程的计算量较大,需要细心、谨慎地计算.如果会使用含统计的科学计算器,能简单得到,,,,这些量,也就无需有制表这一步,直接算出结果就行了.另外,利用计算机中有关应用程序也可以对这些数据进行处理.

举一反三:

【变式1】假设关于某设备的使用年限x和所支出的维修费用y〔万元〕,有如下的统计资料:x23456y2.23.85.56.57.0假设由资料可知y对x呈线性相关关系.试求:

〔1〕线性回归方程;

〔2〕估计使用年限为10年时,维修费用是多少?

【答案】

〔1〕列表如下:i12345234562.23.85.56.57.04.411.422.032.542.049162536,,,

于是,

.

∴线性回归方程为:.

〔2〕当x=10时,〔万元〕

即估计使用10年时维修费用是12.38万元.

【变式2】一个工厂在某年里每月产品的总本钱y〔万元〕与该月产量x〔万件〕之间由如下一组数据:x1.081.121.191.281.361.48y2.252.372.402.552.642.75x1.591.681.801.871.982.07y2.923.033.143.263.363.50〔1〕画出散点图;

〔2〕检验相关系数r的显著性水平;

〔3〕求月总本钱y与月产量x之间的回归直线方程.

【答案】

〔1〕画出散点图:

〔2〕列表如下:i1234567891011121.081.121.191.281.361.481.591.681.801.871.982.072.252.372.402.552.642.752.923.033.143.263.363.502.432.2642.8563.2643.5904.074.6435.0905.6526.0966.6537.245,=2.8475,=29.808,=99.2081,=54.243

在“相关系数检验的临界值表”查出与显著性水平0.05及自由度12-2=10相应的相关数临界值

r0.05=0.576<0.997891,

这说明每月产品的总本钱y〔万元〕与该月产量x〔万件〕之间存在线性相关关系.

〔3〕设回归直线方程,

利用

计算a,b,得b≈1.215,,

∴回归直线方程为:

【变式3】下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量〔吨〕与相应的生产能耗〔吨标准煤〕的几组对照数据.34562.5344.5〔1〕请画出上表数据的散点图;

〔2〕请根据上表提供的数据,用最小二乘法求出关于的线性回归方程;

〔3〕该厂技改前吨甲产品的生产能耗为吨标准煤.试根据〔2〕求出的线性回归方程,预

测生产吨甲产品的生产能耗比技改前降低多少吨标准煤?

〔参考数值:,

用最小二乘法求线性回归方程系数公式:,〕

【答案】

〔1〕略;

〔2〕

法一:由系数公式可知,

,所以线性回归方程为;

法二:〔不作要求〕

设线性回归方程为,那么

∴时,

取得最小值

即,

∴时取得最小值,

所以线性回归方程为.

〔3〕x=100时,,

所以预测生产100吨甲产品的生产能耗比技术改造前降低19.65吨标准煤.高考题萃

1.〔2008陕西〕某林场有树苗30000棵,其中松树苗4000棵.为调

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论