




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、复习回想复习回想1、线性回归模型:、线性回归模型:y=bx+a+e, 其中其中a和和b为模型的未知参数,为模型的未知参数,e称为随机误差。称为随机误差。2、数据点和它在回归直线上相应位置的差别、数据点和它在回归直线上相应位置的差别 是随机误差的效应,称是随机误差的效应,称 为残差。为残差。)iiyy(iiieyy=3、对每名女大学生计算这个差别,然后分别将所得、对每名女大学生计算这个差别,然后分别将所得的值平方后加起来,用数学符号表示为:的值平方后加起来,用数学符号表示为: 称为残差平方和,它代表了随机误差的效应。称为残差平方和,它代表了随机误差的效应。21()niiiyy描写模型拟合的精度描
2、写模型拟合的精度相关指数:相关指数:22121()1()niiiniiyyRyy R2取值越大,那么残差平方和越小,即模型的拟合效取值越大,那么残差平方和越小,即模型的拟合效果越好果越好.1)1)确定解释变量和预告变量确定解释变量和预告变量; ; 2)2)画出散点图画出散点图; ; 3)3)确定回归方程类型确定回归方程类型; ; 4)4)求出回归方程求出回归方程; ; 5)5)利用相关指数或残差进展分析利用相关指数或残差进展分析. .建立回归模型的根本步骤建立回归模型的根本步骤问题:一只红铃虫的产卵数问题:一只红铃虫的产卵数y与温度与温度x有关有关,现搜现搜集了集了7组观测数据组观测数据,试建
3、立试建立y与与x之间的回归方程之间的回归方程 解解:1):1)作散点图作散点图; ;从散点图中可以看出产卵数和温度之间的关系并不能从散点图中可以看出产卵数和温度之间的关系并不能用线性回归模型来很好地近似。这些散点更像是集中用线性回归模型来很好地近似。这些散点更像是集中在一条指数曲线或二次曲线的附近。在一条指数曲线或二次曲线的附近。选变量选变量 解:选取气温为解释变量解:选取气温为解释变量x x,产卵数,产卵数 为预告变量为预告变量y y。画散点图画散点图假设线性回归方程为假设线性回归方程为 :=bx+a选选 模模 型型分析和预测分析和预测当当x=28x=28时,时,y =19.87y =19.
4、8728-463.73 28-463.73 9393估计参数估计参数由计算器得:线性回归方程为由计算器得:线性回归方程为y=19.87x-463.73y=19.87x-463.73 相关指数相关指数R2=r20.8642=0.7464R2=r20.8642=0.7464所以,一次函数模型中温度解释了所以,一次函数模型中温度解释了74.64%的产卵数变化。的产卵数变化。探求新知探求新知050100150200250300350036912151821242730333639方案1当当x=28时,时,y =19.8728-463.73 93一元线性模型一元线性模型奇异?奇异?9366 ?模型不好?
5、模型不好? y=bx2+a 变换变换 y=bt+a非线性关系非线性关系 线性关系线性关系方案2问题问题选用选用y=bx2+a ,还是,还是y=bx2+cx+a ?问题问题3 产卵数产卵数气温气温问题问题2如何求如何求a、b ?协作探求协作探求 t=x2二次函数模型二次函数模型方案2解答平方变换:令平方变换:令t=x2t=x2,产卵数,产卵数y y和温度和温度x x之间二次函数模型之间二次函数模型y=bx2+ay=bx2+a就转化为产卵数就转化为产卵数y y和温度的平方和温度的平方t t之间线性回归模型之间线性回归模型y=bt+ay=bt+a温度温度21232527293235温度的平方温度的平
6、方t44152962572984110241225产卵数产卵数y/个个711212466115325作散点图,并由计算器得:作散点图,并由计算器得:y y和和t t之间的线性回归方程为之间的线性回归方程为y=0.367t-202.54y=0.367t-202.54,相关指数,相关指数R2=r20.8962=0.802R2=r20.8962=0.802将将t=x2t=x2代入线性回归方程得:代入线性回归方程得: y=0.367x2 -202.54 y=0.367x2 -202.54当当x=28x=28时,时,y=0.367y=0.367282-282-202.5485202.5485,且,且R2
7、=0.802R2=0.802,所以,二次函数模型中温度解所以,二次函数模型中温度解释了释了80.2%80.2%的产卵数变化。的产卵数变化。t问题问题 变换变换 y=bx+a非线性关系非线性关系 线性关系线性关系2110c xyc问题问题如何选取指数函数的底如何选取指数函数的底?产卵数产卵数气温气温指数函数模型指数函数模型方案3协作探求协作探求对数对数xcecy21方案3解答温度温度xoC21232527293235z=lgy0.851.041.321.381.822.062.51产卵数产卵数y/个个711212466115325xz当当x=28oC x=28oC 时,时,y 44 y 44 ,
8、指数回归,指数回归模型中温度解释了模型中温度解释了98.5%98.5%的产卵数的的产卵数的变化变化由计算器得:由计算器得:z z关于关于x x的线性回归方程的线性回归方程为为z=0.118x-1.665 z=0.118x-1.665 ,相关指数相关指数R2=r20.99252=0.985R2=r20.99252=0.9850.118x-1.665 10y 对数变换:在对数变换:在 中两边取常用对数得中两边取常用对数得令令 ,那么,那么 就转换为就转换为z=bx+az=bx+a22111221lglg( 10 )lglg10lglg10lgc xc xycccc xc xc2110c xyc12
9、lg,lg,zy ac bc2110c xyc最好的模型是哪个最好的模型是哪个? 产卵数产卵数气温气温产卵数产卵数气温气温线性模型线性模型二次函数模型二次函数模型指数函数模型指数函数模型比一比比一比最好的模型是哪个最好的模型是哪个?解解: : 令令 那么那么z=bx+a,(a=lnc1,b=c2),z=bx+a,(a=lnc1,b=c2),列出变换后数据表并列出变换后数据表并画画 出出x x与与z z 的散点图的散点图 z =lnyz =lnyx和z之间的关系可以用线性回归模型来拟合z = ax+b+ez = ax+b+e2 2c xc x1 1用用y = c e模y = c e模型型; ;1
10、) 运用统计方法处理实践问题需求留意的问题:对运用统计方法处理实践问题需求留意的问题:对于同样的数据,有不同的统计方法进展分析,于同样的数据,有不同的统计方法进展分析,我们要用最有效的方法分析数据。我们要用最有效的方法分析数据。如今有三个不同的回归模型可供选择来拟合红铃虫的产卵数与温度数据,他们分别是:.,212exyecyebaxyexc可以利用直观散点图和残差图、相关指数来确定哪一个模型的拟合效果更好。ebxcz2ety ( (1 1) )0 0. .2 27 72 2x x- -3 3. .8 84 43 3( (2 2) )2 2y y= = e e, ,y y= = 0 0. .3
11、36 67 7x x - -2 20 02 2. .5 54 4( (1 1) )( (1 1) )0 0. .2 27 72 2x x- -3 3. .8 84 43 3i ii ii i( (2 2) )( (2 2) )2 2i ii ii ie e= = y y - -y y= = y y - -e e, , ( (i i = =1 1, ,2 2. . . .7 7) )e e= = y y - -y y= = y y - -0 0. .3 36 67 7x x + +2 20 02 2. .5 54 4, ,非线性回归方程非线性回归方程二次回归方程二次回归方程残差公式残差公式1y=
12、f(bx+a+e))(yfeabx1)(yfz1Z=bx+a+e(2)y=bg(x)+a+et=g(x)y=bt+a+e(3)y=f(bg(x)+a+e))(yfz1)(xgt Z=bt+a+e用线性回归模型处理非线性相关问题小小 结结 实践问题实践问题y = f(x)y = f(x) 样本分析样本分析y y = = f f( (x x) ) 回归模型回归模型y = f(x)y = f(x)抽样抽样回归分析回归分析预告精度预告精度预告预告用身高预告体重时,需求留意以下问题:用身高预告体重时,需求留意以下问题:1、回归方程只适用于我们所研讨的样本的总体;、回归方程只适用于我们所研讨的样本的总体;
13、2、我们所建立的回归方程普通都有时间性;、我们所建立的回归方程普通都有时间性;3、样本采集的范围会影响回归方程的适用范围;、样本采集的范围会影响回归方程的适用范围;4、不能期望回归方程得到的预告值就是预告变量的准确值。、不能期望回归方程得到的预告值就是预告变量的准确值。 现实上,它是预告变量的能够取值的平均值。现实上,它是预告变量的能够取值的平均值。这些问题也运用于其他问题。这些问题也运用于其他问题。涉及到统计的一些思想:涉及到统计的一些思想:模型适用的总体;模型适用的总体;模型的时间性;模型的时间性;样本的取值范围对模型的影响;样本的取值范围对模型的影响;模型预告结果的正确了解。模型预告结果
14、的正确了解。小结小结相关系数相关系数 相关系数又称线性相关系数相关系数又称线性相关系数.它是衡量变量它是衡量变量之间线性相关程度的目的。样本相关系数之间线性相关程度的目的。样本相关系数用用r表示表示,总体相关系数用总体相关系数用表示表示,相关系数的相关系数的取值范围为取值范围为-1,1。|r|值越大,误差值越大,误差Q越小,越小,变量之间的线性相关程度越高;变量之间的线性相关程度越高;|r|值越接值越接近近0,Q越大,变量之间的线性相关程度越越大,变量之间的线性相关程度越低。低。相关系数相关系数 如两者呈正相关,如两者呈正相关,r呈正值,呈正值,r=1时为完全时为完全正相关;如两者呈负相关那么
15、正相关;如两者呈负相关那么r呈负值,而呈负值,而r=-1时为完全负相关。完全正相关或负相关时为完全负相关。完全正相关或负相关时,一切图点都在直线回归线上;点子的时,一切图点都在直线回归线上;点子的分布在直线回归线上下越离散,分布在直线回归线上下越离散,r的绝对值的绝对值越小。相关系数的绝对值越接近越小。相关系数的绝对值越接近1,相关越,相关越亲密;越接近于亲密;越接近于0,相关越不亲密。当,相关越不亲密。当r=0时,阐明时,阐明X和和Y两个变量之间无直线关系。两个变量之间无直线关系。通常通常|r|大于大于0.8时,以为两个变量有很强的时,以为两个变量有很强的线性相关性线性相关性相关系数的性质相
16、关系数的性质 相关系数的性质相关系数的性质 1相关系数可正可负;相关系数可正可负; 2相关系数的区间是相关系数的区间是-1,1; 3相关系数是线性关联或线性相依的一相关系数是线性关联或线性相依的一个度量,它不能用于描画非线性关系;个度量,它不能用于描画非线性关系;偏向平方和偏向平方和 偏向平方和偏向平方和 单次丈量值单次丈量值x1与测定平均值之差的平方的与测定平均值之差的平方的总和,以总和,以Q表示,表示,Q值越大,表示测定值之值越大,表示测定值之间的差别越大,用偏向平方和表征差别的间的差别越大,用偏向平方和表征差别的优点是能充分利用测度数据所提供的信息,优点是能充分利用测度数据所提供的信息,缺陷是缺陷是Q随着测定值数目的增多而增大,为随着测定值数目的增多而增大,为了抑制这一缺陷,用方差了抑制这一缺陷,用方差S2=Q/f来表征差来表征差别的大小,其中别的大小,其中f为自在度。如一个测定结为自在度。如一个测定结果受多个要素影响,那么总偏向平方和等果受多个要素影响,那么总偏向平方和等于实验误差与各要素包括固定要素与随于实验误差与各要素包括固定要素与随机要
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年紫外光固化油墨项目合作计划书
- 车间安全生产工作总结(资料22篇)
- 2025年口服降血糖药项目合作计划书
- 学易密卷:段考模拟君之2025-2026学年七年级英语上学期期末原创卷A卷(河北)(考试版)
- 粮食运输合同范本(2025版)
- 全新餐饮饭店承包合同2025年
- 品牌顾问服务合同(2025版)
- 离职协议合同协议书(2025版)
- 零星店面装修合同书2025年
- 2025年新型膜材料及其装置项目合作计划书
- 2024年计算机一级Ms office考试复习题库500题(含答案)
- 安全使用电脑和互联网
- 会计师事务所培训
- 班主任安全管理培训
- 护理查房阵发性室上性心动过速护理
- 多元智能测评
- 中职英语 基础模块2 Unit 1 Travel
- 鹤岗市昌瑞污、废水处理厂项目环境影响报告书
- 交通强国建设纲要全面解读PPT
- DB22-T 3474-2023羊草菌根化育苗栽培技术规程
- 金蝶KIS旗舰版操作手册
评论
0/150
提交评论