版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第一讲:一元线性与非线性回归分析实验简介一元非线性回归模型MATLAB软件实现一元回归模型与回归分析引例:钢材消费量与国民收入的关系为了研究钢材消费量与国民收入之间的关系,在统计年鉴上查得一组历史数据。引例:钢材消费量与国民收入的关系年份196419651966……197819791980消费(吨)698872988……144627362825收入(亿)109712841502……294831553372试分析预测若1981年到1985年我国国民收入以4.5%的速度递增,钢材消费量将达到什么样的水平?钢材消费量--------试验指标(因变量)Y;国民收入-----------自变量x;建立数据拟合函数y=E(Y
|
x)=f(x);作拟合曲线图形分析。问题分析:2000150010005001000
1500
2000
2500
3000
350025003000钢材消费量y与国民收入x的散点图y=a+bx回归分析是研究变量间相关关系的一种统计分析。特点:试验指标(因变量)是随机变量。图形解释:y
=E(Y
|x)=f(x)假设:f(x)=ax+bxx0y0....
E(Y|x0)x11··
·E(Y|x
).··.·.假设: (y
=E(Y
|x)=f(x))Y是一个正态随机变量,即Y服从正态分布,并且有方差D(Y)=σ2。根据观测值作的散点图,观察出函数f(x)是线性形式还是非线性形式。回归模型及回归分析1、一元线性回归模型2e
~
N
(0,s
)Y
=
a
+
bx
+
e;Y
~
N
(a
+
bx,s
2
)或知识介绍需要解决的问题:在回归模型中如何估计参数a、b和σ2?模型的假设是否正确?需要检验。利用回归方程对试验指标y进行预测或控制?估计量yˆ0
=
aˆ
+
bˆx0
,
区间估计(
yˆ0
-
d
,
yˆ0
+
d
)参数估计2[
y
-
(a
+
bx
)]min
Q(a,
b)
=
i
ii=1解出的参数记为
aˆ,
bˆ则回归方程:yˆ
=aˆ
+bˆx设观测值为(xi,yi)(i=1,2,…,n),代入模型中,yi=a+bxi+εi最小二乘法:nyˆiyi
-yˆi
残差值=
aˆ
+
bˆxi回归模型的假设检验10:
b
=
0;
H
:
b
„
0提出问题:H1、相关系数检验DX
DYr
=cov(X
,Y
)ninin i
=1
-
y
)
2
(
x
-
x
)
2
(
yi
=1
i
=1
(
x
i
-
x
)(
y
i
-
y
)rˆ
=|
r
|≤1|
r
|→1,线性相关|
r
|→0,非线性相关模型:Y
=a+bx
+ε0={|
rˆ
|>
r
(n
-
2)}aH0的拒绝域为:
c()-11||·0rα(n-2)-rα(n-2)2、F-检验法平方和分解公式nn
n
i
i
i
ii=122i=1
i=12ˆ(
y
-
y)ˆ=
(
y
-
y
)
+(
y
-
y)=
Q
+U记为~
F
(1,
n
-
2)Q
/(
n
-
2)LyyUF
=:实测值估计值残差值,剩余平方和,越小越好拒绝域
c
0
=
{F
>
F1-a
(1,
n
-
2)}认为线性回归效果好预测与控制给定的自变量x0,给出E(y0)的点估计量:yˆ0
=
aˆ
+
bˆx0y0的置信度为(1-a)%的预测区间为:(
yˆ0
-
dn
,
yˆ0
+
dn
)xxn1n
L(x
-
x)2+
0
d
=
t
(n
-
2)sˆ
1
+a2=n
-
2Qsˆ
2设y在某个区间(y1, y2)取值时,
应如何控制x的取值范围,
这样的问题称为控制问题。小结:2e
~
N
(0,s
)Y
=
a
+
bx
+
e;Y
~
N
(a
+
bx,s
2
)或模型1、估计参数a,b,σ2;2、检验模型正确与否;(即b→0)3、预测或控制;已知数据(xi,yi)(i
=1,2,…,n),如何利用
MATLAB软件实现以上的统计计算?MATLAB软件实现b=regress(Y,X)
或1
x1
y1
归系数a,b以及它们的置信区间X
=
, Y
=
残差向量e=Y-Y及它们的置信区间[b,
bint,
r,
rint,
stats]
=
regress(Y,
X,
alpha)回
相关系数R2,F-统计量和与χ0对应的概率p。
1
xn
yn
残差及其置信区间可以用rcoplot(r,rint)画图。使用命令regress实现一元线性回归模型的计算默认值是0.05引例求解输入:(hg1.m)x=[1097
1284
1502
1394
1303
1555
1917
2051
21112286
2311
2003
2435
2625
2948
3155
3372];y=[698
872
988
807
738
1025
1316
1539
15611765
1762
1960
1902
2013
2446
2736
2825];X=[ones(size(x')),x'],pause[c,cint,r,rint,stats]=regress(y',X,0.05),pausercoplot(r,rint)输出:c=
-460.5282(参数a)0.9840(参数b)cint=-691.8478-229.2085
(a的置信区间)0.87791.0900
(b的置信区间)r
= [
79.124869.1244-29.3788
-104.1112-83.5709-44.5286-109.7219-18.5724-55.6100
-23.8029-51.4019449.6576-33.4128-109.36515.8160
92.1364-32.3827]’(残差向量)rint=(略)(参见残差分析图)stats
=
0.9631(R2) 391.2713(
F
) 0.0000
(
P{χ0}
)yˆ
=
aˆ
+
bˆx515-4004002000-200600Residual
Case
Order
PlotResiduals10Case
Number第12个数据点异常,可删出预测x1(1)=3372;(hgy1.m)for
i=1:5x1(i+1)=1.045*x1(i);%未来五年国民收入以4.5%的速度递增y1(i+1)=-460.5282+0.9840*x1(i+1);%钢材的预测值endx1,
y1结果3523.7
3682.3
3848.0
4021.2
4202.1x1
=
3372.0y1
=
3006.8
3162.9
3325.9
3496.3
3674.4如果从数据的散点图上发现y与x没有直线关系,又如何计算?例如,试分析年龄与运动(旋转定向)能力年龄
17
19
21
23
25
27
290.48
25.13
26.15
30.0
26.14.35
28.11
26.3
31.4
26.9220.3
19.3525.7
21.3第1人
2第2人
2202530323028262422201815假设模型321
2+
a x
+
a
+
e;Y
=
a
xe
~
N
(0,s
2
)一元多项式回归在matlab
软件中用命令polyfit实现。如前面的例子,具体计算如下:输入:
(phg1.m)x1=17:2:29;x=[x1,x1];y=[20.48
25.13
26.15
30.0
26.1
20.3
19.3524.35
28.11
26.3
31.4
26.92
25.7
21.3];[p,S]=polyfit(x,y,2);p注意:x,y向量的维数要一致。S是一个数据结构,用于其它函数的计算。计算y的拟合值:输入:[Y,delta]=polyconf(p,x,S);Y结果:Y=22.524326.058227.989628.318627.045024.168919.690422.524326.058227.989628.318627.045024.168919.6904拟合效果图:
353025201515
20
25
30用polytool(x,y,2)还可以得到一个交互式画面。ExportParametersParameters
CIPredictionPrediction
CIResidualsAll21
2
3e
~
N
(0,s
2
)+
a
+
e;Y
=
a
x
+
a
x在工作空间中,输入yhat,回车,得到预测值。实验内容1、确定企业年设备能力与年劳动生产率的关系某市电子工业公司有14个所属企业,各企业的年设备能力与年劳动生产率统计数据如下表。试分析企业年设备能力与年劳动生产率的关系。若该公司计划新建一个设备能力为9.2千瓦/人的企业,估计劳动生产率将为多少?企业设备能力(千瓦/人劳动生产率企业设备能力劳动生产率12.86.784.89.822.86.994.910.633.07.2105.210.742.97.3115.411.153.48.4125.511.863.98.8136.212.174.09
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 《翡翠培训资料》课件
- 《证券买卖技巧教案》课件
- 《证券基金销售培训》课件
- 单位管理制度集粹汇编员工管理篇
- 单位管理制度分享大全【人力资源管理篇】
- 《社区工作实务》课件
- 单位管理制度范例选集【人力资源管理篇】十篇
- 单位管理制度范例合集职工管理十篇
- 单位管理制度呈现合集【人事管理】十篇
- 寒假自习课 25春初中地理八年级下册人教版教学课件 第八章 第二节 干旱的宝地-塔里木盆地 第2课时 油气资源的开发
- 老年病及老年综合征中医证治概要
- 三年级上册数学说课稿- 2.2 看一看(二)-北师大版
- 超星尔雅学习通《西厢记》赏析(首都师范大学)网课章节测试答案
- 切削液的配方
- 塑料门窗及型材功能结构尺寸
- 2023-2024学年湖南省怀化市小学数学五年级上册期末深度自测试卷
- GB 7101-2022食品安全国家标准饮料
- 超实用的发声训练方法
- 《第六课 从传统到现代课件》高中美术湘美版美术鉴赏
- 英语四六级讲座课件
- Unit 3 On the move Understanding ideas(Running into a better life)课件- 高一上学期英语外研版(2019)必修第二册
评论
0/150
提交评论