数据分析建模方法_第1页
数据分析建模方法_第2页
数据分析建模方法_第3页
数据分析建模方法_第4页
数据分析建模方法_第5页
已阅读5页,还剩16页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第七章数据分析建模方法(下)*在建立数学模型的过程中,经常需要建立变量之间的关系.*由于对研究对象的内部机理不甚了解,不能通过合理的假设,或根据物理定律、原理,经过机理分析法而得到.问题解决思路数据分析建模方法全文共21页,当前为第1页。*选择适当的数学式对变量间的关系进行拟合.*通过对数据充分观察和分析,获得数据所含信息;*揭示变量间的内在联系;xoy*借助于由实验或测量得到的一批离散数据.数据分析建模方法全文共21页,当前为第2页。两类变量关系

确定性关系确定的函数关系相关关系存在相依关系,但未达到相互确定的程度.两类数据已知规律(函数)的测试数据(在特定时间点或距离上的数据)呈现随机性的数据,可看成具有某种概率分布的随机样本值.数据分析建模方法全文共21页,当前为第3页。

针对两种不同类型的数据,有不同的建立模型方法:1.

数据拟合法(适用于第一类数据)基本思想

已知函数y=f(x)的一组测试数据

(xi,

yi),(i=1,2,…,n),寻求一个函数ψ(x),使ψ(x)对上述测试数据的误差较小,即ψ(xi)≈yi,于是可以用ψ(x)来近似替代f(x).常用的数据拟合方法:一般插值法、最小二乘法、样条函数光顺法等.数据分析建模方法全文共21页,当前为第4页。

插值法的基本思想

寻找

f(x)的近似替代函数φ(x),在插值节点xi上满足

φ(xi)=yi,(i=1,2,…,n),其余点用φ(x)近似替代f(x),称φ(x)为f(x)的插值函数.数据分析建模方法全文共21页,当前为第5页。

最小二乘法基本思想寻找f(x)的近似替代函数φ(x),使2.随机分析方法

对于随机数据进行拟合,可用统计学中的回归分析方法或时间序列分析方法.二.经验模型的建立

以上两种建模方法都是建立在对数据进行充分分析的基础上.数据分析建模方法全文共21页,当前为第6页。

寻找或选择适当的函数拟合变量之间的关系(函数关系或回归关系)是重要的环节.一般步骤1)绘制数据散布图;

2)分析数据散布图;

3)选择函数关系形式.

1)

通过分析数据散布图可以获得对变量间关系的感性认识,形成初步的看法,以便于对问题做进一步的分析.见p156数据分析建模方法全文共21页,当前为第7页。氮施肥量N

-土豆产量数据散布图数据分析建模方法全文共21页,当前为第8页。磷施肥量

-土豆产量数据散布图数据分析建模方法全文共21页,当前为第9页。2)分析数据散布图;

对数据散布图进行分析,可以分析出变量的关系是:1)线性的还是非线性的?2)有无周期性?3)呈现何种变化趋势?变化率如何?…,等等有用的初步结论.数据分析建模方法全文共21页,当前为第10页。

例1建立一个简洁的函数关系式来描述某个地区人的身高和体重的对应关系,数据见表7.4(p156).

曲线特征是体重W

随身高H的增长而单调增长,但可以观察到是非线性增长.身高-体重数据散布图数据分析建模方法全文共21页,当前为第11页。练习试分析以下问题1.氮施肥量N、磷施肥量P关于土豆产量的数据散布图(P153例7.1.1).2.海浪潮高度x

随时间t

的数据散布图.数据分析建模方法全文共21页,当前为第12页。3)选择函数关系形式

1.形式尽可能简洁,尽可能线性化;原则2.依据实际问题的精度要求,合乎实际规律.

续例7.2.1

选择幂函数W=,描述身高体重关系.优点

此函数可以线性化.两边取对数,有数据分析建模方法全文共21页,当前为第13页。

变换为线性函数

例7.2.2

可选二次函数

注:其中b0=y(0)=15.18.

描述氮肥施肥量与土豆产量间的变量关系.

关于磷肥施肥量和土豆产量的变量关系可选择威布尔模型:数据分析建模方法全文共21页,当前为第14页。合理性?3.

y是单调升函数.

也可以选择S

函数:

数据分析建模方法全文共21页,当前为第15页。S函数也满足:

3.y是单调升函数;

哪个模型更好?分析S模型所含参数更少,另外若令可得线性模型数据分析建模方法全文共21页,当前为第16页。

重要定理(维尔斯脱拉斯)若函数f(x)在有限闭区间上连续,则存在一个多项式序列{Pn(x)}在有限闭区间[a,b]上一致收敛于f(x).称f(x)在[a,b]上可由多项式函数逼近.

例6.2.3估计供水塔的水流量

试用以下数据估计任意时刻(包括水泵正在输水的时间内)从水塔流出的流量f(t),并估计一天的总用水量.数据分析建模方法全文共21页,当前为第17页。时间(秒)水位(0.01英尺)时间(秒)水位(英尺)03175466363350331631104995332606635305453936316710619299457254308713937294760574301217921289264554292721240285068535284225223279571854276728543275275021269732284269779254水泵开动

35932水泵开动

82649水泵开动

39332水泵开动

859683475394353550899533397433183445923703340数据分析建模方法全文共21页,当前为第18页。某小镇某天水塔水位散布图

数据分析建模方法全文共21页,当前为第19页。思考为什么考虑用多项式函数?有什么优点?

假设水位高度

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论