版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、线性回归分析12022/9/12一、引言 2004年全国数模竞赛的B题 “电力市场的输电阻塞管理” 第一个问题: 某电网有8台发电机组,6条主要线路,表1和表2中的方案0给出了各机组的当前出力和各线路上对应的有功潮流值,方案132给出了围绕方案0的一些实验数据,试用这些数据确定各线路上有功潮流关于各发电机组出力的近似表达式。 2022/9/13表1 各机组出力方案 (单位:兆瓦,记作MW)方案机组123 4 5 6780120731808012512581.1901133.02731808012512581.1902129.63731808012512581.1903158.777318080
2、12512581.1904145.32731808012512581.190512078.5961808012512581.190612075.451808012512581.190712090.4871808012512581.190812083.8481808012512581.190912073231.398012512581.1901012073198.488012512581.1901112073212.648012512581.1901212073190.558012512581.190131207318075.85712512581.190141207318065.9581251
3、2581.190151207318087.25812512581.190161207318097.82412512581.190171207318080150.7112581.1902022/9/14181207318080141.5812581.190191207318080132.3712581.190201207318080156.9312581.190211207318080125138.8881.190221207318080125131.2181.190231207318080125141.7181.190241207318080125149.2981.19025120731808
4、012512560.5829026120731808012512570.9629027120731808012512564.8549028120731808012512575.5299029120731808012512581.1104.8430120731808012512581.1111.2231120731808012512581.198.09232120731808012512581.1120.442022/9/15表2 各线路的潮流值(各方案与表1相对应,单位:MW)方案线路1234560164.78140.87-144.25119.09135.44157.691165.81140.
5、13-145.14118.63135.37160.762165.51140.25-144.92118.7135.33159.983167.93138.71-146.91117.72135.41166.814166.79139.45-145.92118.13135.41163.645164.94141.5-143.84118.43136.72157.226164.8141.13-144.07118.82136.02157.57165.59143.03-143.16117.24139.66156.598165.21142.28-143.49117.96137.98156.969167.43140.
6、82-152.26129.58132.04153.610165.71140.82-147.08122.85134.21156.2311166.45140.82-149.33125.75133.28155.0912165.23140.85-145.82121.16134.75156.7713164.23140.73-144.18119.12135.57157.214163.04140.34-144.03119.31135.97156.3115165.54141.1-144.32118.84135.06158.262022/9/1624167.69138.07-144.14119.19137.11
7、157.6525162.21141.21-144.13116.03135.5154.2626163.54141-144.16117.56135.44155.9327162.7141.14-144.21116.74135.4154.8828164.06140.94-144.18118.24135.4156.6829164.66142.27-147.2120.21135.28157.6530164.7142.94-148.45120.68135.16157.6331164.67141.56-145.88119.68135.29157.6132164.69143.84-150.34121.34135
8、.12157.6416166.88141.4-144.34118.67134.67159.2817164.07143.03-140.97118.75133.75158.8318164.27142.29-142.15118.85134.27158.3719164.57141.44-143.3119134.88158.0120163.89143.61-140.25118.64133.28159.1221166.35139.29-144.2119.1136.33157.5922165.54140.14-144.19119.09135.81157.6723166.75138.95-144.17119.
9、15136.55157.592022/9/17 仔细分析题目,可以发现,该问题就是要找出各线路上有功潮流与8台发电机出力的函数关系,这在数学上是一个函数拟合问题。 对函数拟合,可以采用线性函数,也可以采用非线性函数,比如多项式函数,三角函数,指数函数等等。在给出具体问题的具体数据时,首先想到的还是最简单的方法下手,采用最简单的函数去拟合,也就是线性函数来表达。1、模型的分析2022/9/18 由电网的拓扑结构,线路上的有功潮流由机组出力决定。又根据功率的叠加原理,各线路上有功潮流应为各发电机组出力的线性组合,考虑对所有实验数据采用最小二乘法进行线性拟合,从而得到各线路有功潮流关于各发电机组出力
10、的近似表达式。2022/9/192、模型的建立与求解2022/9/110 根据表1和表2围绕方案0的1-32组实验数据,可以列出关于未知数的32个方程的方程组,利用SAS或Matlab编程求解方程组,得2022/9/111还需要根据样本值运用假设检验来判断,以确定求得的回归方程是否有价值。 在许多国际国内数学建模竞赛中,都有可能用到回归分析。因此,我们介绍线性回归分析的基本原理,对模型好坏的评价指标,可线性化的回归分析,利用统计软件的实现等具体问题。2022/9/112二、回归分析方法回归分析是研究一个或一组变量(因变量,结果)与另一些变量(自变量或回归变量,原因)之间的依存关系。在回归模型中
11、,若变量之间的关系是线性关系,称为线性回归模型,否则,称为非线性回归模型。当自变量只有一个,称为一元线性回归, 如果自变量有多个,称为多元线性回归。卡盟 卡盟 Microsoft Office PowerPoint,是微软公司的演示文稿软件。用户可以在投影仪或者计算机上进行演示,也可以将演示文稿打印出来,制作成胶片,以便应用到更广泛的领域中。利用Microsoft Office PowerPoint不仅可以创建演示文稿,还可以在互联网上召开面对面会议、远程会议或在网上给观众展示演示文稿。 Microsoft Office PowerPoint做出来的东西叫演示文稿,其格式后缀名为:ppt、pp
12、tx;或者也可以保存为:pdf、图片格式等132022/9/1141、一元线性回归一元线性回归模型为满足2022/9/115一元线性回归2022/9/116则令正规方程组一元线性回归2022/9/117整理得一元线性回归2022/9/118其中,参数的最小二乘估计一元线性回归2022/9/119称作y关于x的一元经验回归方程。一元线性回归2022/9/120一元线性回归2022/9/121一元线性回归2022/9/1222、多元线性回归模型为: 2022/9/123多元线性回归2022/9/124令多元线性回归注意:矩阵X的第一列全是1.2022/9/125则(6)可用矩阵表达为多元线性回归2
13、022/9/126对应正规方程组为 在X不是列满秩时,其解虽然不唯一,但对任意一组解都使得残差平方和最小。多元线性回归2022/9/127多元线性回归关于多重共线性的知识请参阅韩中庚数学建模方法及其应用。2022/9/128 当 p=1 时,多元线性回归就变成一元线性回归分析了,这时参数的求解和误差的方差的无偏估计与一元得到的结论是一样的,类似地也有经验回归平面方程。多元线性回归2022/9/1293、回归模型的假设检验 在许多实际问题中,我们事先并不能断定因变量与自变量之间是否确有线性关系,而前面建立的因变量与多个自变量间的线性关系只是一种假设,尽管这种假设常常不是没有根据的。这就意味,所求
14、得的经验回归方程是否有实用价值,需要经过假设检验才能确定。2022/9/130主要从以下几个方面进行检验: a、 回归方程的检验; b、 回归系数的检验; c、 回归好坏程度的度量。2022/9/131a、回归方程的检验是否全为零。若全为零,则认为线性回归不显著,否则认为线性回归显著。为此,在上述模型中作假设 要检验(6)的变量间有没有这种线性关系,只要检验p个系数2022/9/132考虑总偏差平方和,利用正规方程组,有为了构造检验统计量,记经验回归方程回归方程的检验2022/9/133回归方程的检验2022/9/134 它是由自变量X的取值变化且通过线性回归模型对y的影响所构成的误差平方和。
15、 它是由随机误差和其他未加控制的因素所引起的误差平方和。回归方程的检验2022/9/135回归方程的检验2022/9/136构造检验统计量为回归方程的检验2022/9/137相应的检验法则为:回归方程的检验2022/9/138不全为零,但这并不意味着每个自变量可能会起重要作用,而有的可能起的作用不大或者不起作用。因此,在通过前面的线性回归模型的检验,回归方程的检验2022/9/139还有必要从线性回归模型中剔除那些次要的、可有可无的自变量,只保留那些起重要作用的自变量,以从新建立更为简练的线性回归模型,使之有利于实际应用。回归方程的检验2022/9/140b、回归系数的检验检验假设2022/9
16、/141下面的任务是选取检验统计量。由(7)所以,回归系数的检验2022/9/142则可以证明注意:矩阵C的下标都是从0开始的!回归系数的检验2022/9/143回归系数的检验2022/9/144 如果回归方程的检验结果是显著的,而且各个回归系数的检验结果都为显著时,说明各个自变量对因变量的单纯影响都是显著的。 若有回归系数经显著性检验为不显著时,说明其对应的自变量在回归方程中是不重要的,此时应该剔除。回归系数的检验2022/9/145在对变量进行剔除时,需要注意:1)一次只能剔除一个不显著的回归系数对应的自变量,而且被剔除的自变量,应该是所有不显著的回归系数中的t值最小者。2)重新进行少一个
17、自变量的多元线性回归分析。回归系数的检验2022/9/146 前面说的是剔除变量,也会有变量因素考虑不周的情况,这时应该考虑引入新的变量,那么如何引入新的变量? 对于模型的选择,目前普遍采用的是逐步回归法。也即,每引入一个变量,要进行逐个检验,将不显著的变量剔除。详细情况请参阅韩中庚数学建模方法及其应用第九章。回归系数的检验2022/9/147c、复相关系数 对一个回归方程来说,即使回归显著,但还涉及到回归好坏程度的度量。对于一个因变量和一组自变量之间相关程度,则要采用的复相关系数来度量。 研究一个变量与多个变量的线性相关称为复相关分析。 2022/9/148 复相关系数定义为复相关系数202
18、2/9/149但是复相关系数也有一些缺点。当采用的自变量自变量的引入可能是多余的。为了更准确地反映参数个数的影响,采用调整的复相关系数2022/9/1504、预测 如果经检验,认为线性回归方程是可信的,而且拟合的又好,那么接下来就要用它进行预测。 时对y做区间估计,即以一定的置信度预测y的观察值的取值范围,也即y的预测区间。2022/9/151预测2022/9/152因而其中此时预测2022/9/153预测2022/9/154预测2022/9/155三、可线性化的一元非线性回归模型 上面主要讲的是线性回归,而对于一元回归,非线性回归的情形也是很常见的,对这些问题做回归就是曲线回归。 配置曲线回
19、归的一个基本方法是通过适当的变量代换把非线性回归化为线性回归。具体如下:先画出观察值的散点图,通过与常见的函数曲线对比,经验的选择曲线类型。 常见的是下面六类曲线:2022/9/156(1)双曲线 可线性化的一元非线性回归模型2022/9/157(2)幂函数曲线可线性化的一元非线性回归模型2022/9/158(3)指数曲线:可线性化的一元非线性回归模型2022/9/159(4)倒指数曲线:可线性化的一元非线性回归模型2022/9/160(5)对数曲线:可线性化的一元非线性回归模型2022/9/161(6)S型曲线:可线性化的一元非线性回归模型2022/9/162设有模型线性回归模型:实验数据按
20、上面的变量代换算出可线性化的一元非线性回归模型2022/9/163再按前面的线性回归公式计算参数估计,得当y与x适合模型可线性化的一元非线性回归模型2022/9/164 其他几种曲线都可通过适当的变量代换转化为线性回归模型。这类回归模型就称为可线性化的一元非线性回归模型。 表面上看,该模型比上面的模型简单,然而它却无法化成线性回归,因为它是所谓本质上非线性的模型。可线性化的一元非线性回归模型 值得注意的是,并非所有的曲线回归问题都可线性化,例如 2022/9/165 多项式回归的处理方法和前面的曲线回归类似,通过变量转换化成多元线性回归来解决。对于一元m次多项式回归,可线性化的一元非线性回归模
21、型2022/9/166因此可以用前面的方法解决多项式回归问题。二元多项式回归处理方法类似。 值得注意的是,随着自变量个数的增加,多元多项式回归分析的计算量急剧增加。因此,在多项式回归中较为常用的是一元二次多项式回归和一元三次多项式回归。 可线性化的一元非线性回归模型2022/9/167四、软件应用 解决线性回归问题的常用软件有:Matlab,统计软件SPSS和SAS。SPSS的求解与SAS相同。这里介绍Matlab和SAS的求解方法。2022/9/1681、线性回归的matlab实现 回归分析的求解在Matlab中可用regress实现,其使用格式为:其中y为列向量,表示因变量的取值;X为矩阵
22、,代表自变量的取值;(注意:第一列全是1)alpha为置信水平,缺省时取0.05。b,bint,r,rint,stats = regress(y,X,alpha) 2022/9/169 当置信区间包含0时,说明该参数未通过T检验,可认为0。r-残差向量,取值为Y-X*b。rint-残差的置信度为1-alpha的置信区间。stats-回归方程的统计量,stats(1)为复相关系数, stats(2)为F值, stats(3)为F值对应的概率值,stats(4)为误差方差的估计值。线性回归的matlab实现2022/9/170 对照前面所讲的参数意义,采用Matlab可方便求解该问题。第一个回归模
23、型计算结果如下,其他类似。第 1条线路回归方程参数:系数, 置信下限, 置信上限110.29651,109.37571,111.21731 0.08284, 0.08109, 0.08459 0.04828, 0.04432, 0.05224 0.05297, 0.05164, 0.05430 0.11993, 0.11684, 0.12303-0.02544,-0.02737,-0.02351 0.12201, 0.11939, 0.12463 0.12158, 0.11855, 0.12461-0.00123,-0.00335, 0.00090线性回归的matlab实现2022/9/171统计量值R2=0.9995,F=5861.51944,p=0.00000方案0的原始值,预测值,相对误差百分比:164.7800 164.7120 0.0413140.8700 140.8238 0.0328-144.2500 -144.2051 0.0312119.0900 119.0412 0.0410线性回归的matlab实现2022/9/1722、SASv9求解过程(1)启动SAS软件,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年房屋装修联合出售协议3篇
- 2025年度新能源储能技术标准委托代理合同3篇
- 专业三维模型制作:2024版技术服务协议版
- 二零二五年鱼塘周边土地开发租赁合同3篇
- 二零二五版咖啡厅装饰装修合同范本3篇
- 二零二五年瑜伽馆教练考核与晋升合同3篇
- 2024年高端肉鸡养殖场饲养员技能提升与雇佣合同3篇
- 二零二五年度旅游项目开发合作合同3篇
- 二零二五版历史建筑保护修缮工程合作协议3篇
- 2024年中国石油焦炭行业市场调查报告
- 制造样品生产作业指导书
- 服务经营培训课件ppt 老客户经营综合版
- MT/T 199-1996煤矿用液压钻车通用技术条件
- GB/T 6144-1985合成切削液
- GB/T 10357.1-2013家具力学性能试验第1部分:桌类强度和耐久性
- 第三方在线纠纷解决机制(ODR)述评,国际商法论文
- 公寓de全人物攻略本为个人爱好而制成如需转载注明信息
- 第5章-群体-团队沟通-管理沟通
- 肾脏病饮食依从行为量表(RABQ)附有答案
- 深基坑-安全教育课件
- 园林施工管理大型园林集团南部区域养护标准图例
评论
0/150
提交评论