回归分析法简单线性回归

上传人：r*** IP属地：湖北上传时间：2023-10-18 格式：PPT 页数：107 大小：4.33MB 积分：22 举报 版权申诉

已阅读5页，还剩102页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

Chapter5信息分析方法〔二〕传统的预测方法主要是统计预测方法，对历史数据通过经济模型、回归分析和时间序列等方法预测未来的趋势。在拥有大量历史数据，而且关键变量间的关系在未来保持不变时，统计预测方法比较有效。但在动乱多变和错综复杂的环境下，统计预测方法因其基于关键变量间的历史联系的假设跟实际情况不符而很难奏效。而情景分析法那么通过对未来详细地、严密地推理和描述来设想未来各种可能的方案，从而能够较好的辅助决策。2023/10/1825.1情景分析法5.1.1情景分析法概述情景〔Scenario〕一词有概要、剧本、剧情、情节或情况等意思。关于情景的定义，联合国环境规划署、千年生态评估工程等国际组织和机构以及国内外研究人员给出了数十种不尽相同的表述。具有以下几个典型特点：情景是关于将来的；情景是描述性的；情景提供了一个可选择的、多样化的未来；情景分析需要系统性的过程。情景是一种基于对高驱动力和高不确定性因素的假设，通过系统性的分析，对未来做出可选择的、多样化的描述。情景并不是预测将来会怎么样，而是描绘将来将如何展开；情景是探讨未来的可能性，而不是讨论未来应该怎么样〔娄伟，2021〕。2023/10/183情景分析法〔ScenarioAnalysis〕是通过假设、预测、模拟等手段生成未来情景，并分析情景对目标产生影响的方法情景规划〔Scenarioplanning〕指基于情景分析的战略规划、决策及政策分析方法情景侧重于结果〔情景故事〕，情景分析侧重于过程，而情景规划那么侧重于应用。2023/10/184情景分析法的起源与开展20世纪50-60年代，兰德公司〔RAND〕的研究员HermanKahn率先使用了“scenario〞一词，并将其引入军事战略研究。兰德公司在为美国国防部就导弹防御方案做咨询时进一步开展了该方法。1961年，Kahn离开兰德公司，建立了哈德逊研究所(HudsonInstitute)，开始应用情景分析法进行社会预测分析和公共政策研究。1967年，Kahn出版了?2000年—关于未来33年猜测的框架?〔TheYear2000：AFrameworkforSpeculationontheNextThirty-ThreeYears)，该书成为情景分析历史的里程碑，而Kahn那么因此被称为“情景分析之父〞。2023/10/1851972年，壳牌石油〔SHELL〕公司规划人员PierreWack领导了一个名为“团体规划〞〔GroupPlanning〕的研究小组，运用情景分析法分析了中东局势，得出将爆发石油危机的结论。壳牌公司据此调整了企业战略，及时、成功地应对了70年代石油危机。70年代中后期，得到迅速开展和广泛运用，出现了多种不同的模式及知名研究报告罗马俱乐部〔ClubofRome〕的?增长的极限?〔TheLimitstoGrowth〕和?人类的转折点?〔MankindattheTurningPoint〕此后，情景分析经历了两次飞跃20世纪80年代后期，情景分析的进步随着复杂性理论的兴起而升级。20世纪90年代，情景分析者把规划的焦点集中在组织学习上，情景分析随着组织学习理论的兴起而得到进一步完善。2023/10/186情景分析的学派直觉逻辑学派〔Intuitivelogicsschool〕主要依靠利益相关者及专家的直觉构建情景。当然，也可以同多种模型相结合，以提升情景分析的科学性。代表性的直觉逻辑情景分析主要有斯坦福研究院〔SRI〕、全球商业网〔GlobalBusinessNetwork〕，以及壳牌石油〔Shell〕公司等机构开展的方法。2023/10/187概率修正趋势学派〔Probabilisticmodifiedtrendsschool〕需要借助决策树、蒙特卡罗模拟、贝叶斯决策理论、马尔科夫决策分析等方法。该学派又分为趋势影响分析和交叉影响分析趋势影响分析〔TrendImpactAnalysis，TIA〕是一种实用有效的预测方法，它是为了弥补趋势外推法的缺乏而开展起来的。一般认为，这种方法的出现同位于美国康涅狄格州的未来集团〔FuturesGroup〕密不可分。交叉影响分析〔Cross-impactanalysis，CIA〕又称交叉影响模型、交叉概率法。从1968年Gordon提出基于蒙特卡罗仿真模拟的交叉影响分析模式后，先后出现了用于预见事件发生概率、用于预见事件开展趋势和用于选取关键事件等三种具有不同功能的模式。2023/10/188远景学派〔La

Prospective〕所谓远景，主要是指战略情景构建远景学派由法国哲学家GastonBerger最早开展此后，20世纪70年代以来，MichelGodet开发的以MICMAC和MACTOR等为代表的一系列情景分析工具得到了广泛的应用，从而成为远景学派的代表。MICMAC通过变换代表了事件之间相互影响的交叉影响矩阵，进而发现隐藏在事件之间直接影响之下的间接影响。MACTOR那么专注于定量与定性结合的角色战略分析。2023/10/189

直觉逻辑学派远景学派概率修正趋势学派情景目的战略决策、组织学习支持政策制定、战略决策以及具体行动规划外推预测和政策评估情景表述描述性或规范性通常是描述性的，也可以是规范性的描述性的情景范围范围可宽可窄，从全球、区域、国家，到一家企业通常范围较窄，但在一定范围内要广泛考虑各要素范围较窄，并依据特定事件的发展趋势关注其未来可能动向和影响时间跨度变化：3-20年变化：3-20年变化：3-20年方法论过程导向：归纳或演绎，基本上是主观的，依赖有约束的直觉进行定性分析结果导向：有指导的和客观的。定量化(有一些主观性)，依赖复杂的计算机和数学模型结果进行计算结果导向：有指导的和客观的。定量化(有一些主观性)，依赖复杂的计算机和数学模型进行外推模拟常用工具通用的：头脑风暴，STEEP分析，聚类分析．矩阵，系统动力学和利益相关者分析专有的：结构和角色扮演分析，形态分析，德尔菲法，以及MICMAC、MACTOR等趋势影响分析和交叉影响分析，蒙特卡罗模拟情景出发点特定的管理决策，普遍关注的议题或领域关注具体现象决策/问题的，针对详细的、可靠的时间序列数据进行决策2023/10/18102023/10/1811

直觉逻辑学派远景学派概率修正趋势学派识别/选择关键驱动力直觉:头脑风暴技术，STEEP要素分析，同不寻常人物进行讨论、研究利用角色分析进行讨论，利用先进的计算机工具进行全面的结构分析利用历史时间序列数据的拟合曲线识别发展趋势，使用专家判断创建可能的高度影响不确定未来的事件数据库建立情景框架界定情景逻辑作为主题或原则(常常以矩阵形式)基于关键变量，利用矩阵等手段创建可能的假定基于关键指标的预测，利用蒙特卡罗模拟构建不确定包情景输出定性的：基于图标、有限的量化分析，构建若干个平行的情景故事。启示、战略选择、早期预警越来越多地成为情景输出内容定性的和定量的：基于综合分析可能的行动及其后果，构建多个可供选择的情景定量的：基准情景，加上上下调整的时间序列预测。可以被简短的情景故事所美化情景概率变化不，所有的方案必须具有同样的可能是的，变量发展的概率取决于参与者的认知未来事件的发生概率受制于各类前提条件生成情景数量一般2～4个多个依赖模拟的数量，通常3～6个情景评价标准连贯性，综合性，内部一致性，新颖性，结构分析和逻辑基础的严谨性。所有的情景同等重要连贯性，综合性，内部一致性，严谨的结构。以数据分析为基础，合理的，并且可重复合理的，并且可重复研究人员在情景分析过程中常出现的三种失误构建性错误(Constructionerrors)仅仅构建了一种或两种情景;各种结束状态过分相似;策略和逻辑没有仔细地分开;受先入为主观念的影响;不允许其他人批评和评估出现的筹划;过快地开展起情景的所有细节。访问错误(Assessmenterrors)只是浅薄地检测一个筹划内部的一致性;对一个筹划是否有逻辑支持没有投入足够的精力;没有应用反逻辑方法去检测筹划的有效性;没有意识到竞争者情景如何成为确认和评估一个组织当前和潜在策略的方法;在顾客、通路、技术和竞争动力学方面,没有把竞争者情景看成理解当前和新出现的变化的方法。2023/10/1812组织错误(Organizationalerrors)直到情景大局部或者全部建立以后,才把关键决定制定者包括在内;采用那些只反映了很少多样性的条件;抵抗或禁止组织外在个体的参与;不包括那些对确定竞争者知之甚少的个体(不管这些个体是处于组织内还是组织外);在情景构建和分析中拒绝使用外部专家;设定不切实际的截止日期或者里程碑,导致情景结果变得摇摇欲坠。情景分析的局限性过程复杂。情景分析法在一定程度上依赖于管理者的直觉,而缺乏程序化模式,操作起来比较困难。而且环境中一些极其重要的变化往往逐渐演变,不易觉察。近期效果不显著。运用情景分析法进行预测一般需要高层管理者投入大量珍贵的时间,而且使用者常常经过几年时间才能对情景分析法有深入的理解和信任。2023/10/18135.1.2情景分析的一般操作步骤关于情景分析法的操作步骤，目前存在一些不同的版本。这些版本虽然表述不同，但大多具有类似的步骤，并有一个显著的共同点，就是对情景关键因素的分析，并一致认为这一步骤是否完善将导致对最后各个情景预测的可信性与准确性。2023/10/1814提出者操作步骤Gilbert提出的10个步骤提出规划的前提假设；定义时间轴和决策空间；回顾历史；确定普通和相矛盾的假设；为结构变量决定连接到多样性的指示；为填充决策空间而构建情景草案；为所有的竞争者草拟策略；将策略映射到情景；使替代的策略有效；选择或者适应最好的策略。Fink提出的5个阶段情景准备；情景域分析；情景预测；情景发展；情景传递。斯坦福研究院拟定的

6项步骤明确决策焦点；识别关键因素；分析外在驱动力量；选择不确定的轴向；发展情景逻辑；分析情景的内容。国际能源署〔InternationalEnergyAgency，IEA〕情景构建方案得到了较为广泛的应用，可以作为一般性模板予以参考。并不是每次情景分析都需要所有步骤，具体要根据分析的对象，以及资料的多少来决定分析的步骤及方法。2023/10/1815识别情景的特征与范围目的在于对情景过程及其方案和预期产出有一个清晰的认识。例如，具体可以讨论如下问题：在情景过程中，想解决什么问题？如果它是一个较大评估的一局部，那么评估的其它局部又是如何来解决这些问题的？是否需要探究现行政策？这些政策的效应是否会从根本上改变情景的根本结构？是否预想过情景分析的结果〔或局部结果〕〔例如，情景的预期目标〕？为什么情景构建是一种合理解决该问题的方法？识别利益攸关者并筛选参与人员确保情景过程能从社会各界的广泛参与中得到完善。具体需要：识别由谁〔组织或机构〕来主持开展情景分析；识别情景的其他受众；识别其他的利益攸关者〔例如，那些影响决策过程的人〕。2023/10/1816识别主题、目标、指标及其潜在政策可以通过小组讨论，识别情景分析的主题和次级主题，形成一个有简短解释的初步主题清单；详细说明关键目标和目的，包括限制条件或阈值；详细说明情景分析中所需考虑的政策，这既要包括过去和现行的政策，也要包括其它潜在的政策；而这里的筛选指标那么是为了选择能够表征情景过程的具体〔定量〕指标，以加强情景的定性描述，并为评估有悖于基准的情景提供方法。识别指标识别能够决定未来开展的关键趋势及其动态特征。其中的一个重要问题就在于驱动力是否可能发生变化，而新的驱动力又是否会按所预想的出现。本步骤的预期产出是包含简要说明的驱动清单。具体需要思考重要的历史事件及其开展趋势是如何影响以往情景分析的主题。强调驱动力的因果关系，而不是仅对其进行描述。同时还需要辨识每个驱动力对未来可能的影响方式。2023/10/1817筛选关键的不确定性思考每个驱动力的不确定性程度及其程度的大小，以及对未来可能的影响方式会产生怎样的变化；思考每个驱动力对未来的可能影响〔或重要性〕及其影响的大小；识别具有最大影响和最大不确定性的指标〔通常为2～3个指标〕。构建情景框架2023/10/1818两个最关键的不确定性〔CU1和CU2〕及其未来不同的开展趋势详述情景现状与趋势。就现状所代表的未来情景的特征展开讨论。预期结果。就情景的预期结果展开讨论。一旦关键的不确定性被解决了，那时世界将会是什么样子。添加细节和内容，以丰富情景的预期结果，并创立一个综合的、首尾照应的情景。思考每个主题和驱动力，并提供具体内容。思考哪些方面将变得更好或更糟。思考有哪些挑战已经解决，又有哪些挑战依然悬而未决。时间轴。运用现状、预期结果和时间表。为每个情景命名。2023/10/1819定量分析通过定量信息来加强情景的定性描述。其预期产出是“具体的、有科学说服力的定量信息〞。确定定量分析方法、收集所需数据及其相互关系、运用工具和模型产出定量估计。2023/10/1820联合国环境规划署出版的全球环境展望〔GlobalEnvironmentOutlook，GEO〕系列报告3中通过应用PoleStar软件来对两个情景进行定量分析。尽管PoleStar为备选情景在组织经济、资源和环境信息等方面提供了一个灵活简单的核算框架，但情景作者仍认为，定量分析需要更多环境影响方面的信息来加以补充。因此，其它模型〔即RIVM的IMAGE模型、CSER的WaterGAP模型以及NIES的AIM模型〕也被引入情景过程，以使不同区域之间和定性描述上的数据变得更为连贯，从而统一模型的输入数据〔例如，人均GDP增长率〕。探究政策探究各项政策的可行性、针对性、时效性与稳健性。其预期产出是基于前面的步骤所识别的潜在政策，以及为形成和〔或〕应对各种情景所提供特别政策〔包括政策组合〕可行性、针对性、时效性与稳健性的信息。政策分析在整个情景构建过程中可能会出现屡次，有时需要在情景构建的初期，就将潜在政策引入情景分析，例如，政策可能代表了一个或几个决定情景框架的关键的不确定性；而有时潜在政策的引入仅出现在情景过程的收尾阶段，但对于用户而言，这样的过程是一个“不完整〞的情景过程，因为其没有包括具体的政策假设。另外，应将情景过程是否引入特别政策作为一个单独的环节，以此对由不同关键指标所构建的情景及其目的和目标进行比较。2023/10/1821交流与推广使所有的利益攸关者对情景的内容及其可能的影响展开讨论。为情景构建者分析结果带来有价值的反响意见。可以通过一系列介绍和讨论情景的专题讨论会来实现。IEA认为，交流与推广应贯穿于情景构建与分析的整个过程，而不是仅仅在过程的最后阶段才出现。诸多实践经验说明，利益攸关者在整个过程各个阶段中的广泛参与，是最为有效的交流与推广的方式。2023/10/18225.1.3情景分析法的应用目前，很多企业在制定战略规划时采用了情景分析方法。除了壳牌石油公司外，还包括德国的BASF公司、戴母勒-奔驰公司、美国的波音公司等世界著名跨国公司。一些国家政府和国际组织也采用该方法进行政策或规划研究，如美国马萨诸塞州可再生能源及电力研究、政府间气候变化专门委员会〔IPCC〕对气候变化进行的分析、欧洲委员会〔EuropeanCommission〕对可再生能源政策进行的研究等。国内对情景分析法的应用起步较迟，目前主要的应用领域涉及宏观经济、能源经济与低碳经济、生态与环境经济、资源经济、城市经济与规划、企业经营管理、交通规划、技术预见和医疗卫生等。中国科学院“中国未来20年技术预见研究〞国务院开展研究中心2005-2021年我国经济开展前景模拟分析2023/10/1823南非蒙特佛利会议在南非的政治变革过程中，情景分析法曾经发挥过积极的作用。通过该方法所构建出来的四种情景对南非各利益集团的思想和主张产生了重要影响，从而最终导致了南非的政治变革和社会转型。1990年2月，当时的南非总统德克勒克〔F.W.DeKlerk〕宣布取消对非国大〔AfricanNationalCongress，ANC〕、泛非大〔Pan-AfricanistCongress，PAC〕和南非共产党〔SouthAfricanCommunistParty，SACP〕等组织的禁令，撤销对33个反对种族隔离组织的限制并释放黑人领袖纳尔逊·曼德拉〔NelsonMandela〕等人，南非由此进入从种族隔离制度向种族平等的民主制度过渡的政治变革期。然而，由于各种政治力量的剧烈斗争，使得南非社会经济停滞，社会动乱。2023/10/1824牛长振．2021．国际关系中的情景分析．国际政治科学,(3):61~83在这种情况下，南非各利益集团于1991-1992年在南非开普敦市蒙特佛利国际会议中心召开了蒙特佛利会议〔MontFleurConference〕，以探讨国家变革。该会议的主要目的是探讨南非未来10年可能的开展状况。会议总召集人，南非西开普敦大学〔UniversityoftheWesternCape〕教授皮尔特·拉诺斯〔PieterLeRoux〕邀请了22位在南非较具影响力、来自不同利益团体的人物。包括左翼政治激进分子、非国大官员、主流经济学家、工会代表、资深学者和开明的白人企业家等。会议要求与会者遵循两大规那么：一是自由畅谈南非未来如何开展，不要去管自己或自己的利益团体是否喜欢;二是认真倾听“异见〞、反省深思，不允许在讨论时说“这个情景不可能发生〞或“我不想让这种情景出现〞之类的话，而只允许提出“为什么这种情况会发生〞或“接下来会发生什么事情〞等之类的问题。2023/10/1825蒙特佛利会议总共召开了四次1991年9月，开发出30种情景，后经过整合缩减为9种。之后，会议成员分为四个小组，从社会、政治、经济和国际四个层面，为这9种情景增添内容。1991年11月，选出了4种最能反映真实情况的情景。1992年3月，确定了这4种情景的最终方案。1992年8月，向各利益集团进行了汇报。2023/10/1826“鸵鸟〞〔Ostrich〕。这种情景以“鸵鸟把头埋进沙子里〞来比喻德克勒克政府的不作为，即不与黑人团体谈判、不举行自由大选。这种情景会造成白人和黑人的严重对立，甚至导致内战的爆发。“跛脚鸭〞〔LameDuck〕。该情景描述了南非陷入无限期转型的深渊之中。政府虽声称为全民效劳，但实那么人人厌之。由于这个原因，投资商望而却步，社会开展也停滞不前。这是一种很重要的情景，因为很多人都期望组建联合政府，而现在他们却可以预知其潜在的危机了。“伊卡洛斯〞〔Icarus〕。在这种情景中，黑人取得国家政权，并竭力实现竞选承诺。于是，政府斥巨资进行公共设施建设，但由于没有充分的财政支援，结果导致国库空虚、经济崩溃。2023/10/1827“红鹤飞翔〞〔FlightoftheFlamingos〕。与“跛脚鸭〞情景一样，它也倡导组建联合政府，只不过这种联合政府能带着南非走出困境。该情景选择这个名字，主要是因为尽管红鹤飞得很慢，但都是群聚而飞。在该情景中，政府对政治和经济的变革是逐步进行的，以图实现平稳开展。最重要的是，南非不同利益团体共同参与到变革进程之中，为国家的开展出谋划策、奉献力量。如果各党派之间无法达成协议，就是“鸵鸟〞情景。如果政权过渡长期陷入困境，这那么情景就称为“跛脚鸭〞。如果政策偏向民粹主义，不具可持续性，就会出现“伊卡洛斯〞情景。如果这些情况都得以合理解决，未来的开展状况就是“红鹤飞翔〞。2023/10/1828蒙特佛利会议对南非各利益集团的思想和主张产生了重要影响。“鸵鸟〞情景的可怕后果使德克勒克总统作出“我不是鸵鸟〞的强烈回应，并促使他在制宪谈判上作出了很大的让步。“伊卡洛斯〞情景对促使泛非大放弃武力斗争路线、参加制宪谈判起了重要作用。尤为重要的，“伊卡洛斯〞情景使非国大的领导层意识到如果只重视政治、宪法、政府和军事转型，而无视经济问题或不采取合理的经济政策，南非的平稳过渡就会是一句空话。从而采取了逐步解决黑人经济问题的政策。例如，保持宏观经济的稳定；促进经济增长来逐步改变财富分配的不合理，政府通过财政预算的分配和税收制度的改革来改善黑人的经济和生活状况；保持一个有活力的国营部门，以使政府有力量改造旧的经济结构;结束种族隔离制度下的土地分配状况，在保证现有私人和社区土地所有权的根底上，裁决有历史根据的土地要求，保证被强制搬迁的黑人回到原来的土地上等。2023/10/1829如果书刊经销商想对某一专著销售量进行预测，该如何做呢？某个经销商选择了假设干书店经理、书评家、读者、编审、销售代表和海外公司经理组成专家小组。将该专著和一些相应的背景材料发给各位专家，要求各自给出专著最低销售量、最可能销售量和最高销售量三个数字，同时说明自己作出判断的主要理由。将专家们的意见收集起来，归纳整理后返回给各位专家，然后要求专家们参考他人的意见对自己的预测重新考虑。专家们完成第一次预测并得到第一次预测的汇总结果以后，除了书店经理B，其他专家在第二次预测中都做了不同程度的修正。重复进行，在第三次预测中，大多数专家又一次修改了自己的看法。第四次预测时，所有专家都不再修改自己的意见。因此，专家意见收集过程在第四次以后停止。取小组平均数，最终结果为最低销售量26万册、最高销售量60万册、可能销售量46万册。2023/10/18305.2德尔菲法5.2.1德尔菲法的起源与工作机理德尔菲〔Delphi〕是古希腊传说中的一个地名。传说阿波罗神在德尔菲杀死了彼索斯龙之后成为当地的主人，阿波罗神具有卓越的预测未来的能力。后人为了纪念阿波罗神，建阿波罗神殿于古城德尔菲。从此，人们把德尔菲看做是能够预卜未来的神谕之地，德尔菲法由此得名。其含义就是通过卓越人物来洞察和预见未来。德尔菲法最早出现于20世纪50年代末期当时美国政府组织了一批专家，要求他们站在苏军战略决策者的角度，最优地选择在未来大战中将被轰炸的美国目标，为美军决策人员提供参考。在1964年，美国兰德公司的赫尔默〔Helmer〕和戈登〔Gordon〕为防止集体讨论存在的“团体沉思〔Groupthink〕〞和“团体偏移〔Groupshift〕〞等问题而首次将德尔菲法应用于科技预测中，并发表了?长远预测研究报告?。2023/10/1831德尔菲法依据系统的程序，采用匿名发表意见的方式，通过多轮次调查专家对问卷所提问题的看法，经过反复征询、归纳、修改，最后汇总成专家根本一致的看法，作为预测的结果。信息的收集与反响在这个双向交流中是非常重要的。尽量防止信息的失真，保障信息的准确性是德尔菲法实施的初衷。匿名性、反响性和统计性是德尔菲法的特点。德尔菲方法隐含了这样一个前提，即建立在满足一致性条件的专家群体意见的统计结果才是有意义的，所以它通过“专家意见形成——统计反响——意见调整〞这样一个屡次与专家交互交流的循环过程，使分散的意见逐次收敛在协调一致的结果上，充分发挥了信息反响和信息控制的作用。“团体沉思〞指在团体从众的压力下，会阻碍一些不寻常、少数或少见的观点；“团体偏移〞那么指团体在讨论各种替代方案时，会使最后的决定比他们最初所持有的主张更为夸大或更为保守。2023/10/18325.2.2经典德尔菲法与大规模德尔菲调查经典德尔菲法兰德公司当初使用的德尔菲法主要用于技术预见〔TechnologyForesight〕，现在称为经典德尔菲法。一般需要进行4轮调查，各次调查的内容和问题如下：第一轮调查——向专家提出的问题一般没有固定的格式和内容，要求专家对预见目标、该领域的技术开展趋势、需要解决的问题等自由发表意见，请专家提出未来科学技术开展最有潜力、与目标最相关的领域和工程，并说明提出的依据。这一轮调查回收后的主要工作是整理和归类，经归纳加工而成的各项技术就形成了第二轮调查的技术课题清单。第二轮调查——要求专家对参加调查的技术课题作答。回收意见后进行统计分析，然后将统计结果附上必要的说明反响给专家，进行第三轮调查。2023/10/1833第三轮调查——专家在得到第二轮调查的统计结果和有关说明后，由于信息增多，将对自己原有的判断做出修正。根据统计分析的结果，决定是否进行下一轮调查。如果意见趋于集中，不需要进行第四轮调查，否那么，把上述整理的资料变成下一轮调查的问题，特别是需要把不同的论据反响给专家。第四轮调查——专家根据全部资料作最后判断，并对不同意见做出评论。可能有两种情形：一是专家意见相对集中，说明统计得到的结果代表了专家们对某方面问题的预见意见；二是专家意见离散度大，此时应分析各方面论据，采取其他方式进行综合分析，得到最终结果。在需要收集大多数专家意见时，经典德尔菲调查法确实是一种较为科学和相对可靠的方法，但具体实施时工作量大，周期较长，本钱也相对较高。因此在具体应用时有必要进行一定的修正，采用其他辅助性方法，如相关树法、专题讨论会、情景描述、技术图谱等。2023/10/1834大规模德尔菲调查日本人最早将这种方法用于技术预见。其后，德国、英国、法国、韩国和中国等国家和地区相继采用了大规模德尔菲调查，进行本国的技术预见。参加的人员不只局限于十几个专家，往往研究吸引来自政府、企业、高校、研究机构和社会各方面的大量人员；所涉及的问题非常广泛。以“中国未来20年技术预见研究〞为例〔国家技术前瞻研究组，2005〕，这项研究〔信息、材料、能源和生物4个技术领域〕第一轮调查共有432个技术课题，第二轮调查共有409个技术课题；问卷涉及的问题包括未来技术的重要性、未来技术的可能性〔实现时间〕、未来技术的可行性〔制约因素〕、未来技术竞争对手〔领先国家〕、未来技术优先领域的择优支持〔政策建议〕等。2023/10/1835在进行大规模德尔菲调查时，在预见程序上对经典德尔菲法也可以进行相应修改在“中国未来20年技术预见研究〞中：首先，按照领域成立了4个技术预见领域专家组，确定目标、任务等，通过其下属的各个子领域专家小组采取各种方法〔召开会议或者通信调查等方法〕拟定技术课题清单，代替经典德尔菲法的第一轮调查。大规模德尔菲本钱较高，周期较长，一般只进行两轮，相当于经典德尔菲的第二和第三轮调查。对调查的结果往往组织高层次专家进行审核和论证，形成最后预见结果。2023/10/18365.2.3德尔菲法的关键问题专家组的形成专家筛选一般应注意：对专家自身的要求、专家样本结构的代表性以及专家的人数。国外有资料认为，在一定领域连续工作10年以上的有关人士都可称为专家。可以建立一个完备的评价专家库，包括专家根本信息〔姓名、年龄、学历、学位、研究方向、特长、从事工作等〕和专家特殊信息〔代表性研究成果、承担课题情况、获奖情况等〕。一般可按本领域专家、相关领域专家、管理专家各占一定的比例来选择。同时，专家的学派、单位、地区、经历、年龄结构等在选择时都要注意代表性。

德尔菲法选择专家的人数依课题性质和规模而定，一般的人数范围是10-20人，某些涉及面宽的重大课题，专家人数有时可以超过100人。2023/10/1837调查表的设计调查表的设计没有固定的格式，它因研究课题的不同而不同。一般，一份完整的德尔菲法调查表，应包括提问主体和附件两局部。提问主体即具体的调查内容；附件常包括调查的目的意义、具体要求、背景材料、专家回执等。应根据课题的性质、内容、要求来设计调查表的格式、工程、问题和表达方式，而且随着课题研究的进程，在原先一轮调查表和专家意见的根底上，设计新的一轮调查表，直至完本钱课题的研究。与一般的社会调查表相类似，要求陈述要清楚、用词要准确、防止组合事件，力求简明。此外，为了便于对专家意见的统计处理，调查表的设计应尽可能地采用表格化、符号化、数字化，有利于将一般定性问题用定量化方法处理，并以定量结果表述。2023/10/1838数据处理和表达描述性统计中的大多数内容都可以应用在德尔菲法的数据处理和表达中。德尔菲方法中主要使用的一些参数：积极系数。调查表的回收率，说明专家对该工程关心程度，通常要到达50%以上。权威系数〔Cr〕。用以反映专家对某咨询问题的权威程度，一般由专家对指标做出判断的依据〔Ca〕和专家对指标的熟悉程度〔Cs〕两个局部构成，即Cr=〔Ca+Cs〕/2。一般认为权威系数大于0.7较好。2023/10/1839专家对指标做出判断的依据赋值（分）可以从理论分析层面进行判断0.8-1按照实践经验判断0.6-0.8按照国内外同行的了解0.4-0.6按照直觉0.2-0.4专家对指标熟悉程度赋值很熟悉1熟悉0.8比较熟悉0.6一般熟悉0.4不太熟悉0.2不熟悉0专家意见的集中程度。一般用各指标评分均数和总分值比来表示。总分值比指认为该指标非常重要的专家占专家总数的百分比。评分均数和总分值比越大说明专家意见集中，该咨询问题重要。协调程度。由b个专家对k个观察对象或观察指标进行评分，检验b个评判员的评价结果是否具有一致性，可以使用KendallsW来进行衡量，

Kendalls

是Friedman统计量的标准化形式，可解释为协调系数，是评分者之间一致程度的测量，其范围从0〔完全不一致〕到1〔完全一致〕。使用SPSS进行计算时，可以依次选择:Analyze—NonparametricTests--KRelatedSamples，翻开TestsforSeveralRelatedSamples对话框，在TestVaribles中选入相应变量，同时选定KendallsW复选框。变异系数。说明专家对某一咨询问题认识的波动程度。变异系数越小，专家一致程度越高。标准差除以平均值即为变异系数的值。2023/10/18405.2.4德尔菲法的应用德尔菲法适用于那些缺少情报资料和历史数据，而又较多地受社会、政治、人为因素影响的课题。它既是一种预测方法，又是一种评价方法，其应用领域非常广泛。经典德尔菲法的侧重点仍然是预测，在进行相对重要性之类的评估时，往往也是预测性质的评估，即对未来可能事件的估计比较。主要有以下五个方面的用途：对到达某一目标的条件、途径、手段及它们的相对重要程度作出估计对未来事件实现的时间进行概率估计对某方案〔技术、产品等〕在总体方案〔技术、产品等〕所占最正确比重作概率估计对研究对象的动向和在未来某个时间所能到达的状况、性能等作出估计对方案、技术、产品等作评价，或对备选方案、技术、产品评价相对名次2023/10/1841情报学前沿领域的调查与分析为了对情报学的前沿领域进行识别和分析，北京大学信息管理系的研究组采用德尔菲方法，共进行了三轮问卷调查〔程琮等，2021〕。调查的对象主要是我国高等院校和专业科研院所一局部具有正高级职称的专家学者，以及几位美籍华裔学者。问卷调查所涉及的专家覆盖了我国大陆地区拥有图书馆学、情报学和档案学博士点的高校和有关科研院所。第一轮发放问卷35份，回收32份，回收率91.4%，第二轮问卷发放20份，回收11份，回收率为55%，第三轮问卷发放22份，回收18份，回收率为81.8%。在回收的所有问卷中，除第一轮和第三轮各有1张因填写不符合标准而作废的问卷外，其余均为有效问卷。2023/10/1842第一轮问卷有两种格式：封闭式和开放式封闭式问卷中列出了目前情报学研究10个领域，请专家判断它们是否属于情报学的前沿领域。结果见下表。专家还可以在“其他〞项下面补充列出他认为属于前沿领域的工程。专家们列出的领域非常分散，几乎普及情报学理论、技术和应用各个方面，与情报学密切相关的共有23个领域。2023/10/1843第二轮问卷调查及其统计结果鉴于一些专家在开放式问卷中列出的领域与封闭式问卷中列出的领域有较多重复或高度相关，故将两份问卷列出的领域加以合并，对个别领域的名称做了小的调整。对于认可度较低的领域：“信息网格与内容网格〞和“小世界现象〔六度分隔〕〞，在第二轮问卷设计中不再列入。由此形成第二轮问卷，其中被调查的有30个领域。请专家对所列每个领域属于情报学研究前沿的程度予以评分，分值为0-100，分值愈高表示该领域属于情报学研究前沿的程度愈高。同时，还请专家对“判断依据〞和“对该领域的熟悉程度〞两个栏目进行打勾选择。“判断依据〞栏列出5个选择项：“理论分析〞、“工作经验〞、“参考国内著作〞、“参考国外著作〞、“直觉〞。“熟悉程度〞栏目列出4个选择项：“最熟悉〞、“相当熟悉〞、“一般〞、“不太熟悉〞。2023/10/1844对第二轮问卷调查表的数据统计处理，主要采用了算术平均和加权平均的计分方法。加权平均是对每一个领域去掉专家评分的一个最高分和一个最低分，然后按分值相加平均而成。可以看出，各领域得分大致在75-91分的范围内。2023/10/1845第三轮问卷调查及其统计结果对第二轮问卷，根据每一领域得分的情况进行加权统计和排序，选出加权分高于80分的领域共23个，作为第三轮问卷调查的领域，调查表格式与第二轮根本相同。对第三轮问卷调查获得的数据进行的统计分析中，应用的统计分析指标主要有：等级〔相同时用自然数列的算术平均值表示〕专家意见集中度〔算术平均值，总分值频率，等级和〕专家意见协调度〔变异系数，协调系数，协调统计显著性〕专家积极性系数经测算，协调系数显著，因此，所得专家评价结果可信。2023/10/1846三轮问卷调查数据的综合比较分析第二轮平均分与第三轮平均分呈现出很强的正相关关系；第二轮平均分与第三轮等级和呈现出很强的负相关关系；而第二轮加权平均分与第三轮的平均分表现出较强的正相关；第二轮加权平均分与第三轮的等级和表现出较强的负相关。这些统计数据说明，第二轮的调查结果与第三轮的调查结果呈现出高度相关的关系，在解释和判定情报学前沿领域上有着很强的一致性。结论23个领域的变异系数相对来说都较低，只有2个领域变异系数在0.3以上，说明就问卷中每一个情报学前沿领域而言，专家意见的协调程度较高，意见较为一致。各领域总分值频率均普遍偏低，这说明我国情报学界对筛选出来的这23领域是否属于前沿领域，肯定度还不够高，需要进一步对这23个领域做调查和论证。2023/10/1847在现实生活中，我们面临的预测问题往往影响因素众多、相互作用复杂，很难直接找到描述系统开展变化规律的函数，使用其他的预测方法有时难以得到满意的结果。人工神经网络的出现，为解决这一类问题提供了有力工具。人工神经网络对人脑神经系统进行仿生，从而具有感知学习和推理的能力，非常适合模拟复杂的非线性系统。2023/10/18485.3人工神经网络5.3.1人工神经网络概述生物神经元人类大脑皮层包含约1011-1012个神经元，神经元由细胞及其发出的许多突起构成。细胞体内有细胞核，突起的作用是传递信息。输入信号的假设干个突起称为“树突〞或“晶枝〞〔dendrite〕，输出端的突起只有一个称为“轴突〞〔axon〕。树突是细胞体的延伸部，它由细胞体发出后逐渐变细，全长各部位都可与其它神经元的轴突末稍相互联系，形成所谓“突触〞〔synapse〕。在突触处两神经元并未连通，它只是发生信息传递功能的结合部。每个神经元的突触数目不同，最高可达105个，各神经元之间的连接强度和极性不同，并且都可调整，基于这一特性，人脑具有存储信息的功能。2023/10/1849人工神经网络的根本原理1943年，神经生物学家McCullochW.S.和青年数学家PittsW.A.合作，提出了第一个人工神经元模型，并在此根底上抽象出神经元的数理模型。第一家神经计算机公司的创立者与领导人RobertHecht-Neilsen认为人工神经网络是一个并行、分布处理结构，它由处理单元及称为联接的无向信号通道互连而成。处理单元〔ProcessingElement〕具有局部内存，可完成局部操作。每个处理单元有单一的输出联接，这个输出可根据需要被分支成希望个数的并行联接，这些并行联接输出相同的信号，即相应处理单元的信号，信号大小不因分支多少而变化。处理单元的输出信号可以是任何需要的数学模型，每个处理单元中进行的操作必须是完全局部的。也就是说，它必须仅仅依赖于经过输入联接到达处理单元的所有输入信号的当前值和存储在处理单元局部内存中的值。2023/10/1850该定义主要强调了四个方面的内容：并行、分布处理结构；一个处理单元〔人工神经元，ArtificialNeuron〕的输出可以被任意分支，且大小不变；输出信号可以是任意的数学模型；处理单元完全的局部操作。神经元是构成神经网络的最根本单元〔构件〕。因此，要想构造一个人工神经网络系统，首要任务是构造人工神经元模型。2023/10/1851MeCulloch-Pitts模型1943年W.McCulloch和W.Pitts合作提出对于第j个神经元，接受多个其它神经元的输入xi。Wij为突触强度，既第i个神经元对第j个神经元作用的加权利用某种运算把输入信号的作用结合起来，给出它们的总效果，称为“净输入〞，以Netj或Ij表示。净输入表达式有多种类型，其中，最简单的一种形式是线性加权求和，即：此作用引起神经元j的状态变化，而神经元j的输出yj是其当前状态的函数2023/10/1852M-P模型的数学表达式为：θj为阈值，sgn是符号函数，当净输入超过阈值，yj取+1输出，反之为-1输出。如果考虑输出与输入的延时作用，表达式可修正为2023/10/18535.3.2人工神经网络的根本要素Rumellhart、McClell和Hinton等曾经提出了著名的的PDP〔ParallelDistributedProcessing〕框架，认为人工神经网络由八个方面的要素组成：一组处理单元、处理单元的激活状态、每个处理单元的输出函数、处理单元之间的联接模式、传递规那么、把处理单元的输入及当前状态结合起来产生激活值的激活规那么、通过经验修改联接强度的学习规那么以及系统运行的环境〔样本集合〕。根本要素的不同组合构成了各种各样的神经网络，目前已产生了上百种模型。实践中常用的根本神经网络模型主要有：感知器神经网络、线性神经网络、BP神经网络、径向基神经网络、自组织神经网络和带有反响功能的Elman网络和Hopfield网络等。下面我们从人工神经网络设计的角度选择其中主要的三个局部予以介绍。2023/10/1854神经元功能函数神经元在输入信号作用下产生输出信号的规律由神经元功能函数〔fActivationFunction〕给出，也称激活函数，或称转移函数。f函数形式多样，利用它们的不同特性可以构成功能各异的神经网络。例如，线性函数、非线性斜面函数、阶跃函数、S型函数、硬限幅函数、竞争函数等。2023/10/1855神经元之间的联接形式网络中的神经元分成不同的组〔块〕进行组织的。在拓扑表示中，不同的块可以被放入不同层。层次〔又称为“级〞〕的划分，导致了神经元之间三种不同的互联模式。层内联接是本层内的神经元到本层内的神经元之间的联接，可用来加强和完成层内神经元之间的竞争：当需要组内加强时，这种联接的联接权取正值；在需要实现组内竞争时，这种联接权取负值。循环联接循环联接在这里特指神经元到自身的联接，用于不断加强自身的激活值，使本次的输出与上次的输出相关，是一种特殊的反响信号。2023/10/1856层间联接层间联接指不同层中的神经元之间的联接。这种联接用来实现层间的信号传递。在复杂的网络中，层间的信号传递既可以是向前的〔前馈信号〕，又可以是向后的〔反响信号〕。一般地，前馈信号只被允许在网络中向一个方向传送；反响信号的传送那么可以自由一些，它甚至被允许在网络中循环传送。在反响方式中，一个输入信号通过网络变换后，产生一个输出，然后该输出又被反响到输入端，对应于这个“新的〞输入，网络又产生一个新的输出，这个输出又被再次反响到输入端，如此重复下去。随着这种循环的进行，在某一时刻，假设输入和输出不再发生变化，那么表示网络稳定了下来，此时的输出将是网络能够给出的最为理想的输出。2023/10/1857人工神经网络的学习神经网络的学习就是对它的训练过程。即将由样本向量构成的样本集合〔样本集、训练集〕输入人工神经网络模型，按照一定方式调整神经元间联接权重，使网络能将样本集的内涵以联接权重矩阵的方式存储，从而在网络接受输入时，给出适当的输出。四十年代末，D.O.Hebb提出Hebb规那么。以此为根底，出现了多种形式的学习算法Hebb规那么中，学习信号简单地等于神经元的输出：权向量的调整公式为：2023/10/1858权值调整量与输入输出的乘积成正比。显然，经常出现的输入模式将对权向量有较大的影响。这种情况下，Hebb学习规那么需预先设置权饱和值，以防止输入和输出正负始终一致时出现权值无约束增长。Hebb学习规那么代表一种纯前馈﹑无导师学习。神经网络的学习规那么，大体可以分成三种类型：相关学习规那么：只根据连接间的激活水平改变权系数。常用于自联想网络，如Hopfield网络；纠错学习规那么：根据输出结点的外部反响改变权系数。在方法上它和梯度下降法等效，按局部改善最大的方向一步步进行优化，从而最终找到全局优化值。感知器学习就采用这种纠错学习规那么，例如BP算法。用于统计性算法的模拟退火算法也属于这种学习规那么。无导师学习规那么：是一种对输入测检进行自适应的学习规那么。ART网络的自组织学习算法即属于这一类。2023/10/18595.3.3人工神经网络的应用神经网络的应用领域正在不断扩大，它广泛应用于工程﹑科学和数学领域，也可广泛应用于医学﹑商业﹑金融甚至于文学领域。自20世纪90年代以来，人工神经网络也逐渐在社会科学领域得到广泛应用，如股票预测、汇率预测、GDP预测、人口预测、就业预测、劳动力迁移预测等。人工神经网络在数据处理、模式识别等方面的强大功能为经济行为分类和经济预测等领域的研究提供了新的方法和思路。下面通过一个房价预测的例子，具体介绍通过MATLAB软件实现人工神经网络分析的简要过程。事实上，可以通过很多软件实现来实现人工神经网络的运算，选用MATLAB是因为它除了提供大量相关函数支持编程以外，还附带有专门的神经网络工具箱以及神经网络的图形用户界面〔GUI〕。该用户界面视图清晰，操作简便，适合初学者使用。2023/10/1860基于人工神经网络的房价预测为了对某区域的房价进行预测，统计了506个房屋的相关信息，包括房屋价格和每个房屋的13个属性，这些属性对房屋的价格产生影响。翻开MATLAB提供的人工神经网络图形界面〔启动MATLAB，在命令行输入nnstart〕2023/10/1861选择曲线拟合，翻开曲线拟合对话框将采用两层前馈网络模型〔two-layerfeed-forwardnetwork〕构建神经网络，选用sigmoid函数作为激活函数，网络训练算法为Levenberg-Marquardt反向传播算法〔Levenberg-Marquardtbackpropagationalgorithm〕。如果没有足够的运算空间，将改用尺度化共轭梯度反向传播算法〔scaledconjugategradientbackpropagation〕。2023/10/1862选择数据进入数据选择窗口，指定输入数据〔input〕和目标数据〔targets〕。在这个例子中，前者是506个房屋的13个属性构成的13*506的矩阵，后者那么为506个房屋的价格，为1*506的矩阵。可以直接读取保持在excel中的数据，但需要注意的是，读入的数据都被命名为data，需要及时改名〔例如可命名为house_input，house_target〕，否那么后面读入的文件会把上一个data里存的内容覆盖掉。本例采用Matlab自带的样本数据集，点击“LoadSampleDataSet〞，选择其中的HousePricing即可载入。2023/10/1863指定训练集、验证集和测试集进入验证和测试窗口〔ValidationandTestDatawindow〕，输入数据被随机分成训练集、验证集和测试集。一般默认为训练集占70%，验证集和测试集分别为15%。当然也可以根据需要予以调整。2023/10/1864指定网络结构进入网络结构窗口，指定隐藏层神经元的个数，系统默认为10，如果运行结果不理想，可以返回进行调整。2023/10/1865训练神经网络点击训练按钮，开始训练神经网络。在较新的MATLAB版本中〔例如MATLAB2021〕，还可以在这个窗口指定训练算法。对于大多数问题，可以采用Levenberg-Marquardt算法如果数据集较小噪音较大，可以考虑贝叶斯正那么化算法〔BayesianRegularization〕如数据集很大，那么可使用标度共轭梯度算法〔ScaledConjugateGradient〕。2023/10/1866训练结果如连续6次迭代都没能降低验证误差，训练就会自动结束〔validationstop〕，并显示结果主窗口。在这个窗口中，可以查看训练用时，训练性能等信息。系统默认使用均方差衡量训练性能。在这个例子中，训练在迭代了20次后结束，用时1秒〔这个时间会因为机器配置等原因有所不同〕。2023/10/18672023/10/1868结果保存与使用如果对训练结果比较满意，那么进入保存窗口，输出训练好的网络以及相关的数据。甚至可以生成脚本和simulink模块，以供进一步的使用。需要注意的是，选中保存所有值〔saveallselectedvaluesabovetoMATLABstructnamed〕选项并不写为外部文件，在关闭程序并重启后结果即不可见。使用save命令那么可以保存为外部文件以备下次调用，例如：在MATLAB命令行输入：savemynet1。但必须先选中对net的保存，并执行保存结果〔SaveResults〕选项，注意不能同时选保存所有值选项〔saveallselectedvaluesabovetoMATLABstructnamed〕。2023/10/1869保存以后的神经网络训练结果可以在以后进行调用，并使用新的input数据集来求得相应的output数据集。具体可以通过以下MATLAB命令来实现。>>savemynet1>>loadmynet1>>myinput=xlsread('House_input.xlsx');>>myoutput=net(myinput)其中，第三行命令后面加“；〞号，表示不在屏幕上显示结果；数据集的名字中不可以使用用中划线，但可以用下划线；一般情况下，MATLAB禁止在bin文件夹下保存结果。此外，使用新的数据集来进行预测时，存在excel表格中的行表示属性，列表示实例，与SPSS中的数据相反。2023/10/1870回归分析就是用数学表达式来描述相关变量之间的关系，对未来进行预测的一种数学方法。主要解决以下两个问题：确定几个变量之间是否存在相关关系，如果存在，分析研究一个或几个变量的变动对另一个变量变动的影响程度，找出他们之间适当的数学表达式；用自变量的值去推测因变量的值或范围，且要估计这种预测可以到达何种精确度。2023/10/18715.4回归分析法5.4.1简单线性回归模型构建实际模型必然包括能够反映随机性的方法，随机性是真实世界中的各种过程的一局部。这样的模型称为概率模型〔probabilisticmodel〕。为了建立概率模型，可以从与我们想建立的模型关系较为接近确实定性模型开始。然后增加一个随机项，以衡量确定性成分的误差。一阶线性回归模型：y=β0+β1x+ε〔其中，y=因变量；x=自变量；β0=截距；β1=斜率；ε=误差变量〕估计系数——最小二乘法根据观测得到的自变量和因变量之间的一组对应关系，找出一个给定类型的函数y=f(x)，使得它在各个观测点处所取值与观测值在某种尺度下最接近，即在各点处的总的偏差〔变差、误差〕平方和〔SSE〕到达最小。2023/10/1872误差变量误差变量的概率分布必须满足下面四个条件：回归诊断〔regressiondiagnostics〕2023/10/1873评估模型如果拟合程度低，就应该放弃线性模型而采用其他的模型。斜率的t检验：假设变量间没有线性关系，即斜率为0。零假设为斜率等于0；备择假设为斜率不等于0；检验统计量为t：

〔其中，Sb1是b1的标准偏差〕判定系数：在许多情况下，衡量线性关系的强弱也很有用，特别是在比较不同模型的时候。具有这个作用的统计量是判定系数，用R2表示。2023/10/1874简单线性回归的应用模型通过评价为我们接受以后，就可以用它来预测和估计因变量的值。给出一个x的值，带入回归方程得到的对应的y值称为点预测。点预测本身并不能说明这个值与真实值的接近程度。为此,需要计算特定y值预测区间的置信区间估计：其中，xg为给定的x值，且有时需要预测给定x条件下y期望值的置信区间估计：2023/10/18755.4.2多元线性回归回归模型与必要条件

〔应符合的必要条件与单元线性回归一样〕估计系数与评价模型估计系数的方法：最小二乘法2023/10/1876系数的检验：假设变量间没有线性关系〔其中，i=1,2,……,k〕R2和调整后的R2调整后的R2也叫做调整自由度的判定系数。它考虑了样本变量和自变量的个数。如果自变量的个数相对于样本容量来说较大，那么未调整的R2可能会高的没有实际意义。2023/10/1877检验模型的有效性H1：至少有一个βi不等于0如果原假设为真，自变量中没有一个与因变量相关，模型无效。如果备择假设为真，即至少有一个βi不等于零，那么模型还是有一定的效果。检验统计量:2023/10/1878回归诊断同简单线性回归一样，需要计算残差，并绘制残差的直方图，检验误差变量是否服从正态分布绘制残差与y的预测值的散点图，检验误差变量的方差是否为常数；如出现非正态性或异方差性，可对因变量予以变换，例如对数变换、倒数变换等绘制残差与时间的关系图，检验误差项是否独立〔时间序列数据〕多元线性回归特殊的问题：多元共线性，又称为共线性或组间相关。是自变量之间相关的一种情况。多元共线性会产生两个不利的影响：估计回归系数时将产生较大的抽样误差会影响系数的t检验，使依据t检验做出的是否线性相关的推断发生错误庆幸的是，多元共线性不会影响F检验。2023/10/1879例子：利用回归分析预测人寿保险公司客户寿命人寿保险公司对预测客户寿命的长短感兴趣，因为它们的保险费和盈利水平依赖于这一数据。一家保险公司的保险精算师选取了最近去世的100位男性客户作样本，记录了客户的年龄及其祖父母、父母去世时的年龄。相关数据存储于“人寿保险公司.sav〞中。基于这些数据进行回归分析并建立回归模型；预测一位父母的寿命都是70岁、祖父的寿命是75岁、祖母的寿命是80岁的客户的寿命〔置信度为95%〕；估计所有母亲的寿命是75岁、父亲的寿命是65岁、祖母的寿命是85岁、祖父的寿命是80岁的客户的平均寿命〔置信度为95%〕。2023/10/1880调用SPSS主菜单的Analyze—〉Regression—〉Linear命令，翻开对话框，指定因变量〔客户寿命Longevit〕和自变量〔客户的祖父、客户的祖母、客户的父亲、客户的母亲去世时的年龄〕，以及回归方式：逐步回归。2023/10/1881在Statistics栏中，选择Estimates以输出回归系数B的估计值、t统计量等；选择Durbin-Watson进行DW检验；选择Modelfit输出拟合优度，F统计量值等。2023/10/1882在Plots栏中选择Histogram绘制标准化残差的直方图；选择Normalprobabilityplot绘制标准化残差分布与正态概率比较图；绘制残差与y的预测值的散点图，检验误差变量的方差是否为常数。2023/10/1883提交运行，并在输出窗口中查看结果系统在进行逐步回归过程中产生了两个回归模型，模型1先将与因变量〔客户寿命Longevit〕线性关系最密切的自变量MOTHER引入模型，建立它们之间的一元线性回归模型。而后再逐步引入其他变量，模型2说明又将自变量FATHER引入，建立了二元线性回归模型。可见，客户祖父母的寿命对客户寿命的影响相对较小。回归模型概述表中给出了两个模型各自的R2和调整后的R2。第一个模型中客户寿命中有49.3%的变异可以用客户母亲寿命的变异来解释。第二个模型中客户母亲寿命和客户父亲寿命的变异可以解释客户寿命中73.1%的变异。两个模型都通过了F检验。此外，F统计量的值较大，t统计量的值也通过了检验，不存在严重的多元共线性问题。2023/10/18842023/10/1885回归残差的直方图与图上的正态分布曲线相比较，可以认为残差根本服从正态分布。2023/10/1886观测量累计概率图：纵坐标为期望累计概率分布，横坐标为观测量累计概率分布，图中的斜线对应着一个均值为0的正态分布。如果散点密切地散布在这条斜线附近，说明残差服从正态分布。如果偏离这条线太远，应该疑心残差的正态性。2023/10/1887残差与y的预测值的散点图用以检验误差变量的方差是否为常数，随着的变化，残差无明显变化，因此误差变量的方差为常数，不具有异方差性。进行预测在原始数据中回归模型的自变量下方输入给定的值，相应的因变量将产生缺失值；选择主菜单Analyze—〉Regression—〉Linear，翻开LinearRegression对话框。指定自变量和因变量；单击Save按钮，选择PredictedValues栏中的Unstandardized，保存非标准化预测值在一个新变量中；选择PredictionIntervals栏中的Mean和Individual，并在ConfidenceInterval框中输入置信度，保存所输入的置信度条件下y期望值和特定y值预测区间的上下；提交运行，除了输出回归分析结果外，还将在数据文件中生成pre_1、lmci_1、umci_1、lici_1和uici_1等变量。其中，pre_1保存点预测值，lmci_1和umci_1分别保存y期望值预测区间的下限和上限，lici_1和uici_1分别保存特定y值预测区间的下限和上限。2023/10/18885.4.3非线性回归非线性回归〔NonlinearRegressionAnalysis〕是寻求因变量与一组自变量之间的非线性相关模型的统计分析方法。如不能确定一个适当的模型，可借助曲线估计过程预先分析，或借助散点图，直观观察变量的变化，将有助于确定一个合用的函数关系。在一般统计软件中，会提供常用的非线性回归模型，供使用者参考。2023/10/1889练习：某研究机构为研究儿童的智力状况，调查了16所小学的平均语言测试得分〔y〕与家庭社会经济状况综合指标〔x1〕、教师语言测试得分〔x2〕及母亲教育水平〔x3〕的数据，试进行多元回归分析〔linearregression2.sav〕。旅游业的经营易受季节的影响，某旅游胜地的一家旅馆记录了最近5年每个季度的入住率。旅馆经理关心以下问题：五年来，这家旅馆的入住率是否呈现上升或下降趋势？下一年，每个季度的入住率分别是多少？对于这样的问题，时间序列分析是很好的解决方法。2023/10/18905.5时间序列分析5.5.1时间序列的概念及构成因素时间序列〔timeseries〕数据按照一定的先后顺序〔例如时间〕建立起来的同一变量的一组数列或一组观察数据就是时间序列数据。可以是时间顺序，也可以是具有各种不同意义的单调递增的量，如温度或速度。时间序列只强调顺序的重要性，而并非强调必须以时间顺序排列。序列中的数据或数据点的位置依赖于“时间〞，即数据的取值依赖于“时间〞的变化，但不一定是“时间〞t的严格函数；每一时刻上的取值或数据点的位置具有随机性，不可能完全准确地用历史值预测；前后时刻〔不一定是相邻时刻〕的数值或数据点的位置有一定的相关性，这种相关性就是系统的动态规律性；时间序列往往呈现某种趋势性或出现周期性变化的现象。2023/10/1891大量事实说明，一个时间序列往往是以下几类因素〔或成分〕的叠加或耦合长期趋势运动〔Tt〕。指时间序列的长期开展趋势。循环运动〔Ct〕。也称循环变差，指时间序列围绕趋势线或趋势曲线的长期振动或摆动。通常是指周期为一年以上，由非季节因素引起的涨落起伏波形相似的变动。季节运动〔St〕。或称季节变差，指一年或更短的时间之内，由于受某种固定周期性因素〔如自然、生产、消费等季节性因素〕的影响而呈现出有规律的周期性波动。随机波动〔Rt〕。随机波动是指由于大量的随机因素产生的宏观影响。随机波动往往掩盖了其他相比照较容易预测的时间序列成分因子。根据中心极限定理，通常认为随机变动近似服从正态分布。2023/10/1892时间序列分析每一个时间序列都包含了产生该序列的系统历史行为的全部信息。时间序列分析就是一种根据动态数据揭示系统动态结构和规律的统计方法。其根本思想是根据系统的有限长度的运行记录〔观察数据〕，发现其中蕴含的规律，建立能够比较精确地反映时间序列中所包含的动态依存关系的数学模型，从而预测出未来的时间序列变量值。2023/10/18935.5.2时间序列数据的预处理缺失值替换转换〔transform〕缺失值替换〔replacemissingvalues〕定义时间变量数据〔Data〕定义日期〔DefineDates〕2023/10/1894时间序列.sav；移动平均.sav时间序列的平稳化如果能明确时间序列的成分因子，就能够更好地进行预测。但随机波动的存在加大了这一工作的难度。减少随机波动的最简单的方法之一就是时间序列平滑法，其中，常用的主要有移动平均和指数平滑。移动平均移动平均值〔movingaverage〕是某一时期及其相邻时期内的时间序列数据的算术平均值。需要注意的是，移动平均值需要被放在被平均的一组值的中心，以对应具体的时刻，形成新的时间序列。对于奇数的期数来说，做到这一点很容易，可是如果取偶数就存在困难。例如计算4期移动平均，解决方法是求中心移动平均值：计算4期移动平均值序列的2期移动平均。2023/10/1895指数平滑〔exponentialsmoothing〕移动平均法存在两

人人文库> 全部分类> 行业资料 > 信息产业

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

回归分析法简单线性回归

文档简介

温馨提示

最新文档

评论

相关文档