信息资源管理 课件 6-信息分析_第1页
信息资源管理 课件 6-信息分析_第2页
信息资源管理 课件 6-信息分析_第3页
信息资源管理 课件 6-信息分析_第4页
信息资源管理 课件 6-信息分析_第5页
已阅读5页,还剩90页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第六章

信息分析《信息资源管理》目录content2信息分析概述0101信息分析基本方法0202大数据分析法0303情报关切下的分析与应用04046.1信息分析概述3长尾理论的提出01美国施乐公司于二十世纪中后期首次推出办公用复印机,垄断世界复印机市场。随着佳能等日本企业进入复印机市场后,行业市场竞争加剧,施乐公司因忽略了全球性的信息分析,未能及时调整经营战略,被迫陷入被动地位,其全球市场份额由82%下降到35%。当施乐公司对日本公司的产品和价格进行分析时发现,日本佳能公司复印机的销售价格与本公司成本价格一致,且并非采用低价倾销策略。此外,其质量也并不逊色。4案例:美国施乐公司重夺市场份额施乐.加强对竞争对手分析,反败为胜[EB/OL].[2021-08-26]./auto/db/detail.aspx?db=998001&rid=38长尾理论的提出01通过对日本公司的产品进行细致的信息分析比对,施乐公司发现对手公司在产品导入时长和所消耗的人力上都只有本公司的一半,且设备安装时间仅为本公司的三分之一,这便是日本公司成本大幅降低的关键原因。为提升市场竞争力,争夺市场份额,施乐公司加强对对手公司的信息搜集、处理和分析工作,还成立了专门的竞争情报研究部门,并展开了全球性的、全国性的和地区性的竞争信息分析和研究工作。在制定长期战略计划的同时,利用遍布美国的37个销售网点来收集市场信息,建立相应的顾客信息数据库。此外,施乐公司还专门剖析对手企业的专利技术和秘密技术等,从而了解对手公司降低产品成本,提升产品质量的制造原理和使用方法。最终,施乐公司夺回了其原有的市场份额。5案例:美国施乐公司重夺市场份额施乐.加强对竞争对手分析,反败为胜[EB/OL].[2021-08-26].

/auto/db/detail.aspx?db=998001&rid=38长尾理论的提出01为达到扩大市场份额的目的,美国施乐公司综合运用定性及定量化的信息分析方法来提升市场竞争力,在制定长期战略计划的同时,还根据市场环境及时调整战略决策,以达到信息分析的最优效果。通过上述案例可以发现,信息分析在企业提升市场竞争力、降低生产成本、抢占市场份额的过程中发挥了关键作用。只有依靠事实数据,基于科学的方法对对手企业进行详细的剖析,才能做到知己知彼,百战不殆。6案例:美国施乐公司重夺市场份额信息分析的概念、类型、特征及作用01科研领域:信息分析是运用科学的理论、方法和手段,在搜集、加工和整理海量信息的同时,把握客观事物发展运动的规律[1]。信息分析是以社会用户的特定需求为依托,采用定量及定性分析方法对文献信息进行收集、整理、鉴别、评价、分析和综合,从而形成新的信息产品增益,服务于具有科研性质的智能活动的决策[2]。军事领域:又称“情报分析”,军事情报分析是通过对军事情报特性、工作规律和指导规律进行研究和概括,对军事情报工作实践进行思考、分析和总结,从而更好的服务于国防政策制定、指挥作战的战略决策的过程[3]。7[1]查先进.信息分析与预测[M].武汉:武汉大学出版社,2000:2.[2]朱庆华.信息分析:基础、方法及应用[M].北京:科学出版社,2004:4.[3]高金虎.军事情报学研究现状与发展前瞻[J].情报学报,2018,37(5):477-485信息分析的概念、类型、特征及作用01政治领域:政治信息分析指国家机关、团体组织和个人在法律和道德允许的界限内对与竞争对手及环境相关的信息进行收集、分析、总结和概括,以实现维护国家和民族利益,提升综合国力和国家核心竞争力的目的[1]。经济领域:经济信息分析指通过对经济事物过去和现在状态的数据和资料信息进行深加工,认识和总结经济事物发展的特定规律,基于科学的理论方法对其发展状态进行分析预测,以期为经济发展提供决策依据[2]。8[1]唐超.国家竞争情报系统构架的基础性理论框架研究[D].天津:天津师范大学,2008:22.[2]滕佳东.经济信息管理与分析教程[M].北京:经济科学出版社,2001:59.信息分析的概念、类型、特征及作用01参考不同学者对信息分析概念的界定,信息分析的定义包含3个部分:结合研究分析方法。以用户需求为基础进行数据的处理,这里的用户需求不仅仅局限于科技领域,还包括政治、经济、军事等诸多领域。将数据处理结果进行深加工以实现信息增益,从而为不同用户群体的战略发展决策提供支持。9信息分析的概念、类型、特征及作用01大数据及人工智能等技术为信息分析的发展带来了机遇和挑战,而信息分析概念的界定也逐渐模糊化。数据分析(DataAnalysis)、信息分析(InformationAnalysis)和情报分析(IntelligenceAnalysis)常常被认为是相同的概念。在很多情境下,信息分析是一种广义上的理解,其在延伸情报分析思想的基础上,以数据分析为基础,不断吸纳和融合其他学科的理论方法,进一步加深了学科间的融合。综合来看,对信息分析的理解可以从信息链的广义视角作出阐释,因为从本质上看,信息分析及信息链要素上的各种分析都具有相通性或相关性,在特定情境下则显示出差异。10信息分析的类型、特点和作用01信息分析的类型:按分析方法划分。基于方法性质,信息分析的方法可以划归为定性分析方法、定量分析方法以及定性与定量相结合的方法。按所属领域划分。按照信息所属的不同领域,可将信息分析分为政治信息分析、经济信息分析、科技信息分析、军事信息分析和社会信息分析等。按分析内容划分。按照不同的信息分析内容,可将信息分析划分为评价信息分析、比较信息分析、跟踪信息分析和预测信息分析等。11信息分析的类型、特点和作用01信息分析的特点:主体性和针对性。信息分析的主体性和针对性体现在两方面:一方面,信息分析为特定组织的行为活动提供服务。另一方面,信息分析是以用户需求为导向,其总是针对特定事物开展,以达到为生产、决策及科研活动服务的目的。系统性和综合性。信息分析的系统性体现在信息分析的各个过程中,包括信息分析中系统化的数据采集与处理、信息分析程序及方法的结构化以及信息分析理论、方法和知识的系统化应用。信息分析的综合性则体现在其对不同来源、不同格式数据的整合、定量及定性分析方法的综合应用以及政治、经济、科技等诸多领域的综合考量。科学性和创造性。信息分析是科学技术发展的产物。因此,信息分析工作建立在科学理论和方法论基础上,具有科学研究活动的一般特性。此外,信息分析工作在认识事物特性的同时,也致力于挖掘事物发展的规律。这个过程依靠研究人员知识积淀、敏锐的洞察力和准确的判断力,产生新的智力劳动成果,因此,信息分析具有创造性。12信息分析的类型、特点和作用01信息分析的作用:为科学决策服务。在科学决策的每一个环节,信息分析都扮演着重要的角色,信息分析工作也因此受到各级各类管理者和决策者的重视。为研发活动服务。科技活动以研发的形式表征。随着科学和技术的发展,研发活动也日益成为企业、部门、产业和国家竞争力的体现。信息分析的功能能够产生研发活动所需的有序信息资源,这些经过深加工的信息资源对科学研究具有重要的借鉴、启迪和推动作用。为开拓市场服务。信息分析的预测和反馈功能支撑其为开拓市场服务,具体体现在结合内部和外部信息资源,帮助用户识别市场机会、把握方向,精准突破新的市场,等等。13信息分析的流程02(1)确定分析问题满足政策制定需要满足科研项目需求满足大型工程项目需求满足产品开发需求(2)研究计划制定问题概述调查大纲研究方法人员分工完成时间和实施步骤预计成果形式14(3)信息采集、整理、评估和分析文献信息采集非文献信息采集信息形式整理信息内容整理(4)报告撰写主题确定材料选择结构设计提纲拟定撰写初稿修改报告信息分析的发展趋势0315分析内容的多元化。从决策主体的角度来看,信息分析不仅面向政府和企业的决策需求,针对个人的咨询服务也逐步兴起。从服务内容的角度来看,当前信息分析的服务内容已经囊括了经济、政治、社会、国防等诸多领域乃至细分领域。因此需要相关工作者构建从多维度、多领域视角开展信息分析研究的观念和思维。技术手段的现代化。在大数据与智能化环境下,数据资源、算力算法不断发展,各种形式的数据挖掘、知识发现等智能化信息分析软件得以开发和利用,从多个方面提升了信息收集、存储、分析和处理的能力,从而使得过去信息分析不能研究的问题或者难以研究的问题在技术赋能下变得可能。信息分析的发展趋势0316分析结果的市场化。信息分析的成果是体现信息分析人员智慧的劳动产品。将信息分析的结果商品化、将信息分析业务的经营产业化,是适应市场经济大环境的必然趋势。交流协作的多样化。信息分析交流与合作的多样化主要体现在服务范围及交流协作的多样化。一方面,引入和推进与国际接轨的行业准则和规范,建立国际范围内认可的工作流程,是实现信息服务范围国际化的关键。另一方面,加强各国对信息分析结果的交流与协作,监测信息分析的发展趋势,了解国际上关于科技、经济发展的动向,对推进信息分析的多样化也至关重要。6.2信息分析基本方法17推理法0118推理法是信息分析的基本逻辑学方法,推理法是从已知的信息和知识中推导未知的信息和知识,并获得新的认识和判断的逻辑思维方法,其反映了事物之间的内在联系和发展趋势,从而实现信息分析的预测功能。推理都是由前提、推理过程和结论三个要素组成。一个正确的推理既要内容真实又要形式正确。推理法0119归纳推理在一个平面内,直角三角形内角和是180度;锐角三角形内角和是180度;钝角三角形内角和是180度。而直角三角形、锐角三角形和钝角三角形包含了全部三角形。因此,平面内所有三角形的内角和都是180度。个别一般推理法0120归纳推理所谓归纳推理就是以有关某类思维对象个别或部分个体的知识为前提,从中推出关于该类思维对象全体的一般性知识的结论的推理。归纳推理的类型按照其发展的不同阶段可以分为古典和现代两种。根据前提中所考察的事物对象的范围不同,古典归纳逻辑把归纳推理分为完全归纳推理和不完全归纳推理。归纳推理完全归纳推理不完全归纳推理简单枚举归纳推理科学归纳推理推理法0121

推理法0122

推理法0123

推理法0124演绎推理演绎推理是由普通性的前提推出特殊性结论的推理。按照推理的前提是简单判断还是复合判断,演绎推理又分为:简单判断的推理——三段论等;复合判断的推理——假言推理、选言推理等。一般个别推理法0125

推理法0126演绎推理假言推理:基于一个假言判断的前提,推出其前件和后件,并通过肯定其后件或前件来论证原有假言判断结论正确性的推理方法。假言判断是断定事物之间条件关系的判断。假言推理分为充分条件假言推理、必要条件假言推理和充分必要条件假言推理。例如:

如果他是作案人,那他一定有作案时间,现已查明,他没有作案时间;所以,他一定不是作案人。推理法0127演绎推理选言推理:以至少一个选言判断为前提,并根据选言判断中“各选言支”之间的关系进行推演的推理方式。假言推理分为相容的选言推理和不相容的选言推理。相容的选言推理:

大前提:老舍是画家或作家;小前提:老舍不是画家;结论:老舍是作家不相容的选言推理:

大前提:电动汽车要么属于机动车,要么属于非机动车小前提:国家规定,电动车按机动车管理结论:电动车不属于非机动车分析与综合法0228分析与综合是人类在认识事物过程中将整体分解为部分,而后将部分整合为整体的逻辑思维方式,其主要解决部分与整体、系统与要素之间的问题。信息分析活动中研究对象较为复杂,分析与综合方法作为信息加工的基本方法,能够揭示事物的本质和规律,形成对事物的观点和看法,被较多应用于信息分析与研究工作中。分析与综合法0229表象和本质分析利用事物的表象与本质之间的关系进行分析的方法。本质是事物的根本性质,是构成事物的关键要素之间的内在联系。而表象则是事物的表面特征及其外部联系。表象和本质是揭示事物外部表现和内在联系间关系的范畴。通过表象和本质分析,能够透过现象,把握事物的本质特征。分析与综合法0230相关分析利用事物间的相关关系进行分析研究,以一种或几种已知事物来判断或推知未知事物的方法的统称。按照事物之间关联关系的不同,相关关系可以分为因果相关、伴随相关等。因果相关:基于已知事物与未知事物之间的因果关系对事物进行研究伴随相关:基于已知事物与未知事物之间相伴出现的特点对事物进行研究。分析与综合法0231因果分析因果分析是客观事物各种现象之间的一种普遍的联系形式。任何现象都有它产生的原因,任何原因也都必然引起一定的结果。引起某种现象出现的现象就是原因,由原因的作用而产生的现象就是结果。只要当某一现象出现时,另一现象必定会接着出现,就可认为这两个现象具备因果关系。分析与综合法0232因果分析因果分析通常需要遵循以下三点原则:居先原则:在时间上,原因在前,结果在后。共变原则:即结果跟随原因的变化而变化关联原则:即原因和结果作为两种现象需要互相接触,或通过一系列中介事物相关联。分析与综合法0233因果分析因果分析的三种形式:求同法:在不同的场合观察到相同的现象,这些不同的场合各有若干原因,其中有一个原因相同,则可初步确定该原因就是产生该现象的共同原因。求异法:所观察现象在第一种场合出现,在第二种场合不出现,而这两种场合只有一个原因不同,则可初步确定该原因为引发此种现象的原因。共变法:所观察现象发生变化的各种场合里,其他原因保持不变,有一个原因发生了变化,则可初步确定该原因是使所观察的现象发生变化的原因。信息计量法0334信息计量学分为广义的信息计量学和狭义的信息计量学。广义的信息计量学探讨以广义信息论为基础的信息计量问题,涉及范围十分广泛。狭义的信息计量学是通常意义上的信息计量学,主要基于数学和统计学等定量分析方法对信息的现象、过程和规律进行研究和描述。信息计量法0335信息计量学理论研究方法研究应用研究学科基本问题信息分布变化规律信息测度指标体系建立引文分析法词频分析法共现分析法等基于信息计量学的基本原理及方法对信息资源加工、整理、分析、解读对某一学科或技术领域的可能的发展方向进行预测信息计量法0336引文分析科学文献的引用与被引用,代表了科学知识的传承与利用。在科学文献体系中,文献间的关联和相互作用突出表现为文献间的引用关系。通过对文献引证频次进行分析,能够实现对某一学科、研究人员、期刊、机构、地区乃至国家科学水平和学术能力的评价。此外,研究者可以基于科学文献引文网络探索信息流的方向、规律和特征,从而挖掘科学发展的规律和方向。引文分析法是利用统计学和数学、及比较、归纳等逻辑学方法,对科学文献、期刊、著者等分析对象的引证与被引证情况进行分析,以揭示其数量特征及内在规律的分析方法。信息计量法0337引文分析的分类引文的数量分析引文的网状分析引文的链状分析引文分析法引文数据库可视化软件信息计量法0338引文分析的测度指标测度指标表示形式期刊载文量期刊所刊登的论文数量期刊引用量期刊引用其他期刊的次数期刊被引量期刊被其他期刊引用的数量引用率期刊参考文献总量/期刊载文量影响因子期刊论文的被引量/期刊可引用论文总量表

期刊测度指标信息计量法0339引文分析的测度指标测度指标表示形式共被引强度两篇文献共同被其他论文引用的次数被自引率主体文献被自引的次数/主体被引用的总次数耦合强度两篇文献同时引用一篇或多篇相同文章的次数自引率主体本身范围内文献引用的次数/主体引用的文献次数表

文献测度指标信息计量法0340引文分析的工具引文分析的工具主要是一些引文数据库,例如美国的《科学引文索引》(SCI)、《基本科学指标》(ESI)等,国内的如《中国科学引文数据库》(CSCD)、《中国科技论文与引文分析数据库》(CSTPC)、《中国社会科学引文索引》(CSSCI)等。美国《科学引文索引》SCI美国《基本科学指标》ESIGoogleScholar……中国科学引文数据库CSCD中国科技论文与引文分析数据库CSTPC中国社会科学引文索引CSSCI中国人文社会科学引文数据库中国引文数据库CCD……信息计量法0341引文分析的步骤选取统计对象根据所要研究的学科的具体情况,选择该学科中有代表性的较权威的杂志,确定若干期及若干篇相关论文作为统计的对象。统计引文数据在选取的若干篇论文中,分项统计每篇论文后面引文的数量,引文的出版年代、语种、类型,论文作者的自引量等。进行引文分析在获取的引文数据的基础上,根据研究的目的,从引文的各种指标或其他角度进行分析。得出结论根据引文分析原理和其他一般原则进行判断和预测,从而做出相应的分析结论。回归分析法0442回归分析法是运用数理统计方法,通过两个及两个以上变量之间的相关关系对未来状况进行预测的一种定量化研究方法。由于回归分析法提供了建立变量间相关关系的数学表达式的一般途径,且能够分析所建立公式的适用性以对其进行有效的控制和预测,因此被广泛应用于信息分析领域。回归分析法0443回归分析的基本步骤数据搜集设定回归方程统计检验确定回归系数预测及置信区间确定回归分析法0444回归分析模型的分类回归分析模型按自变量个数分类按变量的关系分类非线性回归模型线性回归模型一元回归模型多元回归模型回归分析法0445

回归分析法0446

回归分析法0447

回归分析法0448多元回归分析多元回归模型的统计检验t检验以判断多元线性回归方程中系数的作用是否显著。F检验用于判断多元线性回归方程在整体上是否显著成立。R检验通过负相关系数R的大小来衡量回归方程拟合真实数据的总近似水平。回归分析法0449应用:专利知识吸收和扩散演化规律及影响研究[1]张雪,张志强.专利知识吸收和扩散演化规律及影响研究[J/OL].科研管理:1-18[2021-10-13]./kcms/detail/11.1567.G3.20211001.2012.028.html.社会网络分析法05六度分隔理论:哈佛大学心理学教授斯坦利.米尔格兰姆曾将一封信件随机发送给50名参与者,要求参与者将这封信至一个股票经纪人手中。最终经过六次以内的人际传递,信的送达率达到了97%。任何两个人间最多只需要通过六个中间人建立联系,这便是著名的“六度分隔理论”。150定律:英国牛津大学人类学家罗宾.邓巴根据猿猴的智力与社交网络推断,人类智力允许人类拥有稳定社交网络的人数是148人,四舍五入则为150人,这就是著名的“邓巴数字”,也叫150定律。“150定律”指出人们可能拥有更多的好友,但一年内至少联系一次的好友圈最多由150个人组成。50起源:社会网络分析[1]BarnesJA.ClassandcommitteesinaNorwegianislandparish[J].Humanrelations,1954,7(1):39-58.[2]TraversJ,MilgramS.Anexperimentalstudyofthesmallworldproblem[M].Princeton:PrincetonUniversityPress,2011:130-148.社会网络分析法05社会网络由多个点(社会行动者)和各点之间的连线(行动者之间的关系)组成,是指由多个组织或者个人的节点所构成的社会结构,且能够展现节点之间的关联关系。社会网络分析是对社会关系结构及其属性进行分析的一套规范和方法。51社会网络分析法05社会网络分析方法的步骤确定研究问题明确研究对象和层次研究对象的选择和抽样数据收集数据整理和表示52社会网络分析法05科研合作网络分析科研合作网络是社会网络的一种重要形式,其形成基于研究主体间合作发文的交互关系。科研合作网络是无向网络,对科研合作网络指标的深入挖掘能够从宏观和微观角度呈现网络的结构属性和内在规律。53社会网络分析法05

54社会网络分析法05

55社会网络分析法05

56社会网络分析法05

57社会网络分析法05图中的政务Twitter用户之间的联系较为紧密,这说明相同类型的政务Twitter用户之间容易相互关注。其次,不同用户在该网络中的关注者数量差异较大,且具有一定的聚集效应。58案例:基于社会网络分析的政务微博影响力研究[1]吴锦池,余维杰.基于社会网络分析的政务微博影响力研究[J].情报科学,2021,39(02):78-85.6.3大数据分析法59关联分析01在美国沃尔玛连锁超市中,有管理人员在进行销售记录分析时发现,婴儿的尿不湿和啤酒这两种看起来毫不相关的商品,其销售数据曲线竟十分相似。于是,销售人员就将尿布与啤酒摆放在一起进行售卖,而这一举措也成功使尿布和啤酒的销量大幅上升。这一现象是由于美国妇女通常在家照顾孩子,所以她们经常会嘱咐下班回家的丈夫让其为孩子买尿不湿,而丈夫在买尿不湿的同时又会顺手购买自己喜欢喝的啤酒。60案例:尿布和啤酒关联分析01关联分析又叫关联挖掘,是无监督算法的一种。从上述案例可以看出,关联分析能够从大量数据中挖掘潜在的关联性和相关性,从而对一个事务中某些属性同时出现的规律和模式进行描述。关联分析的基本概念:项集(Itemset):由多个项组成的集合。若一个项集包括k个项,则称其为“k-项集”,k表示项集的长度。关联规则(Associationrules):若X和Y表示不相交的两个项集,则X→Y则表示两个项集间的关联规则。通过支持度和置信度能够衡量关联规则的强度,强关联规则同时满足最小支持度和置信度。支持度计数(Supportcount):表示指定项集出现的频数,用σ表示。支持度(Support):所有事务中,指定项集出现频次所占比重。置信度(Confidence):表示Y在X的交易中出现的频繁程度。频繁项集(Frenquentitemset):支持度大于等于所设定阈值的项集。61[1]徐涵.大数据、人工智能和网络舆情治理[M].武汉:武汉大学出版社,2018:161.关联分析01先验原理1:如果一个项集是频繁的,则其所有子集也一定是频繁的。先验原理2:如果一个项集是非频繁的,则其所有超集也是非频繁的62图

先验原理1图

先验原理2[1]TanP,SteinbachM,KumarV.数据挖掘导论(完整版)[M].范明,范宏建,译.北京:人民邮电出版社,2011:281.关联分析01Apriori算法Apriori算法是挖掘布尔型关联规则频繁项集的最基础和经典的算法②,其核心思想是通过多次扫描数据库并逐层迭代的方式来探索数据库中项集的关系。Apriori算法中支持度(Support)、置信度(Confidence)、频繁项集三个概念至关重要。Apriori算法的基本步骤:基于逐层搜索的迭代方式,k-项集用于搜索(k+1)-项集。基于最小支持度,获得频繁1-项集的集合L1,再基于L1找到频繁2-项集,以此类推,直到不能找到频繁k-项集连接:基于找到的Lk集合,将其两两连接,其中必有k-1个属性是相同的,产生候选集Ck+1剪枝:候选集中并不都是频繁项集,基于阈值剪枝后得到频繁k-项集的集合Lk。基于所得到的频繁k-项集,以置信度阈值为标准,挖掘产生强关联规则。63分类分析02在信息分析领域,分类能够对已知类别数据进行分析,从中发现分类规则,以预测新数据类别的数据挖掘方法,这不仅解决了传统信息分析面对大数据无法有效处理的问题,同时也扩宽了信息分析的应用范围。当前,分类算法是应用最为广泛的数据挖掘方法,是有监督学习的一种。数据分类算法中的基本概念:训练集(TrainingSet):为建立模型而被分析的数据集合为训练集。其中的单一样本为训练样本。分类器(Classifier):通过对训练集的训练生成的用于分类的模型。测试集(TestingSet):将分类器应用于测试集,能够对分类器的准确性和性能进行评价。当未达到理想效果,就需要对训练集重新训练,直到分类器的准确性和性能达到要求。将分类器应用于未分类的新数据中,就可以对数据所属类别进行预测。64分类分析0265图

分类算法原理分类分析02常见的分类算法朴素贝叶斯算法(NaïveBayesClassifier,NBC):一种基于概率统计原理进行分类的算法,其基于贝叶斯定理对样本所属类别的概率进行预测。决策树(DecisionTree):基于决策判断树对无次序、无规则的实例进行归纳学习,并推理出树形结果的分类规则。支持向量机(SupportVectorMachine,SVM):对数据进行二元分类的广义分类器,其决策边界为对学习样本求解的最大边距超平面。支持向量机最终的决策函数仅由少量支持向量确定,得到局部最优解,从而避免了高维样本数据计算的复杂性,大大简化了分类问题。K-近邻算法:数据挖掘分类技术中最简单、常用的方法之一。66K-近邻分类算法K-近邻算法根据与所需预测点最近的几个样本值来推断预测点的结果。相比于其他分类算法,K-近邻分类算法是一种懒惰学习算法,因为这种算法并没有实际的训练过程,也不产生真实意义上的“分类模型”,而只是将训练样本按原样保存,当需要分类新样本时,与其最近的k个样本就可代表新样本的类别。分类分析0267图K-近邻分类示意图

来源:/p/25994179聚类分析是指基于样本特征之间的相似性程度,对一批没有标记类别的模式样本集进行分类的过程。其中,样本特征之间的相似性程度是以样本间的距离远近作为评价指标,即两个样本的距离越近,则其相似性就越大。聚类分析与分类分析的区别:分类问题是在特定类别标识下探寻新样本的所属类别。聚类分析所划分的类别是未知的,是通过对样本数据集的分析比较来生成新的类标识。聚类分析0368图

聚类分析原理示意图聚类分析的步骤:聚类分析0369相似度计算和分组特征获取和选择特征标准化和降维存储准备分析阶段(使用聚类结果进行分析,考察结论是否科学合理)数据准备聚类结果展示聚类结果评估聚类阶段(构建聚类模型)聚类统计量:①距离②相关系数数据对象的多样性基于模型的算法基于划分的算法基于密度的算法基于网格的算法层次聚类算法……可视化:Ucinet、Pajek、CiteSpace分析工具:SPSS、SAS、STAT、S-Plus语言:R、python……其他:Matlab、Ntsys、Weka……提高聚类效果聚类分析的类型:基于分层的聚类。这种聚类方法是对给定的数据集进行逐层分解。初始时,每个数据记录为单独的一组,在迭代过程中不断将相互临近的组合成为一组,直到所有记录组成一个分组为止。由于分解策略不同,这种聚类方法分为“分类法”和“凝聚法”两种。典型的算法包括BIRCH算法、CURE算法等。基于划分的聚类。这种聚类方法是将包含n个对象的数据库划分成k类,其中k≤n。k值由用户指定,对于给定的k,首先由算法给出初始分组,并通过反复迭代的方式,基于上述基本聚类原理确定最优分组。典型的算法包括K-means算法、K-medoids算法等。聚类分析0370聚类分析的类型:基于密度的聚类。基于密度的聚类方法弥补了层次聚类算法和划分聚类算法等只能发现凸形聚类簇的缺陷,其通过将区域内点的密度与阈值相比较,如果密度大于阈值,则将其加入到相近的聚类,该方法中阈值的设定是以用户经验为主。典型的算法包括DBSCAN算法等。基于模型的聚类。这种聚类方法针对数据对象集合以潜在的混合概率分布为基础生成假设,且给每一个聚类假定一个模型,试图将给定数据与假定的数据模型达成最佳拟合。典型的算法包括期望最大化方法、自组织神经网络方法及概念聚类等。聚类分析0371聚类分析的类型:基于网格的聚类。这种聚类方法将数据对象所在的空间划分为有限数目的单元,从而形成网格结构,通过对网格进行聚类操作来得到聚类结果。由于该方法处理时间仅与每一维空间所划分的单元数量有关,因此具有处理时间短等优点。典型算法包括STING算法等。聚类分析0372K-means算法K-means算法是典型的基于距离进行划分的聚类算法。由于该方法简单、操作便捷、且具有高效处理大量数据的优势,是数据挖掘领域较为常用的一种聚类算法。K-means算法也被称为快速聚类和动态聚类。k是指研究者制定的聚类数目,means是指聚心,为一个聚类的凝聚点。聚类分析0373K-means算法K-means算法的步骤:分析变量的确定;从n个数据对象中选定k个对象作为初始聚类中心;按照距初始聚心距离最小的原则将各数据对象分配到各聚心所在类别,完成第一次迭代。计算每个聚类中数据对象的均值,并依照均值再次计算各数据对象到聚心的距离,按照照最小距离原则重新划分聚类。重复③-④步,经过t次迭代,直至每个聚类中数据对象不再发生变化,输出最终的聚类结果。聚类分析0374K-means算法K-means算法的优点:不需要在计算机处理过程中存储距离矩阵,因而其占据的存储空间和计算工作量较小,适用于大样本文件的聚类分析。简单、快速、且对大数据集的处理效率较高并具有可伸缩性。聚类分析03756.4情报关切下的分析与应用76竞争情报是指经过筛选、提炼和分析后,可据之采取行动的关于竞争对手和商业环境的信息集合。竞争情报的层次在战术层面,竞争情报分析要解决既定战役目标下的竞争模式及其实现,在其作用时限内(三个月-一年)为短期的任务提供清晰的指导;在战役层面,竞争情报分析服务于企业既定战略下所要达成的目标。根据Fahey的观点,在该层面竞争情报分析关注市场战略;资产、能力/素质、技术;活动/价值链、网络;假设;基础设施、文化等方面的要素。在战略层面,竞争情报分析关注实现目标的关键资源投入和运用,最典型的分析框架是Porter的五力竞争模型。在愿景层面,竞争情报分析需要回答企业“在长期想要达成的目标”或它“如何看待自己”这一重大问题。该层面的竞争情报分析框架更为广泛,远远超出企业边界乃至行业边界。竞争情报分析0177竞争情报的关键问题与竞争对手的比较挖掘与竞争对手的联盟关系及产品的潜在市场对细分竞争市场未来前景的预测以及从总体上把握竞争对手的战略竞争情报的分析方法基础商业分析的常用方法,例如核心竞争能力分析、企业战略分析、财务分析、产品、价格及市场分析等。完全信息条件下的分析方法,可以看作是经典的信息分析方法。例如时间序列分析、标杆分析、关键成功因素分析、SWOT分析、价值链分析、战争游戏法、博弈分析、层次分析、投入-产出分析等等。不完全信息条件下的分析方法,例如信号分析、片段情报分析、内容分析、竞争性假设分析、预警分析等等。这一类分析方法最能体现竞争情报分析的“竞争”二字。竞争情报分析0178科学注重对理论方法的探索,其目的是在现象中寻求本质而完成知识创造的过程,是对自然现象进行阐述的理论成果。技术是人类在解决实际问题中所采用的方法和手段,其以物质形态呈现新的技术、工艺和方法等,通过改造客观世界来满足人们的需求。随着科学和技术的转化周期不断缩短,科学与技术也逐渐发展成为不可分割的整体。科技情报分析0279科技情报信息是通过基础研究、应用研究和开发研究三个层次的科技活动产生、存储、转换和加工形成的各种信息。科技情报信息是有关科学及技术活动的一切信息的总称。科技情报的分析与研究是指按需求基于信息载体所传递的科学技术信息或知识单元,即基于用户的特定需求,在广泛搜集和整理科技情报信息及资料的基础上,基于科学的分析方法对科技情报信息进行整理、归纳和评估以提出具有预测性质的研究结论的过程。科技情报分析0280[1]卢小宾.信息分析[M].北京:科学技术文献出版社,2008:199.[2]刘全根.科技情报分析研究[M].兰州:甘肃科学技术出版社,1993:7.科技情报分析研究的特征针对性。科技情报分析需要有明确的研究目的,这种目的是为了满足用户的某种需求。综合性。与信息分析相似,科技情报研究不仅在科技领域展开,还广泛应用于经济、政治和社会等诸多领域。时效性。情报分析需要在用户特定需求下,精准的为用户服务,才能发挥其最大的社会效益和经济效益。如果错过了需求的时效性,则情报分析也失去了价值。交叉性。科技情报分析的交叉性不仅体现在研究领域的交叉,也体现在研究方法的交叉。科技情报分析0281科技情报分析研究的过程科技情报分析0282图

科技情报分析流程[1]吕斌,李国秋.信息分析新论[M].北京/西安:世界图书出版公司,2018:62.专利分析专利的分类专利分为发明专利、实用新型专利以及外观设计专利三种类型。发明分为产品发明和方法发明两类。中国《专利法》规定,发明是指对产品、方法或者其改进所提出的新的技术方案,发明专利的有效期为20年。实用新型专利是指产品的形状、构造或者其结合所提出的适于实用的新的技术方案,其保护期限为10年。实用新型专利只针对具有立体形状、构造的产品而言,且产品必须能够在产业上利用,具有实用性。外观设计是指对产品的形状、图案以及色彩与形状、图案的结合所做出的富有美感并适用于工业应用的新设计,其有效期为10年。科技情报分析0283专利分析专利的特征独占性:对同一内容的发明创造,国家只授予一项专利权,且在一定的时间(专利权有效期)和地域(法律管辖区)内,任何单位和个人若未经专利权人许可,不得以生产经营为目使用、制造、销售进口,或使用其专利方法制造、许诺销售、销售、进口其专利产品。时效性:专利仅在法律规定的有效期保护期内有效,当保护期限结束后,专利权则自动失效,成为公共财富,可供他人无偿使用。区域性:专利的空间限制性,指一个国家授予的专利权,仅在该国的辖区内有效,其他国家和地区对其不具有法律约束力。科技情报分析0284[1]刘海桑.决策情报学从概念、框架到应用[M].厦门:厦门大学出版社,2018:160-161.[2]曹彩英.科技信息资源检索[M].北京:海洋出版社,2013:157.专利分析专利分析的类型科技情报分析0285图

专利分析方法专利分析的类型定量分析方法是在对大量专利文献进行加工整理的基础上,对专利的申请人、专利引用以及专利分类等特征进行科学计量分析。从而将零散的、分散的专利信息整合成为完整的、有价值的情报信息。定性分析方法则是基于演绎、归纳推理等定性分析方法提取专利文献的内在特征,来呈现某一具体技术领域的发展状态。科技情报分析0286技术预见技术预见(TechnologyForesight)是一种对科技、经济与社会的未来进行系统研究的情报收集过程,其致力于信息一体化以及资源的优化配置,是一种战略管理工具。\技术预见的分类(基于技术预见的功能和过程)调查研究方法:包括情景分析法、头脑风暴法、社会需求调查法等分析评估方法:对技术是否具有发展前景进行科学评价,主要包括科学计量学法、模型模拟以及专利分析法科技情报分析0287[1]曾忠禄.21世纪商业情报分析、理论、方法与案例[M].北京:中

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论