《数学建模方法浅谈》(中国工业大学--孟大志教授)_第1页
《数学建模方法浅谈》(中国工业大学--孟大志教授)_第2页
《数学建模方法浅谈》(中国工业大学--孟大志教授)_第3页
《数学建模方法浅谈》(中国工业大学--孟大志教授)_第4页
《数学建模方法浅谈》(中国工业大学--孟大志教授)_第5页
已阅读5页,还剩59页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、2021/4/11数学建模方法浅谈数学建模方法浅谈 孟大志孟大志北京工业大学北京工业大学Tel: 137013771082021/4/12李大潜院士倡导:李大潜院士倡导:问题驱动的应用数学。问题驱动的应用数学。数学建模的目的是科学研究与数学应用。数学建模的目的是科学研究与数学应用。应用数学方法:应用数学方法:数学建模和科学与工程计算构成了数学应数学建模和科学与工程计算构成了数学应用的两大支柱。用的两大支柱。2021/4/13引子:大学生的问题:引子:大学生的问题:数学建模数学建模 = 数学引模数学引模 ?目前的数学建模教学:目前的数学建模教学:介绍建模五步法(一节课);介绍建模五步法(一节课)

2、;工具训练(两节课);工具训练(两节课);讲解案例(二十节课);讲解案例(二十节课);练习(十节课)练习(十节课)如何建模?如何建模?一、一、数学建模的本质方法是什么?数学建模的本质方法是什么?2021/4/14实际或竞赛实际或竞赛的建模问题的建模问题课程学习与培训中课程学习与培训中的数学建模案例的数学建模案例 引用案例引用案例 借鉴案例借鉴案例类比、引用和借鉴是很有效的方法:类比、引用和借鉴是很有效的方法:现状!现状!数学建模方法数学建模方法= 创造性的本质方法创造性的本质方法 + 模型类比方法模型类比方法数学建模数学建模数学荐模数学荐模+数学引模数学引模一种初步实用一种初步实用的,基于的,

3、基于类比与经验的类比与经验的方法:方法:非普适的、非创造性的和非本质的!非普适的、非创造性的和非本质的!但是:但是:2021/4/15例一、例一、Web中的问题中的问题 网络已经成为现代人的一种生活方式。网络已经成为现代人的一种生活方式。在网上,每天有成千上万的多媒体文件在在网上,每天有成千上万的多媒体文件在传输(例如,路透社每天收到网上文本文传输(例如,路透社每天收到网上文本文件达件达20万)。试建立数学模型,使得可以万)。试建立数学模型,使得可以对这些文件进行自动分类,以便人们阅读对这些文件进行自动分类,以便人们阅读和使用。和使用。没有可类比的案例时怎么办?没有可类比的案例时怎么办?202

4、1/4/16例二、中国菜系研究例二、中国菜系研究 中国是一个美食及其文化非常丰富的国中国是一个美食及其文化非常丰富的国家,因为国土辽阔,人口众多。中国著名的家,因为国土辽阔,人口众多。中国著名的菜系:苏菜、闽菜、川菜、鲁菜、粤菜、湘菜系:苏菜、闽菜、川菜、鲁菜、粤菜、湘菜、浙菜、徽菜。菜、浙菜、徽菜。 请用数学建模方法研究这些菜系的特点。请用数学建模方法研究这些菜系的特点。 2021/4/171、模型、模型? 数学?数学模型?数学?数学模型?从基本概念的理解出发:从基本概念的理解出发:模型?模型?+ 数学?数学? 数学模型?数学模型? 如何建模?如何建模?问题:如何从数学模型的概念出发问题:如

5、何从数学模型的概念出发构造方法构造方法结构化数学建模方法:结构化数学建模方法: 基于创造的本质性的方法。基于创造的本质性的方法。2021/4/181)社会科学模型)社会科学模型经济与管理科学模型、军事模型(越战)、政治模型、社会学模型等等。1.1 什么是模型什么是模型这是一个通过举例或指认回答的简单问题。这是一个通过举例或指认回答的简单问题。例例 选举模型选举模型:多数选举法、累计选举法等等,是特种社会活动的模型。例经济学模型:例经济学模型:市场模型、竞争模型、企业战略模型、股票模型、金融模型,等等。这些模型共同特点是:这些模型共同特点是:分析对象的结构,表达方式分析对象的结构,表达方式易于理

6、解,抽象度低易于理解,抽象度低。2021/4/19建筑模型 ,交通模型,电路模型,服装模型 等等。表达:建筑设计图、交通网络、电路图、服装模版等。2)工程技术模型)工程技术模型3)生命科学模型)生命科学模型新陈代谢模型、光合作用模型、血液循环模型、DNA双螺旋模型 、蛋白质结构模型等等。4)化学模型)化学模型苯环 、化学健理论、反应平衡等等;5)物理模型)物理模型基本粒子、原子模型、晶体模型 、光学的衍射等等。用专业理论抽象出的结构用专业理论抽象出的结构,并用专业语言表示的模型。并用专业语言表示的模型。2021/4/1101.2 模型是什么?模型是什么?模型:模型:以特定以特定目的目的对事物原

7、型抽象出对事物原型抽象出结构结构并适当并适当表示表示。抽象出结构抽象出结构:不是一般概念的抽象,而是结不是一般概念的抽象,而是结 构的抽象;构的抽象;适当的表示适当的表示:使用不同知识与方法,需要不同使用不同知识与方法,需要不同 的语言表示。的语言表示。特定目的特定目的:目的不同,关注的结构(事物的内部目的不同,关注的结构(事物的内部 联系)不同;联系)不同;原型原型 抽象出结构抽象出结构 模型模型2021/4/111例例. 飞机模型飞机模型目标不同,模型不同目标不同,模型不同目的目的:空气动力学研究空气动力学研究抽象结构抽象结构:外型结构,除去内部构造;外型结构,除去内部构造;目的目的:机舱

8、设计机舱设计抽象结构抽象结构:内部空间结构,除去外部结构;内部空间结构,除去外部结构;不同目的关注的内容不同,抽象的结构不同。不同目的关注的内容不同,抽象的结构不同。表示:表示:专业图形和航空语言表示。专业图形和航空语言表示。2021/4/112例例. 地图地图是结构的抽象!是结构的抽象!概念的抽象(不是模型!)概念的抽象(不是模型!):楼群、居住小区、公共楼群、居住小区、公共场所与设施、商区、政府机关、河流、湖泊、公交线场所与设施、商区、政府机关、河流、湖泊、公交线路、各级公路、快速路、高速路、立交桥等等。路、各级公路、快速路、高速路、立交桥等等。目的目的:城市交通研究城市交通研究抽象出结构

9、抽象出结构:小区、商区、立交桥、道路、交叉路口小区、商区、立交桥、道路、交叉路口等概念的等概念的关联和区分关联和区分忽略细部特征、概念的部分忽略细部特征、概念的部分内涵、人口结构等等。内涵、人口结构等等。模型表示模型表示:城市交通地图城市交通地图2021/4/1132021/4/1141.3 核心是结构核心是结构理解原型的结构,抽象并表示结构是核心问题。理解原型的结构,抽象并表示结构是核心问题。什么是结构?什么是结构?抽象定义:集合的结构是集合的子集族。抽象定义:集合的结构是集合的子集族。例例 图书馆图书馆字符集:中文字、英文字母、数字等等各种字符的全体。字符集:中文字、英文字母、数字等等各种

10、字符的全体。书、文章、多媒体文本等形成子集族书、文章、多媒体文本等形成子集族集合的文本集合的文本结构。结构。文本按知识类型分类,形成不同层次的子集族文本按知识类型分类,形成不同层次的子集族国际图书分类法国际图书分类法图书馆的藏书结构图书馆的藏书结构专业模型。专业模型。2021/4/115例例. .语言的不同结构产生不同的文学信息语言的不同结构产生不同的文学信息 唐诗唐诗清明时节雨纷纷清明时节雨纷纷路上行人欲断魂路上行人欲断魂借问酒家何处有借问酒家何处有牧童遥指杏花村牧童遥指杏花村 宋词宋词清明时节雨清明时节雨纷纷路上行人纷纷路上行人欲断魂。欲断魂。借问酒家何处借问酒家何处有牧童有牧童遥指杏花村

11、。遥指杏花村。2021/4/116 剧本剧本( (元曲元曲) ) 清明时节清明时节 雨纷纷雨纷纷 路上路上 行人(欲断魂):行人(欲断魂):借问酒家何处有?借问酒家何处有?牧童牧童(遥指)(遥指): :杏花村。杏花村。时间时间环境环境地点地点人物人物语言语言另人物另人物动作动作语言语言2021/4/117抽象出结构抽象出结构: 七言唐诗 比较规整,适于言志“诗言志” 宋词 错落有序,用语活跃,适于抒情“词抒情”元曲时间、地点、情景、人物、动作、言语等。用语白话,易懂。百姓故事2021/4/118结构的不同表示可以表现出文学基调不同:结构的不同表示可以表现出文学基调不同:专业模型专业模型 数学模

12、型?数学模型? 乔姆斯基的形式语言?乔姆斯基的形式语言?七言唐诗*用音高表示:唏 唏 唏 唏唏啦嫂发米来斗宋词 * * * *嫂 啦 米 啦 嫂 米规则变化2021/4/119结构主义学派(结构主义学派( Bourbaki ):):数学数学 = 集合集合 + 结构结构2. 数学是什么?数学是什么?这是一个困难的问题,并没有唯一的答案。这是一个困难的问题,并没有唯一的答案。布巴基学派认为有三种母结构:序结构、代数结构布巴基学派认为有三种母结构:序结构、代数结构和拓扑结构;其他数学结构都是母结构的组合或复和拓扑结构;其他数学结构都是母结构的组合或复合,形成复杂结构。合,形成复杂结构。不同的数学就是

13、结构不同不同的数学就是结构不同。 例如例如 所谓实数直线所谓实数直线R,就是由全体实数构成的,就是由全体实数构成的一维欧氏空间我们将看到,一维欧氏空间我们将看到,R是一个完备的阿基是一个完备的阿基米德全序域它是由代数结构米德全序域它是由代数结构(域域)、序结构、序结构(全序全序)、拓扑结构拓扑结构(完备性结构完备性结构)形成的分支结构形成的分支结构 2021/4/120数学是普适的数学是普适的原型原型=集合集合+结构结构数学数学 = 集合集合 + 结构结构2.1数学的普适性数学的普适性原型:具体的元素与部件具体的结构原型:具体的元素与部件具体的结构数学:抽象的元素抽象的结构数学:抽象的元素抽象

14、的结构数学研究的内容决定了数学的普适性!数学研究的内容决定了数学的普适性!应用应用2021/4/1213. 什么是数学模型什么是数学模型“定义定义”:模型模型原型结构的适当表示;原型结构的适当表示;数学:集合数学:集合+结构,数学是研究结构的,结构,数学是研究结构的,数学模型:原型结构的数学表示。数学模型:原型结构的数学表示。“定义定义” 如何建模?如何建模?2021/4/1223)推导模型公式推导模型公式 完善模型的假设,并表示成适定的形式。完善模型的假设,并表示成适定的形式。4)求解模型求解模型 选择正确的解法,特别是数值计算与分析。选择正确的解法,特别是数值计算与分析。5)回答问题回答问

15、题解释数学解,分析鲁棒性和近似假定,确定解释数学解,分析鲁棒性和近似假定,确定解对于问题的作用。解对于问题的作用。2)选择建模方法选择建模方法 利用经验、技巧和文献选择解决问题的一般性求解方法。利用经验、技巧和文献选择解决问题的一般性求解方法。1)提出问题提出问题 列出所有变量、单位和所有假设,并表列出所有变量、单位和所有假设,并表示。用数学表达式给出问题的目标。示。用数学表达式给出问题的目标。1. 目前的方法目前的方法 一般建模程序,一般建模程序,Mark M. Meerschaert的著作的著作“Mathematical Modeling”中,提出数学建模的五步法:中,提出数学建模的五步法

16、:二、结构主义数学建模二、结构主义数学建模2021/4/123 以上方法并没有解决以上方法并没有解决抽象什么、怎么抽象,抽象什么、怎么抽象,“抽象抽象”是最抽象是最抽象,学生在没有经验的条件下束,学生在没有经验的条件下束手无策。手无策。 通常的教学重点在于讲案例,学生没有本质通常的教学重点在于讲案例,学生没有本质的建模方法的情况下,于是的建模方法的情况下,于是“荐模荐模”和和“引模引模”成为主要方法。成为主要方法。结构化建模方法:结构化建模方法:提供分析的方法提供分析的方法分析结构的方法,分析结构的方法,学习原型结构的表示方法学习原型结构的表示方法建立专业模型,建立专业模型,学习数学结构,产生

17、建模的可操作程序。学习数学结构,产生建模的可操作程序。结构化建模方法不是排斥结构化建模方法不是排斥“五步法五步法”,而是充,而是充实实“第二步第二步”的具体可行的方法。的具体可行的方法。2021/4/1242. 结构化数学建模程序结构化数学建模程序利用数学理论分析、计算、推演,求得问题的解利用数学理论分析、计算、推演,求得问题的解或产生新的结构或产生新的结构 揭示新的专业结构。揭示新的专业结构。数学语言表示的结构数学语言表示的结构数学模型数学模型专业语言描述结构专业语言描述结构专业模型专业模型分析出原型的结构,并用数学语言表示其结构。分析出原型的结构,并用数学语言表示其结构。一般流程:一般流程

18、:有些问题专业模型难,有些问题数学模型难。有些问题专业模型难,有些问题数学模型难。对原型确定目的对原型确定目的分析原型的结构分析原型的结构建立专业模型建立专业模型建立数学模型建立数学模型解数学模型解数学模型寻找对应的数学结构寻找对应的数学结构2021/4/1252010年赛题:上海世博会影响力的定量评估年赛题:上海世博会影响力的定量评估2010年上海世博会是首次在中国举办的世界博览会。从1851年伦敦的“万国工业博览会”开始,世博会正日益成为各国人民交流历史文化、展示科技成果、体现合作精神、展望未来发展等的重要舞台。请你们选择感兴趣的某个侧面,建立请你们选择感兴趣的某个侧面,建立数学模型,数学

19、模型,利用互联网数据利用互联网数据,定量评估,定量评估2010年上年上海世博会的影响力。海世博会的影响力。三、结构主义建模例子三、结构主义建模例子2021/4/126用结构主义的观点分析问题用结构主义的观点分析问题“问题问题”的结构:的结构:背景、条件或限制、问题的目标背景、条件或限制、问题的目标理解背景:理解背景:背景帮助你理解问题的全貌,特别背景帮助你理解问题的全貌,特别是开拓性。(高教收费问题的引起)是开拓性。(高教收费问题的引起)分析条件:分析条件:条件的内涵容易清晰,往往外延模条件的内涵容易清晰,往往外延模糊,从而对于建模假设很有意义。糊,从而对于建模假设很有意义。明确目标:明确目标

20、:目标明确,特别是多目标的主次和目标明确,特别是多目标的主次和关联性识别。关联性识别。 2021/4/127对问题理解的关键对问题理解的关键1(背景的概念):(背景的概念): 什么是互联网数据?什么是互联网数据?在互联网上自然传播的数据,包括传播的文本、在互联网上自然传播的数据,包括传播的文本、多媒体数据类等;多媒体数据类等;在互联网上发生的数据:点击率等,由设备或终在互联网上发生的数据:点击率等,由设备或终端的行为转换成的数据。端的行为转换成的数据。互联网自身以外形成的文本和多媒体数据,本身互联网自身以外形成的文本和多媒体数据,本身并不是在互联网上自然传播:图书馆的电子书,并不是在互联网上自

21、然传播:图书馆的电子书,统计局的统计数据,银行数据等,应该不是互联统计局的统计数据,银行数据等,应该不是互联网数据。网数据。2021/4/128对问题理解的关键对问题理解的关键2(条件的多种选择,外延):(条件的多种选择,外延): “选择感兴趣的某个侧面选择感兴趣的某个侧面”,这是问题中的,这是问题中的简化性条件,因为问题涉及的方面太多,所以只简化性条件,因为问题涉及的方面太多,所以只要从某个方面去证明自己的结论。要从某个方面去证明自己的结论。对问题理解的关键对问题理解的关键3(目标的内涵限定):(目标的内涵限定): “定量评估定量评估”,两类互联网数据都要量化,两类互联网数据都要量化,特别是

22、网络上自然传播的文本,需要量化分析。特别是网络上自然传播的文本,需要量化分析。2021/4/129分析:分析:从条件理解的关键从条件理解的关键2,显然在世博会影响的评,显然在世博会影响的评估中涉及许多估中涉及许多领域或视角领域或视角:国家形象,宏观经:国家形象,宏观经济,百姓好恶,旅游发展等领域,视角:同地济,百姓好恶,旅游发展等领域,视角:同地其他活动比对,历届世博会比对,与大型全国其他活动比对,历届世博会比对,与大型全国性活动比对,以及拓展性与预测性视角等。性活动比对,以及拓展性与预测性视角等。这种模糊或多选择,给你这种模糊或多选择,给你界定自己研究领域与界定自己研究领域与视角的选择,需要

23、对背景的深入理解。视角的选择,需要对背景的深入理解。这是开这是开放性问题的特点。放性问题的特点。一个显然的理解:一个显然的理解:开放性没有标准答案,因此开放性没有标准答案,因此结论平凡显然不好,结论的价值与新颖是关键。结论平凡显然不好,结论的价值与新颖是关键。2021/4/130从目标理解的关键从目标理解的关键3,两类互联网数据:发生,两类互联网数据:发生的和自然传播的。的和自然传播的。第一类例如点击率,显然的理解是第一类例如点击率,显然的理解是关注度关注度,“点击点击”本身没有内容,点击对象是分析、挖本身没有内容,点击对象是分析、挖掘的重点:掘的重点:正面的和负面的网页与文档,并且正面的和负

24、面的网页与文档,并且设计各个领域。设计各个领域。第二类是在网络上自然传播的各类文档(包括第二类是在网络上自然传播的各类文档(包括多媒体)。显然,除了文档的数量与篇幅反应多媒体)。显然,除了文档的数量与篇幅反应关注度关注度以外,文档的内容可以是:以外,文档的内容可以是:正面的和负正面的和负面的网页与文档,并且设计各个领域。面的网页与文档,并且设计各个领域。2021/4/131总体分析结论:总体分析结论: 显然,通过条件、目标的理解我们可以得显然,通过条件、目标的理解我们可以得到影响力评估的两个主要内容:到影响力评估的两个主要内容:关注度和影响关注度和影响力内涵的评估。力内涵的评估。选择一两个重点

25、领域和某个适选择一两个重点领域和某个适当的视角进行比对,形成评估方法。当的视角进行比对,形成评估方法。具体分析:具体分析: 目标的目标的“量化量化”要求,对于要求,对于关注度关注度显然是统显然是统计模型进行分析;而计模型进行分析;而影响力内涵的评估影响力内涵的评估模型是什模型是什么呢?么呢?2021/4/132必须建立文本的必须建立文本的理解与分析模型理解与分析模型,基于文本分,基于文本分类的模型。类的模型。理解与分析理解与分析: 理解基于分类,理解就是分类!理解基于分类,理解就是分类! Web中的问题中的问题: 在网上,每天有成千上万的多媒体文件在传输。在网上,每天有成千上万的多媒体文件在传

26、输。试建立数学模型,使得可以对这些文件进行自试建立数学模型,使得可以对这些文件进行自动分类,以便人们阅读和使用。动分类,以便人们阅读和使用。如何建立文本分类的数学模型?如何建立文本分类的数学模型?2021/4/133在线文本自动分析在线文本自动分析原型的目标:原型的目标: 在线电子文本的计算机自动分类与辅在线电子文本的计算机自动分类与辅助理解。助理解。两类两类“分类模型分类模型”的目标:的目标:检索性分类检索性分类国际图书分类法,目的是查询;国际图书分类法,目的是查询;理解性分类理解性分类基于语意、概念层、主题层的细分类,基于语意、概念层、主题层的细分类,目的是分析和理解。目的是分析和理解。)

27、建立专业模型建立专业模型2021/4/134原型的结构分析原型的结构分析文本文本章节章节段落段落语意团语意团句或短语句或短语词词字符字符文本的结构:文本的结构:原型有两层结构:原型有两层结构:文本的结构,文本的结构, 文本集合的结构文本集合的结构。分析:文本集合的结构依赖于文本的结构;分析:文本集合的结构依赖于文本的结构; 文本集合的结构是原型对于目的的主要结构;文本集合的结构是原型对于目的的主要结构; 因此因此文本的结构的表示依赖文本集合的结构文本的结构的表示依赖文本集合的结构。2021/4/135原型的专业模型(源于关键词和摘要的作用的理解)原型的专业模型(源于关键词和摘要的作用的理解)模

28、型模型1. 以词频为特征的分类模型以词频为特征的分类模型词词: 有语意的初级字符串单位有语意的初级字符串单位语言的细胞;语言的细胞;词在文本中的频率与不同类文本间频率差别是分类词在文本中的频率与不同类文本间频率差别是分类的基本特征和基本的结构性差别。的基本特征和基本的结构性差别。模型模型2. 以语意团为特征,重在语意差别的分类。以语意团为特征,重在语意差别的分类。模型模型3. 混合模型混合模型语言能力模型:语言能力模型:乔姆斯基的语法结构模型是另一乔姆斯基的语法结构模型是另一类语言模型,目的是一般语言的生成结构。类语言模型,目的是一般语言的生成结构。2021/4/136文本集的结构分析:文本集

29、的结构分析:分类是在文本的集合中进行,分类是在文本的集合中进行,因此是原型的用于分类目标的主要结构。因此是原型的用于分类目标的主要结构。联想到数学中的结构联想到数学中的结构,例如代数结构,是在集合中,例如代数结构,是在集合中定义代数运算定义代数运算加法和数法:元素间的运算关系加法和数法:元素间的运算关系两个文本的合并还是文本两个文本的合并还是文本加法封闭;加法封闭;一个文本的倍数仍然是文本一个文本的倍数仍然是文本数乘封闭!数乘封闭!分析文本集的结构,首先是分析文本集的结构,首先是文本之间的相互关系文本之间的相互关系:两个文本合并是什么?还是文本!两个文本合并是什么?还是文本!)同构分析同构分析

30、2021/4/137同构:同构:此时问题的原型的结构直接和数学结构联系起来!此时问题的原型的结构直接和数学结构联系起来!建立原型结构的数学表示则建立了数学模型。建立原型结构的数学表示则建立了数学模型。文本的集合文本的集合应该应该有一个有一个“线性空间线性空间”的结构的结构;文本的分类是在线性空间中的文本的分类是在线性空间中的“向量的分类向量的分类”!具有高等代数的知识,对于线性代数的结构具有高等代数的知识,对于线性代数的结构有清楚的理解和关注,则容易发现:有清楚的理解和关注,则容易发现:2021/4/138以上分析导至以上分析导至文本向量的概念文本向量的概念:每个文本对应地定义一个文本向量,用

31、于分类,分量每个文本对应地定义一个文本向量,用于分类,分量如何定义?如何定义?显然,分量是显然,分量是“分类特征分类特征”的具体表示:的具体表示:基于词频以及用于区分文本的量化的表示基于词频以及用于区分文本的量化的表示分析!分析!模型模型1的数学模型:的数学模型:向量空间的结构向量空间的结构+词频特征词频特征。)同构表示与数学建模同构表示与数学建模2021/4/139 根据专业模型,词频及具有分类的特征信息,根据专业模型,词频及具有分类的特征信息,因此可以因此可以仿照熵仿照熵的定义:的定义:假设假设TF(w(i),dj)是词是词w(i)在文本在文本dj中出现的次数,中出现的次数,|D|是是D中

32、文本总数,中文本总数,DF(w(i)是指在是指在D中至少出现一次中至少出现一次w(i)的文本数。则每一个文本的文本数。则每一个文本djD,和一个特征词,和一个特征词w(i)存在一量:存在一量: )(log,wdwdwijijiDFDTFTFIDF这里熵的形式,一来用类似信息熵的定义,符合这里熵的形式,一来用类似信息熵的定义,符合“分分类类”的特征信息的概念:好的分类,信息增益;二来,的特征信息的概念:好的分类,信息增益;二来,词频的作用大于词在文本集合中出现的作用。词频的作用大于词在文本集合中出现的作用。2021/4/140记记d(i)j =TFIDF(w(i),dj) ,则每一个文本,则每一

33、个文本djD,存,存在一个分量适当排序的文本向量在一个分量适当排序的文本向量: 1jijkij , .0 , 0 , , , ddddddNjjjNddd 是 维实向量对于任意实数和任意的两个文本向量则ikjij . :1 - , - . ddd dkdd 是一个可能存在的文本的文本向量 如果进一步比较抽象地理解也是的文本向量的另一个表达式 则的意义就不难理解2021/4/141文本集合的数学模型文本集合的数学模型文本的特征向量的空间,文本的特征向量的空间,分类问题是分类问题是N维线性空间中的向量的分类问题。维线性空间中的向量的分类问题。 许多方法可以用于求解,例如许多方法可以用于求解,例如S

34、VM分类器对于分类器对于数据压缩很有效。数据压缩很有效。2021/4/142文本自动分类文本自动分类: : 理解文本的类属性理解文本的类属性, ,子空间分类子空间分类. .文本自动聚类文本自动聚类: : 发现文本集合中的新模式发现文本集合中的新模式, ,新概念新概念. .文本向量文本向量: : 由文本的实意词的特征值或特征模式为分量的向量由文本的实意词的特征值或特征模式为分量的向量. . 以信息熵的形式构造以信息熵的形式构造. .特征子空间特征子空间: : 具有某种共同意义的分量组成的子空间具有某种共同意义的分量组成的子空间. . 主义主义 自由自由 科学科学文本向量空间文本向量空间: : 全

35、部文本向量的高维线性空间全部文本向量的高维线性空间. .应用事例:思想史研究中,应用事例:思想史研究中,“五四五四” 运动的讨论的主要思运动的讨论的主要思想是什么?想是什么?发现在发现在“自由主义自由主义”的特征词所在的子空间中,文本的投影的特征词所在的子空间中,文本的投影数量最大!数量最大!2021/4/143 有了文本分类的向量模型,我们可以按照有了文本分类的向量模型,我们可以按照关键词搜索,建立网络文档在各个领域的分类关键词搜索,建立网络文档在各个领域的分类集合,进一步还可以用分类模型分开正面与负集合,进一步还可以用分类模型分开正面与负面的文本。在此基础上进行统计比对,就得到面的文本。在

36、此基础上进行统计比对,就得到量化的影响力评估。量化的影响力评估。 特别值得注意的是,进一步使用文本向量特别值得注意的是,进一步使用文本向量分析方法,可以建立多因素评估的方法。这类分析方法,可以建立多因素评估的方法。这类方法很多。方法很多。 文本分类与理解的研究已经很热,实际上文本分类与理解的研究已经很热,实际上有许多现成的程序支持这种方法的使用。有许多现成的程序支持这种方法的使用。2021/4/144四、数学模型的发展四、数学模型的发展随着核心学科的转变,数学的应用随着核心学科的转变,数学的应用对象发生改变,数学模型发生改变,对象发生改变,数学模型发生改变,数学的内容、意义和方法也将发展数学的

37、内容、意义和方法也将发展与变化。与变化。2021/4/1451、中心学科的转变对数模创新的刺激、中心学科的转变对数模创新的刺激二十世纪是物理学世纪:理论力学、电动力学二十世纪是物理学世纪:理论力学、电动力学(场论)、统计力学、量子力学与相对论。形成(场论)、统计力学、量子力学与相对论。形成理论物理,同时推动了数学的发展。理论物理,同时推动了数学的发展。流形上的函数及其场方程的模型:代数方程组和微流形上的函数及其场方程的模型:代数方程组和微分方程组。分方程组。理论力学的理论力学的 Lagrange和和Hamilton方程组;方程组;电动力学的电动力学的 Maxwell方程组;方程组;统计物理的统

38、计物理的 热力学基本方程和统计分布函数;热力学基本方程和统计分布函数;量子力学的量子力学的 Shr dinger、Dirac、Heisenberg方程;方程;相对论的相对论的 爱因斯坦的引力场方程。爱因斯坦的引力场方程。2021/4/146二十一世纪形成以生物为核心的多中心:二十一世纪形成以生物为核心的多中心:生物学能源信息社会经济2021/4/147陈省身:陈省身: 二十世纪的数学家要关注物理,二十一二十世纪的数学家要关注物理,二十一世纪的数学家要关注生物学。世纪的数学家要关注生物学。杨振宁:杨振宁: 我们应该关注生物学,生物学还没有理论,我们应该关注生物学,生物学还没有理论,但是积累了大量

39、的数据,期待理论的建立。但是积累了大量的数据,期待理论的建立。2021/4/1482、 系统生物学二十一世纪的核心学科系统生物学二十一世纪的核心学科生物学世纪的学科进展:生物学世纪的学科进展:分子生物学:生物分子的化学,反应、结构与生分子生物学:生物分子的化学,反应、结构与生物化学功能;物化学功能;生物组学:生物组学:DNA序列与基因组学,序列与基因组学, 蛋白质组学,蛋白质组学, 代谢组学,代谢组学, 信号转导网。信号转导网。 产生高通量表达数据!产生高通量表达数据!2021/4/149系统生物学:系统生物学:理解生物体以及生物过程,并非只理解生物体以及生物过程,并非只是在生命的各个层次上的

40、研究,而是各层结构的是在生命的各个层次上的研究,而是各层结构的整合才涌现出生物功能。整合才涌现出生物功能。分子分子 细胞细胞 组织与器官组织与器官系统生物学是生物学的第一个理论化的学科,它将系统生物学是生物学的第一个理论化的学科,它将引导生物学从实验科学走向理论指导下的实验、计引导生物学从实验科学走向理论指导下的实验、计算、理论的科学。算、理论的科学。正象二十世纪的理论物理的产生时代!正象二十世纪的理论物理的产生时代!基本方法:海量数据的基本方法:海量数据的计算为基础计算为基础,系统的,系统的数学建数学建模为核心模为核心理论方法,以理论方法,以系统干扰为特征的实验系统干扰为特征的实验。2021/4/150以数学建模为核心的生物理论;以数学建模为核心的生物理论;以高通量数据为主要对象的科研领域;以高通量数据为主要对象的科研领域;以整体论为主方法的实验与理论体系;以整体论为主方法的实验与理论体系;多学科综

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论