




已阅读5页,还剩4页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
面向科学平台的知识系统分析面向科学平台的知识系统分析2011-03-22 10:13李春文,刘嘉陵.面向科学平台的知识系统分析J.清华大学学报(自然科学版).2001年第41卷第6期:32-34摘要:针对知识总量和信息总量爆炸性增长所带来的诸多问题,提出了科学平台这一新型集成网络知识载体的概念,为此进行了面向科学平台的知识系统的研究。知识系统的模型化和结构化是知识系统可实现的前提。综合运用知识工程、互联网、信息科学和现代数理工具,对科学平台构建中所涉及到的知识系统进行了深入全面的分析,主要包括知识系统的抽象简化、形式结构分析、分类系统分析和理论核心分析,建立了知识系统结构化理论,从而为科学平台的知识系统建立了概念模型,并为进一步在网络知识库环境下构建科学平台系统奠定了理论基础。关键词:科学平台;知识集成;网络知识系统中图分类号:TP 18;G 30文章编号:100020054(2001)0620115205文献标识码:A Ana lys is of knowledge system sin tegrated in to the science platform LI Chunw en,L IU Jia ling(Departmen tof Automation,Tsinghua Un iversity,Be ij ing 100084,China)Abstract:The problem scaused by the exp lo sion of know ledge and info rmation can be so lved using the science platform concept,which is anew integrated netwo rk know ledge carrier.Thus,research is needed on know ledge system sw ithin the science platform.Knowledge systems need to be modelled and structured.Knowledge Engineering,the Internet,Info rmation Science and Modern Mathematics are integrated in an analysis of the know ledge systems involved in the construction of the science platform,including abstract simplification,formal configuration,classification systems and theo ret ical kernel analysis of the know ledge system s.The structural theo ry and the concep tual know ledge system smodels are developed to provide atheo retical basis fo rconstructing the scient ific platfo rm in an environment of netwo rk know ledge databases.Key words:science platfo rm;know ledge integration;network know ledge system s在当今世界,科学技术正以前所未有的惊人速度向前发展,知识量和信息量呈现出爆炸性增长。但是,现有的以书籍、期刊为主的知识载体和信息传播媒体,以及依赖于此而存在的传统型工作和思维方式,却未能实现应有的突破,从而导致一系列新问题的产生。解决这些问题的根本所在,就是要充分利用最先进的信息技术成果,将以科学技术为主体的人类知识全面集成为统一的网络信息管理系统,从而建立起适合信息社会的新型知识载体。由此诞生了科学平台的概念1,2。科学平台是一个集人类当前全部知识为一体的、合理组织的、表述和谐的、动态生长的网络知识集成系统,利用计算机网络通过信息集成和知识集成来实现科技知识的合理组织和动态生长,从而实现知识产生、传播和应用的总体最优化。在科学平台的构建中,有一系列问题值得探讨,例如,科学平台的概念和背景的进一步认识3,4、所涉及到的知识系统的分析、数学建模问题、技术实现、前景研究等等。其中,知识系统的模型化、结构化和量化是科学平台系统可实现的前提。本文着重探讨知识系统的模型化、结构化问题,为科学平台的知识系统建立概念模型。1知识系统模型化的基本问题知识系统的模型化主要解决知识系统的有限化、理想化、简化和抽象概括的问题。通过这一过程,纷繁芜杂的知识系统成为一个有限的、可认识的、可表述的、可操作处理的对象。1.1知识的总体规模估计知识的总体规模可借用分类学来考察。对一个学科对象进行分类,即使它的下级分支对象只构成上级对象的零测部分,这种划分过程也可以逐级退行以至无穷,因而知识是无尽的。但借用公理化的手段,从现实价值和可操作的角度出发,可将知识的全体看作一个虽很大但有限的系统。这一观点构成了科学平台系统可行性的理论基础。1.2知识的意义和价值截取因子知识的意义、价值可划分为4类:1)理论与应用的意义和价值皆大,2)理论或应用之一的意义和价值大,3)理论或应用的意义和价值之一小但存在,4)若干理论或和若干应用的组合有意义和价值。其中,第3类指的是原问题空间中的微测或零测非空集,而第4类指原问题与某些新问题的乘积空间中的微测或零测非空集。虽然知识的可能性空间无限,但具有一定意义和价值的知识集合却小得多。而且,略去意义、价值相当小的知识细节将不会影响对知识的理解、掌握和实际应用。因此,意义、价值小于某一个阈值的知识,将被科学平台的截取因子过滤掉。这一过程实现了科学平台知识系统的有限化。1.3知识的逻辑连接知识之所以积累为一个严格统一的体系离不开逻辑(形式逻辑)连接。形式逻辑是理想化的逻辑系统,它对知识系统内部关系的简化,使得在构造科学平台时简便、易操作,避免了复杂、不易操作关系的出现(如互为因果的逻辑关系)。整个知识系统是由各个级别的学科群、学科分支领域按逻辑关系紧密连接在一起,包括从属关系、因果关系等等。每个学科分支又由其中的基本概念、基本规律等按逻辑关系紧密联系在一起。许多概念系统的内部又可以进一步展开为具有丰富联系的、深一层次的概念集合与命题规律集合的系统结构。如此则形成一个由逻辑连接为一体的巨大系统。1.4知识与自然语言的可表达性知识总是要以自然语言为基础来表达。自然语言总是不精确吗?持数理逻辑观点的人是这样认为的。然而,精确的逻辑系统仍需元语言表达。因此,恰当的看法是:自然语言是严格度不同的若干语言族的集合,其中也包含了形式逻辑的基本原则,如排中律等。建立在自然语言基础上的科学平台知识系统,并不缺乏人们所要求的严格性、准确性。2知识系统的结构化知识系统的结构化过程是在模型化的基础上,进一步抽象出每一个知识单元的结构共性,得到知识单元的形式结构。所有的形式结构单元相互连接,就构成了知识系统的高维网状结构。这一过程也是对知识系统的形式化。通过形式化,可使知识系统的结构分析设计和内容分析设计成为两个相互独立的过程。2.1知识单元的形式结构一般来讲,一个学科和其周边学科的关系,可分为上属、下属、相因、相果4种类型。其中,相因(即上相关,或引用关系)又分为直接相因和参考相因两部分,相果(即应用关系)可分为直接相果和参考相果两部分。再加上该学科单元的基本本体部分,便构成了一个一般性学科的关联关系。如此关系联结起来便形成一个学科的结构形式,此结构形式再经内容赋值,便构成一个具体学科。例如,一种基于逆系统方法的飞行控制器技术,可归属于科学平台技术自动控制技术飞行控制技术,其子类可设计为其下属,如高度控制器技术、速度控制器技术,等等。其上相关为科学平台理论数学数学应用控制论非线性控制论逆系统方法,其下相关为科学平台产品飞行器飞行控制器,且可建立此种技术与其它相关技术的连接以进行比较分析。2.2知识系统的连接结构知识单元的形式结构按照逻辑关系相互连接,便构成了知识系统的连接结构。树形结构和网络结构都是特别重要的自然结构。科学平台的学科结构设计是基于树形结构和网络结构的。这是建立在学科的问题树与工具链理论之上的。对一个问题的研究可归结为对若干子问题的研究,如此类推,形成问题树。对某个子问题的研究要以某一理论工具为基础,而该理论又由某种更基本的理论与工具构建,依此类推形成工具链。无需再向下归结的问题和工具是元问题和元工具(理论)。问题树与工具链的交织形成了错综复杂的网状结构。2.3知识系统的基本视角很多知识对象是难以归类的。它们旁征博引,在一个极大的时间、空间和学科范围内展开,思路纵横驰骋。但它们还是有规律的。通过仔细考察,仍可以使它们形成一个通式:从第i只眼睛(视角、角度、领域范围、论域)在第j个层次看第k个对象(领域、分支学科、理论结果、问题等)。在科学平台上,这种视角导致了知识的高维结构的出现。2.4知识系统的高维结构知识系统的高维结构包括丰度维、深度维和模式维。丰度指同一主题的展开详尽程度。深度是指针对某一问题所讨论的抽象程度、复杂程度等的一种度量,它以所使用的数学工具来表征。对同一事物从不同出发点、角度、侧面去认识的方式便是不同的模式、风格。问题维可算作又一个广义维,则科学平台内容的排列方式为:问题风格深度丰度。作为约定,能在上层完成分类的就不在下层分类。知识系统中每个坐标点是一个广义问题,即每个坐标点都包含了狭义问题、丰度、深度和模式分量。而且,它们也都要被统一归结到由问题引导的学科自然分类构成的自然树中。锥型结构既表现在全局也表现在局部的各个层次,从而是分形结构,且构成多重分形。2.5科学平台的形式结构设计科学平台的形式结构有一维(序)、二维矩阵(表)、三维立方、高维立方结构。知识的树结构可归结为高维结构并可表示为二维表(这里的表实际是一种存储形式,而不是外部使用形式,因其不直观),但它作为表时实际上是对角或对角块型的稀疏结构。如二层树(二级复分无重合时)是一个对角块型矩阵,三层树(二、三级复分皆无重复时)是对角块型数据立体,等等。如果下级复分全重复,则化成小体积的非稀疏结构。若只有少量重复,即使是非对角型,也是在对角的基础上加上少量补充元素的稀疏型。若非规整部分已不少,且非常不均匀,则应分而治之、不同区域分别处理,这样形成大型层次结构。若分布较均匀,则使用统一结构。总之,规整立体结构适于局部描述,大型稀疏层次结构适于描述大范围与全局。2.6结构分析总结科学平台的结构设计,首先是设计抽象的知识单元逻辑结构。任何节点(知识块,即一个知识点或学科单元)和周围节点的关系是4种之一:上属、下属、因性相关、果性相关。整个知识系统是由这种通用节点连接起来的网状结构。这种网状结构可为全连接型,但实际上是大型稀疏连接。连接关系中最重要的是从属关系(上、下属关系)连接,但其划分方案并不唯一。定义一套上、下属关系后即可形成一个树,即该划分方案构成科学平台的实体主干树结构,而其它的划分方案则只作为连枝处理。此外,连接关系中的因果关系也构成连枝。所有的连枝关系构成非实体辅助连接网。综合起来,科学平台的知识系统构成了以大型层次型稀疏结构为主的网状结构,而且这种结构可以实现为二维表,用常规关系型数据库支持。逻辑结构确定之后,就要进行结构赋值,以构成具体的分类结构体系。结构赋值问题最终可归结为形式分类问题。3知识系统的分类分析知识系统的分类是对结构化后的抽象形式结构赋值,从而得到知识系统的分类目录结构。3.1可分类性物质无限可分已是一种观念、信念,但从技术上讲,难免有限,如就当前来说限于夸克。知识世界从任一点下行细分亦永无止境,唯有适可而止。因此,物质无限可分而止于手段,精神无限可分而止于适当。联系到科学平台,首先为树状问题维,它们的划分将止于目录层的底部,然后进入底层内容,它从本质上讲仍可理解为问题的进一步细分,但实际上更适合于理解为细分已达到的适可而止的位置,即底层可以看作科学平台建造者所划定的知识最小单元。由于知识最小单元属人为划定,而知识又在发展,所以最小单元在一定时间之后可能会分裂出一组新的最小单元,而原最小单元成为次最小单元。3.2分类形式在实践上,仅用一套狭义问题P 2风格S 2深度D 2丰度R的分类程序有时可能无法完成某一给定方向的广义分类直达底层最小单元。可能的情况是,狭义问题分类到某阶段后,转入风格分类,然后又转入狭义问题分类,等等,从而形成多种情况组合。最终的广义分类过程可概括为:分类的结构形式=P 1,S 1,D 1,R 1,P n,S n,D n,P n共n组,其中n为循环次数加1,在每一循环回跳时,P,S,D,R 4者中都可有部分缺省。3.3动态分类树结构科学平台的查询、浏览等操作使它与外界环境发生交互作用,可以赋予它们对科学平台结构的反馈作用。通过一个知识点而到达另一知识点,可以看作二者之间发生了一次联系。而两个知识点之间的联系程度,将随着这种联系次数的增加而加深,反之则减弱。如图1所示。图中连线上的数字为联系程度的度量,t表示主干式联系,b表示连枝式联系。用户不断通过连枝结构访问该知识点,使联系程度发生变化,最终主干和连枝发生转换,形成更合理的新的分类树结构,由图1a变成图1b。图1科学平台动态分类树结构变化这种方法使系统具有不经系统管理人员的干预而自动更新、自动发展的功能,它使平台的体系结构不断完善,从而确保系统的效率不致因体系结构的不合理而不断降低。这也有利于解决分类学上一些长期争论不休的问题。4知识系统的理论核心结构4.1理论在知识系统中的地位这里的理论是以数学为核心、外围包含物理、化学、天文、地理、生物等学科的统一的宏大体系,再外围则是各应用基础领域对象的数学模型、问题以及对应的学术课题。基础理论是整个知识大厦的核心部分。在基础学科中,仍有思想原理性基础和应用性基础两种类型之分,有不同的价值取向、地位及作用,也应有不同研究目标、方式及评价判别标准。前者如哲学、数学、物理等学科中的基本部分,后者如化学、生物等学科中的细节部分。这许多细节的结果是由理论嵌入、算法嵌入构成的。把一种理论、方法、算法嵌入到另一种理论、方法、算法的某些环节中,形成新的理论、方法、算法的结果,这一过程叫做理论嵌入或算法嵌入。理论嵌入的过程还可以进行多次复合,形成多重嵌入。多重嵌入是一类复合型的嵌入映射过程。它使处于核心地位的、少量的思想原理性基础知识扩张成浩瀚宏大的知识体系。科学平台的理论平台部分也正是在上述理解方式的基础上提出的,它的分类结构是基于数理学科的内在联系的抽象理性结构的分类,而不是限于直观可见的分类。4.2极小性进一步考察科学平台上的知识体系与现实世界的关系,不难看出,它的知识系统是现实世界事物按下述顺序高度浓缩的产物:1)现实世界的各个事物及其规律的总和;2)具体直接的重复性事物的等价类压缩投影形成商空间1;3)抽象性重复性事物的等价类压缩映射形成商空间2;4)共性提取压缩,可将共性部分提取出来,形成前述子空间上的商空间3;5)意义因子和价值因子的截取过程,将意义和价值小到一定程度的部分略去;6)表现空间压缩,从公认的一种或几种看问题的视角出发而形成的树结构,就是对表现空间的压缩,即压缩得到表现空间中的一个或几个元素。由此可以看到,科学平台和真实世界相比,只表现了真实世界的极其微小的一部分。这种抽取出大量具体信息的性质,就是理论体系的特性。正是理论体系所具有的这种高度抽象与概括性,才使得人们有可能通过一个较小的与人们的认知能力相匹配的理论结构,去尽可能全面完整地、充分地把握和理解这个复杂多样的世界。5科学平台知识系统的实现基于上述讨论,在In ternet和W indow sN T环境下实现了科学平台第一个阶段的实验系统。科学平台实验系统的数据库关系如图2所示。它主要包括文章列表、知识关联表、新闻列表、讨论区列表、知识目录表和系统用户表等。其中知识目录表处于数据库的核心地位,它设计和实现为多维、多层次的动态树状结构,每个知识单元都有从属关系连接和相关关系连接,因此其分类结构构成了以实体主干树为主的网状结构。系统在In ternet下实现的工作界面如图3所示。在这里,知识得以根据其本身的内在逻辑重新有序组织,而不是简单地按照原有知识载体的形式进行存储。实践表明,新的知识系统有助于提高知识的传播和利用效率。6结论本文主要讨论了科学平台这个网络知识集成管理系统所涉及的知识系统的若干问题,包括知识系统的有限化、理想化、模型化、结构化、形式化和分类体系等方面,建立了知识系统的概念模型,也就是科学平台的概念模型。在此基础上就可进行科学平台系统的定量分析、网络知识库和数据库设计,并进一步在网络知识库环境下构建科学平台系统。图2科学平台实验系统数据库关系表图3科学平台实验系统工作界面参考文献(References)1李春文.建立科学平台促进科学发展(一):背景、概念及可行性初探J.清华大学教育研究,1997,18(4):21 26.L IChunwen.Building science platfo rm and enhan
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 九年级物理上册 第二章 改变世界的热机 第3节 热机效率教学设计 教科版
- 人教部编版7 溜索公开课教案
- 非销话术培训
- 买鲜花、租船问题(教学设计)-2024-2025学年二年级下册数学冀教版
- 三位数的连续退位减法(教学设计)-2023-2024学年数学二年级下册冀教版
- 高校新闻稿培训:提升宣传能力与专业素养
- 2024内蒙古北奔重型汽车集团有限公司招聘2人笔试参考题库附带答案详解
- 云南省昆明市官渡区艺卓中学七年级美术下册教学设计:第4课 扮靓生活的花卉纹样
- 粉末静电喷涂安全培训
- 三年级语文下册 第八单元 25 慢性子裁缝和急性子顾客第2课时教学设计 新人教版
- Java Web编程技术 课件 第17章SSM框架整合与实例
- 2024年青岛市中考数学试卷(含答案解析)+2023年试卷及答案详解
- 冷库建设日常运营与维护保养方案
- 【真题】2024年镇江市中考道德与法治试卷(含答案解析)
- 火花机安全操作规程
- 文化行业标准 WH-T 97-2022 舞台灯光系统验收检测规范
- ISO9001-ISO14001-ISO45001三体系内部审核检查表
- JT-T-1094-2016营运客车安全技术条件
- 基于数据驱动的锂离子电池剩余寿命融合预测方法研究
- 2024年九年级中考语文《对联题》复习训练卷及答案解析
- 2024年河南经贸职业学院单招职业适应性测试题库各版本
评论
0/150
提交评论