信息管理学基础信息管理技术_第1页
信息管理学基础信息管理技术_第2页
信息管理学基础信息管理技术_第3页
信息管理学基础信息管理技术_第4页
信息管理学基础信息管理技术_第5页
已阅读5页,还剩184页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第六章信息管理技术信息管理技术概述信息获取与处理技术信息组织与存储技术信息检索与传播技术信息传输与安全技术本章要学习的内容6.1概述语言的产生文字的创造印刷术的发明电信技术的运用计算机技术的普及-----进入新的信息技术革命的高潮从属地位-----〉主导地位每一项信息技术自问世起就一直在推动人类的发展什么是技术?技术是人类有目的地改变现实世界(包括自然界、人类社会和人类思维)形成的知识系统人类的科学史是以技术史开始的1C

简单地认为信息技术就是计算机技术(包括硬件和软件技术),这是早些时候一些人对信息技术的片面理解。2C计算机技术和通讯技术是整个信息技术的核心。如果说计算机技术是现代社会的“大脑”,那么通信技术就是现代社会的“中枢神经系统”。3C

现代信息技术主要包括信息处理技术、通讯技术、控制技术等。有人认为控制技术不应单列为一项,因为它只是计算机的一项功能。事实上,控制是使信息发挥作用,完成人类改造世界活动的基本前提。

4C

信息技术是指获取、传递、处理和存储、以及利用信息的技术。感测技术是信息的采集技术,对应于人的感觉器官;通讯技术是信息的传递技术,对应于人的神经系统;计算机技术是信息的处理和存储技术,对应于人的思维器官;控制技术是信息的使用技术,对应于人的执行器官。对于信息管理领域来说,信息处理技术和通信技术是最重要的两种信息技术工具。

更为全面的是钟义信教授提出的信息技术四基元,即感测技术、通信技术、计算机和智能技术、控制技术。他指出,通信技术和计算机与智能技术处在整个信息技术的核心位置,感测技术和控制技术则是核心与外部世界之间的接口。没有通信技术和计算机与智能技术,信息技术就失去了基本的意义;没有感测技术和控制技术,信息技术就失去了基本的作用:一方面没有信息的来源,另一方面也失去了信息的归宿。可见,信息技术的“四基元”是一个完整的体系。信息技术的含义信息技术是收集、处理、存储和传递信息的技术,是扩展人类信息器官功能的一类技术。

信息器官人体信息器官的功能拓展信息器官功能的信息技术

感觉器官获取信息感测技术神经系统传递信息通信技术思维器官加工/再生信息信息处理技术效应器官使用信息控制技术

信息技术的含含义信息技术群包包括:信息处理技术术、感测技术术、通信技术术、控制技术术(主体)、微电子技术、、激光技术、、生物技术、、机械技术((支持技术))、新材料、、新能量技术术(基础性技技术)等。未来的技术趋趋势:以计算机技术术为核心的现现代信息处理理技术与通信信技术、感测测技术和控制制技术融合在在一起,形成成智能信息环环境系统。目前:信息息处理技术和和通信技术((推动社会信信息化进程;;信息管理的的两种重要信信息技术工具具)信息技术的作作用推动社会生产产力的变革社会生产力??劳动工具--标志性的要要素原始人类没没有明确的的劳动工具农业时代人人力操纵畜畜力驱动简简单工具拓拓展执行行器官功能工业时代劳劳动工具重重大改进、蒸汽机、内燃燃机、电力相相继发明明拓展执行行器官望远镜、显微微镜、电报、、电话拓展展了感觉器官官和神经系统统功能信息时代信信息处理理、通信、感感测、控制技技术形成成了一体化、、智能化、信信息化的劳动动工具体系((重要的是拓拓展了劳动动者的脑力)),形成了信信息时代的社社会生产力模模型信息技术的作作用促进产业结构构的变革促进新兴产业业的产生人类社会发展展过程中,每每一时代都存存在着对社会会产业结构和和经济结构的的变革有影响响的新技术群群---社会会主导技术狩猎技术、农农业技术、工工业技术(旧旧,人类体能能的延伸)、、信息技技术(新,推推动信息产业业和信息经济济发展的核心心力量)改造传统产业业变革生产方式式、管理体制制、经营模式式生产过程自动动化、管理决决策智能化、、商业贸易电电子化服务业迅速发发展改变人类生活活方式soho电话、电子通通讯、在线购购物。。。提高人类社会会开发利用信信息资源的能能力人类信息器官官基本功能局局限性信息技术信息技术的问问题信息污染计算机病毒侵犯知识产权权网络犯罪等等信息技术的发发展规律(1)信息技技术辅人律---以满足足人类需要为为中心内容:为了满足社会会实践的需要要,人类创建建了各种各样样的信息技术术,还在不断断地发展和创创新信息技术术以适应社会会需要的发展展变化。需要信息技术术?---扩扩展人类信息息器官的固有有功能围绕人类需要要这个中心发发展时,不是是齐头并进的的。根据社会实践践活动的需要要创造的。定律表明了信信息技术的目目的、性质、、任务、功能能及它存在和和发展的价值值(2)信息技技术拟人律---以节约约物质和能量量为动力人类自身进化化过程中三部部曲执行器官的进进化---〉〉感觉器官、、语言器官和和传导神经系系统的进化---〉思维维器官的进化化信息技术的辅辅人功能也租租遵循同样的的逻辑次序,,螺旋式上升升信息技术的发发展,遵循人人类自身进化化的路线前进进巧合??---省力法法则和熵增加加原理在起作作用(熵:系统状状态的一种量量度)通过拟人的手手段达到辅人人的目的定律揭示了信信息技术的发发展路线,决决定了信息技技术延长和扩扩展人类信息息器官功能的的内容和方向向(3)信息技技术共生律----以人人类信息运动动规律为依据据人类的生存和和发展需要信信息技术的帮帮助信息技术的发发展更需要人人类的指导人与信息技术术的功能互补补---在信息技术的的发展过程中中,必须根据据人类信息运运动的客观规规律求得人与与信息技术的的和谐统一,,实现人机共共生。理解:信息技技术的本质((辅人),发发展模式(拟拟人)----〉人机共共生人的信息能力力与信息技术术互相结合、、补偿:计算机的高速速度、精度《《---弥补补----》》人的智慧共生关系中::人处于主导导地位共生结果:人人的总体信息息能力得到了了进一步的加加强(4)信息技技术倍增率((标志:摩尔尔定律)1965Fairchild半半导体公司工工程师GordenMoore“工艺技术的的不断进步会会使计算机性性能保持几何何级数的增长长,大约18个月,芯片片上的晶体管管数目就会翻翻一番,但价价格依旧。””1965年Moore,RobertNoyce,,AndyGrove----〉intel公司司1971年2250个晶体管时时钟频率率:108Khz4位微微处理器40041998年750万万个450Mhz32位位PetiumⅡⅡ1.7G64PetiumⅣⅣ201110亿亿●狭义的信息息技术只包括括信息技术中中的主体技术层次和应用技术层次,它们可可以直接延长长、扩展人类类信息器官的的功能●广义信息技技术还包括两两个外围层次次,即基础技技术层次和支支撑技术层次次■主体层次((或称主体技技术)▲通信技术和和计算机技术术▲感测技术和和控制技术■应用层次((即应用技术术)■支撑技术层层次■基础技术层层次信息技术的层层次和体系主体技术基础技术支撑技术应术用技信息技术层次次支撑技术层次次▲信息技术要要通过支撑技技术才能实现现▼机械信息技技术——用机械技技术实现的信信息技术,如如算盘、计算算尺、手摇计计算机和电动动计算机等▼电子信息技技术——用电子技技术实现的信信息技术,如如广播电视、、电话电报和和电子计算机机▼激光信息技技术——用激光技技术实现的信信息技术,如如激光光纤通通信、激光控控制和激光计计算机;▼空间信息技技术——用空间技技术实现的信信息技术,如如通信卫星和和行星探测器器等▼生物信息技技术——用生物技技术实现的信信息技术,如如生物传感器器和生物计算算机等基础技术层次次是指提高信息息技术性能、、水平所依赖赖的新材料和和新能量技术术▲电子信息技术术▲激光信息技术术◆基础技术层层次和支撑技技术层次尽管管很重要,但但只有在某些些特定条件下下才能称它们们为信息技术术,这时所说说的信息技术术就是广义的的■不把制造集集成电路的技技术笼统称为为信息技术,,只把利用集成成电路制造电电子计算机、、通信系统或或传感器等的的技术称为信信息技术,这时它被全全面地用于扩扩展人的信息息器官的功能能■不把激光器器的制造技术术都称为信息息技术,只有有当激光器被被用做某种信信息设备中的的一部分时,,才能称其为为信息技术6.2信信息获取与处处理技术为了获取更多多的信息,人人们制造了各各种仪器。其其中的一些仪仪器既能获取取信息,也能能传递和处理理信息。雷达为了获取更多多的信息,人人们制造了各各种仪器。其其中的一些仪仪器既能获取取信息,也能能传递和处理理信息。射电望远镜为了获取更多多的信息,人人们制造了各各种仪器。其其中的一些仪仪器既能获取取信息,也能能传递和处理理信息。为了获取更多多的信息,人人们制造了各各种仪器。其其中的一些仪仪器既能获取取信息,也能能传递和处理理信息。为了获取更多多的信息,人人们制造了各各种仪器。其其中的一些仪仪器既能获取取信息,也能能传递和处理理信息。为了获取更多多的信息,人人们制造了各各种仪器。其其中的一些仪仪器既能获取取信息,也能能传递和处理理信息。为了获取更多多的信息,人人们制造了各各种仪器。其其中的一些仪仪器既能获取取信息,也能能传递和处理理信息。6.2.1感感测技术一般原理可用用下图来表示示:信息获取技术术敏感器换能器显示器感测对象图中敏感器的的作用在于对对事物的某种种动状态及运运动方式能够够产生灵敏的的感受。换能能器的作用是是把这种运动动状态及运动动方式的原始始能量形式转换为便于观察和和计量的能量量形式。显示示器的作用是是把转换后的的能量大小及及其变化以可可见或可闻等等方式表现出出来。通常把把敏感器和换换能器结合起起来称为传感感器(transducer)。敏感器换能器显示器感测对象现在人们已经经有了种类极极其丰富的感感测技术系统统,可以对自自然界和社会会领域众多对对象的运动状状态及其变化化方式进行感感知和测量,,大大扩展了了人的感觉器器官的功能。。传感器(transducer)是一种检测装装置,能感受受到被测量的的信息,并能能将检测感受受到的信息,,按一定规律律变换成为电电信号或其他他所需形式的的信息输出,,以满足信息息的传输、处处理、存储、、显示、记录录和控制等要要求。它是实实现自动检测测和自动控制制的首要环节节。物理传感器应用的是物理理效应,诸如如压电效应,,磁致伸缩现现象,离化、、极化、热电电、光电、磁磁电等效应。。被测信号量量的微小变化化都将转换成成电信号。化学学传传感感器器包括括那那些些以以化化学学吸吸附附、、电电化化学学反反应应等等现现象象为为因因果果关关系系的的传传感感器器,,被被测测信信号号量量的的微微小小变变化化也也将将转转换换成成电电信信号号。。以其其输输出出信信号号为为标标准准可可将将传传感感器器分分为为::模模拟拟传传感感器器————将将被被测测量量的的非非电电学学量量转转换换成成模模拟拟电电信信号号。。数数字字传传感感器器————将将被被测测量量的的非非电电学学量量转转换换成成数数字字输输出出信信号号(包包括括直直接接和和间间接接转转换换)。。开开关关传传感感器器————当当一一个个被被测测量量的的信信号号达达到到某某个个特特定定的的阈阈值值时时,,传传感感器器相相应应地地输输出出一一个个设设定定的的低低电电平平或或高高电电平平信信号号。。压力力传传感感器器pressuretransducer光电电传传感感器器photoelectrictransducer遥感感卫卫星星这是是20世世纪纪60年年代代兴兴起起的的一一种种探探测测技技术术,,是是根根据据电电磁磁波波的的理理论论,,应应用用各各种种传传感感仪仪器器对对远远距距离离目目标标所所辐辐射射和和反反射射的的电电磁磁波波信信息息,,进进行行收收集集、、处处理理,,并并最最后后成成像像,,从从而而对对地地面面各各种种景景物物进进行行探探测测和和识识别别的的一一种种综综合合技技术术。。目前利用用人造卫卫星每隔隔18天天就可送送回一套套全球的的图像资资料。利利用遥感感技术,,可以高高速度、、高质量量地测绘绘地图。。遥感技术术英文名称称:remotesensingtechnology定义1::从地面到到高空各各种对地地球、天天体观测测的遥感感综合性性技术的的总称。。由遥感感平台、、遥感仪仪器、信信息处理理、接收收与分析析应用等等组成。。应用学科科:地理学(一级学学科);;遥感应应用(二二级学科科)定义2::在一定距距离以外外不直接接接触物物体而通通过该物物体所发发射和反反射的电电磁波来来感知和和探测其其性质、、状态和和数量的的技术。。应用学科科:资源科技技(一级级学科));资源源信息学学(二级级学科))遥感技术术(remotesensingtechnology)是一种将将感测技技术与通通信技术术相结合合的高级级感测技技术。利用遥感感技术,,不直接接与目标标物接触触就可感知它的性质质和状态态。根据探测测电磁辐辐射方式式的不同同①主动遥遥感activeremotesensing②被动遥遥感passiveremotesensing根据电磁磁辐射波波长范围围的不同同①紫外遥遥感ultravioletremotesensing②可见光光遥感visualremotesensing③红外遥遥感infraredremotesensing④微波遥遥感micro-wave

remotesensing⑤多波段段遥感multi-bandremotesensing遥测技术术telemetry遥测技术术是也一一种将感感测技术术与通信信技术相相结合的的高级感感测技术术。利用遥遥测技技术,,可以以对被被测对对象的的某些些参数数进行行远距离测测量。我们由感受器所接收的信息通过脑部分析后是否有可能产生误差?图中的的圆圈圈有没没有变变形??图A中心的的圆形形是否否比图B中心的的圆形形大?柱子是是圆的的还是是方的的?数一数数,这这里有有几个个黑点点?看一看看,画画面是是静的的还是是动的的?信息处处理技技术信息处处理技技术((信息息技术术群的的核心心)---基本本功能能相当当于人人脑的的思维维功能能人类最最古老老的信信息处处理技技术::有关关“计计算””的技技术((算算盘、、计算算尺))简洁,,速度度和准准确性性方面面缺陷陷例:美美国1880年的的人口口调查查人人工处处理5000万万人数数据量量10年年完成成1887美美统统计计学家家H。Hotlerith提提出机机读卡卡片概概念设设计计了““人口口调查查机””每分钟钟处理理50—80穿穿孔卡卡片-----〉1890年年人人口调调查3年年完成成1896年年创创立制制表机机器公公司-----〉国国际商商用机机器公公司穿孔卡卡片缺缺点::内部部数据据传输输需人人工干干预计算机机使数数据输输入/输出出不再再需要要人工工干预预计算机机与其其他数数据处处理机机器最最大的的区别别:本身有有可以以改变变的指指令,,指导导它自自动执执行信信息处处理步步骤因此::现代代信息息处理理技术术的发发展史史就是是一部部计算算机技技术的的发展展史6.2.2计计算算机技技术的的发展展1833英英国剑剑桥桥大学学教教授CharlesBabbage提出出计算算机的的理论论雏形形1936年年剑剑桥大大学AlanTuring提提出出了通通用数数字计计算机机的模模型此后陆陆续续展开开研制制机电计计算机机电电磁磁继电电器控控制内内部操操作算算术术计数数器机机械械式的的第一代代:电电子子管计计算机机1945年年底第第一台台通通用电电子数数字计计算机机ENIAC((投资资60万美美元))美美国宾宾夕法法尼亚亚大学学莫尔尔学院院18800个个电子子管7万万个电电阻1万万个电电容50万万个接接头耗耗电电140千千瓦5000次次/秒秒不具备备储存存程序序的能能力通通过过外接接电路路板输输入1949年年世世界上上第一一台储储存程程序的的计算算机ENSAC由英英国剑剑桥大大学M.V.Wilkes研制制成功功第二代代:晶晶体体管计计算机机1956S.Cray第第一台台晶体体管计计算机机---1605高级程程序设设计语语言((Fortran,COBOL,Basic)出现现----〉计计算机机应用用方便便第三代代::集成成电路路计算算机1958集集成成电路路问世世1964IBM360系列列的混混合固固体逻逻辑集集成电电路计计算机机(投投资5亿美美元))---为为首发发展大大型机机同时小小型型机开开发代代表表产品品::DEC公公司PDP—8,PDP——10,PDP——11向电路路元件件小型型化方方向发发展降降低低了制制造费费用、、提高高了计计算速速度和和存储储效率率计算机机应用用范围围扩展展到----〉〉办公公室事事务处处理、、工业业控制制领域域第四代代::大大规模模和超超大规规模集集成电电路计计算机机1971Intel公公司发发明明微处处理器器4004+TI公公司生生产的的超级级计算算机““高级级科学学计算算机””标标志技术上上向巨巨型化化和微微型化化发发展PC出出现1978PC产品品APPLEⅡⅡ问问世建建立立了个个人电电脑的的标准准1980IBM选选择DOS此此年年8088微微处理理器---〉开开发发式体体系结结构的的IBMPC标志--桌桌面计计算机机走向向主流流1982Columbia数据据产品品公司司和Compaq先先后制制造出出IBMPc的兼兼容机机Pc使使计算算机在在全世世界得得以普普及计算机机技术术的总总趋势势:体积缩缩小、、速度度提高高、费费用下下降、、可靠靠性增增强性能价价格比比的增增长令令人吃吃惊计算机机应用用的主主流数数值值计算算---〉〉信息息处理理目前::数值值计算算占10%过过程控控制占占5%80%信息息处理理计算机机应用用技术术人工智智能技技术电脑““聪聪明的的笨蛋蛋”AI技技术的的研究究目的的实现AI的的途径径(1)面面向功功能的的专家家系统统;((2))面向向结构构模拟拟的神神经计计算机机专家系系统::特定定领域域以人人类专专家水水平去去解决决困难难问题题的计计算机机程序序“全智智全能能”系系统===〉专专家系系统数据库库技术术DB::按一一定的的数据据模型型在计计算机机系统统中组组织、、存储储和使使用的的相互互联系系的数数据集集合数据集集合+DBMS层次、、网状状、关关系((1970)数数据库库;70年年代后后期的的关系系数据据库产产品DW、、OLAP、DM多媒体体技术术文、图图、声声、影影集成成处理理的技技术虚拟现现实多媒体体技术术是一一种迅迅速发发展的的综合合性电电子信信息技技术“多媒媒体””是指指能够够同时时获取取、处处理、、存储储和展展示两两个以以上不不同类类型信信息媒媒体的的技术术,这这些信信息媒媒体包包括文文字、、声音音、图图形、、图像像、动动画、、视频频等6.2.3多多媒媒体技技术文字声音图形图像动画视频1.文本文本是是以文文字和和各种种专用用符号号表达达的信信息形形式,,它是是现实实生活活中使使用得得最多多的一一种信信息存存储和和传递递方式式。文文本主主要用用于对对知识识的描描述性性表示示,如如阐述述概念念、定定义、、原理理和问问题以以及显显示标标题、、菜单单等内内容。。如Word文文字处处理软软件编编辑出出的““DOC”文件件,记记事本本和写写字板板的““TXT”文件件等。。2.图像图像是是多媒媒体软软件中中最重重要的的信息息表现现形式式之一一,它它是决决定一一个多多媒体体软件件视觉觉效果果的关关键因因素。。3.动画动画是是利用用人的的视觉觉暂留留特性性,快快速播播放一一系列列连续续运动动变化化的图图形图图像,,也包包括画画面的的缩放、、旋转转、变变换、、淡入入淡出出等特殊殊效果果。通通过动动画可可以把把抽象象的内内容形形象化化。存存储动动画的的文件件格式式有FLC、MMM、GIF、SWF等。4.声音声音是是人们们用来来传递递信息息、交交流感感情最最方便便、最最熟悉悉的方方式之之一。。在多多媒体体中声声音基基本上上分为为音乐乐和音音效两两类。。5.视频影影像视频影影像具具有时时序性性与丰丰富的的信息息内涵涵,常常用于于交待待事物物的发发展过过程。。视频频非常常类似似于我我们熟熟知的的电影和电视,有声有色,,在多媒体中中充当重要的的角色。视频频文件的存储储格式有AVI、MPG、MOV等。多媒体技术基基础图像技术简介介主流图像文件的格式简简介(1)BMP格式(2)GIF格式(3)JPEG格式(4)JPEG2000格式(5)TIFF格式(6)SVG格式多媒体技术基基础音频技术简介介主流音频文件的格式简简介(1)CD格格式(2)WAV格式(3)MP3格式(4)WMA格式多媒体技术基基础视频技术简介介主流视频文件的格式简简介(1)AVI格式(2)MPEG格式(3)WMV格式(4)RM格格式(5)RMVB格式常见的压缩媒媒体文件与流流媒体文件文件格式扩展名媒体类型客户端播放器软件流媒体服务器压缩媒体文件先下载才能播放.mov视频.mpg视频.mp3音频.avi视频流媒体文件边下载边播放微软.ASF视频WindowsMediaPlayerWindowsMediaServerRealServer.WMA音频RealNetworks.RM视频RealOnePlayer.RA音频.RP文本.RT文本苹果.MOV视频QuickTimePlayer.QT视频Macromedia.SWFFLASH动画FlashPlayerRealNetworks和Macromedia.RF动画Vivo.VIV动画流媒体技术的的应用领域非计算机系统统信息收集处处理技术(1)摄影、、声像技术摄影、声像技技术是近代声声学、电影和和电视技术的的综合性运用用,通过画面面和音响来表表达内在含义义的方法和设设备。涉及对语言、、音响和画面面加工处理,,电影胶片制制作和电视录录像制作等技技术。(2)激光信信息处理技术术激光信息处理理,是利用光进进行记录、记忆、、信息采集和和处理以及机器的控制,籍以对人的的视觉、听觉觉和头脑提供供帮助的一种种工程技术。。激光信息处理理包括:激光印刷全息照相光学存储光计算激光全息照片片英女王的全息息照片全息照相的特特点⒈它是一一个十分逼真真的立体像。。它和观察到到的实物完全全一样,具有有相同的视觉觉效应。⒉可以把把全息照片分分成若干小块块,每一块都都可以完整地地再现原来的的物像(孙悟悟空似的分身身术)。⒊同一张张底片上,经经过多次曝光光后,可以重重叠许多像,,而且每一个个像又能不受受其他像的干干扰而单独地地显示出来,,即一张底板板能同时记录录许多景物。。⒋全息照照片易于复制制。普通光再现、、彩色立体电电视、彩色立立体电影等。。(3)复印与与传真技术复印和传真在日常信息处处理过程中比比较常用的办办公管理设备备和技术。复印技术主要实现的是是图像文字资资料的采集功功能传真技术指的是先经过过它的扫描系系统把文字变成光光信号,再由内部的调制解调器转换为电信号,然后经过电电话线传输到到其它地方另另一台传真机上,用它的调制解调器转换电信号号为电压不同同的电信号的的感热头上,再打印出相应文文字的处理技术。。6.2.4人人工智能能技术人工智能技术术-----用计算机模模拟人类处理理信息的能力力,使计算机机能显示出人人类智能行为为的技术。人工智能学科科研究的主要要内容包括::知识表示、、自动推理和和搜索方法、、机器学习和和知识获取、、知识处理系系统、自然语语言理解、计计算机视觉、、智能机器人人、自动程序序设计等方面面。智能和人工智智能智能就是智慧和能力,是个体有目的的行为、合理的思维以及有效地适应环境的综合性能力。人工智能,通过对人类智力活动奥秘的探索与记忆思维机理的研究,来开发人类智力活动的潜能、探讨用各种机器模拟人类智能的途径的一门学科。在定义智慧时时,英国科学学家图灵做出出了贡献,如如果一台机器器能够通过称称之为图灵实实验的实验,,那它就是智智慧的,图灵灵实验的本质质就是让人人在不看外型型的情况下能能不能区别是是机器的行为为还是人的行行为时,这个个机器就是智智慧的。对于计算机人人士而言,获获得图灵奖就就等于物理学学家获得诺贝贝尔奖一样,,图灵在理论论上奠定了计计算机产生的的基础人工智能的主主要技术知识获取与表表示技术--KBE技技术及其在产产品设计中的的应用;作作者:彭颖颖红等著;;出版社社:上海交通通大学出版社社出版时间:2007-7-1知识库技术推理技术---五色房子问题题,四色定理搜索与数据挖挖掘技术智能接口技术术知识获取和知知识表示知识获取技术术是为获取和存存储知识库中中的所有信息息、数据、规规则、案例和和关系等元素素的一组程序序…知识的表示就是对人类知知识的一种描描述,把知识识表示成计算算机能够处理理的数据结构。对知识进行表表示的过程就是把知识编码成某种数据结构的过过程。知识表示方法法谓词逻辑表示示法产生式表示法法语义网络表示示法框架表示法面向对象表示示法状态空间表示示法与/或树表示示法谓词逻辑表示示法例:设有下列事实性知识:张晓辉是一名名计算机系的的学生,但他他不喜欢编程程序。李晓鹏比他父父亲长得高。。用谓词公式表示这些知识识。解第一步:定义谓词:COMPUTER(x):x是计算机机系的学生LIKE(x,y):x喜欢yHIGHER(x,y):x比y长得得高定义个体:张晓辉(zhangxh),编程序序(programming),李李晓鹏(1ixp),函函数father(lixp)表示示李晓鹏的父父亲。第三步:根据语义,,用逻辑连接符将它们连接起起来,就得到到了表示上述述事实性知识的谓词公式:COMPUTER(zhangxh)∧~LIKE(zhangxh,programming)HIGHER(1ixp,,father(1ixp))第二步:将个体代入入谓词中:COMPUTER(zhangxh),~~LIKE(zhangxh,programming),HIGHER(lixp,,father(lixp))例如:规则1:if该动物有羽毛毛then该动物是鸟规则2:if该动物是鸟and有长脖子and有长腿and不会飞then该动物是鸵鸟鸟产生式表示法法语义网络表示示法---情况和和动作的表示示例:一只名叫““神飞”的小小燕子从三月月到十一月占有一个巢。专家系统的语语义网络智能系统专家思维专家知识困难问题专家系统是一种能解决具有能模拟例6.1下下面是一个描描述“教师””的框架:框架名:<教教师>类属:<知识识分子>工作:范围:(教学,科科研)缺省:教学性别:(男,,女)学历:(中师师,高师)类型:(<小小学教师>,,<中学教师师>,<大学学教师>)框架表示法例3.12“教室”框架架。框架名:<教室>墙数:窗数:门数:座位数:前墙:<墙框架>后墙:<墙框架>左墙:<墙框架>右墙:<墙框架>门:<门框架>窗:<窗框架>黑板:<黑板框架>天花板:<天花板框架架>地板:<地板框架>讲台:<讲台框架>例6.6下下面是面向对对象程序设计计语言C++中一个雇员员类和经理类类的定义。classEmployee{privite:char*Name;intAge;intSalary;=public:Employee(char*name,intage,intsalary);~Employee();面向对象表示示法};Employee∷Employee(char*name,intage,,intsalary){Name=newchar[strlen(name)]];strcpy(Name,name);Age=age;Salary=salary;=}=Employee∷~Employee(){DeleteName;=}VoidEmployee∷Change(intage,intsalary){Age=age;Salary=salary;}VoidEmployee∷Retire(){if(Age>60)Deletethis;}以上是雇员类类的定义,用用此定义就可可生成一个雇雇员类的实例例,即雇员对对象。与/或树表示示举例每一种知识表示方法法都有其相应的的专用实现语语言。例如,,支持谓词逻逻辑的语言有有PROLOG和LISP,专门支支持产生式的的语言有OPS5,专门门支持框架的的语言有FRL,支持面向对象表示示的语言有Smalltalk、、C++和Java等,,支持神经网网络表示的语语言有AXON。推理技术---自动推理理地图四色定理(Fourcolortheorem)最最先是由一位位叫古德里((FrancisGuthrie)的英国大大学生提出来来的。四色问问题的内容是是:“任何一一张地图只用用四种颜色就就能使具有共共同边界的国国家着上不同同的颜色。””用数学语言言表示,即““将平面任意意地细分为不不相重叠的区区域,每一个个区域总可以以用1,2,,3,4这四四个数字之一一来标记,而而不会使相邻邻的两个区域域得到相同的的数字。”这这里所指的相相邻区域,是是指有一整段段边界是公共共的。如果两两个区域只相相遇于一点或或有限多点,,就不叫相邻邻的。因为用用相同的颜色色给它们着色色不会引起混混淆。数据挖掘,也可以称为数数据库中的知知识发现(KnowledgeDiscoveryinDatabase,简称称KDD),,是从大量数数据中提取出出可信、新颖颖、有效并能能被人理解的的模式的高级级处理过程。。数据挖掘的重重要性就来源源于数据仓库库中巨大的数数据量。数据挖掘技术术从一开始就就是面向应用用的。它不仅仅是面向特定定数据库的简简单检索查询询调用,而且且要对这些数数据进行统计、分析、、综合和推理理,以指导实际际问题的求解解,发现事物物间的相互关关联,甚至利利用已有的数数据对未来的的活动进行预测。数据挖掘:多多种技术的的融合数据挖掘数据库技术统计学机器学习模式识别算法其他技术可视化WhyDataMining?--潜潜在的应用数据库分析和和决策支持市场分析和管管理市场营销,顾顾客关系管管理,菜篮子子分析,cross销销售,市市场细化.风险分析和管管理天气预报,顾顾客消费习习惯,保险险业,质量量控制,竞争争分析等等.诈骗预测和管管理智能查询回答答Intelligentqueryanswering1/7/202390DM应应用::市场场分析析和管管理供分析析的数数据源源在哪哪里?信用卡卡业务务,信信誉誉卡,优优惠券券,顾顾客客投诉诉,大大众众生活活方式式研究究.市场营营销Targetmarketing:寻找典典型消消费者者的聚聚类,,他们们有相相同的的特征征:偏偏好、、收入入水平平、消消费习习惯等等等.Determinecustomerpurchasingpatternsovertime:Conversionofsingletoajointbankaccount:marriage,etc.Cross-marketanalysis销售产品之之间的关联联基于相关信信息的预测测1/7/202391DM应用::市场分析析和管理Customerprofiling数据采掘可可以告诉你你什么类型型的顾客买买什么样的的产品(聚类或分分类).确认顾客需需求为不同顾客客确认最好好的产品预测什么因因素会吸引引新顾客提供简报各种多维简简报;统计简报(数据的的主要趋势势和变化)1/7/202392DM应用用:企业业分析和和风险管管理财政计划划和资产产评估:资金流动动分析和和预测为资产评评估提供供意外索索赔分析析cross-sectionalandtimeseriesanalysis(financial-ratio,trendanalysis,etc.)资源规划划:对资源和和消耗进进行简要要说明和和比较Competition:Monitorcompetitorsandmarketdirections(CI:competitiveintelligence).市场细化化把消费费者分类类,对其其采取基基于分类类的价格格策略.在有竞争争力的市市场的中中应用价价格策略略(e.g.,REPSOLgaschainstationinSpain).1/7/202393DM应用用:风险险探测和和管理应用:在医疗保保健、零零售业、、信用卡卡服务、、电信业业(电话话卡欺诈诈)等方方面.思路:用历史数数据为欺欺诈行为为建模,,用数据据采掘来来帮助识识别类似似事件。。例子:AutoInsurance:detectagroupofpeoplewhostageaccidentstocollectoninsuranceMoneyLaundering:detectsuspiciousmoneytransactions(USTreasury'sFinancialCrimesEnforcementNetwork)MedicalInsurance:detectprofessionalpatientsandringofdoctorsandringofreferences1/7/2023DM应应用::其他他应用用体育IBMAdvancedScout分分析析NBA比比赛统统计(篮篮板,助助攻,和和犯犯规),为为纽约约尼克克斯队队和迈迈阿密密热队队赢得得了长长足的的进步步。天文CalTech和和thePalomarObservatory在在数数据采采掘的的帮助助下发现了了22个个星星体。InternetWebSurf-AidIBMSurf-Aid为为Web提供供了数数据采采掘算算法,,可以存存取与与市场场相关关的记记录日日志,,以以发现现顾客的的嗜好好和行行为记记录,分析Web营营销的的成效效,改改进Web站站点的的组织织,等等等。。1/7/202395NBA教练练如何何布阵阵以提提升获获胜机机会??美国著著名的的国家家篮球球队NBA的教教练,,利用用IBM公公司提提供的的数据据挖掘掘工具具临场场决定定替换换队员员。想想象你你是NBA的教教练,,你靠靠什么么带领领你的的球队队取得得胜利利呢??当然然,最最容易易想到到的是是全场场紧逼逼、交交叉扯扯动和和快速速抢断断等具具体的的战术术和技技术。。但是是今天天,NBA的教教练又又有了了他们们的新新式武武器::数据据挖掘掘。大大约20个个NBA球球队使使用了了IBM公司司开发发的数数据挖挖掘应应用软软件AdvancedScout系系统来来优化化他们们的战战术组组合。。例如如Scout就就因为为研究究了魔魔术队队队员员不同同的布布阵安安排,,在与与迈阿阿密热热队的的比赛赛中找找到了了获胜胜的机机会。。主要的的KDD技技术关联规规则的的挖掘掘分类知知识的的挖掘掘基于决决策树树的分分类聚类分分析知识发发现(KDD)过过程程数据挖挖掘——知识识发现现过程程的核核心数据清清理数据集集成数据库库数据仓仓库知识任务相相关的的数据据选择数据挖挖掘模式评评估关联规规则的的挖掘掘关联规规则的的挖掘掘(例例子分分析)关联规规则的的挖掘掘(例例子分分析续续)关联规规则的的挖掘掘(挖掘掘结果果的应应用)R1:烤烤鸭面饼、面面酱。支支持度40%,,置信度度为66.6%R2:面饼烤鸭、面面酱。支持度度40%,置信信度为66.6%R3:面酱面饼、烤烤鸭。支持度度40%,置信信度为50%KDD结结果不一一定是因因果关系系。运用用之妙成成乎于人人。例如∶用R1,,将烤鸭鸭降价以以促销面面饼、面面酱,很很可能会会破产用R2将将面面饼降价价,以促促销烤鸭鸭,可能能会发财财;用R3,,引不起起顾客的的热情。。分类知识识的挖掘掘例住房分配配(监督下下分类SupervisedClassification)(1)输入∶训练数数据集(符合群众众利益或领导意图图)分类知识识的挖掘掘(住房房分配例例子分析析)(2)输出从训练数数据中"发现"出一个个分房计分分公式(知识)(3)调用特征征选择过过程.比比较张三三与张C,李李四与李李D王五与王王E发现现身高、、体重与与住房无无关,删删去(4)交交互生成成加权机机制Total=∑PiFi,其中Fi为各条件件量化值,,Pi为加权值值,总分为应应住面积积。(5)根根据训训练数据据,调整整加权。。例如如张三及及类似与与张三条条件的应应住85平方米米等等。。,使得得在训练练集中各各记录的的∑PiFi刚好在应住面面积的分数段段中。(6)用测测试数据测测试和修改公公式Total=∑PiFi分类知识的挖挖掘(住房分分配例子分析析续)(7)公式Total=∑PiFi就是从数据中中“挖”出来的的分类知识,可以推广使使用。KDD先从实实践中来,然然后,用到实实践中去。基于决策树的的分类(信息增益(熵熵)理论较深)例高校招生生德智体三三标准(门限限值)。决策策树德不合格0.1%智(总分)99.9%不合格60%体39.9%不合格6.9%录取33%基于决策树的的分类(高考考招生例,续续)上述决策树把把德育放在第一一位。绝大多数考考生都符合标标准。第一节节点(德育)分流后,候候选空间并未未迅速减少(信息增益小)如果把智育节节点提前,可可在第一步将将候选集缩小小到1/3,,提高整个系系统效率。事实上的招生生过程采用了了这一方法。。决策树分类技技术研究节点点集的选择,,节点的次序序,门限值的的确定公式等等等,其目的的是使分类比比较准确,比比较快。智能接口技术术文字识别语音识别图像识别人脸表情识别别手语识别视线跟踪技术术生物特征识别别…人脸表情识别别------科学家用计算算机分析“全全世界最有名名的微笑”科学家用计算算机分析了《《蒙娜丽莎》》显示的“全全世界最有名名的微笑”,,认为蒙娜丽丽莎确实在笑笑,因为她的的面部表情包包含了快乐、、厌恶、恐惧惧和愤怒四种种情绪,快乐乐的成分远远远超过其他成成分。分析结结果显示,蒙蒙娜丽莎的微微笑中,带有有83%的快快乐,9%的的厌恶,6%的害怕以及及2%的气愤愤。这说明,,蒙娜丽莎脸脸上的主要情情绪是快乐。。思考:这个技技术可以用在在哪方面?6.3信信息组织与存存储技术1.文件存储储系统1)文件的基基本概念6.3.1文文件组织织技术数据项:是最基本的不可分的数据单位,也是文件中可使用的数据的最小单位。记录:是数据项的集合,是文件中可存取数据的基本单位。文件:是记录的集合。信息的组织层层次数据的组织一般分为数据项、记录录、文件和数据库四个层次:1.数据项是具有确定逻辑意义的数据的最小单位。是不可再分的数据单位。2.记录是具有一定关系的数据项的一个集合。3.文件是同类记录的有序集合。4.数据库是存储起来的相关数据的集合。2)文件的的组织文件的组织方方法:(1)顺序文件:物理顺序和和逻辑顺序相相一致。(2)索引文件:保存一个索索引来指示关关键字与记录录地址之间的的对应关系,,索引是按关关键字顺序存存放的,而文文件本身可按按顺序也可不不按顺序存放放。记录区按按关键字顺序序排列的称索引顺序文件件,记录区不按按关键字顺序序排列的称为为索引非顺序文文件,简称索引文文件。(3)直接存取文件件:寻找一个均均匀的杂凑函函数(又称Hash函数数),实现关关键字到地址址的转换,然然后进行直接接存取。存取取速度快,节节省存储空间间;缺点是不不易找到理想想的Hash函数。3)文件系统统文件系统:计算机中用用来管理外存存上的数据的的子系统。一个命名了的的数据集合称称为一个文件。文件与应用程程序紧密相关关,不同的应用用程序独立地地定义和处理理自己所要用用的文件。文件系统的缺缺陷:①数据共享性差差,冗余度大大。不同的应用程程序使用相同的文件时,会出现重复定义、重重复存储。②数据不一致性性。数据的冗余余给数据的修修改和维护带带来了困难。。③数据独立性差差。当文件的结结构改变,也也要修改应用用程序的数据据处理部分。。④数据结构化程程度低。文件之间是是孤立的,从从整体上看是是无结构的,,因此很难对对数据进行合合理的组织以以适应不同应应用的需要。。2数据管理理技术数据管理的主主要任务:实现对数据的的合理组织、、维护和存取取,处理好应用程程序与数据之之间的关系。。数据管理大致致经历了三个个阶段:人工管理阶段文件系统数据库系统(1)人工管管理阶段20世纪50年代中期以以前,也就是是计算机应用用于业务管理理之前的阶段段。数据管理的主主要特点是::数据不在计算机中长期保存没有软件系统对数据进行管理一组数据对应于一个应用程序(2)文件系系统计算机用于管管理,有了了专门管理数数据的软件。。数据管理工作作的特点:数据按一定的规则组织成文件后,可对文件进行反复的查询、修改、插入、删除等操作程序与数据之间有了一定的独立性。文件不易扩充,修改维护还比较费时。数据共享有限,冗余度仍然较大,空间浪费严重等(3)数据库库系统处理数据量的的增加,产生生了专门的数数据管理软件件,实现对数数据的管理工工作。数据管管理方面具有有如下特点::能够描述各数据元素间数据集合间的关系具有最小的数据冗余,节省存储空间,减少重复。具有较好的数据共享性。允许多用户并发地使用数据库中的数据,以最好的方式去满足多用尸的需要。具有较好的数据独立性对数据进行统一的管理和控制。6.3.2数数据库技术术如前所述,数数据是信息的的具体化、形象象化,是表示信息息的物理符号号。在信息系系统中,要对对大量的数据据进行处理,,首先就要弄弄清现实世界界中事物及事物间间的联系是怎样的,然然后再逐步分分析、变换,,得到系统可可以处理的表表现形式。对客观世界的的认识、描述述是一个逐步深入的过程。数据库管理系系统的功能结结构(1)数据定义功能:DBMS能够提供数据定义语言(DDL),提供相应的建库机制(2)数据操纵功能(DCL):实现数据的插入、修改、删除、查询、统计等数据存取操作的功能(3)数据库的建立和维护功能:是指数据的载入、转储、重组织及数据库恢复功能。(4)数据库的运行管理功能1概念模模型是对信息世世界的管理理对象、属性性及联系等信息的描描述形式。。它不考虑计算算机实现,客观地反反映所研究究问题中的的信息及信信息联系的的模型,是是对现实世世界的真实反应。实体可以指实际的东西,也可以指概念性的东西属性是实体(事物)的某一方面的性质或特性联系是指客观存在的事物之间的相互关系,通常是指实体集与实体集之间的关系。l.概念模模型的要素素2.两个实实体集之间间相互联系系的方式一对多联系系(1:n))一对一联系系(1:1))多对多联系系(m:n))3.E-R模型E-R方法法是一种信息结构的的图示法,它主要描述实体集集之间的联联系。通常用长方形表示实体集集;用椭圆形表示实体集集的属性,,用菱形表示实体集集间的联系系。常见数据模模型层次模型(HierarchicalModel)层次模型的的数据结构构是一种树树型结构网状模型(NetworkMode)数据模型中中各个记录录型(实体体集)相互互联系形成成一个整体体均可以看看着是网状状模型。但但为了与层层次模型相相区别,在在网状模型型上增加了了一些限制制条件,即即满足下列列条件的数数据模型称称为网状模模型:1)可以有一个以上的节点(记录型)无父节点;2)至少有一个节点的父节点多于一个。网状模型关系模型(RelationalModel)关系模型将将数据的逻逻辑结构归归纳为满足足一定条件件的二维表的形式,称称为一个关关系(Relation),,关系又由由关系框架架和若干元元组(Tuple)组成,一一个元组实实际上就是是二维表中中的一行内内容。一个关系相当于数据组织中的同质文件关系框架相当于其记录类型,每个元组相当于一个记录值(常代表一个实体)关系中每一列(分量)是同类型的数据的值的集合(常代表实体的属),也称域每个数据库中的数据均可划分成多个关系(多个二维表)

3.关系模模型关系模型的的数据结构构无论对实体集还是实体集之间的联系(包含多元多对多的联系),均采用关系(二维表)来描述要求关系规范化,就是指关系模式要满足一定的规范条件。满足最基本规范化化的关系模式加第一范式第一范式的关系模式再满足另外一些约束条件就产生了第二范式、第三范式、BC范式等等关系操作和和关系的完完整性约束束条件关系操作主要包括数数据查询和和插入、删删除、修改改数据。关关系中的数数据操作是是主要集合合操作,包包括传统的的集合运算算,如并、、交、差和和关系运算算,如选择择、连接、、投影等。。关系的完整整性约束条条件包括三类::关系模型的的完整性约约束,是为为了使数据据库在使用用、维护、、调整、更更新、扩展展时保持数数据结构的的灵活、稳稳定、可靠靠和数据与程序序的相对独独立性。实体完整性参照完整性用户定义的完整性关系数据库库的特性(1)简单、灵活易用。(2)关系数据语言具有较好的非过程化特性(3)有更高的数据独立性(4)易于实现对数据库的重组和控制(5)易于实现各种不可预计的随机查询(6)完备性,规范化及查询优化等方法(7)易于向推理系统和知识库系统扩展和综合常见关系数数据库系统统简介1.FoxproFoxpro是FoxBase进行行改进后的的产品。主主要特点::(1)提供供并引入了了强有力的的辅助工具具,例如屏屏幕生成工工具;报表表生成工具具;标签生生成工具;;菜单生成成器;以及及项目管理理工具。(2)可以以使用SQL标准查查询语言。。(3)通过过查询优化化技术、按按例相关查查询技术以以及新的索索引结构等等进行更快快速方便的的数据查询询。(4)提供供了与高级级语言C语语言的接口口工具。(5)提供供了编译分分销工具,,使所开发发的应用系系统可以完完全脱离Foxpro环境运运行。主要适用于于小型应用用系统的开开发,或中中型数据库库应用系统统的前端开开发工具。。2.ORACLE(1)具有有很强的可可移植性、、可兼容性性和可联接接性。可在100多种不同同类型的计计算机系统统上运行,,支持多种种操作系统统。允许不不同类型的的计算机和和操作系统统通过网络络共享其信信息资源。。(2)Oracle8以新版版本已超出出了客户/服务器范范围,发展展到了分布布式数据管管理。通过网络络联接,Oracle将存放放在多台计计算机上的的数据组合合成一个逻逻辑数据库库,可被全全部网络用用户存取,,像集中式式系统一样样具有用户户透明性和和数据的一一致性。(3)支持多用户户、大型数数据库的高高性能事务务处理。支持大小可可到几百GB的数据库,,支持大量量用户同时时在同一数数据上执行行各种应用用。(4)Oracle系统有较较好的安全全性和完整整性控制。。遵守数据存存取语言、、操作系统统、用户接接口和网络络通信协议议的工业标标准,可以以很好地保保护用户投投资。3.SybaseSybase公司是是后起之秀秀,其DBMS始终终保持“领先一步”:(1)C/S结构构。(2)存储过程、、触发器和和Transact-SQL语言。(3)远程调用(RPC)功能。提供了一一个数据库库外壳,可可以通过它它来访问远远程表。(4)多服务器结结构,以最大效效率处理各各种任务和和输入输出出工作。(5)编程式应用用程序接口口(API)。可以将数数据库处理理与电子邮邮件和客户户书写的应应用联接起起来,具有有很好的开开放性。(6)Sybase系统在在有关工具具及实用程程序方面有有一些欠缺缺,需需借借助助第第三三方方的的软软件件予予以以辅辅助助。。(7)能够够在在异异构构DBMS之之间间方方便便地地进进行行复复制制。(8)采用用基基于于脚脚本本的的方方式式支支持持Internet。用用户户可可在在Web主主页页被被激激活活时时访访问问特特定定的的数数据据库库。。4..Informix主要要特特点点有有::(1)它它是是UNIX系系统统上上效效率率高高、、性

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论