高新技术企业项目可行性分析报告_第1页
高新技术企业项目可行性分析报告_第2页
高新技术企业项目可行性分析报告_第3页
高新技术企业项目可行性分析报告_第4页
高新技术企业项目可行性分析报告_第5页
已阅读5页,还剩47页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1 / 52高新技术企业项目可行性分析报告目录1. 企业概况 5企业基本情况 5科技力量 5产业化及研发环境 7企业长远发展规划及目标 82. 互联网咨询协调过虑器及智能检索支援系统项目论述 9互联网咨询协调过虑器及智能检索支援系统技术可行性分析 9国际市场现状及产品分析 9智能检索技术的概述 10协调过滤(Collaborative Filtering)技术造就的个性化服务 10检索服务的个性化 22自动收集技术 22自动定点观测技术 22系统的综合 23系统的运用形态 23互联网咨询协调过虑器及智能检索支援系统市场调查和需求预测 252 / 52项目实施方案 26开发实施方案 26营销计划实施方案 28项目实施目标 28投资估算 28经济、社会效益分析 28项目可行性分析结论 284 管理信息化系统通用化平台及业务逻辑自动生成工具系统项目论述 29管理信息化系统通用化平台及业务逻辑自动生成工具系统技术可行性分析 29开发背景 29平台模式 29开发方案 31管理信息化系统通用化平台及业务逻辑自动生成工具系统市场调查和需求预测 33项目实施方案 33开发实施方案 33营销计划实施方案 33项目实施目标 33投资估算 34经济、社会效益分析 343 / 52项目可行性分析结论 34 WBT 系统项目论述 35.1 WBT 系统技术可行性分析 35WBT 系统的诞生背景 35计算机辅助教学的理论 36建构主义学习与教学理论在计算机辅助教学中的实现模式 36计算机辅助教学的现有模式 37(1) CBT(Computer-Based Training)模式 37(2) 初级 WWW 模式 37(3) 具有管理机能的 WWW 模式 38(4) 统一规格的具有管理机能的 WWW 模式 38WBT 系统模式的规格 39(1) AICC 39(2) IMS 39(3) IEEE LTSC 39(4) ADLNet 40(5) WBT 系统模式规格之间的关系 40WBT 系统的构成理论 41CMI 的管理体系 41WBT 规格下的 CMI 等级 42CBT 机能 424 / 52CBT,CMI 的界面 42WBT 系统实装形态 43WBT 的应用范围 47WBT 的特点 48WBT 发展现状 48WBT 系统的构筑平台系统市场调查和需求预测 48项目实施方案 48开发实施方案 48营销计划实施方案 49项目实施目标 49投资估算 49经济、社会效益分析 49项目可行性分析结论 491. 企业概况 企业基本情况公司是一家由海外归国人员和国内的计算机界精英共同创办的追求高科技、重视实际应用的公司。企业的法定地址为公司现有员工人。注册资金为人民币、总资产为5 / 52人民币。企业登记注册类型有限责任公司。科技力量(1) 主要人员构成情况职务 姓名 学历 主要经历 技术专长 王立群 博士 1 1980 至 1984西安电子科技大学2 1984 至 1989中国计算机系统工程研究所3 1989 至 1990日本日立制作所4 1990 至 1992夏普多媒体研究所5 1992 至 1994富士通网络事业部 上一篇:青年岗位能手申报银行 下一篇:xx 公司企业文化建设优秀单位申报材料 6 1995 至 1996日本 NTT 软件公司7 1997 至 2000日本 NTT 通信研究所6 / 528 2000 至 2001日本共达网络有限公司9 2001 至 2002-2北京共达公司总经理 计算机操作系统,计算机应用系统,计算机图像处理,计算机通信技术,互联网技术,软件工程。 高洋 大学本科 1 1994 至 1998北京大学2 1998-8 至 2001-5日本 UNSYS 有限公司3 2001-6 至 2002-2北京共达公司董事兼系统开发部部长 计算机操作系统,计算机应用系统,计算机图像处理,计算机通信技术,互联网技术,软件工程。 李发春 大学本科 1 1994 至 1998北京大学2 2000-8 至 2001-6日本共达网络有限公司3 2001-6 至 2002-2北京共达公司董事兼总工程师 计算机操作系统,计算机应用系统,计算机图像处理,计算机通信技术,互联网技术,软件工程。7 / 52 吴涛 硕士 1 1994 至 1998北京大学2 1998 至 2001-4中国科学院3 2001-5 至 2002-2北京共达公司产品开发科科长 计算机操作系统,计算机应用系统,计算机图像处理,计算机通信技术,互联网技术,软件工程。 戴永继 大学本科 1 1994 至 1998中国北京大学2 1998 至 2000-5中国石油化工研究院3 2000-5 至 2000-4日本共达网络有限公司4 2000-4 至 2002-2北京共达公司工程开发科科长 计算机操作系统,计算机应用系统,计算机图像处理,计算机通信技术,互联网技术,软件工程。公司的主要人员均具有良好的基础知识和理论知识,并具有较长时间的国内外研究开发实践,具有良好的外语水平。不断关注掌握国外技术新动向,同中国具体实际相结合,开发出符合实际需求的实用产品,是我们追求的目标。8 / 52(2) 企业科研队伍知识结构、人数、科技成果、新产品开发情况。公司现有科研开发人员*名,均具有大学本科以上的学历。并伴随公司的发展,计划从现地陆续招收优秀人才。公司的主要人员通过多年的研究开发实践,通过长年学习和调查的日积月累,通过较长时间的讨论和实验,已积累了下述 2 个项目的大量资料和代码。公司准备用 1 到 2年的时间,在承接企业信息化建设项目的同时,完成这 2个项目的产品化。项目 1:互联网咨询协调过虑器及智能检索支援系统项目 2:管理信息化系统通用化平台及业务逻辑自动生成工具系统产业化及研发环境企业生产地址、研发地址研发环境主要是计算机及其关联设备。企业长远发展规划及目标前 2 年为稳定基盘阶段,后 2 年以扩大发展为中心。第一年 第二年 第三年 第四年人数 10 人 20 人 30 人 40 人销售额 180 万 250 万 500 万 1000 万9 / 52第一年以我们利用业余时间开发的企业网构筑框架为中心,承接国内的企业网开发项目,并不断完善企业网构筑框架,使其成为管理信息化系统通用化平台及业务逻辑自动生成工具。自主产品首先以管理信息化系统通用化平台及业务逻辑自动生成工具和互联网咨询协调过虑器及智能检索支援系统为主进行投入开发。2. 互联网咨询协调过虑器及智能检索支援系统项目论述 互联网咨询协调过虑器及智能检索支援系统技术可行性分析国际市场现状及产品分析人类进入二十世纪之后,有 2 种不同概念的高速公路得到了迅猛的发展。这 2 种不同的高速公路,极大地改变了人类的生活方式以及思维方法。其中,一种是现实生活中交通环境的高速公路车辆行驶的高速公路,另一种是信息社会中的交通要道情报高速公路。 上一篇:青年岗位能手申报银行 下一篇:xx 公司企业文化建设优秀单位申报材料 由于计算机技术的迅速普及和 WWW 技术即互联网技术的不断进化,情报高速公路得到了前所未有的促进和发展。10 / 52与此同时,情报高速公路的完善反过来也极大地促进并影响了计算机技术和互联网技术的进一步普及。这种互相促进互相补充的关系,终于造成了本世纪“工业革命”的爆发。据截止到 2000 年 12 月 31 日的统计表明,中国国内连接到互联网上的计算机数达到了 892 万台。ISP 和 ICP 的数目达到了数万个,其客户数达到了 2250 万人。到年,我国联网计算机将达到万台,数据、多媒体和互联网用户将达到亿户左右,上网人口普及率将达到左右。但另一方面,从至今为止 ISP 所能掌握的技术和其所能提供的服务来看,各家之间并没有实质性的不同。因此,各家服务商围绕着通信速度、用户所能享受的磁盘空间、特别是上网价格方面,展开了激烈的竞争。随着硬件成本的不断下降,最终必将导致价格之战的恶性循环。纵观互联网的发展过程,可以得出以下的结论:没有鲜明特色的 ISP,必然会被时代所淘汰。因此,经济概念上的ISP 必将向 ASP 的方向进化,这也就是 ASP 成为现今的热门话题的最重要的原因,也就是说能提供满足用户千变万化的要求的真正的服务才能获得生存的空间。据某些分析资料,在二十一世纪 IT 产业将流行三个不同的 C。第一个 C 是 EC。第二个 C 是 Communication。第三个11 / 52C 是 Customize。在本可行性报告中提到的互联网咨询协调过虑器及智能检索支援系统的着眼点直接涉及到了Communication 和 Customize,并间接影响到了 Electronic Commerce。这个系统的目标是把强大的生命注入到 ISP 中去,使其进化成具有鲜明个性的 ASP,从而使单纯的价格之战转化为互联网服务内容和水平的高层次的胜负较量。智能检索技术的概述协调过滤(Collaborative Filtering)技术造就的个性化服务背景:当今世界,随着网络技术的发展,诸如WWW,Netnews,Mailing list 等各种各样的情报源不断涌现,使得人们有可能从更多的情报源中收集信息。与此同时,大量的情报造成了信息的爆炸,使人们为了获得所需的情报不得不花费大量宝贵的时间,从而使情报收集变得近乎失去了意义。为解决这个问题,出现了各种不同的办法和方案。但同时也存在着共同的问题:想要获得的情报虽然并不存在,但由于用户无法判断而还在执迷不悟地检索;想要得到的情报的确存在,然而由于方法不当而找不到这些信息;12 / 52在情报检索过程中,收集到大量的洪水般的多余情报致使有用的信息被淹没;至今为止,从互联网上获取信息有情报检索、情报过滤和浏览等几种方法。简述如下: 情报检索情报检索,即对检索关键字不断调整,判断其检索结果并将其反馈到关键字中去,最后,特定到所需的情报源之上。用户所指定的关键字直接影响到数据库的检索。数据库系统将符合条件的数据抽取出来送给用户,由用户自己去判断检索结果的满足度。用户的要求得到满足后,情报检索宣告结束。否则将会再次修正关键字,再度检索数据库力争逼近理想的结果。这个处理周而复始,整个过程就形成了人们所熟知的情报检索。对于情报检索来说,每个用户,每次检索过程都互不相关,完全是独立的。也就是说关心同一类情报的用户之间并不能交换情报,所以也无法形成信息共有,情报检索的效率完全依赖于检索者个人的知识和熟练程度。 情报过滤情报过滤是指对所获得的情报而设定优先度,比如Mailing list 就是一例。加入者众多的 Mailing list,一个用户在一天之内完全有可能收到 100 件以上的电子邮件,13 / 52而用户查看这些邮件必然要花费大量的时间。情报过滤就是为解决这个问题而发展出的技术。 上一篇:青年岗位能手申报银行 下一篇:xx 公司企业文化建设优秀单位申报材料 情报过滤是这样一个过程:用户可以事先指定代表不需要情报的关键字,过滤系统则将含有这些关键字的信息源排除出去。除此之外,用户亦可指定所需情报的关键字及优先顺序,过滤系统将根据这些要求把收集到的情报标上优先顺序再提供给用户。情报过滤系统就是这样一个选择情报的收集方法。和情报检索方法类似,使用情报过滤系统的用户,相互之间是独立的,无法实行有效地情报共享,也做不到高效率的情报收集。用户根据自己的水平决定关键字,稍有不慎会导致将实际上所需要的情报拒之门外。综上所述,情报过滤与情报检索相同,欲实现高效的检索必须具有相当的熟练经验。 浏览浏览是指相关于 Hypertext 的情报收集方法。一个具体的例子就是大家所熟悉的对各种 WWW 主页的检索。浏览的一个特点是某些场合下用户并没有明确的目的,在对各种主页进行浏览的过程中逐步获得明确目的的情报。14 / 52浏览属于最困难的情报收集方法的一种。首先,用户并不知道他所需的情报是否存在。其次,用户很可能找不到他所需的情报。用户通过各种连接方式去寻找情报,但对Link 的选择可能导致他离所需情报愈来愈远。这个问题的发生,同样是因为浏览亦是相互之间独立进行的缘故。因此,从上述网上获取情报的 3 种方法的说明上可以得出结论,独立进行情报收集的做法,造成了即使是关心同样内容的用户也无法实现情报共有/共享。而在现实世界里,对于关心共同话题,共同内容的用户来说,一个最重要的问题就是进行高效的情报交流和共享。但是十分遗憾的是传统的手法实现这种共有/共享是不可能的。相互间独立的情报收集是现有各种主要检索软件的致命伤,是一种不可取的方式。互联网的发展,迫切需要一个用于信息收集、具有智能的检索支援系统。为解决上述的问题,出现了协调过滤这样一种崭新的方法。协调过滤法充分利用了他人的知识进行情报收集。而这些知识常常包含了间接、甚至直接解决问题的重要信息。这种做法大大减少了收集情报所需的时间和工作量。更具体地说,根据用户的爱好和要求,系统自动提供/推荐各类信息,也即推荐服务的方法。以下是日本的日经网络商务举办的第 9 回互联网用户调查的结果。15 / 52调查提问.作为检索服务的一种,以用户输入的检索关键字为基准,向用户介绍有关网上商品销售网站的推荐型服务已经开始了。你想使用这类服务吗?请选择下列合适的答案。回答 年月 1999 年 12 月 1999 年 6 月 1998 年 12 月还从未使用过,看起来很方便,今后想利用。 % % %不知道是什么样的服务,无法表态。 % % %还从未使用过,因感到不必要,今后也不打算利用。 % % %已经使用过了,感到很方便,今后也准备继续利用。 % % %已经使用过了,感到没必要。今后不再利用了。 % % %其他 % % %互联网活跃用户调查(日经 BP 出版社)据以上的调查结果,实际上用过情报推荐服务的用户占全体的%,作为刚开始不久的服务来说这个数字不算什么,但想利用的用户占%,将全体的一半。从这个调查结果来看,推荐服务将在互联网今后的发展中起到举足轻重的作用。综上所述,在各种情报的收集活动中,通过使用协调技术,可以提高收集活动的效率。体现协调特点的情报收集的一个例子是 mailing list。关心相同内容的用户参加mailing list,相互之间交换情报。请想象某用户就某个问题向 mailing list 的参加者进行询问,而参加者们或直接回答问题,或提供能对解决问题有帮助的情报及提示。16 / 52这个过程即是一个相互协调的过程。与单独的情报收集相比,相互协调的方法能更有效地提高检索效率。 上一篇:青年岗位能手申报银行 下一篇:xx 公司企业文化建设优秀单位申报材料 技术构成要素协调过滤方法是基于情报流通传播,以提高收集效率为目标的情报收集的方法。情报流通是指为持不同问题的用户自动寻找解决问题的情报;向持相同问题的用户提供推荐服务;需要寻找关注某特定问题的用户群,进而得到为解决问题所必需的信息。则是将这些用户的特征归纳起来,做到情报的交换。协调过滤方法则将上述的过程自然地融为一体。所以,我们可以为协调过滤做以下的定义。协调过滤:从人类的情报收集活动中,归纳抽象出其所对应的爱好,关心,意图等形态意识,并通过获取的收集情报及归纳抽象出的形态意识,对人类进行分类,实现类似人类间的情报交换的手段。另外,还有各种各样不同的定义方法。比如,1996 年出现的协调过滤法研究系统 Group lens,其开发者之一 Paul Resnick 有过如下的说明。17 / 52“Guiding peoples choices of what to read,what to look at,what to watch,what to listen to ,and doing that guidance base on information gathered from some other people。 ”可翻译成下文:以从其他用户收集到的情报为基础,向每个利用者提供“应该读什么” , “应该关注什么” , “应该看些什么” , “应该听些什么”等建议从上述的表述中可以看出,对各种各样的情报来说,人们的评价及这些情报在社会中的影响可以被用来判断情报本身的价值,以及决定是否值得被推荐,这也就是协调过滤法的一个最大的特征。正是基于这点,有时也称其为社会过滤法。作为协调过滤方法的一种,为实现能从洪水般的情报中抽取用户必要的信息,推荐系统常备使用。另外,为能实现利用者爱好的自动追踪及判断,Agent 系统技术及人工智能技术的研究利用,也有很大的潜力。协调过滤法用到的算法有以下几种:I Active Collaborative Filtering(ACF)最初的协调过滤系统是 Xerox 公司的 PARC 研究所的电子邮件系统,由 David Malts 等人开发研究的 Information Tapestry 电子邮件系统,该系统被 Lotus Notes 中的Printer 部分所采用。18 / 52该系统的特点是:彼此相识、指定范围内的用户通过相互指定,可以做到指定人与其认可的某一领域专家(被指定人)间的情报同步。II Automated Collaborative Filtering(ACF)正如其名称所示,系统会根据用户已有的评价值,对尚未处理的情报进行自动评价(预测),将得分高的情报主动向用户推荐。自动评价的预测值则是根据其他用户和本用户的评价情报,采用皮尔森相关系数等相关算法而计算出来的。这种方法有它的缺点。由于归根到底是靠用户的评价值而进行推荐的,如果某个情报谁也没进行评价则永远得不到推荐。另一方面,评价数据不足时推荐的精度也受影响。另外,情报量和用户数差距较大时,难以找到附近的用户等。MIT 的音乐情报推荐系统 Ringo,明尼苏达大学的Netnews 推荐系统 Group lens 等许多协调过滤系统都采用了这一种方法。III Feature Guided Automated Collaborative Filtering根据用户的爱好,从事的领域各不相同这一现实,采用把作为过滤对象的项目群赋予属性情报,从而缩小问题的范围,提高推荐精度的方法即为 FGACF 法。Firefly 19 / 52Networks 公司的 Firefly 采用了这个方法。纯粹的 ACF 基本上不考虑情报的内容,在情报量不断增大的时候仍把各种情报一视同仁,很容易造成错误的推荐。另外,存在着随情报量增大计算时间也增加的问题。为解决这些问题,事先把各种情报通过赋予属性情报的方法进行分类,根据属性情报分组,将爱好相近,领域类同的有用情报尽早地向用户推荐。 上一篇:青年岗位能手申报银行 下一篇:xx 公司企业文化建设优秀单位申报材料 IV Content-Based Collaborative Filtering当主要以 Web 网页,Netnews 信息等文章情报作为过滤处理对象的时候,同时结合情报内容(Contents)过滤处理和协调过滤处理两者长处的作法也逐步得到了完善和发展。近年来,以互联网的各种 Web 网页作为过滤处理对象,从文章中出现的各个关键词组出发,对系统中新登录情报进行预测评价的方法受到了广泛的关注。通过事先将各种情报分组的方法,达到提高协调过滤处理精度目的的手法得到了引人注目的发展。斯坦福大学(Stanford University) 的产品 Fab,明尼苏达大学计算机科学工程系(Dept. of Computer Science and Engineering at the University of Minnesota)的20 / 52Net Perceptions Inc.的产品 Filterbots 等都是文章情报基础的协调过滤系统的例子。上面提到的作为 Netnews 的推荐系统 Grouplens 也在把成为推荐对象的文章分成 Newsgroup 方面下了大的力量,所以从广义上也可以说是一个 FGACF 系统。除此之外,世界上各大学和公司也在研究利用情报的属性进行多变量解析的 Cluster 分析法自动地把项目分组,从而提高系统性能和精度。以上各种算法的实现,基于大量的传统数学模型,一种算法中可能包含有多种数学模型,也可能是某一算法对应于多种数学模型候补。从类别上可分成类似算法数学模型,分组算法数学模型,自然语言分析数学模型等三类。关于这些数学模型情报,我们在下一节中有较详细的记述。协调过滤法的特点下表列出了协调过滤法的主要特点。优点 缺点不依赖于情报的内容可解决仅靠一般方法而解决不了的情报过滤问题 初期评价的问题单纯的协调过滤法不能对新登录的情报进行评价预测。另外,对于登录的情报及新注册的用户而言,推荐21 / 52的精度较差。易于发现重要情报互联网情报内容基础上的过滤法是对所有的情报不加区分,一视同仁地处理的。相比之下,协调过滤法,则可自动判别这些情报是否受到广大用户的认可。 稀薄性问题能使协调过滤系统正常发挥作用的理想条件是存在大量的,得到众多用户评价的情报。但现实往往是只能收集到很少一部分受到评价的情报。评价情报的反馈用户对情报的评价可将系统运营者的利益和用户的利益直接连接起来。 孤独用户的存在问题特别是在中小规模的网络内使用协调过滤系统时,有可能存在着与多数用户意见不同的孤独的用户。结果不够明确因为采用统计学的方法计算预测评价值,所以无法保证100%的准确性。由此而造成错误的过滤。由上表可知,想开发成功的制品,就需要扬长避短,在前述的技术构成要素之上施行细致的调整。可以这样说,怎样将各种技术要素有机地结合成一个完整的系统,是本系统商品化成败的关键。当今世界中协调过滤技术的应用现状近年来,做为取代传统的想方设法地搜索信息的方法,22 / 52开始出现了一种从情报源主动向用户提供情报的方法,即推荐服务的方法。更值得注目的是以著名的,规模大的互联网提供商提供的检索引擎和电子商务服务为中心而逐步展开的个人服务。这些服务针对每个用户的不同特点进行调整,从而形成因人而异的情报提供方式。个性化服务和一对一服务具有相同的含义。这类服务建立了 Web 网页提供商和用户之间一一对应的关系,由此出发,进而大幅度提高服务质量。做为推荐服务和个性化服务的核心技术,协调过滤技术在 1996 年左右就被研究开发出来了。但目前的现实是该技术的研究开发仍是以美国的大学和研究机构为主。处理中使用的各种数学模型系统内部使用的算法如下所示,所有算法都属于古典统计学的范畴之内。i:类似算法数学模型 上一篇:青年岗位能手申报银行 下一篇:xx 公司企业文化建设优秀单位申报材料 类似算法:对某个对象而言,从对象集合中找出与其相类似的对象的算法.以下列出各算法的方程式,并对各个符号一一说明.i=(i1,i2,.,ip);23 / 52j=(j1,j2,.,jp);(max,min 是 的最大值和最小值): if (mn= = 0) then = 0 ; else = 1 ;以下的计算结果为的时候,值越小表示二者越类似;计算结果为的时候,值越靠近 1 表示二者越类似。 平均尤库里多距离的二乘法 平均距离法 最大值距离法 二值距离法 Dice Coefficient 法 rij=2 x|Kij|(|Ki|+|Kj|) Jaccardss coefficient 法24 / 52 皮尔森相关法ij= Co(i,j) ij 限定皮尔森相关法ij= Co(i,j) ij 斯皮尔曼相关法 改良二值距离法MapI (mn) = cmnMapU (mn) : if (mn= = 0) MapU (mn) = 0; elseif (mn in topN ) /如果为重要属性MapU (mn) =BIG; /BIG 是大于”1”的定数。elseMapU (mn) = SMALL; /SMALL 是小于”1”的定数。dij=1rij25 / 52ii :群(Clustering)算法即将相类似的对象归为同一个群的算法.以下涉及的 7 种群算法都将分两步实现.第一步:对各个基本要素,使用 10 种距离计算值之一求出二者之间的距离.距离最近的两个基本要素成为一个新要素.基本要素被称为叶,新要素则被称为分支.第二步:实行递归处理.利用以下的方程式计算出与新要素间的距离,进而生成新要素。下面用到 2 个基本方程式,方程式和系数的不同组合形成 7 种不同形式。dxc=adxa+bdxb+dab+|dxa dxb (1)dxc2=adxa2+bdxb2+dab2+|dxa2 dxb2 (2)方程式表示从 a 和出发,生成新要素,并求出与要素的距离。 群平均法利用方程式(2)。 上一篇:青年岗位能手申报银行 下一篇:xx 公司企业文化建设优秀单位申报材料 系数:a= na / nc b= nb / nc =0 =026 / 52 重心法利用方程式(2)。系数:a= na / nc b= nb / nc = (na nb)/ nc2 =0 最长距离法利用方程式(1)。系数:a= b= =0 = 可变法利用方程式(2)。系数:a= (1-) / 2 b= (1-) / 2 =定数 =0 介质法利用方程式(1)。系数:a= b= = =0 最短距离法利用方程式(1)。系数:a= b= =0 = Wood 法利用方程式(1)。27 / 52系数:a= (nx+na) / (nx+nc) b= (nx+nb) / (nx+nc) =nx / (nx+nc) =0iii:分组(Grouping)算法即将相类似的对象归为同一个组的算法。从现有的组里抽样获取要素,利用类似算法求出对象与组之间的距离,找出最为类似的组并将该对象归入该组。iv:自然语言解析算法自然语言解析是指将对象文章按单词的单位分割,并将其生成一个个的标签(tag),进而选出必要的名词(如已知和未知的名词),计算出其出现频度,考虑其在文章中的位置,文章的长度等因素,并进行关键字重复度处理.在必要的时候,可提供禁用词汇的管理机能以及对现实生活中没有特别意义的名词不予登录(象对禁用语的处理一样)的机能.预计开发产品的特点 关于算法在对中介绍的协调过滤系统的各种算法和上一节中介绍28 / 52的各种数学模型进行分析后,我们在前期开发中进行了大量的模拟实验。首先,协调过滤的算法可以分成 3 类。其一,Active Collaborative Filtering。利用这一技术,互相了解的用户之间可以相互指定, ,获得彼此有用的信息。可以和这个领域之内的专家保持同步。这次列在预计开发范围之内。其二,Automated Collaborative Filtering 和Feature Guided Automated Collaborative Filtering。从效率和精度的角度多方分析的结果上看,Feature Guided Automated Collaborative Filtering 遥遥领先。因为本次开发准备採用 FGACF。其三,Content-Based Collaborative Filtering。这次准备分阶段实现。首先是以文章情报为对象,然后再考虑其它的媒介。其次,对算法中使用的数学模型进行了分析。在 Cluster 诸算法之中,Wood 法和群平均法的精度较好。分组计算方面,基本上是利用类似算法。分组所使用的类似算法中 Jaccards Coefficient法,平均最小二乘距离法,改良二值距离法的精度比较理想。29 / 52Clustering 方法和分组算法的目的是相同的。Clustering 的特点是精度高,但处理速度较慢。分组算法则恰恰相反。可以靠系统控制参数来平衡这两种方法的使用,根据系统的规模灵活调整。 上一篇:青年岗位能手申报银行 下一篇:xx 公司企业文化建设优秀单位申报材料 判别类似的对象有 4 种,即用户对用户的类似,文章对文章的类似,用户对文章的类似及关键字的类似。判断的对象不同,评价结果也各不相同。对于用户间的类似和文章间的类似来说,按 Jaccards Coefficient 法,平均最小二乘距离法,改良二值距离法距离法,皮尔森相关法的顺序,计算精度比较理想。而对用户和文章的类似来说,则按改良二值距离法,Jaccards Coefficient 法,平均最小二乘距离法,皮尔森相关法的顺序,为计算精度的顺次。关键字的类似考虑用统计学的方法去实现。另外,由于必须确定提供范围的域值,所以同距离算法相比,相关算法要适合得多。如果将上面几种方法组合起来使用,相信还会进一步提高推荐精度。 关于提供的服务对一般用户主要提供以下服务:30 / 52 推荐服务:寻找和对象用户的相似用户,把对象用户未访问过的文章向其推荐; 提供类似文章服务:提供和对象文章类似的文章的一览; 检索结果的过滤服务:在检索结果的基础上,根据实施检索的用户的爱好,对结果进行挑选。 新到情报的推荐服务:根据各个用户的不同要求,在一定的时期内,把新到情报提供给用户; 用户特征指定服务:允许用户将其关注的单词/文章等在系统里登记或删除; 类似关键字的提供服务:系统可提供与检索用关键字相类似的关键字一览表; 热门网页的提供服务:提供受欢迎的网页的地址; 个性广告的提供服务:对互联网服务商来说,可根据用户的特点、爱好而主动提供恰到好处的广告;为管理操作的方便,同时也向系统管理员提供机能丰富的服务。 关于体系结构 采用适合于互联网 WWW 服务系统开发的 Java 语言,以 Servlet 的形式开发; 协调过滤系统属于 Multi-Agent 系统的一种,所以必须具有其分散处理的特性。本系统将采用计算机分散技术31 / 52的标准-CORBA,来实现分散化处理; 采用 DBMS 对情报进行管理。并利用 JDBC 与本系统其它部分相连; 自然语言的解析处理会占用系统相当多的时间,将尽可能采用 C+语言,以库函数的形式提供。与本系统其它部分的连接准备使用 JNI; 本系统允许事先设定用户的特征情报,同时如即使不作任何设定,可根据用户操作处理的轨迹,系统将自动推测出用户的爱好及其迁移。但同时不准备以单纯的访问操作或检索关键字影响用户爱好的迁移,为此计划提供控制情报和相应的控制处理。另一方面,也将考虑系统的规模及负荷; 管理者可同时进行大批量文章的收集、保存处理,抽取文章的属性并对其管理。亦可从检索结果中,通过一般用户的访问操作来实现上述处理。但保存与否,可通过访问次数来控制; 关于其它本系统在参考所介绍的协调过滤的特点和所介绍的世界中使用现状的基础上,将实现自己独特的调整手段。检索服务的个性化(1)背景至今为止检索服务的用户接口对所有的用户都是一视同32 / 52仁的。提供检索服务的互联网服务商有各种各样的特点,比如对技术情报擅长,或对新闻情报擅长等。而本系统开发的一个目标就是提供一个满足用户个性要求的接口。(2)本系统在实现个性化方面的特征主要特点如下所述。 做为缺省,提供分组化的检索引擎类(检索服务商); 自动追加新的检索服务商及删除消亡的检索服务商; 检索目的类型(例新闻,技术等)的登录/删除机能; 检索服务商的组合指定机能;自动收集技术 上一篇:青年岗位能手申报银行 下一篇:xx 公司企业文化建设优秀单位申报材料 (1)背景现行的各种浏览器的收集机能基本上是以文件为单位,不能作灵活的调整。如能在指定时间指定的网站,对所关心的文章的类型进行自动收集,将会给用户带来很大的方便。(2)本系统在自动收集方面的特征主要特点如下所述。 可指定网站的位置,支持登录及删除功能; 收集对象的类型的指定;33 / 52 收集时间的指定; 保存场所的指定;自动定点观测技术(1)背景假设某个用户,对所关心的网站的不同位置的情报很感兴趣,并进行了访问,收集了所需情报,但是情报源在不断地更新,如果能有观测机能将会给用户提供很大的方便。(2)本系统在自动定点观测方面的特征主要特点如下所述。 可指定被监视网站的不同位置,并可登录/删除; 指定被监视对象的类型; 指定保存场所; 指定监视时间; 浏览被更新的情报及新到的情报; 自动收集被更新的情报;系统的综合上述 4 种技术的组合而达到系统的综合化。本系统的目标之一就是想通过灵活的调整做到突出用户个性化,也即是从 ISP 到 ASP 进化的一个具体的步骤。系统的运用形态 对于中小规模的 ISP,因为其负荷不很重,可以细致地管理用户爱好的迁移;34 / 52 对于大规模的 ISP,因为其负荷有可能很大,可以对用户爱好进行较为粗旷的管理,同时在分散处理上多下工夫; 可形成社内教育,社内管理系统的运用形态; 可形成 Mailing list 系统的付加服务的运用形态;系统构成的示例如下所示: 互联网咨询协调过虑器及智能检索支援系统市场调查和需求预测代表性的研究系统一览表系统名称 研究机构 特 点 研究時間Tapestry Xerox Palo Alto Research Center 最早的ACF 系统。需要事先指定情报交换小组的成员。因为是靠由获得情报的一方明确指定情报推荐者和评价值,来实现过滤过程的,所以仅适用于小规模网络。 1992GroupLens Dept. of Computer Science and Engineering at the University of Minnesota Grouplens 是推荐网络新闻的过滤系统。用户需要了解其他的用户。用户针对某个新闻可赋予 5 阶段的评价,系统则会向具有与该利用者相似爱好的其他用户自动推荐,并可对其他的新闻施行预测评价。 1994 35 / 52Ringo Massachusetts Institute of Technology Ringo 是音乐情报的推荐系统。用户通过电子邮件将自己喜爱的作品赋予 7 个阶段的评价值,而系统则将根据其他用户的评价值向该用户返送有可能得到其较高评价的作品一览表。Ringo 的过滤方法与 Grouplens 没有大的差别,但相关算法有所改进。 1994Fab Stanford University Fab 是同时利用互联网资讯过滤和协调过滤技术的 Web 网页的推荐系统。它实装了多代理体系结构。用户对得到的情报进行 7 个阶段的评价并返回给系统。 19961997Yenta MIT Media Laboratory Yenta 是采用多代理技术的中介系统。系统寻找具有相同爱好的用户,为他们建立联系实现情报共有。该系统不设服务器,各用户各自的计算机之间 1 对 1 连接,实现过滤处理。 1997Filterbots Dept. of Computer Science and Engineering at the University of Minnesota Filterbots 是 Grouplens 研究小组为提高协调过滤的精度而开发的自动评价系统。她以互联网资讯过滤处理为目的,针对典型协调过滤处理的 2 个缺点(“随着情报量的增加,造成评价情报分布不均,而找不到附近的用户”和“无人评价的情报形不成推荐对象”)进行了改进。系统对新登录的情报会自动对其进行评价。 1998 36 / 52上一篇:青年岗位能手申报银行 下一篇:xx 公司企业文化建设优秀单位申报材料 有代表性的互联网服务服务名 经营组织 URLMyyahoo yahoo http:/Movie Critic Andromedia, Inc. http:/Alexa Alexa Internet http:/, Inc. http:/, Inc. http:/Direct Hit Ask Jeeves, Inc. http:/有代表性的产品制品名 开发公司名 价 格Firefly Firefly Network, Inc. 700 万日元 One-To-One BroadVision, Inc. 2,000 万日元Gustos Guide Gustos Software LLC 需要咨询37 / 52LikeMinds Andromedia, Inc. 10,000 美元Net Perceptions Net Perceptions, Inc 45,000 美元Open Sesame Profiling Server Bowne Internet Solusions 25,000 美元互联网咨询协调过虑器及智能检索支援系统的产品还主要局限于国外,而且价格昂贵,主要应用于企业的电子商务,研究机关,网站等,国内在此方面的应用还较少见。由于本系统有稳定性,可扩展性,可组合性,自主产品性等特点,所以预测可以开拓一定的市场。项目实施方案开发实施方案软件工程是指导计算机软件开发和维护的工程科学,数字式图像监视系统的开发也应遵循软件工程进行。 软件工程是将软件开发过程视为一个工程项目,采用工程的概念、原理、技术和方法来开发和维护软件,把经过时间考验,证明正确的管理技术与当前能够得到的最好的软件技术方法结合起来,这就是软件工程。使用软件工程于软件开发的各个阶段,通过使用各种工具,从支持开发各个阶段的方法,通过使用各种技术,以保证软件质量。 1969 年 Fritz Bauer 给出了软件工程的早期定义,他认为:制定并使用合理的工程原则,从而以较低的费用获得可靠的、能在机器上高效工作的软件。38 / 52软件工程包括 3 个主要元素,即方法、工具和过程。从这 3 个要素入手便能控制软件的开发,并为软件开发者提供了高级和高质量的开发基础。方法是提供怎样去建立软件的技术,这些技术包括项目的计划和评审、系统和软件需求分析、数据结构定义、程序结构、算法、编码、测试和维护等。工具是为软件工程方法提供自动化或半自动化的支持。目前上述每一个方法都有支持工具,如果将这些工具集成起来,那么由其中一个工具产生的输出信息就可以被另一个工具使用,于是便创建了支持软件开发的综合系统计算机辅助软件工程。过程是使方法和工具相结合的粘合物,它使得软件开发任务能够经济地、准时地、快速地完成。过程定义了一系列步骤,并规定了每一步骤应使用的方法和应交付的文档及报告,以及用于帮助保证质量、协调变化的措施,还定义了能使软件开发人员了解进展情况的一些里程碑。 BD 是 Basic Design 的缩写,完成“本系统要做什么” ,即系统的分析阶段工作;FD 是 Function Design 的缩写,完成本系统功能块的划分,是“怎么去做”的第一阶段工作,即系统的设计初期阶段工作;DD 是 Detail Design 的缩写,完成本系统各个功能模块的详细设计工作,是编程39 / 52阶段的准备设计阶段;MK 是 Making 的缩写,即具体编程实施阶段;UT 是 Unit Test 的缩写,即单元测试阶段;CT 是Combine Test 的缩写,即结合测试阶段;ST 是 System Test 的缩写,即系统测试阶段;PT 是 Product Test 的缩写,即商品测试阶段。UML 是 Unified Modeling Language 的缩写,UP 是Unified Process 的缩写,是国际上最新的面向对象的分析设计与开发方法的方法论。在承接面向对象的应用项目开发时,我们曾经使用过 80 年代国际上流行的 BOOCH 方法、OMT 方法、OOSE 方法。但目前我们主要使用的是国际上最新的面向对象的分析设计与开发方法 UML(Unified Modeling Language, 由 Booch、Rumbaugh、Jacobson 联手发明)及 UP。 上一篇:青年岗位能手申报银行 下一篇:xx 公司企业文化建设优秀单位申报材料 UMLUP 的开发方法是通过使用下列图示中的 3 种概念(从用例视图出发的概念, 视图构造中心的概念,反复同时向上发展的概念)将 9 种设计图形详细贯通的过程,并在此基础上将系统实装完善的过程。在以往的开发过程中,我们通常使用了全部的 3 种概念及 9 种图形构件的 5 至 740 / 52种图形构件。在开发过程中,严格控制”UMLUP”方法论规定的每一个步骤的生产物。营销计划实施方案采用自主和合作并行的方针。项目实施目标第一年 第二年 第三年套数 2 5 20投资估算准备投资 30 万人民币。经济、社会效益分析产品投入市场后,年内收回投资。由于为使用者提供从海量信息中快速获取有价值情报的手段,所以可以节省人力物力。另外,主动向使用者提供有价值的信息,使得调查研究及学习更加有效。项目可行性分析结论由于我们在国外完成过类似系统的实装,并有解决几乎所有核心技术问题的方案,所以我们认为上述的方案是可行的和实际的。3. 管理信息化系统通用化平台及业务逻辑自动生成工具41 / 52系统项目论述 管理信息化系统通用化平台及业务逻辑自动生成工具系统技术可行性分析开发背景管理信息化系统通用化平台及业务逻辑自动生成工具系统的目的和理念是将业务逻辑和控制逻辑分离。依据模式技术发明之父、国际著名模式技术专家亚历山大-克力斯多夫提出的理论, “所谓模式,是对我们周围经常发生的问题以及对这些发生问题解决方法要点的记述。每一个模式描述了一个在我们周围不断重复发生的问题,以及该问题的解决方案的核心,这样,你就能一次又一次的使用该方案而不必做重复的劳动。 ”。亚历山大-克力斯多夫认为,各行各业的控制逻辑均是可归纳的,且数量是有限的,对这些有限数量的控制逻辑进行各种组合,就可以实现对某一行业的完整控制。计算机软件设计模式的权威专家 Erich Gamma、Richard Helm、Ralph Johnson 及 John Vlissides 四人(后来被人们亲切的称为 GoF(四人帮),对现实世界的数百种成功的系统和项目进行了分析,归纳总结了计算机界软件设计模式的 23 类;计算机软件架构模式的权威专家 Frank Buschmann、Regine Meunier、Hans Rohnert、Peter Sommerlad 及 Michael Stal 五人,通过多年的实践、调查与研究,归纳总结了计算机界软件架构模42 / 52式的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论