




已阅读5页,还剩70页未读, 继续免费阅读
(计算机应用技术专业论文)基于服务聚类的个性化语义web服务发现机制研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
耩 7 ; i z 辑晕承蛳压斡呼髯辫诽鲤华一暂刨牟朝哦耍目兽畚群裂罩鲤华一暗椠鳓堆 朝酵滔d 目f f j 群群擤髟朝期,匪椠髟d 茸皿罂觐晋砚飘妙业圈弹朝哦覃冒身 上、f 黪朝碡孽澎朝娶洱翠吼卧少士譬鬃髟芬牲赫飘甜翠掣明鳓奄辫诽罩辞 裂明椠髟瞠髟蛩岜取鳓奄拯或群哇攀益朝晕一凿罄著骢鞯甏。自犁明虿j 唾台: 士 豳治互阜磁翠目半辑瞠砚蟊朝谜犁酵中出翠警砰磐硬m 砸瞽半辑压辫孙飘少瞠 椠逢。凿骚明揖转截嚣菌承辨朝骣戥士髯诳萃晰酶醢群明翠群廿j f 冒骂辫射 承群岛勒章辫辫暂酣叩瓜、璐章辫戥d 茸卒蕈骚藓餮阜鎏餮华磁髯髟硝驴瓜 朝啮群蕊群瞠新戥士霉牲一上串鹫参茸翠敏。章释辑晕掣瞥刨函群覃驹暂硼 上辨别椠凿影础q o a x 鞑苗4 4 翠协醉鹬雅暂酯q o a x 号黪量习协髀阴甜辩暂酣 菌托矶摹猫粤聚承辨融裂暂础q o h x 牲豳! u o d 茸胜翕磐性。椠凿暂础岜蔡半喹 酶鲷醢f f j 中斜茸檠辨暂舶翠匦罄* 壬髯田篱翕左b 邪n 啤掣详琶地朝索释磁髯桑 确椠梢目半辑肇砰冯7 粤m 磁出耐审延搬明婴箪号翠。堡华翕半辑瞠识醢谜搿明 莘弭抖醢号粝、染磋朝压斡恤髯暂殂、爨龌饕葛盟虱暂酣翠砸鞘益车延擒¥啡 朝陋当一上智妊哲半杀哲掣国鳍刨明露驿磁髯暂础q o a x 朝印瞢迥算艇杩 。劈刨朝谶掷鳓匦亡b 延擅雠髯暂酣 婴呆搿日幸磷明葫* 瑁协戢掣瞢团鲜明谩弼暂砸q o a x 狲捌埘晖荟辫【j y 骥黎业幸磁明硫髯暂础q o a xk 璺琏畚飘暂明裂裂一晷。苗瓠q o a x 明娶衅翠吼 辟勒澎吗冬晕与砸髯业w 零擗勒卓明娶胖z 与瞳台: 避酗x 璺朝零辫璐章与专鹩 ¥专号七b 檠辨暂酯葛* 半呈¥朝刨z 零磷匕b 璐章辫谶益罂罩审乱轻磁髯犟裂 罂朝潺嵩百澎暂瞪羔一翕蕊群镦京、葫* 谩劢琴斟勒卓壬* 群吾葫托百璺 。东致晕唑索弓耍朝谧髯上掣哿丁臌髯明茵县掣珊百璺翠 覃嚣辑晕明暂殂现曰马朝旋髯暂邵q o h x 士目瑕抖举摹红朝趔醢相乜器衅牲一 伯肾7 身百娶智鼻暂砷q o a x 紧丁啦髯明歌抖暂酣q o a x 阜磁翠鹤翡磁髯暂殂q o a x 朝百璺壬髯。啦霉朝瑕斟k 璺身聚谧髯髟酯q o a x 牲瞽叼,辫明呈璐q 呲百璺 瞽浓蟛脚乜刨湃e i d 辑鹭上百晕种摹红晕裙壬斡驻朝磁蟛百要审q o a x 百嬖 骇孵吾勒卓。百娶朝暂础q o a x 驻辨半秘壬浓斟磁蟛朝鞘牢士鸯七bq o a x 百娶罂娶 相乜智鼻哇虬薤驹q o a x 晕硷牲普q o a x 百要。a a z 鳍千延擅¥三d e a x 瞽q o a x 百璺,业旱罢a a l 。s a o t u o f lm k l 辑璎7 明d e a x 瞽毋县醣髯鲷q o a x 。晦般延拇摹勤 懈鲷与霉射环工唑酉y 距拉琴影、朝台鹜3 c 触甲甄一瞽q o a xk 蛰衅滋上华 辨嘏坷明鳍刨驰丁紧髓吊朝q o a xx 璺。暂础明娶号唾群七b 凿羁诳髯w 拳智 d 出 土狲索弓晕与岔我革阴髓髯暂础爵冒髫百璺朝聚辨暂酯q 呲蜊醢鸦- _ k 谩弼 朝右秘¥壬甲智髯蛹暂础q o a x 犁娶鹬业目瑶辩砸髯暂础鲷专罄¥壬霉阜诳丛 鞴。嚣刨翕刨业军娶裂嘴、斛哲号士中苗般辛掣髟上澉柳罩砑圭益车驹茸暾啭 哲澉榔鲤j 苗硼瞠半辑¥号鬃犁髟础q o a x 銎婴目朝出翠骑当疆掌钐晕到 磊萋晤。毒毫扩艘 鬈嚣 馨-晷嚣蓉篱釜甏壁嚣嚣垂罄露爱瘟囔通ii垮碧鬟爹鬟蓄霎篱 鼻辫诽草鼻朝瓦斡酵d 茸朝翠扭唾勘哦革勃考明y 辨d 目辫谢餮菌谩虱瑶 辫面斡理弼髟邵q o a k 朝吼飘少哇椠酱士霉鄙卒罄骂鞯覃坞朝臻华砸髯暂砸 骖封上驰剧华鼻辜茸。酱彩群晕朝晚裂匿唾戡d 茸辖黠承蛳蠼垂酱粝谩砀髟酣 鞑赢斡耐d 出辫谢歌华轴刨。骠坳朝理弼苗舶上币擞骚晕飘牲鹄晕曾直群晕 朝略椠暂殂珊业w 当* 鲷恻z 喈椠椠酱与呼d 目蝉髟咨融群晕莘组朝出瑶 辫d 目辫谢翼阜姿。餮华硷髯髟础q 弧x 娶种科少朝椠凿壬髯牲一印静( e ) 。羽,晚皲明畚群乱衽谧髯暂酯轻瓦辫酵上掣瞢匦掣x 娶 鲷赢斡溯誓半薛留朝零辫璐卓y l 台七b 瓦辩裂米翠。魄裂椠亘苗* 翠群鲁; 爵刨 肆并i i ;甘召业w 哥碑鲷掣典酵少号器欧半吼距蜘业朝椠岜d 茸嬖鲥压辫群d 茸勘翦嚣牟瞠零擗鲷压索瑶辫上用篱娶瑶斡璺咨。联d 茸璐曾当擎举掣鼻孑 擗勒卓甲申辩零酶翠斡零擗璐章朝裂泺i 自覃鼙期刨矾喜弹d 目琳承华 葛* 朝辫曾轻豇砚摹征士圈藓萧d 甘蛐猪琳晕掣蝉髟辫狲g 鞯。翕刨期、椠 些斟驳暂邵i 茸晦攀圈妙士譬明酵d 茸睁缮中醇裂隧髯蜘缮吊龀錾扭明鬃 粤d 茸乱释磁髯暂郡q 弧牲耻觐歌华与摹军朝出瑶辫计飘少上嵌收华翼茸卓 上蝥群半群荡日皆犁半辑孙科少仁b 半辑幽独互m 磁翠。罐辫种飘少磁髯暂砷 鲷璐章辑鹭士霉牲一吊鬻延搬明餮些擎璐章酵瞠半辑孙科少鞑骚馨( 乙) 。飘姚歌朝椠凿暂础上掣静麟掣k 要朝椠甏f f j 硫璐 群狲明椠髫紧勘影斟璐卓琳餮肇审乱辩椠凿。鹭影础山士凳唾台; 掬辑礤士凳 鲷僻疆雨、f 咨鞑哥蜊鲷犁餮辫谢辫搿雨f 咨鲷暂郡士* 唾勘菌* 嚣茸m u d 裂觐g 滔固砰睥朝暂殂谶辫瞳勘列葫托明窜柳髀刨暂础罂觐。餮华萄托翠柳晔 驹刨z 零擗雾鲫影邵浓辫士* 旌台; 幂磋丁啦霉邓翠箕嚣箪朝葛托翠柳胖零斟辑 章朝甫蟛潞羽牲一冶霰璐雌鹭明苗托k 璺唾犁皋嚣毕零擗璐章士凳朝暂瓠磁 辫唾尝; 瞀掣筷冒粤朝承孵暂酯鞑# 卓辑鹭辫狲华鼻餮牟姿。娶华6 l j 椠甏暂殂 q o a k 驹秽擗勒牢辑鹭士霉牲一吊蕾延擅明群冒椠酱哇麟勒勒卓轻罂藓( i ) :i 蹲蛙掣益干孽审融霹磁髯暂硼q o a k 百璺0 歪目犁葺徘蔼斡谩弼磁髯暂撕裂觐箕 瑶辫矾飘少唑餮苗椠凿识囤殇斟取磋醉留百里茸唑嚣华鎏累阜砸髯暂邵q 弧 x 璺孙飘少朝椠酱士髯牲一串瞥始搬朝茬辫砚弭少疆餮华椠酱胚轻联茸章 。磷掣 睥亘辞轻硫髯暂酯q 眦百婴明蘑辫种科妙哇椠髫士霉台; 觋世w 戥掣百叠朝瑶 斡矶璐少氍廨珊暾取明椠凿要碗朝骚阜确血茸唑明转卓门,猝q 呲百璺鞑裂 联。出勤狲罐朝砚科山瞠椠逢挺q 呲百璺上蜘豸衅由裂鞣诳髯壬目翠嚣赫摹 华牲斟轻甄重瑕一甫酱中龋抱脚硷髯暂硼崾目犁瑶辫孙科少哇椠甏拯翼系 。索暾裂朝哦革茸署掣篱伯乜酱崭 i 靠,牡静墨锤罄:。 l_l_; 磅嚣“篱舞搿自i藿藿委 一 _ 4#p、a蒋fe* j;,;焉箍雾j_1,川, l-、。lyq:乱il。,e|;,; 。鳍刨明翠掣审茸犁判近询驾近瞬鹬业 馨骠锈运班融辩明诲# 互群明 i g s a k 与s i a 八o 、辑晕朝暂硼出i o g f l 、辫斜 群磉审融裂磁髯雾按上勋豸出孺添蕈磐壬甲澎群磁髯暂酯朝幂蕈覃蕈( 杪) 。哥刨朝谶蒯益鐾瞽蜱翕裂阜茵托明程群刨副耐米d 茸覃群谣诵哥砰朝士圉蛐缮释妙号犁嘞斟蹲串魏琶明瑶斡酵翠( ) 。掣喜朝延抱掰一生瞢茸珂鲷审压斡酵咄椠凿翠华鹬 蟊群擗蕊勒卓耳犁埘蹲髟衅朝当* 澉看零琏壬¥审鞘卓上哇茸肖喜茸承群身 聚哂群些勒曾裂鞋冀独* 互脚朝刨z 秽瓣上覃蕺士翠哥劬叼,辫朝# 卓( z ) 。诹辫延扭乖一生 魁阜歌卑蜒查菩取椠逢朝驿阜覃薄埘蹲勤工朝¥碧甄一普琳椠酱暂酣q 眦身 琅缝重期暂酬鲷缝y 睥审掣暂酯q o a x 果融罂朝翠睡瞽椠甏影础( i ) :辨b 益丰 距擅明乖一幂匿型诅盟肇雾诽翠嚣肇醢髯刮阜士平哇刨轴鲷异勤丁睥辑鹭半 辑号崾召积x 嚣阜诳髯影础姿士甲串裂取磁髯影砷瞳目犁融飘少哇椠甏徘索 磁磁髯苗酯掣群乜 晦瞽朝延抱蚤千茸率。距控朗鬃一幂 j 鬃彩阜娶堡华帮运哇现 鼠朝茸翠q a a x 百璺翠诺掣智 瞽业娶g 抱明盟华茸犁q o a x 百璺壬* 蝉目 。磷阜禁歪舍; 藁i 畚群明料章 辑鹜翠蜒匿朝藤辫酵萧d 茸唛壁询乜毋叫粱轴刨犁虿堂驾幸瓷谧髯洋辨箍¥ 醉暗椠椠酱与娶露辫孙飘山壬甲酶鞋朝d 茸号黜睥歪酱夥明磁髯苗砷台; 翦y i 圭鲷压辫孙科少帘垦诩乜e 锈近w2 酉醣啤直哂酱磁朝篥凿土设鲫明啤廨斟搿磉 少苗础系幸驿朝磁髯暂谢掣鬻¥询也茸犁朝椠甏的擎乙锈幂:币擞腊椠椠凿 瞬氟朝薯臻苗瑚七b 椠酱一刨犁畏业w f 敬率益朝翠协群朝刨暂硼q a a x 七b 暗 椠椠髫一刨驱期紊酱翠暂础截翦¥融剪蜊币撇丛¥廨明哥蜊嬖到兽醵明眙椠椠 髫影甜蛐缮明酱磁椠凿鞑冶晷明毋例醣擎i 孺摹飘髟卫驹餮华明檠尉茸现的 銎半锈近僻斡少三龚陋裂鞋嘉茸g 害。磋辫弹脚d 出缝歪举世w 紧身鲷酱粝 回娶牲d 岜脊劲华身d 茸群珊轴刨d 目锈回娶璺承蟛唑茸瓣蚴量蕈弹j 茸并茸托欺型硪辫d 目辫谶脊酱彰暂殂鲷恒宣; 琳眙椠椠凿朝璐曾耍玛晕肇掣掣 i ,蓐女;,r;r。, 杭州电子科技大学硕士学位论文 基于服务聚类的个性化语义 w e b 服务发现机制研究 研究生:陈金奎 指导教师:徐小良教授 l l i i il ll iti ll lu ll lli il y 19 0 9 0 8 5 d i s s e r t a t i o ns ub m i t t e dt oh a n g z h o ud i a n z iu n i v e r s i t y f o rt h ed e g r e eo fm a s t e r t h ew e bs e r v i c e d i s c o v e y ,ss t u d y b a s e d o nc l u s t e ra n d p e r s o n a l i z a t i o n c a n d i d a t e :c h e nj i n k u i s u p e r v i s o r :p r o f x ux i a o l i a n g d e c e m b e r ,2 0 1 0 杭州电子科技大学 学位论文原创性声明和使用授权说明 原创性声明 本人郑重声明:所呈交的学位论文,是本人在导师的指导下,独立进行研 究工作所取得的成果。除文中已经注明引用的内容外,本论文不含任何其他个人 或集体已经发表或撰写过的作品或成果。对本文的研究做出重要贡献的个人和集 体,均己在文中以明确方式标明。 申请学位论文与资料若有不实之处,本人承担一切相关责任。 论文作者签名:印。仓、龟 日期:y t ) 年f 月f 耖日 学位论文使用授权说明 本人完全了解杭州电子科技大学关于保留和使用学位论文的规定,即:研 究生在校攻读学位期间论文工作的知识产权单位属杭州电子科技大学。本人保证 毕业离校后,发表论文或使用论文工作成果时署名单位仍然为杭州电子科技大 学。学校有权保留送交论文的复印件,允许查阅和借阅论文;学校可以公布论文 的全部或部分内容,可以允许采用影印、缩印或其它复制手段保存论文。( 保密 论文在解密后遵守此规定) 论文作者签名:下矗鼋 指导教师签名:镎小莨 日期:汐f 年f 月fy 日 日期:加j 年f 月p 日 杭州电予科技大学硕士学位论文 摘要 语义w e b 技术解决了传统w e b 服务发现查全率和查准率低下的问题,已成 为国内外的研究热点。然而由于语义计算的复杂性,导致了语义w e b 服务发现 效率低下,如何在保证查全率和查准率的基础上,提高语义w e b 服务发现效率 成为当前亟待解决的问题。本文提出一种基于聚类的个性化语义w e b 服务发现 方法,该方法利用语义思想改进传统图论聚类算法和个性化模型,并通过服务发 现匹配模型将其应用到语义w e b 服务发现过程中,其主要内容如下: n ) 通过对本体结构和聚类思想的研究,提出一种基于领域本体概念的w e b 服务聚类的方法。该方法依据本体概念之间的关系计算w e b 服务相似度,并通 过改进后的图论聚类算法实现了w e b 服务聚类。聚类过程中,方法将本体概念 作为聚类的依据,体现出聚类的语义内涵,提高了服务聚类的准确性。 ( 2 ) 通过对个性化技术和兴趣本体表示法的研究,提出一种基于领域本体的 服务发现个性化模型。该模型建立了反映用户兴趣的本体概念树,通过对兴趣概 念的语义计算来反映模型的语义内涵,并定义相应的模型学习方法,适应用户兴 趣的不断变化。 ( 3 ) 提出一种基于聚类的个性化语义w e b 服务发现方法。该方法根据用户模 型中的历史查找记录,分析用户兴趣与聚类类别之间的关系,从而使服务类别的 查找更具有针对性,有效减少了服务匹配的次数。同时方法根据用户兴趣模型对 服务匹配结果重新筛选,帮助用户得到更准确的查找结果。 论文利用本体概念改进传统聚类方法和个性化模型,并以此改善了传统语义 w e b 服务发现过程,实验证明,该服务发现机制能有效提高发现效率。 关键词:本体,个性化,聚类,语义w e b ,服务发现 杭州电了科技大学硕一i j 学位论文 a b s t r a c t t h es e m a n t i cw e b t e c h n o l o g yh a ds o l v e dt h ep r o b l e mo fl o wr e c a l la n dp r e c i s i o n i nt h et r a d i t i o n a lw e bs e r v i c e sd i s c o v e r y , w h i c hh a sb e c o m et h er e s e a r c hh o t s p o ta t h o m ea n da b r o a d h o w e v e r , d u et ot h ec o m p l e x i t yo fs e m a n t i cc a l c u l a t i n g ,s e m a n t i c w e bs e r v i c e sd i s c o v e r yl e dt ol o w e re f f i c i e n c y , s of i n daw a yn o to n l ym a k et h er e c a l l a n dp r e c i s i o ng o o d ,b u ta l s oc a ni m p r o v e st h ee f f i c i e n c yo fd i s c o v e r yi sb e c o m em o r e a n dm o r eu r g e n t t h i sp a p e rp r e s e n t sas e m a n t i cw e bs e r v i c e s d i s c o v e r ym e t h o d b a s e do nc l u s t e r i n ga n dp e r s o n a l i z a t i o n ,t h i sm e t h o du s e st h es e m a n t i ci d e a st o i m p r o v et h et r a d i t i o n a lg r a p hc l u s t e r i n ga l g o r i t h ma n dt h eu s e r si n t e r e s tm o d e l , w h i c hi m p r o v e st h ep r o c e s so fs e r v i c ed i s c o v e r yb yu s i n gt h em a t c h i n gm o d e la n dt h e m a i nc o n t e n ta sf o l l o w s : ( 1 ) t h r o u g ht h er e s e a r c ho fo n t o l o g ya n dt h ec l u s t e r i n g ,p r o p o s e daw e bs e r v i c e c l u s t e r i n gm e t h o db a s e do nt h ed o m a i no n t o l o g y t h i sm e t h o dg e t st h ew e bs e r v i c e s i m i l a r i t yb yc a l c u l a t i n gt h ed i s t a n c eo fo n t o l o g yc o n c e p ti nt h ed o m a i no n t o l o g y , a n d r e a l i z e st h ew e bs e r v i c ec l u s t e r i n gw i t ht h ei m p r o v e dg r a p hc l u s t e r i n ga l g o r i t h m i n t h ep r o c e s so fc l u s t e r i n g ,t h em e t h o dc o n s i d e rt h eo n t o l o g yc o n c e p ta st h ec l u s t e r i n g b a s i s ,w h i c hm a n i f e s t st h es e m a n t i cm e a n i n go fc l u s t e r i n gc l a s sa n di m p r o v et h e a c c u r a c yo ft h es e r v i c ec l u s t e r i n g ( 2 ) w i t hs t u d yo ft h ei n d i v i d u a l i z e dt e c h n o l o g ya n dt h em e t h o do fi n t e r e s t r e p r e s e n t a t i o nb yo n t o l o g yc o n c e p lp a p e rp r o p o s e da ni n d i v i d u a l i z e dm o d e lo f s e r v i c ed i s c o v e r yb a s e do nd o m a i no n t o l o g y t h em o d e le s t a b l i s h e dt h e o n t o l o g y c o n c e p tt r e et or e f l e c tu s e r si n t e r e s t s ,a n dr e f l e c tt h em o d e l ss e m a n t i cm e a n i n gb y s e m a n t i cc a l c u l a t i o n ,w h a t sm o r e ,i no r d e rt oa d a p t e dt ot h ec h a n g i n go fu s e r s i n t e r e s tc o n s t a n t l y , t h em o d e la l s oh a sd e f i n et h el e a r n i n gm e t h o d s ( 3 ) t h ep a p e rp r o p o s e das e m a n t i cw e bs e r v i c e sd i s c o v e r ym e t h o db a s e do n c l u s t e r i n ga n di n d i v i d u a t i o n t h i sm e t h o da c c o r d i n gt ot h eh i s t o r yo fu s e r sq u e r yi n t h eu s e rm o d e l ,s e a r c ha n df i n d t h er e l a t i o n s h i pb e t w e e nt h eu s e r si n t e r e s ta n d c l u s t e r i n gc l a s s ,w h i c hm a k et h ef i n d i n go fs e r v i c ec a t e g o r ym o r ee f f e c t i v e ,a n d r e d u c et h es e r v i c em a t c h i n gt i m e s m e a n w h i l et h em e t h o dc a nm a k et h er e s u l tm o r e h u m a n i s t i c ,h e l pu s e r sg e tm o r e a c c u r a t es e a r c hr e s u l t s i naw o r d ,t h ep a p e rp r o p o s eam e t h o do fw e bs e r v i c ed i s c o v e r y , w h i c hi m p r o v e n 杭州电子科技大学硕上学位论文 t h et r a d i t i o n a ls e m a n t i cw e bs e r v i c ed i s c o v e r yp r o c e s sb yu s i n gi m p r o v e dc l u s t e r i n g a n di n d i v i d u a l i z e dm o d e l ,w h i c hi n t r o d u c et h ei d e ao fo n t o l o g yc o n c e p t t h e e x p e r i m e n th a sp r o v e dt h i sm e t h o do fs e m a n t i cw e bs e r v i c ed i s c o v e r yc a l li m p r o v e t h ee f f i c i e n c y k e y w o r d s :o n t o l o g y , p e r s o n a l i z a t i o n ,c l u s t e r , s e m a n t i cw e bs e r v i c e ,s e r v i c e d i s c o v e r y i i i 杭州电了科技大学硕士学位论文 目录 摘要i a b s t r a c t i i 第一章绪论1 1 1课题背景及研究意义1 1 2国内外研究现状2 1 3主要研究内容3 1 4 论文安排4 第二章语义w e b 服务发现相关技术综述5 2 1 语义网5 2 2 本体理论7 2 2 1 本体概述7 2 2 2 本体结构与描述语言7 2 2 3 本体分类8 2 3 基于语义的w e b 服务发现模型9 2 3 1w e b 服务简介9 2 3 2 基于语义w e b 服务发现机制1 4 2 4 本章小结1 7 第三章基于本体概念的服务聚类算法1 8 3 1 图论聚类1 8 3 1 1 聚类基本概念1 8 3 1 2 图论聚类方法2 3 3 2基于本体概念的服务聚类方法2 4 3 2 1构建标识服务的加权图2 5 3 2 2 对加权图进行聚类2 6 3 3 本章小结2 7 第四章服务发现的个性化研究2 8 4 1个性化基本概念2 8 4 1 - 1 个性化技术简介2 8 4 1 2 个性化架构分析2 8 4 2基于本体概念的个性化模型3 1 4 2 1用户兴趣模型本体表示法3 1 4 2 2 用户兴趣影响因子3 2 4 2 3 用户兴趣模型学习3 4 i v 杭州电子科技人学硕士学位论文 4 3 本章小结3 5 第五章基于聚类的个性化的服务发现机制3 6 5 1服务匹配过程3 6 5 1 1传统服务匹配过程3 6 5 1 2 基于聚类的个性化服务匹配过程3 6 5 1 3 个性化服务发现匹配算法3 8 5 2实验与分析3 9 5 2 1支持环境与工具3 9 5 2 2 实验结果与分析4 0 5 3 本章小结4 4 第六章总结与展望4 5 6 1本文工作总结4 5 6 2 进一步工作展望4 6 致谢4 7 参考文献4 8 附录5 1 v 杭州电子科技大学硕上学位论文 1 1 课题背景及研究意义 第一章绪论 随着分布式系统应用的日益广泛,w e b 服务成为各大技术和服务厂商解决异 构调用的主要手段,它解决了分布式计算中平台异构、编程语言不同等问题。然 而现有基于关键字的服务发现模型已不能适应w e b 服务的发展,由于关键字的 匹配不能理解w e b 服务描述的语义信息,使服务发现的查准率与查全率低下, 用户很难从发现结果中找到合适的服纠m j 。语义w 曲的出现为上述问题的解决 带来了契机,语义w e b 是一项由w 3 c 领导的、众多研究人员和工业伙伴参与的 协作式研究计划。w e b 的发明者也是w 3 c 的总裁t i mb e m e r s l e e 曾宣布“语义 w e b 是w 3 c 三大研究主题之一 。语义w e b 是对现有w e b 的延伸和扩剧引,可 以通过语义w 曲中基于本体的知识标识手段来描述w 曲服务的语义1 6 j 。本体是 描述语义w 曲中语义知识的建模手段,它形式化定义了领域内共同认可的知识, 是语义w e b 体系的核心【9 】,是对w e b 服务发现进行语义标注的基础。基于语义 的w e b 服务发现能够在现有w e b 服务标准的基础上为w e b 服务扩展语义信息, 以一种机器可以理解的形式来标注用于w e b 服务发现的信息,使服务的查找建 立在语义距离计算的基础上,提高了发现的查全率和查准率1 7 8 j 。 语义计算是指关于本体概念匹配计算、逻辑推理等一系列复杂且繁琐的过 程,在发现过程中,它需要根据本体中概念之间的关系来计算服务描述中各个关 键字与本体概念的语义距离,得到与之相近的本体概念,从而发现与查询条件相 似度相近的w e b 服务。这一过程的复杂性导致语义w e b 服务发现的效率不能被 人们接受,如何降低w e b 服务匹配的范围,提高相似度计算的效率已成为当前 服务发现研究中亟待解决的问题。 聚类和个性化模型技术是现代资源搜索应用中较成熟的理论和技术【l ,已在 现有互联网中得到广泛的应用。聚类就是按照一定的要求和规律对事物进行区分 和分类的过程,它根据事物的内在特性,将对象分为若干个相似度接近的簇,有 效的缩小了信息查询的范引13 1 ,而个性化是通过对用户行为习惯的分析,挖掘 出用户感兴趣的事物类别,一方面它能指导信息查询的方向,另一方面根据其兴 趣模型筛选查找结果,可以提高信息查询的准确率1 1 4 1 酬。 本论文从实际出发,研究适合语义w e b 服务发现的聚类方法和个性化模型, 并应用到语义w e b 服务发现过程种,以解决其发现效率低下的问题。 杭州电子科技大学硕士学位论文 1 2 国内外研究现状 针对前面提出的w e b 服务发现效率的问题,国内外学术界开展了一系列的 相关研究,主要体现在服务匹配算法改善、服务发现模型的改进、结合现代搜索 的成熟理论和技术等方面。 ( 1 ) 服务匹配算法改善。匹配算法是提高w e b 服务发现性能的关键,主要 体现在语义距离计算的研究。邓水光等提出一种基于二分图匹配的服务相似度计 算方法,将服务匹配过程转换为扩展后的二分图的最佳匹配求解问题。文中依据 w s r m 模型,考虑局部依赖输出与全依赖输出在匹配的差异性,设计了算法 c a l s i m p r 来计算服务操作和服务请求的相似度,并结合二分图匹配算法k m , 提出接口匹配算法i n t e r f a c e m a t c h ,实验表明该算法能较大提高服务发现的召回 率和准确率,同时也大大提升了发现的效率【1 7 】;陈德伟等提出了关键字匹配和基 于语义匹配的二次匹配查询方法,通过对服务发现效率和质量的综合考虑,在服 务发现的时间开销和发现精度之间取得平衡值1 1 8 j ;蒋运承等提出了主题服务本体 的概念,通过研究主题服务本体与主体服务之间的关系,提出一种利用服务本体 来提升服务匹配效率的算法,并通过仿真实验证明其算法理论的正确性【1 9 】。 ( 2 ) 服务发现模型改进包括查找方式的改善、w e b 服务部署的改进、描述语 言及方式的改进等。吴健等提出基于本体论和词汇语义近似度的w e b 服务发现 模型,文章分别给出了基于词语间距离和基于义原的语义近似度计算方法,为 w e b 服务相似度计算、w e b 服务发现提供了一种有效可行的方法;部署方式主 要体现在集中式向分布式部署改进,单个中心对于大量服务查找请求往往负载过 重,且容易发生单点故障。分布式部署方式能够较好的支持负载平衡,减少单点 故障影响。目前分布式部署方式主要基于p 2 p 网络【2 0 , 4 0 】、服务网格【2 1 】和共享空 间 2 2 j 等。如文献【1 8 】提到的m w s d i 项目,它是在u d d i 规范基础上引入p 2 p 技 术,建立u d d i 服务器之间的p 2 p 网络,从而共享w e b 服务描述信息,减小单 一服务器压力,提高服务查找的效率。文献 7 】是关于描述语言的典型研究,通 过设计基于功能语义的w e b 服务描述语言,定义w e b 服务功能描述模型,并通过 构建原型系统,证明其可靠且有效。 ( 3 ) 聚类和个性化是现代搜索领域中较为成熟的应用技术,如何将其与语义 结合应用在服务发现领域,建立统一的服务发现模型是研究者一直探讨的问题。 聚类的本质是无监督学习过程,通过分类自动化,能有效减少服务匹配次数,提 高系统效率1 2 阳4 | 。当前,研究者们从不同的角度对w e b 服务如何聚类进行了研 究p u 3 1 j 。n a k a y 等提出基于关键词在服务描述文档中出现的频率来进行服务聚类 u 引。孙萍等利用p e r t i 网对w 曲服务过程描述进行形式化,计算服务过程的相似 2 杭州电予科技大学硕士学位论文 度,再结合w e b 服务功能相似度计算对w e b 服务聚类,降低了服务的查找空间, 提高查找效率【25 | 。彭敦陆等充分利用w e b 服务描述信息,根据服务方法的相关 性和度量方法的定义,提出一种基于k m e a n s 的服务聚类算法,并给出基于聚类 算法的服务检索模型1 1 3 1 。个性化是数据挖掘的典型应用,语义w e b 服务发现技 术其根本是为用户找到合适的w e b 服务。将个性化思想应用至服务发现领域是 最近学者研究服务发现的有益尝试,如冯在文等提出了一种基于情境和推理规则 的w e b 服务发现方法,该方法通过建立用户情境本体、w e b 服务情境本体等描 述情境信息和相应的推理规则,实现基于情境的推理算法,取得较好的效果【4 】。 c h e n 等通过分析用户服务请求的历史记录,对具有相同兴趣的用户进行聚类, 建立用户之间的协作关系,从而改善服务发现过程【l 。廖祝华等利用数据挖掘以 及相应建模技术,发现w e b 服务描述文档与用户兴趣特征之间的相关性,并建 立基于用户兴趣特征的个性化模型,由于用户特征与具体服务描述文档相关联, 很大程度上提高发现准确率和效率【l 引。 当前对聚类和个性化模型应用到服务发现的研究中,只单一注重通过何种方 式将其应用于发现过程中,却忽略了语义w e b 对聚类和个性化的积极作用。通 过对语义w e b 核心本体的利用,可以有效的改善聚类的准确性,增强个性化模 型的语义内涵,从而使得基于聚类和个性化模型的语义w e b 服务发现过程更加 高效。 1 3 主要研究内容 本文主要针对现有研究中服务发现的效率问题,参阅现代搜索技术中的若干 技术,研究提出优化语义w e b 服务发现模型的方案,以提高服务发现效率,改 善用户体验。 ( 1 ) 基于对各种聚类算法的研究,提出一种基于领域本体的w e b 服务聚类方 法。方法参考了概念格的思想,由领域本体概念组合标识w e b 服务,通过利用 图论聚类方法实现w e b 服务聚类。由于语义网的关键在于本体的建设和对本体 的利用 2 6 1 ,直接将本体概念作为聚类的依据,提高了聚类的准确率。 ( 2 ) 建立服务发现的个性化模型。文章提出一种基于领域本体的个性化模 型,建立反应用户行为习惯的本体概念树,并确定兴趣影响因子的计算方法和模 型学习的方式,在此基础上建立应用于服务发现的用户模型架构。 ( 3 ) 建立基于服务聚类的个性化服务发现模型,将个性化模型应用到服务发 现过程中,通过个性化模型中的领域本体概念相似度的计算帮助服务发现快速定 位到合适的聚类类别中,提高服务匹配的效率,同时个性化模型通过对用户兴趣 权值的计算,对服务结果再次筛选,从而改善服务发现的用户体验。 杭州电子科技大学硕士学位论文 1 4 论文安排 本文共分为六章,内容安排如下: 第一章,阐述了课题的研究背景和研究的意义,分析了国内外语义w e b 服 务的发展现状及存在的问题,介绍了本文主要研究内容和安排。 第二章,介绍了w e b 服务和语义技术,简单描述了语义w e b 服务的发现模 型,分析了本体在语义w e b 服务发现中的重要作用。 第三章,在对聚类算法的分析和服务匹配算法研究的基础上,提出一种基于 领域本体的服务聚类算法,算法利用领域本体概念计算具体服务节点间的相似 度,构建标识服务的加权图,最后通过改进后的图论聚类算法完成w e b 服务聚 类。 第四章,介绍了传统个性化模型技术及其架构设计思想,提出基于本体概念 表示法的兴趣模型,通过对用户行为习惯的研究,确立用户兴趣影响因子,建立 相应的模型学习方法。 第五章,提出基于聚类的个性化语义w e b 服务发现机制,阐述了如何利用 聚类和个性化模型改善服务发现过程以及本体概念在其中的作用。最后通过仿真 实验验证论文所提方法能有效提高服务发现的效率,改善用户体验。 第六章,总结全文研究,指出其提出的发现机制的优点与不足,展望下一 步研究。 4 杭州电了科技人学硕十学位论文 第二章语义w e b 服务发现相关技术综述 2 1 语义网 语义w e b ( s e m a n t i cw e b ) 是万维网之父蒂姆贝纳斯李( t i mb e m e r s l e e ) 等人 在2 0 0 0 年提出,它是当前w e b 技术的扩展和延伸,通过对互联网信息进行语义标 记,使得互联网成为可以理解知识库。现有互联网技术能共享各种信息,但并未 对信息内容进行描述,不能提供可理解的语义信息,致使信息查找时往往面临信 息量巨大却并不是所想要的结果。语义网目标就是让互联网信息及资源描述具有 充分的、完备的语义定义,能够建立人与计算机、计算机与计算机间语义层次的 理解与合作,从而提高用户分布式异构系统中信息访问和检索的准确性。 例如,如要去某地旅游,人们通常需要查询关于目的地的天气、航班、住宿 等信息。如果使用万维网的话,你必须先查询航班,记下后查询航班到达后当地 的天气以及附近的宾馆。但如果此时使用的语义网,那么一切都将如此的简单, 语义网将所有你需要的信息有序的组织在一起,并给你一个非常直观的结果。 为了实现语义w e b 这个人工智能与w e b 技术相结合的产物,2 0 0 0 年世界x m l 大会上,l e e 提出了语义w e b 的概念和体系结构【2 川如图2 1 所示。 、r u l e s t r u s t 。、 d a t a ; p r o o f 墅 j 再j 。、d 搬 l 0 1 3 i c c 塑 s e l f - 4 价 d e s c 。l l o n t o | o g yv o c a b u l ar y 葛 = d o c 1 鬟 孽 篷 r d f 斗r d f s c h e m e a jq 移”霞” 。锡 x m t 串n s 牛x m t s c h e m a 7 二。:五锄。i e = = 誊:j 图2 1 语义w e b 层次结构 u r i 和u n i c o d e u r i 和u n i c o d e 在语义w e b 体系结构中属于整个语义w e b 的基础,其中u r i 用来标识资源位置,而u n i c o d e 提供了统一的字符编码。通过这两种技术,使 得w e b 环境下应用之间的通讯、信息发布以及共享成为可能。由于语义w e b 杭州电子科技人学硕士学位论文 的最终目的是构建全球知识互联网,故将u n i c o d e 作为其编码。 x m l 、n a m e s p a c e 及x m ls c h e m a 这一层是在u r i 和u n i c o d e 上数据抽象表示,将x m l 作为一种“元语言”, 用户可通过自定义标签来描述w e b 信息,同时使用x m ls c h e m a 来约束标签结 构。n a m e s p a c e 群l 命名空间,由u r i 索引确定,为的是避免不同路径下相同名 字资源的命名冲突。该层负责从语法上表示数据的内容和结构i 实现资源对 自身的描述。 r d f 和r d fs c h e m a r d f ( r e s o u r c ed e f i n i t i o nf r a m e ) ! j 资源描述框架,r d f 是有关语义w e b 表 达最基础的规范,它是规范和明确w e b 资源语义的基本方法和框架。该框架 能充分利用各类元数据的优势,描述了元数据之间的关系,解决了采用x m l 描述资源对象二义性的问题,使得所描述资源的元数据信息成为机器可理解 的信息。该数据模型主要包含以下三个对象类型: ( 1 ) 资源( r e s o u r c e ) :资源可能是整个网页;网页中的一部分;或者页面 的全部集合;或者是不通过w e b 放的对象。 ( 2 ) 特性( p r o p e r t i e s ) :特性是描述资源特定的方面、特征、属性或关系。 ( 3 ) 声明( s t a t e m e n t s ) :一个特定资源和特性名称加上该特性的值一起构 成了一个r d f 声明。一个声明中的这三部分分别被称为:主题( s u b j e c t ) 、谓词 ( p r e d i c a t e ) 和对象( o b j e c t ) 。 r d f 定义o b j e c t p r o p e r t y - v a l u e - - - 元组作为基本建模原语,提供一个表达元 数据模型,r d f s 进一步定义建模原语,增强了r d f 对资源的描述能力,可以 用来定义一个描述类和类之间的简单关系。需要说明的是,r d f 虽然解决了 如何无二义性的描述资源对象的问题,使得描述资源的元数据信息能为机器 所理解。但是r d f r d f s 描述语义的功能非常有限,需要进一步扩展。 o n t o l o g y o n t o l o g y 即本体层,本体是指共享概念模型明确的形式化规范说明。互 联网中对同一概念往往有不同的表述,通过本体的建设,统一各个应用对相 同事物的描述是构建语义网的关键,本章第二节将对本体进行详细论述。该 层是在r d f ( s ) 基础上定义概念及其关系的抽象描述,用于描述应用领域的知 识及各类资源之间的关系。 l o g i c 、p r o o 圾t r u s t l o g i c ( 逻辑层) 是本体语言逻辑上自然的推进和扩展,使其具备表示应 6 杭州电子科技大学硕士学位论文 用领域动态变化知识的能力。p r o o f 和t r u s t 在概念上尚未在学术界形成共识, 大致上,p r o o f ( 证明层) 运用知识进行推理,包括推理过程表示和推理验证。 t r u s t ( 信任层) 是通过数字签名、证书等技术来实现语义w e b 的信任管理。 2 2 本体理论 2 2 1 本体概述 本体最初是哲学领域的概念,用来表示世界的本源和存在的性质,后来本引 入到计算机领域,用来表达人们对相同概念理解的一致性。已在计算机各个领域 得到
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 需支付定金的购车合同模板8篇
- 赠与协议与赠与合同6篇
- 2025年责任保险合同7篇
- 杭州房屋租赁合同二零二五年
- 主页制作合同
- 供暖设备维修施工方案
- 枣庄中式庭院门施工方案
- 阳泉师范高等专科学校《藏药矿物学》2023-2024学年第一学期期末试卷
- 山东杏林科技职业学院《研究型建筑设计》2023-2024学年第二学期期末试卷
- 上海海洋大学《与实践》2023-2024学年第二学期期末试卷
- 卫星网络管理与运维-深度研究
- 2025偏心半球阀技术规范
- 2025年春新人教版语文一年级下册教学课件 11 浪花
- 金融投资策略分析报告
- 专练04-中国地理、世界地理100题(解析版)
- 《某小区深基坑支护设计》8100字(论文)
- 水利工程信息化项目划分表示例、单元工程质量标准、验收应提供的资料目录
- 意识哲学研究前沿-洞察分析
- 固定资产投资统计专业培训(2024年11月)
- 2025年中国铁路兰州局集团限公司招聘高频重点提升(共500题)附带答案详解
- 2025道路运输安全员两类人员考试考核题库含答案全套
评论
0/150
提交评论