在线社会网络研究(OSN)_第1页
在线社会网络研究(OSN)_第2页
在线社会网络研究(OSN)_第3页
在线社会网络研究(OSN)_第4页
在线社会网络研究(OSN)_第5页
已阅读5页,还剩47页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、在线社会网络研究内容提纲研究背景相关研究研究内容工作研究背景Web2.0技术的发展促使在线社会网络(OnlineSocialNetwork,简称OSN)的兴起:Facebook,Twitter,MySpace,Flickr,Youtube等等。两个重要挑战:A海量数据使数据分析和数据挖掘迎来了前所未有的机遇和挑战。对新兴媒体的监管提出了挑战。研究背景美国2011年7月启动“战略通信中的社交媒体”研究计划,投资4200万$。目的:有效对社交媒体中出现的欺骗性信息等进行监测、分类和追踪,并在深入分析之后通过有针对性的信息发布阻止谣言等传播。印第安纳大学复杂网络和系统研究中心研发岀Truthy系统,

2、它每小时能够对Twitter用户废送的数午条tweets行分析,以识别岀用户行为模式以及传播的观点等信息。采用了文本和数据挖掘、复杂系统模型分析等先进技术,研究人员希望最终能借助该系统实现对社交媒体中传播错误信息的行为进行自动识别和监测。新媒体监管项目成立相关研究什么是新媒体微博相关介绍在线社会网络的相关研究社会网络研究的方向传统媒体传统大众媒体就是电视、广播.杂志.报纸什么是新媒体?新媒体是相对于传统媒体在传播形式和载体上的表现形式相比较而言的,因此一切在媒介表现形式上具有新颖性的媒体都称为新媒体。传统媒体如果运用上了新技术,新形式也是新媒体。新渠道一一新阅读终端新形态一一社区媒体新表达方式

3、一一碎片化+互动+多媒体新媒体二新渠道+新形式+新表达方式+传统的编辑卡青神+持续陥责廷感微博的鼻祖dRobtrtWijhti5i)rcaiinj(kd3虹Ckwiging.MwifcHefonngsiwuMY切iidd口沁k伽fhc里程碑第00亿!ttcwfkbjohncwiIvev/TiuaiihiyekwjTIMEcorsiwv-abouih(*vTvvrUert$changingthewaywelis-e-anrishowinginthelucureolmnovaticfl.Ekiyacosy!10,000,898,537lO.OlO.OOO.CCO03:35:3S10,100,000

4、,CCOIday23:*4411.000.000/m19dw19:00:2120.003.000.CCO19BderF$01:56:372010年3月5日,Twitter信息统计网站Gigatweet的数据显示,Twitter信息发送总量已经突破100亿条。微博在中国微博白皮书微博时代做啥网2007年正武上线嘀咕网2009年2月8日正式上线同学网2009年5月进军微博领域9911微博客2009年5月底正式上线Follow52009年6月上线新浪微博2009年8月开始内测搜狐微博2009年12月14日上线百度i贴吧2009年11月推出网易微博2010年1月20日上线内测腾讯微博2010年4月1日

5、对外小规模测试2010年底,中国互联网微博累计活跃注册帐户数将突破6500万个,2011年中将突破1亿。微博正以燎原之势在全球蔓延Twitter(6年)全球独立用户超过102亿新浪微博(6个冃)酬用户已经超过2900万微博的特征平民化:以普通用户为主自发传播:朋友间的相互推荐和转发随性化:没有时空、形式的限制M平等、开放、直接、正是微博这些特征迎合了人们的真实需求,微博改变了世界,也改变了互联网,它将人们带入了一个更自由、更开放、更加即时、更加互动的个人互联网时代鲜活微博应用我的最佳Fans将基于你最近发布的微博受到的转发和评论来源、最近AT你的人、他们是否关注了你等多个条件,使用不同的权重,

6、计算出您近期的最佳粉丝排行榜。我的热门词语酉卩合庞大的中文词典进行分词。并且按照自然词频进行需异金菲站分析您最近20条微博的热门词语。围脖粉丝分析可以知道粉丝的男女比例、V认证比例、粉丝在全国各地的分布情况。也可以知道你的粉丝中的明星有哪些以及粉丝中谁在围脖中的资格比较老。微博应用微博风云查询您微博的影响力和活跃度排名。对您的微博,朋友,粉丝进行深度分析。谁最爱评论我找出最喜欢通过评论和你互动的朋友,关注这些更值得关注的人。我最受欢迎的微博可以知道你的原创微博中最受欢迎的那一条。微分析您的微博被转发的趋势图,您的微博被评论的趋势图,您的粉丝的粉丝数分布社会网络分析(SocialNetworkA

7、nalysis)社会网络分析方法是由社会学家根据数学方法、图论等发展起来的定量分析方法,是社会学领域比较成熟的分析方法。社会网络分析法可以从多个不同角度对社会网络进行分析,包括中心性分析凝聚子群分析核4边缘结构分析以及结构对等性分析等。一般来说,社会网络可以表示成一个图G=(V,E),每个节点yGV,图中的边V,rGEo加时间标签诟Vu,vt示当节点y或者边Vs卩在某个时刻幼|入图中中心性分析-点度中心度/图中心势:行动者的重要性-中间中心度/中间中心势:行动者之间的控制性-接近中心度/接近中心势:行动者之间的独立性社会网络分析社会网络的研究成果1967年,MilgramdfiJ“sixdeg

8、reeofSeparation”推断1973年,Granovetter的提出“强链接,、“弱链接”理论1998年,Watts和Strogatz分析了小世界特性并建立了小世界网络模型1999年,BarabasiDAbert揭示无标度(scale-free)性质并建立无标度网络模型-网络度的分布遵循幕律(power-law)在线社会网络的相关研究Adamicetal.发现OSN存在小世界现象,并局部聚集。Liben-Nowelletal.在LiveJournal上发现社会网络的朋友关系和地理位置非常相关。GirvanandNewman观察到OSN的用户倾向形成紧密群组。Kumar等人研究了大型在线

9、社会网络的动态结构模型。他们采用了经典的方法,用不同时间点的图的快照来推断网络增长过程。AlanMislove等人对4种OSN进行测量和分析,实验结果确认了在线社会网络的幕律、小世界、无标度等特征。还观察到结点的入度和出度基本一致;网络包括了一个紧密链接的高度核心结点;这个核心结点链接小的群组,这些群组是由低度的网络边缘结点强链接构成。社会网络的直径小,图中的边趋向于局部聚类。以MSN信息网络为例,它的平均路径长为6.6,且90%的节点可通过8步达到。社会网络分析的研究方向社会网络的结构分析-统计分析:网络直径、PowerLaw、网络直径等-社区发现-结点分类:影响力,专家发现-网络演变:动力

10、学-链接预测-可视化社会网络的内容分析-通用数据挖掘-文本挖掘-多媒体挖掘-传感器的数据流挖掘社会网络分析的研究团队国内的团队-上海交大:汪小凡教授-中国原子能科学研究院:方锦清教授-电子科大:周涛教授网络信息挖掘-中国传媒大学:沈浩教授网络数据挖掘-国防大学:胡晓峰教授基于战争的复杂网络研究-北京理工大学:张华平博士网络搜索挖掘与安全研究内容微博的研究新浪微博的统计分析用户排名的相关研究微博的研究微博基本的统计性质微博中内容分析的研究-自动生成标签-基于主题模型的研究-自动抽取关键短语-微博和传统媒体内容间的差异-微博中的HashTag的研究微博中社会关系网络的分析-各种链接关系图以及链接间

11、的分析-链接关系的语义-用户排序-资源排序微博的研究微博中检索分析-微博的检索需求-比较微博检索和传统检索的不同-如何利用微博来提高传统检索-如何利用传统检索来加强微博检索微博的应用研究-事件检测-情感分析新浪微博的统计分析分析工具-UCINET6.0可以处理32767个点的网络数据xitbuttonxitbuttoneditorSubmenubuttons分析工具-Pajek2.0PajekJnlxlFileNetNetsOperationsPartitionPartitionsPernut.ClusterHierarchyVectorVectorsOption$DrawMacroInfoT

12、ools分析结果一网络直径(pajek2.0)命令:Net/Pathsbetween2vertices/Diameter的菜单命令网络的直径:27左右一平均距离(pajek2.0)命令:Net/Pathsbetween2vertices/fromallvertices纟占果:Averagedistanceamongreachablepairs:863561-平均度(1420036)平均入度:2.129(770405)平均入度:1.709分析结果-度分布分析双对数坐标下的入度分布(770405个结点,1316791条关系)分析结果-度分布分析双对数坐标下的入度分布(1420063个结点,3023

13、835条关系)分析结果-度分布分析双对数坐标下的出度分布(80000随机结点)分析结果-微博数分布分析微博数分布用户排名的相关研究RankingApproachesforMicroblogSearch1摘要:本文描述了在实时搜索引擎中的几个微博排名策略,因为缺乏公开真实有效的数据集,因此我们设计了一个获取有效数据集的框架TABS,并提岀了评估排名策略准确性的方法,实验表明考虑微博作者的社会网络属性和微博的自身属性对微博的搜索引擎是有益的。2主要贡献:提岀了几个微博排名策略;设计了数据集的收集工具,提出了两个排名策略的定量评估指标。实证了所有排名算法的有效性。3主要内容定义1:微博排名(Twee

14、tRank):TR(a)=N(a),N(R是a作者目前的微博数。用户排名的相关研究(续)RankingApproachesforMicroblogSearch定义2:FollowerRank是:FR(a)=i(a)/(i(a)+o(a)定义3:tweets排名:fTR(t,q)=TR(auth(t)fpR(t,q)二FR(auth(t)定义4:长度排名:fLR(t,q)二l(t)/maxl(s)定义5:URL排名:fUR(t,q)=ciftcontainsaURLelse0定义6:fFLR(t,q)=fFR(t,q)+fLR(t,q)fFLUR(t,q)=fFLR(t,q)+fuR(t,q)A

15、WeightedMulti-factorAlgorithmforMicroblogerSearch1摘要:该论文主要关注微博的排名策略,利用6个要素度量用户的社会影响力,每个要素都和微博的作者及其自身属性的社会网络特征有很大的相关性,基于此,论文提出了加权多要素排名算法(WMFR)。通过对用户选择和tweets选择算法进行Kendall的才相关分析,结果表明与现有的几个算法相比,WMFR更高效。2主要内容:文章提岀了影响排名的6个要素:微博数、粉丝数、微博长度、URL数、转发数和评论数,并给出相应的排名策略:定义1URLRank:fUR(t,q)二N(URL)定义2RetweetRank:fR

16、T(t?q)=N(rt)定义3mentionRank:fMention(q)=N(mention)定义4综合排名:fFLR匚q)=fFRt,q)+fLRt,q)fFLUR,匚Q)-%斤(匚6+血心金FLURT(q)二fFLURt,g)+fRTt,q)fgR(t,q)二fFR(t,q)+fLR(t,q)+fuR(t,q)+fRT(t,4)+fmerition(匚q)二Wo*fFR(t,q)+W*fLR(t,q)+w2*fuR(t,q)+w;3*fRT(t,q)+W4*f斶tion(Kq)TwitterRank:FindingTopic-sensitiveInfluentialTwitterers

17、1摘要:该论文关注的是微博用户的影响力问题。提出了衡量用户影响力的PageRank的扩展算法一TwitterRank。该算法从主题相似和链接结构两个方面评价用户的影响力。2主要内容:TopicDistillationTopic-specificRelationshipNetworkConstructionTopic-sensitiveUserInfluenceRankingTwitterRank:FindingTopic-sens!tiveInfluentialTwitterers(1)通过分析twitter用户他们所发表的tweets的内容,识别他们所感兴趣的topic(2)基于中特定的to

18、pic,构造twitter用户间的关系网络(特定topic用户间转移方式)(3)对于每个特定topic,twitter用户影响力排序从tweets中提取潜藏的主题信息topic采用了LDA(LatentDirichletAllocation,中文名潜在的狄利克雷分配)模型。利用随机游走算法给相同主题的用户进行排序。最后比较了indegree,PageRankTopic-sensitivePageRank0TwitterRank等4种排序算。用户排名的相关研究(续)MeasuringUserInfluenceinTwitter:TheMillionFollowerFallacy1摘要:在本文中对

19、三种衡量影响力的方法进行深入的比较:入度,转发和评论。根据这些要素,研究了跨主题和时间的动态用户影响力。得出:入度高的用户并不一定具有影响力最具有影响力的用户在多个主题上有显著的影响影响力不是自发地或意外获得,而是通过协调一致的努力。比如在单一主题上有着高质量的内容一点想法微博的重要用户分析前提:微博已经变得越来越流行,在给人们带来方便的同时,也成为谣言传播的平台。为了对微博进行有效的监管,用户的权威性分析变得越发的重要。方法:首先采用监督学习的方法根据用户所发的微博内容对用户进行社会领域分类,然后分析用户的度中心性、中间中心性、微博数、转发数和评论数,利用加权平均的方式计算出用户在各领域中的

20、权威性排名。未来工作关注新媒体的信息传播模型ReferenceNaginoti,R.,A.Teredesai,andM.DeCock,RankingApproachesforMicroblogSearch.Proceedings2010IEEE/ACMInternationalConferenceonWebIntelligence-IntelligentAgentTechnology(WITAT),2010.Zhao,L,Y.Zeng,andN.Zhong,Aweightedmulti-factoralgorithmformicroblogsearch.ActiveMediaTechnology,2011:p.153-161.Weng,J,etal.,TwitterRank:findingtopic-sensitiveinfluentialtwitterers,inProceedingsof

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论