基于数据挖掘算法的“B站”用户行为数据分析（最终）

上传人：3*** IP属地：天津上传时间：2024-02-23 格式：DOCX 页数：36 大小：4.49MB 积分：12 举报 版权申诉

已阅读5页，还剩31页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

摘要经过多年的发展，网络视频已经成为互联网上的主要应用之一。目前，网络视频具有数量大、发布快、影响多、影响力大的特点。BililiBarrageVideoNetwork(简称B站)作为当下国内首屈一指的弹幕视频网站。对全平台的视频调查可知，B站用户创作的视频数量所占比例高达85%。而对于其中的视频创作者而言，如何在互联网繁杂的数据海洋中，进一步分析和研究热点视频则成为了研究的难题所在。本文的数据取自2020年8月的B站，其主要涉及有关生活版块的热点视频数据，并选取了大量热点词、评论等数据进行分析和研究，并最终实现了数据的可视化研究，不仅可以了解这段时间网络舆情的总体趋势，掌握用户的心理态度，加强受众的互动反馈，还可以激发用户对于B站文化探索的兴趣。关键词哔哩哔哩；用户行为分析；热点视频；ABSTRACTAfteryearsofdevelopment,onlinevideohasbecomeoneofthemainapplicationsontheInternet.Atpresent,onlinevideoshavethecharacteristicsoflargequantity,quickrelease,largeinfluenceandgreatinfluence.BililiBarrageVideoNetwork(abbreviatedasStationB)iscurrentlytheleadingbarragevideowebsiteinChina.Accordingtothevideosurveyonthewholeplatform,theproportionofvideoscreatedbyusersofstationBisashighas85%.Forthevideocreatorsamongthem,howtofurtheranalyzeandstudyhotvideosinthecomplexdataoceanoftheInternethasbecomeadifficultresearchproblem.ThedatainthisarticleistakenfromstationBinAugust2020,whichmainlyinvolveshotvideodatarelatedtolifesections,andselectedalargenumberofhotwords,commentsandotherdataforanalysisandresearch,andfinallyrealizedthevisualizationofthedata.Understandingthegeneraltrendofonlinepublicopinionduringthisperiod,graspingthepsychologicalattitudeofusers,andstrengtheningtheinteractivefeedbackoftheaudiencecanalsostimulateusers'interestinculturalexplorationatstationB.Keywords：Bilibilib;Userbehavioranalysis;Hotvideo;

目录第1章绪论第1章绪论1.1选题背景与意义国内用户将Bilibili简称为B站，该平台是自AcFun之后，国内的第二家弹幕视频网站。随着平台地不断发展与壮大，B站已经逐渐发展为集video、broadcast、game、blog、vlog等于一体的内容分享化平台。其不仅拥有国内最大的视频平台体量，更是在questmobile评选的多项榜单中荣膺桂冠。2021年3月29日，哔哩哔哩第二次正式在港上市。哔哩哔哩的高互动性、时效性、娱乐性和较强的二级语言风格使其不断扩大用户群，成为中国最大的青年文化社区。该网站的前身是mikufans，该平台创立于2009年，并于一年后改名为哔哩哔哩。2018年，经过了近8年的努力之后，B站在美国纳斯达克成功上市并发行配额股票。B站在权威网站alexa的排名也是水涨船高，在跻身全球前百名的基础上仍然保持着稳步上升。而在中国top网站排行榜中，B站作为硕果仅存的四家视频网站之一，已经成功闯入了前二十名，仅次于国外视频分享平台youtube，而与国内的同类型网站对比中，B站更是超越了传统视频平台霸主爱奇艺和youku。在其设计之初，B站的初衷仅仅在于视频分享领域。而随着平台的发展和逐步升级，B站的触手也广泛地深入到了传统的电影、音乐等领域。本文将B站作为研究对象的主要原因可以归纳为以下几点：市场潜力广阔：通过数据可知，B站在国内的视频网站排行里独占鳌头，而根据其官方数据可知，仅2018年的前两个季度，月活跃用户的总量已经高达近7700万，而2017年的月上传视频数量更是高达近90万。而就其移动端汇总的数据来看，仅2017年一年，每天使用移动端的用户点击次数更是高达约2亿人次，而实际的用户转化率维持在80%上下。年轻群体的占比高：18岁—28岁之间的青年用户在使用本站的总用户中占比高达约82%，而该目标群体在我国人口中所占比例更是高达约24%，18-28岁青年用户被视作未来我国网络消费领域的主力军。使用者互动水平较高：通过B站过去发布的ipo报告可知，2017年全年积极参加平台设计的月活跃用户人数在1500万人次上下波动，其中互动次数更是高达近2.3亿次。该报告细致分析了用户互动的深层原因，即B站优异的网站交互设计模式。该模式旨在让用户可以借内容实现社交层面的基本互动。B站作为国内最为成功的内容分享网站之一，其用户群体有着鲜明的用户画像，商业价值极高。而作为中国最大的弹幕网站，B站的用户在使用过程中也保持了极为活跃的互动习惯。故而，本文选择具有天然大数据属性的B站作为研究对象。而视频网站中也专门设立了包括动漫专区在内的近12个专区以供研究。1.2研究目的及意义随着互联网技术的日益普及，人们的娱乐化需求也发生着悄然改变，其中在线视频网站正扮演者愈发重要的角色。根据国外知名机构emarket的预测，截止到2018年，在线视频用户数量将在2017年的基础上井喷至22亿。而到2020年年尾，在线视频流量之于总流量的占比也会从现在的60%上升到80%。根据国家互联网信息中心发布的一项报告显示，中国互联网用户的近八成都是在线视频用户，用户数高达约5.5亿人次。而与国内同类型的视频网站进行比较的过程中，其竞争也愈发激励，为了提升服务品质并维系新老用户，B站等平台开始逐步挖掘并推广高质量、高权重视频内容。与此同时，视频博主也有意识的隐藏视频中的关键信息，以获取来自用户的真实反馈数据，这种手段极大的增强了用户同up主之间的交互，并有利于视频博主创作更高质量的视频内容。它还可以激发用户探索弹幕文化的兴趣。使用户保持新鲜感，延长软件的使用寿命。1.3国内外研究现状当下的学术界中，如雨后春笋般的涌现出了多种对于用户的分析方式，其中较为常见的有用户行为分析方式。由于该方式较为新颖，受众相对较少，使得大多数研究人员对其认知不足。然而这不能掩盖其作为一项分析用户行为的方式的特殊价值。作为研究用户的手段之一，通过大量的数据作为佐证来验证该理论的可行性。美国IllinoisInstituteofTechnology的学者指出，通过观察并研究人们的日常表现，而进行的一种新颖且特殊的设计研究方式。在我国香港进行的一个项目，通过观察记录人们的日常，了解不同人群在生活过程中的兴趣爱好，以此来挖掘人们的实际需求。这也是很多企业在进行产品设计过程中的必由之路。这样不仅可以吸引到用户的注意力，更能按照用户的实际需求开发令其满意的产品。在进行开发和设计的过程中，客户的实际需求将成为产品设计的重中之重，而提升用户的满意度也将成为考核的环节之一。著名学者亨特曾经深入研究用户的行为并撰写文章，其认为心理学的变化从传统的辩论时代发展到以实践为基础的实验时代，有必要从客观的角度来研究和分析人类的行为。心理学系统地论述了有机体的定义和行为，描述了当前社会环境下有机体的外显行为。基于国内的研究情况，江湘芸教授在有关用户行为分析的著作中也指出，用户的行为模式可以与用户的思维进行深度融合，并引出一种崭新的模式。这种模式的特点在于其对于产品的主体进行了严格的划分，一个是在其使用情境上运用了大量的革新手段，一个是深化其具体的操作流程。

第2章关键技术1.1爬虫技术基本上所有Python爬虫初学者都会接触到两个工具库，requests和BeautifulSoup，这二者作为最为常见的基础库，其使用方式也截然不同，其中request工具库主要是用来获取网页的源代码，其需要向服务器发送url请求指令；而beautifulsoup则主要用来对网页的源语言，包括且不限于HTML\xml进行读取和解析，提取重要信息。这两个库模拟了人们访问网页、阅读网页以及复制粘贴相应信息的过程，可以批量快速抓取数据。流程如图1所示。图1数据获取及解析流程图2.2PythonPython是荷兰科学研究学会的GuidovanRossum的设计语言，其面世于1990年代，主要用于c语言的备选语言，Python语言本身具有显著的特点，其不仅提供了结构严谨的数据结构，也可以如java、c++等语言进行面向对象的开发与设计。Python的语法结构和解释器类型注定了其可以在多种平台上进行脚本的开发与设计，也注定了其是一款用于进行高效开发的程序语言。随着python语言版本的不断更新，越来越多项目的开发过程中，也开始选用高效便捷的Python语言进行独立化的开发设计。Python丰富的标准库为各主要系统平台提供了合适的源代码或机器码。第3章模块设计本平台的结构如图2所示：图2平台结构图3.1数据爬取模块用python进行数据挖掘的过程中，主要是通过爬虫程序和数据的预处理来收集相应的用户数据信息。网络爬虫的实现往往是利用用户在视频上传过程中使用到的aid码进行，并通过request来选择B站的网址，从而最终收集到相关的数据。数据预处理很大程度上市用来爬取视频收集过程中的基本数据信息，并进行相关的操作。（1）数据清洗技术主要是通过使用python语言中的正则表达式技术，通过其大量收集目标数据，并进一步进行提取。（2）数据转换技术主要是通过加载法，将源数据中收集到的字符串按照相应的规则和序列转换成字典。（3）数据去重即用unique方法，返回没有重复元素的数组或列表。预处理后保存到CSV文件中。3.2数据的挖掘与分析模块数据挖掘主要是通过运用设计好的算法对已有的数据进行分析和汇总，并按照数据的特征进行情感分析。统计数据过程中多使用snownlp类库来实现这一基本的情感分析的操作，通过计算弹幕的数据值，来分析其中的倾向性。情感分析中长用sentiment来指明实际的情感值。其中，数据一旦越靠近1则越表明其正面属性，越接近0越负面，相关的结果数据可以作为情感分析的基础数据而得到。3.3数据可视化模块数据可视化模块主要采用饼图、词云和折线图等手段来实现最终的数据可视化。并通过matplotlib库等技术来进一步地研究和分析数据的特点，最终通过图表的模式来展示数据的深层含义。可视化模块包括各时段视频播放量比例图、热词统计图、每周不同时间视频播放量线图、情绪比例图等可视化图形。

第4章数据挖掘和分析4.1样本选取与数据来源因为要大数据集，所以不考虑热榜排名，因为所有的区域加起来也就一千左右。本研究样本来源于2020年8月哔哩哔哩网站搞笑生活领域视频流行度排名，2020年8月1日至8月31日的30天的总数据。从视频流行度排行中选择时间段，查看热点视频信息，同时分析各种因素对视频播放量的影响。虽然只是一个小分区的月度热度排名，不包括所有视频，但是数据量也是巨大的，近23万条数据。4.1.1数据爬取首先webanalytics发现这里有一个难点，就是虽然浏览器可以查看web源代码，并且包含视频相关信息，但是请求后web源代码中没有相关信息。所以前两个版本我用的是selenium库方法获取信息，但是这种方法有一个缺点，速度慢(因为需要像浏览器一样加载整个页面信息)，信息少(只有标题、作者、视频介绍、视频页面、个人主页URL)，非常麻烦。所以这次我切换到API调用的方法。当我们选择一个特定的号码进行搜索时，我们可以找到一个接口。点进去后可以发现结果中有20条数据，正好对应每页20个视频。可以看出，它包含了作者、标题、标签、播放等一系列数据。接口是/cate/search?callback=main_ver=v3&search_type=video&view_type=hot_rank&order=click©_right=-1&cate_id=138&page=1&pagesize=20&jsonp=jsonp&time_from=20200801&time_to=20200831,view_type是排名类型，page是页数，pagesize是页面上视频的最大数量，上限好像是100。是时候结束了。但是我还是需要投币、点赞和收藏的数据和UP的粉丝数。通过同样的分析，得出得到三连的API接口：/x/web-interface/archive/stat?aid=371876135其中aid由BV转换。粉丝数为/x/relation/stat?vmid=32172331mid可以在第一个界面获得。这时候虽然可以启动抓取，但是如果数据量稍微大一点，访问稍微频繁一点，IP就会被屏蔽。这时候就需要用代理IP了。虽然有免费的代理IP，但是GITHUB上有专门的项目来搭建代理IP池。不过免费IP毕竟麻烦，所以我选择用日租专用的IP。/，将视频数据与上传者数据相结合，最终形成研究所需的样本数据集。按照上面的数据采集流程，在近一个月的数据采集过程中，通过采集技术收集到了近23万条视频数据。其中，每个视频数据都包含着其视频的基本信息，比如视频的实际播放次数、视频的收藏次数、视频的分享记录、上传者的基本信息、上传者的好友动态、上传者的粉丝列表等基本信息（见表1）。而对于收集到的具体数据，则可以按照以下表1的描述方式进行。包括作者ID和粉丝数。信息描述如表1所示：表1视频主要信息描述原始信息描述视频基本属性日期视频投稿日期标题视频标题BV视频BV号Mid标签视频所属范围视频互动属性播放数视频当前的播放次数弹幕数视频当前的弹幕总条数评论数视频当前的用户评论总条数点赞数视频当前的点赞总数硬币数视频当前的投硬币枚数收藏数视频当前的收藏人数分享数视频当前的分享总次数当前排名视频当前达到的排名（1-1000）上传者特征作者上传者ID粉丝数上传者当前的粉丝总人数接下来爬一下弹幕的详细信息：一般情况下，在用户浏览视频的过程中，弹幕会自动浮现在视频的观影窗口。实际上，在技术操作层面，程序员会将弹幕内置于源代码中，通过xml来进一步的加载，可以简单理解为记录数据的格式。XML和描述网页的HTML很像。弹幕文件网址是：/92542241.xml它由一个固定的网址+视频的cid+.XML组成，在实际抓取过程中，如果你想搜索到目的视频的cid码，你可以通过更换xml的方式来获取视频的弹幕信息，其中需要注意，B站网页进行数据挖掘过程中，弹幕的数据一般小于1000.获取cid的方法相对简单，选择任意的浏览器（一般建议选择Googlechrome），打开浏览器并进入目标网页，在设置中逐一检查网页的源代码，用“Ctrl+f”打开网页自带的搜索框并键入“cid”，发现cid是网页源代码中非常常见的短语，而我们实际寻找的cid通常会直接以“cid”数据串的模式出现。为了进一步的减少范围，通过标准通配符加引号进行搜索可以提升搜索的效率，在获取到了准确的cid码之后，就可以开始进行基本的爬虫操作。将视频窗口内的所有的弹幕信息内置于tag之下，故而就需要设计一个专门的程序获取视频窗口下的标签信息：第一，通过request工具库，来进入弹幕网页的网址url，从而获取页面数据。导入bs库，使用lxml解析器解析页面。因此你需要提前用安装lxml库，查询所有页面的d标签并打印出来。这个操作之后，d标签中隐藏的弹幕内容全部被python抓取，对收集到的弹幕进行数据分析，通过整理将收集到的弹幕信息、网址信息等编制成字典，并按照固定的格式添加到相应的任务栏中，共计可以收集到近千条数据，保存为CSV文件。做完数据后，我们还可以分析，比如词汇出现的频率等。，可以根据需要自由处理。示例:《花丸幼稚园》第六集url：/bangumi/play/ep17617，弹幕文件51816463.xml：/51816463.xml，参数略解、详解分别如表2、表3所示：表2参数略解stime:弹幕出现时间(s)mode:弹幕类型(<7时为普通弹幕)size:字号color:文字颜色date:发送时间戳pool:弹幕池IDauthor:发送者IDdbid:数据库记录ID（单调递增）表3参数详解stime（float）弹幕出现时间，单位是秒；也就是在几秒出现弹幕。mode（int）弹幕类型，有8种；小于8为普通弹幕，8是高级弹幕。1~3滚动弹幕4底端弹幕6顶端弹幕7逆向弹幕8高级弹幕size（int）字号12非常小16特小18小25中36大45很大64特别大color（int）文字颜色；十进制表示的颜色。data（int）弹幕发送时间戳。也就是从基准时间1970-1-108:00:00开始到发送时间的秒数。pool（int）弹幕池ID0普通池1字幕池2特殊池（高级弹幕专用）author（str）发送者ID，用于"屏蔽此发送者的弹幕"的功能。dbid（str）弹幕在数据库中的行ID，用于"历史弹幕"功能。获取到弹幕数据后，将获取到的数据按照固定的格式存储到在danmus.csv文件：4.1.2数据预处理删除空值，重复值，对数据进行预处理，将None值换成0，只保留中文字符，将标题分割成一个个短词，同理处理标签，设置一个四舍五入代码，计算三连等比率：点赞率=点赞/播放量*100%；硬币率=硬币/播放量*100%；收藏率=收藏/播放量*100%；转发率=转发/播放量*100%；弹幕率=弹幕/播放量*100%；评论率=评论/播放量*100%4.2各功能模块的实现4.2.1热点视频的数据分析及可视化首先查看处理后的视频数据信息，如图3所示：图3视频数据信息共有88350位UP主，统计每个播放量区间的视频数量，[0,9999]区间的共213115个，占样本比例93.86%,[10000,99999]区间的共有10731个,占样本比例4.73%，[100000,499999]区间的共有2436个，占样本比例1.07%,[500000,999999]区间共有464个，占样本比例0.14%，[1000000,∞]区间共有320个，占样本区间0.02%，画出饼图，如图4所示：图4播放量占比图如果只展示一万播放量以上的内容，统计每个播放量区间的视频数量，[10000,99999]区间的共有10731个,占样本比例76.92%，[100000,499999]区间的共有2436个，占样本比例17.46%,[500000,999999]区间共有464个，占样本比例3.33%，[1000000,∞]区间共有320个，占样本区间2.29%，画出饼图，如图5所示：图5播放量占比图（播放量1万以上）统计展示播放量排名前二十的UP主，统计结果如图6所示：:图6播放量排名按播放量排名前20的具体数据展示，结果如图7所示：图7具体数据展示根据UP主分组对每个UP八月的总播放量进行排序，排序结果如图8所示：图8每个UP八月的总播放量展示图还可以对每个UP主的弹幕数进行排序，排序结果如图9所示：图9弹幕数排序对每个UP主的评论数进行排序，排序结果如图10所示：图10评论数排序对每个UP主的视频数等综合进行排序，排序结果如图11所示：图11视频数排序绘制折线图，对每周不同时间段发布的视频播放量进行统计，统计结果如图12所示：图12播放量统计对每周不同时间段发布的视频播放量大于10000的视频数量进行汇总，结果如图13所示：图13播放量统计（视频播放量大于10000）绘制词云，用词云显示出来“题目”热词，如图14所示：图14题目热词用词云显示出来大于1万播放视频“题目”的热词，如图15所示：图15题目热词（播放量大于10000）用词云显示出来大于10万播放视频“题目”的热词，结果如图16所示：图16题目热词（播放量大于100000）用词云显示出来大于100万播放视频“题目”的热词，结果如图17所示：图17题目热词（播放量大于1000000）查看标签的热词，结果如图18所示：图18标签热词用词云显示出来大于1万播放视频“标签”的热词，结果如图19所示：图19标签热词（播放量大于10000）用词云显示出来大于10万播放视频“标签”的热词，排序结果如图20所示：图20标签热词（播放量大于100000）用词云显示出来大于100万播放视频“标签”的热词，结果如图21所示：图21标签热词（播放量大于1000000）统计标题中包含“老师”的视频数和播放数分别为3200和16610756；据统计，标题中包含“兄弟”字样的视频总数和播放数分别为1897和25270292。据统计，标题中有“老师”字样的视频总数和播放数分别为830和28265224。统计结果如图22所示：图22包含“女朋友”的标题中包含“兄弟”的视频信息统计标题中包含“一旦”的视频数和播放量的综合分别为89和28302099；统计标题中包含“吾辈”的视频数和播放量的综合分别为318和35563900；统计标题中包含“歪嘴”的视频数和播放量的综合分别为1810和70787655；查看标题带有['老师','兄弟','女朋友','一旦','吾辈','歪嘴']热词的视频个数饼状图，结果如图23所示：图23标题热词数量占比绘制带有标题热点的视频播放量饼图，如图24所示：图24带有标题热点的视频播放量饼图处理标签的热词，绘制含有标签热词的视频个数饼状图，结果如图25所示：图25含有标签热词的视频个数饼状图绘制带有标签热词的视频播放量饼图，结果如图26所示：图26带有标签热词的视频播放量饼图通过公式点赞率=点赞/播放量*100%，计算视频点赞率并进行排序，排序结果如图27所示：图27点赞率排序（播放量大于10000）通过公式硬币率=硬币/播放量*100%，计算视频硬币率并进行排序，排序结果如图28所示：图28硬币率排序（播放量大于10000）通过公式收藏率=收藏数/播放量*100%，计算视频收藏率并进行排序，排序结果如图29所示：图29收藏率排序（播放量大于10000）通过公式转发率=转发/播放量*100%，计算视频转发率并进行排序，排序结果如图30所示：图30转发率排序（播放量大于10000）通过公式弹幕率=弹幕/播放量*100%，计算视频弹幕率并进行排序，排序结果如图31所示：图31弹幕率排序（播放量大于10000）生活搞笑领域的视频大多集中在10000以下，占93.86%。爆款视频关键信息:粉丝数量、视频质量、视频数量。每个月上传大量视频，出爆款视频完全有可能。播放量排名最高的两个UP，一个投稿154个视频，另一个投稿528个视频。弹幕和评论跟UP人气相关，粉丝数量越多，粉丝粘性越高。8月份视频投稿最多的UP是老人诱捕大队队长，共6932个视频。视频主要在10:00-24:00播出，这个区间的总播出量也是最高的。八月份的高频词汇主要是龙王、七夕，与节日相关以及高人气UP。Bilibili相关活动热词视频播放量普遍较低，UP和月梗相关播放量最好。三重播放率、弹幕率、转发率、评论率对视频播放量影响不大。4.2.2视频弹幕数据查看弹幕数据信息，如图32所示：图32弹幕数据对弹幕进行词频分析，如图33所示：图33弹幕词频分析对弹幕进行情感分析，如图34所示图34情感分析从图34可以看出，3000个弹幕中，超过一半的是积极弹幕，超过30%是中性弹幕。关于弹幕调侃的内容居中，梗多，会对情绪分析造成很大障碍。比如：>>>fromsnownlpimportSnowNLP>>>s=SnowNLP('阿伟死了')>>>s.sentiments0.1373666377744408“阿伟死了”有“死”字，所以判定为负面情绪。但实际上，它反映了积极的情绪，描述了看到可爱的东西时的兴奋情绪。对视频弹幕数进行折线图分析，如图35所示：图35折线图分析高能时刻即更多时候，我们可能对精彩片段不太关注，而是想知道番剧的名场面出自几分几秒，即高能时刻。输出：9m29s名场面:怀中抱妹鲨。我们去视频中看一下，9m29s确实是名场面，如图36所示：图36名场面福利内容指的是字体颜色为黄色且十进制颜色值为16776960时出现的比较污的画面。同时，为了防止出现异常，只有当这一分钟出现黄色弹幕的次数不低于3时，表示这一分钟内是福利内容，输出这一分钟第一次出现黄色弹幕的秒数。如表4所示：表402m15s吼吼吼06m19s真的有那么Q弹吗08m17s憋死09m10s前方万恶之源10m54s噢噢噢噢11m02s这就是平常心12m34s这个我可以17m19s因为你是钢筋混凝土直女18m06s假面骑士ooo是你吗19m00s警察叔叔就是这个人20m00s金色传说的说。。。21m02s嘿嘿嘿~弹幕内容的挖掘分析是一个非常有意义的方向。本文实现了弹幕数据的统计分析和内容的情感分析。爬虫过程中收集到的样本数据，其不仅包含了弹幕的基本数据信息，更包含了视频的内容数据，这些数据对于研究弹幕的互动有着一定的借鉴价值，对用户的行为模式分析也有一定的现实意义，这可以使得创作者从弹幕的内容中获取到有用的信息，并凭此创造出高质量的视频作品，这些操作将有助于我们了解用户的交互模式。

第5章总结我们的研究基于来自哔哩哔哩网站的生活搞笑区视频样本数据，运用统计分析、情感分析对热点视频的数据以及用户的类型进行了深入的探讨。本文按照预设模块逐项进行分析，基本模块均已实现。对热度视频的热词，点赞，投币，收藏，评论，弹幕等数据对视频播放量的影响进行可视化分析。本文仅选取Bilibili搞笑版块的相关视频作为研究对象，数据样本的选取范围也主要是单一类型的视频，其单一性决定视频不会受到其余主题视频的影响。而B站的实际用户群体多是90后，特定的用户年龄段使得用户属性也相对独特，这有别于企业的视频平台。在未来的深入研究中，一来可以收集多个主题的数据信息，二来可以进行多平台的调查研究，通过提升样本多样性来增加结论的真实性。

参考文献陈格.青年亚文化视角下的弹幕视频探析[D

人人文库> 全部分类> 教育资料 > 作文作品

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

基于数据挖掘算法的“B站”用户行为数据分析（最终）

文档简介

温馨提示

最新文档

评论

相关文档