下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、电子商务教学中微博和微信大数据挖掘研究摘要:在电子商务教学与应用中,很多内容己经在向大数据的方向 前进,用大数据进行分析和总结,教学效果可以由大数据分析总结出来。 因此,在这个大数据化的时代,不与大数据有一定关联性,很可能会被社 会所淘汰。本文研究了在电了商务教学中,大量的微博和微信内容,进行 大数据挖掘研究。关键词:电子商务;大数据;挖掘1引言电子商务已经成为中国战略性新兴产业中的一个重要组成部分,代表 了全球信息经济的发展趋势。随着电子商务的发展,出现了基本问题,如 支付和分配,双方的信任和声誉,这些已成为了电子商务和电子服务发展 的瓶颈。在虚拟市场中,信任的缺失、信任危机和信任状况的恶化
2、等问题 越来越严重。wcb2. 0技术的应用和发展为表达自己的欲望和感情的用户提供了丰 富的渠道和方式。各种各样的人通过网络、网站、博客、微博、微信等发 表评价商品,产品和服务的意见。特别是,微博和微信在电子商务的应用 领域中,提供了一种人们可以表达各种物品的感情,业务和服务渠道。这 种用户评价和微博客评论已成为一种形式,所有的用户都可以发布、关注、 评价、评论和分享信息。用户微博客的信息和数据和电子商务的意见和评 价不仅包括结构化、半结构化和非结构化的数据,还包括文木、链接、图 片、音频和视频内容,电子商务发展迅猛。信息和数据的快速膨胀。通过 数天和数月的时间逐渐形成了大量的数据,大容量和复
3、杂的结构,还有各 种类型的大数据。2微博和微信微博起源于新浪媒体,是一个社会媒体平台,微信是一个社交平台。 吴军先牛在浪潮之顶中提到的企业基因,认为新浪是一个网络媒体, 而腾讯是社交软件和聊天工具,所以它也决定了两种产品的方向。微博客 是社会媒体的核心,还具有社会功能;社交工具的本质,还有一些媒体的 功能。微博作为一种媒体工具,关系主要建立在兴趣上,关系质量薄弱, 更多的是单向传播,更多的是注重传播速度和内容的公开,这些信息很快 就能在微博上传播。微信是一个社交工具,是在社会关系的恢复,关系主 要在社交上,关系质量强大,更多的是双向的关系,关注的是私人之间的 交换和互动内容,信息传播的速度不是
4、很快,但观众的消化率很高。举一个例子,同样的内容,在微信上的评论和回复要比在微博多很多, 一个可见的关系,在你的生活中有很多的关系,微博客是单向的或更多一 些的人之间的关系,看到和接受的信息,是不愿意花时间复习和反馈的, 因为是一个单向的关系。微博和微信这两种产品的优劣长短,在核心业务上没有直接的冲突。 就像在互联网时代之前,你也得看电视,或者打个电话。微博要做的是媒 体,主要是卖广告;社会和销售增值服务平台。虽然微博也有很多做平台 的行动:微博支付等等,但是,更多的是有关媒体的。吴军的企业基因决 定论中,认为新浪的基因是深的,而腾讯的基因则更纯,在未来联想微信 产甜方面有更多的空间。3大数据
5、关联规则挖掘关联规则挖掘的过程主要包括两个阶段:第一阶段必须从数据集合中 找岀所有的高频项目组,第二阶段是从这些高频项目组中生成关联规则。 关联规则挖掘的第一阶段必须从原始数据集屮找出所有的高频项冃。高频 意味着一个项目组的频率相对于所有的记录必须在一定的水平。关联规则挖掘的第二阶段是生成关联规则。从高频项目组产生关联规 则,将产生高频率的项目的规则,在最小置信度阈值的条件下,所得到的 规律和最小的可靠性就是关联规则。首先,我们必须设置最小支持度和最小信任度两个阈值。因此,满足 超市的要求的关联规则将在同一时间满足上述两个条件。如果在挖掘过程 中发现的关联规则符合下列条件,可接受生成关联规则。
6、1 apriori 算法apriori算法是一种最具影响力的挖掘布尔关联规则的算法。核心是 一个在递归算法的基础上的两个阶段的频率集理论。关联规则属于一维, 一层,布尔关联规则。在此,所有的支持度都大于最小支持度。该算法的基本思想是找出所有的频率集,就是相同的最小支持度。然 后,通过频率集,产生关联规则,它必须满足最小支持度和最小置信度。 然后,第一步是用找到所需的规则所产生的所有规则,其中只包含一组条 款,只有一个在这里使用的每一个规则的权利z-o 一旦生成这些规则, 只有那些大于用户给定的最小信任度的规则被留下。为了牛成所有的频率 集,使用递归的方法。可能会产生人量的候选集,以及可能需要重
7、复扫描 数据库,这是apriori算法的主要缺点。2频集算法虽然apriori的算法有缺陷,但han j.提出了不产生候选频繁项集挖 掘的方法:fp树算法采用分而治之的策略,在首次扫描数据库时,将频率 集压缩成一个fp树(树),与他们相关的信息分化为条件fp树库,再将 每个库的频率设定到长度为1。条件为开釆基地,当原始数据量大时,也 可以结合划分的方法,使fp-tree可以放入内存。实验表明,和apriori 算法进行比较,fp增长有不同长度的规则,适应性好,具有良好的效率。3.划分算法划分算法是一个基于分区的算法。该算法首先将数据库逻辑上划分为 几个不相交的块,每个块单独考虑它牛成所有的频繁
8、集,然后将产生的频 率集,用于生成所有可能的频率集,最后计算项集。块大小的选择在这里 可以使每个块被放入到主存储器屮,每个阶段只是一个扫描。并且该算法 至少保证在一个块的频率集的正确性。该算法可以是高度并行的,而且每 个块可以被分配到一个处理器,然后产生频率集。在生成集的每个周期后, 处理器与处理器通信会产牛一个全局候选项集。通常通信过程是算法执行 时间的主要瓶颈,而另一方面,每个处理器的时间也是一个瓶颈。4结束语在这个大数据时代,如果没有和大数据有一定的相关性,很有可能会 被社会淘汰。本文是对电子商务教学以及大量的微博和微信内容,开展了 大数据挖掘研究。参考文献:1 高海建基于大数据视角的电子商务产业研究d首都经济贸易 大学,2015.2 韦伟大数据背景下的微博在高校管理中的作用j 高教学刊, 2015 (24): 147-14
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年商业底商以租赁形式转让使用权合同版B版
- 2024年合伙经营合同范本
- 佳木斯大学《牙体牙髓病学》2021-2022学年第一学期期末试卷
- 2024年全新机械设备租赁合同违约责任
- 2024年园林景观绿化施工劳务分包合同模板版
- 饭店2024年度卫生与食品安全合同3篇
- 全新建筑工程项目管理合同2024年专用2篇
- 济宁学院《英语报刊阅读》2021-2022学年第一学期期末试卷
- 暨南大学《会计职业道德》2021-2022学年第一学期期末试卷
- 英国继续教育与培训
- 机器人技术等级考试一级真题汇总与答案
- 小学生自我介绍竖版
- GB∕T 13610-2020 天然气的组成分析 气相色谱法
- 凸透镜成像规律 动画演示
- 单轨吊设计施工技术方案及措施
- 大气数据系统:绪论
- 医疗机构管理条例(79张)课件
- 1.2集合间的基本关系 课件(共20张PPT)
- 三菱变频器d700使用手册应用篇
- 康复治疗预防二次伤害预案
- 建筑公司分包单位考核管理办法
评论
0/150
提交评论