湖北移动互联网渠道二期技术方案建议_第1页
湖北移动互联网渠道二期技术方案建议_第2页
湖北移动互联网渠道二期技术方案建议_第3页
湖北移动互联网渠道二期技术方案建议_第4页
湖北移动互联网渠道二期技术方案建议_第5页
已阅读5页,还剩114页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

附件三:技术建议书项目总体说明项目背景随着湖北公司建设的企业级数据中心,接入了经分数据,数据业务数据,用户上网行为数据,位置数据,客服数据等,为精准客户画像的构建,用户行为偏好分析提供了基础能力,充分发挥大数据的优势,有利于精准营销的开展。同时从成本和运营的角度考虑,电子渠道会成为公司销售和服务的重要渠道,其便捷性也使得电子渠道越来越成为大众用户的首选。而针对电子渠道,实现千人千面的精准广告宣传,以差异化的服务提升用户感知,是提高运营效能的重要方式。基于此,湖北移动与2014年启动了互联网渠道运营子系统一期的建设,系统在2015年6月上线以来,通过建设“五个中心模块”,有机整合用户、内容、时机、渠道等要素形成一体化客户场景,通过电子渠道开展营销,目前策划上线并监测93项营销活动,整体营销效果显著。随着客户的精准化营销需求的提升,互联网广告市场跑马圈地的时代到来,作为拥有用户精准数据的电信运营商,湖北移动公司在互联网渠道运营子系统一期建设的基础上,借鉴互联网广告运营模式,进一步扩充电子渠道接入范围,丰富客户精准标签,优化场景化营销配置,完善监测评估能力,新增内部考核模块,充分发挥渠道、网络、用户、及资金优势,构建具备湖北移动特色的广告精准营销平台。建设目标互联网渠道运营子系统二期的规划建设,在一期系统能力基础上,借鉴互联网广告模式,整合营销资源,扩充渠道范围,提升内容管控能力,构建智能场景营销能力,精准客户画像,完善监控手段,并建立考核机制,实现线上通过系统促成闭环营销管理,线下通过考核和监控优化营销工作的双闭环。在建设过程中,关注系统可扩展性,逐步实现对外广告能力。数据挖掘分析模块:扩充数据管理平台的数据接入类型,包括CRM,流量平台以及Gn接口等数据,为精准刻画用户画像提供基础。智能场景运营模块:整合营销管理资源,面向内部营销以及做好与外部其他公司的各种第三方平台对接的准备。触点管控模块:丰富渠道类型,通过有效的管控手段,实现触点的广覆盖监测评估模块:监控获取营销运营环节的效果情况,提供咨询优化手段,实现优质运营的永动机模式。内部考核模块:通过营销效果评估,科学建立考核KPI,奖惩有据,激励员工创造更大的价值。建设原则开放性与先进性基于开放式标准,采用先进成熟的设备和技术,确保平台的技术先进性,保证投资的有效性和延续性。灵活性与可扩展性方便扩展设备容量和提升设备性能;具备支持业务处理的灵活的、参数化配置,业务功能的重组与更新的灵活性,新的应用业务可灵活加载,并不影响原有业务流程。安全性与可靠性提供良好的安全可靠性策略,支持多种安全可靠性技术手段,制定严格的安全可靠性管理措施。准确性与实时性保证平台数据处理的准确性,提供多种核查手段。对实时性要求高的处理提供特殊有效的处理方法。易用性与可管理性对于用户可以方便、快捷的使用业务。平台本身应具有良好的操作界面、详细的帮助信息,系统参数的维护与管理通过操作界面完成。平台应具有良好的管理手段,可管理安全、网络、服务器、操作系统、数据库及应用等。术语定义下列术语、定义适用于本期工程:4A:Account,Authorization,Authentication,Audit 帐号、授权、认证、审计。BASS:BusinessAnalysisSupportSystem 经营分析系统。BI:BusinessIntelligence 商业智能。BOSS:BusinessOperationSupportSystem 业务运营支撑系统。CRM:CustomerRelationshipManagement 客户关系管理。VGOP:Value-addedServiceGeneralOperationPlatform 增值业务综合运营平台。FTP:FileTransferProtocol 文件传输协议。XML:ExtensibleMarkupLanguage 可扩展标记语言。Hadoop:一个分布式存储及分布式计算架构,可充分利用集群的威力高速运算和存储。HDFS:HadoopDistributedFileSystem,Hadoop分布式文件系统,该系统有着高容错性(fault-tolerent)的特点,并且设计用来部署在低廉的(low-cost)硬件上。而且它提供高吞吐量(highthroughput)来访问应用程序的数据,适合那些有着超大数据集(largedataset)的应用程序。NameNode:Hadoop中管理数据服务器,负责管理文件系统名称空间和控制外部客户机的访问。DataNode:它为HDFS提供存储块。MapReduce:MapReduce是Google提出的一个软件架构,用于大规模数据集(大于1TB)的并行运算。概念“Map(映射)”和“Reduce(化简)”,及他们的主要思想,都是从函数式编程语言借来的,还有从矢量编程语言借来的特性。Hive:是基于分布式系统的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供完整的sql查询功能,可以将sql语句转换为MapReduce任务进行运行。ZooKeeper:是一个针对大型分布式系统的可靠协调系统,提供的功能包括:配置维护、名字服务、分布式同步、组服务等。YARN:ApacheHadoop下一代MapReduce框架,提供跨平台的资源管理,满足资源的统一调度与管理。MR2:MapReduce2.0,运行于YARN之上。Spark:Spark是UCBerkeleyAMPlab所开源的类HadoopMapReduce的通用的并行计算框架,Spark基于mapreduce算法实现的分布式计算,拥有HadoopMapReduce所具有的优点;但不同于MapReduce的是Job中间输出结果可以保存在内存中,从而不再需要读写HDFS,因此Spark能更好地适用于数据挖掘与机器学习等需要迭代的mapreduce的算法。COC:具备对客户的上网行为、业务行为数据进行深入分析,为业务部门营销活动、客户需求分析提供支撑。ICA:互联网内容分析,通过对互联网和移动互联网中的内容信息进行采集和解析,实现互联网内容分类、互联网信息的深度识别。IMCD:智能营销管理产品集成了客户洞察、营销管理两大支撑能力。在营销管理方面,实现了从事前计划、事中控制、到事后分析评估完整的营销闭环管理流程的IT化支撑。CPCC:承载了将营销内容推荐给用户、引导用户使用、收集用户行为、采集和反馈营销效果的重要职责。OC-Hadoop(OrangeCloudHadoop):是基于ClouderaCDHv5版本的分布式Hadoop平台,通过集成/优化/封装,支持对海量结构化、半结构化和非结构化数据的高速处理,对交付版本在服务期内全面负责。OCDC(OrangeCloudDistributedComputing):是在Hadoop之上的管理系统,提供hadoop的自动化部署功能,全面维护、监控、优化hadoop平台,管理多租户,开放计算和存储服务接口,管理hadoop数据。AICEP(AsiaInfoComplexEventProcessing):是针对海量结构化数据的实时复杂事件处理场景设计的,采用的Esper流计算处理引擎作为底层支撑。Esper:使用Java开发的事件流处理(ESP:EventStreamProcessing)和复杂事件处理(CEP:ComplexEventProcessing)引擎。Mahout:提供一些可扩展的机器学习领域经典算法的实现,旨在帮助开发人员更加方便快捷地创建智能应用程序,实现包括聚类、分类、推荐过滤、频繁子项挖掘。Redis:基于key-value存储系统,支持存储的value类型包括string(字符串)、list(链表)、set(集合)、zset(sortedset--有序集合)和hash(哈希类型)。Memcached:高性能的分布式内存对象缓存系统,用于动态Web应用以减轻数据库负载。Nginx:轻量级的Web服务器/反向代理服务器及电子邮件(IMAP/POP3)代理服务器,并在一个BSD-like协议下发行。总体建设方案总体建设思路亚信对湖北移动互联网渠道集中运营子系统二期建设的理解,在一期建设基础上,整合功能模块,按照客户运营分析模块,智能场景运营模块,触点管控模块,监控评估模块,内部考核模块和系统管理模块组成二期系统建设。互联网渠道集中运营子系统建设思路图系统定位互联网渠道中心二期规划,以集团第三代业务支撑系统关于营销中心的要求保持一致,同时结合湖北省公司实际需求,在一期建设基础上,进一步发挥数据中心能力,扩充渠道覆盖范围,统一管控,智能运营,提升公司营销业务水平。互联网渠道集中运营子系统通过调用企业级数据中心API接口获取数据,引用数据挖掘算法与技术,实现用户信息深度挖掘、营销素材库的丰富、营销智能匹配及推送,将数据探索成果与运营思路结合,固化沉淀并形成生产力,提升运营效率。总体功能框架以大数据分析和挖掘为基础,将用户、内容、规则、事件、时机、场景、触点有机结合,通过智能营销,驱动互联网渠道高效运营。为实现此目标,本期平台建设方案结合项目需求,总体系统架构分层分为处理层、应用层和接触层。处理层:主要负责数据采集、用户与内容标签的加工处理,结合数据挖掘算法实现客户行为的深入洞察,同时对时机内容信息进行实时计算,以支持精准营销;应用层:实现对各类标签信息的创建、展现、管理等功能,同时负责营销活动策划、审批、监控与评估;接触层:作为互联网渠道集中运营子系统与外部各渠道的主要接口,进行各渠道触点的管理,同时采集各渠道营销活动的效果信息。功能架构图总体技术架构技术架构图1、引入流式爬虫、中文分词,实现互联网网页信息实时采集;具有高可用,动态防封,高吞吐量等特点。2、引入VlotDB和Redis内存数据库,实现海量数据实时计算;引入Esper复杂事件处理引擎,实现基于复杂规则数据处理。VlotDB主要特点是基于内存实时计算,在内存中快速完成数据的复杂计算,Redis主要特点是基于K-V的快速查询。两者结合使用,满足对动态标签的更新和营销策略的查询,使系统性能大幅提升。3、引入SparkSQL计算框架,MLLib挖掘工具实现全量数据挖掘。4、引入MySQL数据存储引擎,利用分片(Sharding)技术实现数据快速访问。数据管理中心建设内容用户管理中心建设内容功能概述 用户管理中心的建设目标是基于已有的客户基础信息标签,建立全面的以客户特征、客户需求为标签的研究和运营机制,服务于外部营销和内部管理的运营管理体系,并提供针对特定客户群体分析专题下的分析功能。基于上述系统建设目的,用户管理中心系统作为一个分析型、运营型的系统,主要在标签库体系的基础上,建立针对互联网中心的完善分析和研究机制,并提供多样化的客户需求分析结果并且应用于互联网渠道营销与企业运营业务。 在一期项目的基础上,本期中,以实现精细化场景营销为建设目标,依托湖北移动数据中心的大数据处理与挖掘能力,结合互联网运营中心实际业务需求,建立完善的客户标签体系,丰富标签种类与数量,加强对标签分类的统计分析,从标签的热度、增长趋势进行深度分析,对标签分类的设置和优化,提供指导参考。整合数据强化标签运营,对内加强对场景运营的个性化生成需求支撑能力,对外通过标签数据的开放提供基础信息服务能力,助力企业数据价值变现。标签全景视图 用户管理中心提供标准化的的标签体系接口,可以纳入并管理任何第三方系统(例如BOSS,经分,VGOP,流量平台,冲浪平台)的标签数据,建设成符合规范的全量标签体系,并通过全景视图的形式,展示全量标签。依据标签分类的维度进行统计分析,对标签的热度、增长趋势进行深度分析,对后续标签分类的设置和优化,提供指导参考。统一标签视图 支持查看标签全量视图,全量的展现标签的完整分类体系。全景标签视图页面可以按照层级查看系统所有标签,并查看标签的详细信息,并提供标签各种操作和加入计算中心的操作入口。分类标签占比分析 支持依据标签的分类,从最高一级到最低一级的标签分类,以时间为维度,逐级进行各分类的个数统计、占比分析。支持同一级别的分类进行对比分析。分类标签增长趋势分析 支持依据标签的分类,从最高一级到最低一级的标签分类,以时间为维度,逐级呈现各标签分类个数的增长趋势变化,支持柱状图、曲线的呈现形式。标签热度分析 热度分析,从用户使用角度,对标签使用的频次进行统计分析。计算频次时,需要注意,若一个标签,在一个客户群计算中被使用了两次,频次上即统计为两次。通过热度分析,可以对标签进行优化,对于热度低的标签可以进行停用、下线、删除的处理,对标签进行精简,使标签的设置更加合理。营销导航 支持以营销导航的模式,展示标签分类,使分类标签的选择更便捷。支持对标签,进行官方、热度、收藏的设置。智能分析 在用户管理中心创建并生成客户群清单后,提供对客户群进行智能深入的分析。支持用户自选维度和指标,即时展现分析结果,并支持导出客户群。业务人员通过它可以对自己创建的客户群进行多角度自定义分析,更全面的了解该客户群的用户详情,进而针对客户群开展营销提供辅助决策支持。自助分析自助分析支撑用户对客户群进行更详细、定制化的分析。通过自行拖拽分析维度和分析指标对用户自定义创建的客户群进行多角度分析,并可以将分析结果进行保存。基于多维分析结果,用户可以对单个客户群清单所包含的客户不断进行细分,并将细分结果保存为新的客户群。支持创建计算字段,即将几个分析指标属性或分析指标属性与常量按照一定的计算规则组成一个新的分析指标,计算规则应包括常用的数学计算(加、减、乘、除等)及常用的聚合运算(如总计、计数、平均、最大值、最小值等)。呈现的结果支持曲线、饼图、柱状等不同类型,。例如:一个2G客户群,自带属性包括,基本套餐生效日期(月)、基本套餐细类(月);通用属性包括,性别、校园WLAN上网网流量(日)、所在学校、校园WLAN上午流量、基本套餐生效日期、年龄、3G网络移动数据上网流量(日)、手机终端基本特征(月)、通话费用。用户在选定需要分析的维度、指标后,分析页面根据不同类型的维度、指标组合展示不同的图表。高级分析用户可以将多个自助分析结果保存为分析报告,进行输出。分析报告可以被该客户群套用以生成不同周期清单的分析结果,分析报告也可以被其他规则相似的客户群套用。标签/用户群组合运算提供标签和客户群之间的运算能力,用户可通过对已有标签和客户群进行交、并、剔除运算,生成新的客户群。排行榜 展示系统热门标签、系统热门客户群、最新发布标签、最新发布客户群,并可根据近一周、近一个月、近三个月查询排行。具体排行均默认展现TOP99。系统热门标签 支持以系统热门标签列表形式,展示标签名称和使用次数,按照系统使用次数从高到低显示前99个标签。系统热门客户群 支持以系统热门客户群列表形式,展示客户群名称、客户群规模和使用次数,按照系统使用次数从高到低显示前99个客户群。最新发布标签 支持以最新发布标签列表形式,展示标签名称、发布时间,按照发布时间从近到远显示前99个标签。最新发布客户群 支持以最新发布客户群列表形式,展示客户群名称、客户群规模、修改时间,按照发布时间从近到远显示前99个客户群。客户标签体系构建客户标签基于对经分、Gn、Mc等多中数据源的采集,通过显性化处理、数据统计分析、模型挖掘三种方式,以《一体心理学》理论为依据,从自然属性、心理属性、社会属性三个维度构建完整的客户评价体系,对内可提升湖北移动个性化场景运营支撑能力、推动企业内部生产的精细化和智能化转型;对外可通过标签数据的开放提供基础信息服务能力,助力企业数据价值变现。数据采集:从湖北移动大数据平台或从各运营支撑系统直接采集数据处理:依托于湖北大数据平台的数据处理与挖掘分析能力,完成从原始数据向客户标签的转化过程,生成各类标签数据标签体系:以《一体心理学》理论为依据,从自然属性、心理属性、社会属性三个维度构建客户标签体系标签应用:对内以支撑互联网运营中心及市场部精细化场景运营;对外通过标签数据的开放,助力企业数据价值变现本期项目将从互联网运营中心实际业务需求为出发点,针对客户自然属性和心理属性标签进行建设,重点满足对终端、流量套餐、数据业务产品的精细化场景营销支撑要求。客户标签属性划分《一体心理学》认为人是自然性、心理性和社会性的统一体,要真实、全面、本质的对人进行描述,可从自然属性、心理属性和社会属性入手。客户标签分类体系本质上是对客户的全方位、客观真实的研究,与《一体心理学》的方向及观点一致,因此可借鉴《一体心理学》中的相关理论及结论,将客户标签体系一级类别划分为三大类,如下图所示:自然属性,主要描述客户外在的、客观自然的属性;心理属性,主要描述统计客户内在的、心理活动层面的属性;社会属性,主要描述人从属于社会系统、人与外界事物的关系属性。综上,自然属性和心理属性主要针对个人情况的描述,即标签的主体对象即用户个人,社会属性标签强调个人与外部事物关系或逻辑的描述,即标签的主体对象包括用户个人和其他外部事物。自然属性标签客户自然属性标签构建的目的是为了客观直接地对人物外在特征进行描述,湖北移动数据现状及互联网客户标签特征,本期项目将从基本信息、通信信息、互联网信息、人生阶段、身份特征五个维度对客户自然属性进行分析。个人信息:基于经分系统用户注册数据直接提取,用于描述客户的外在基本属性。包括:姓名、性别、年龄、身份证号、教育水平、家庭地址等;通信信息:基于经分及VGOP业务使用及订购信息进行标签化处理生成,用于描述客户的基本通信特征。包括:手机号码、通信消费能力、通话时长、上网时长、上网流量、常用终端型号等互联网信息:基于爬虫工具和Gn流量话单进行处理生成,用于描述客户的基本上网特征。包括:社交账号、电子邮箱、常用网站、常用论坛、常用APP、上网活跃时间段、常用手机端支付方式等心理属性标签客户心理属性标签构建主要是通过对用户上网行为的分析和挖掘,从行为特征、性格特征、偏好特征三个维度发现客户内在的心理活动特征和需求。行为特征:基于爬虫工具、Gn流量话单、经分等多种数据源进行处理生成,用于分析和挖掘客户内在的通信和上网行为特征,支撑客户维系、信用评估等运营活动的开展。包括:离网预警、欠费预警、销户预警等;性格特征:基于爬虫工具和Gn流量话单进行处理生成,用于分析和挖掘客户内在性格特征,支撑精细化营销工作开展。包括:追新型、保守型、果断型、犹豫型等偏好特征:基于爬虫工具和Gn流量话单进行处理生成,用于描述客户显性和隐性的生活需求,可支撑对内精细化营销工作开展和对外数据开放运营。包括:衣着偏好、美食偏好、出行方式、娱乐方式等。社会属性标签客户社会属性标签构建主要是通过对用户上网行为的分析和挖掘,从人物画像、家庭圈、社交圈三个维度描述客户在社会系统中的位置以及人与人之间的联系。人物画像:通过对爬虫信息和Gn流量话单进行特征挖掘,从身份特征、人生阶段进行客户特征画像,用于描述客户的“隐性”特征。家庭圈:通过Mc和Gn话单进行通话及上网信息挖掘,总结客户家庭圈特征。如:家庭圈大小、成员职业构成、成员背景、经济能力等。社交圈:通过Mc和Gn话单进行通话及上网信息挖掘,总结客户社交圈特征。如:社交圈大小、成员职业构成、成员背景、经济能力等。客户标签描述终端类标签功能描述4G终端用户换4G终端用户标签通过潜在换4G终端识别模型,对存量4G终端用户进行预测根据模型算法分析最终输出潜在换4G终端的4G终端用户列表。非4G终端用户换4G终端用户标签通过潜在换4G终端识别模型,对存量非4G终端用户进行预测根据模型算法分析最终输出潜在换4G终端的非4G终端用户列表。终端机型偏好标签用户终端机型偏好模型通过建立潜在用户与定制终端的适配关系,根据用户对终端的偏好的分进行标签划分,最终输入终端机型的偏好用户。流量类标签功能描述流量超套用户标签通过潜在流量超套用户识别模型,对存量用户进行预测根据模型算法分析最终输出潜在流量超套用户列表。流量维持用户标签通过潜在流量维持用户识别模型,对存量用户进行预测根据模型算法分析最终输出潜在流量维持用户列表。流量下降用户标签通过潜在流量下降用户识别模型,对存量用户进行预测根据模型算法分析最终输出潜在流量下降用户列表。自有业务偏好标签功能描述139邮箱偏好用户标签通过自有业务配置模型,对存量用户进行139邮箱偏好预测根据模型算法分析最终输出用户对139邮箱的偏好得分,根据得分进行排列推荐。根据用户的偏好得分进行划分,最终输出139邮箱偏好用户。飞信偏好用户标签通过自有业务配置模型,对存量用户进行飞信偏好预测根据模型算法分析最终输出用户对飞信的偏好得分,根据得分进行排列推荐。根据用户的偏好得分进行划分,最终输出飞信偏好用户。和视频偏好用户标签通过自有业务配置模型,对存量用户进行和视频偏好预测根据模型算法分析最终输出用户对和视频的偏好得分,根据得分进行排列推荐。根据用户的偏好得分进行划分,最终输出和视频偏好用户。和动漫偏好用户标签通过自有业务配置模型,对存量用户进行和动漫偏好预测根据模型算法分析最终输出用户对和动漫的偏好得分,根据得分进行排列推荐。根据用户的偏好得分进行划分,最终输出和动漫偏好用户。咪咕音乐偏好用户标签通过自有业务配置模型,对存量用户进行咪咕音乐偏好预测根据模型算法分析最终输出用户对咪咕音乐的偏好得分,根据得分进行排列推荐。根据用户的偏好得分进行划分,最终输出咪咕音乐偏好用户。和游戏偏好用户标签通过自有业务配置模型,对存量用户进行和游戏偏好预测根据模型算法分析最终输出用户对和游戏的偏好得分,根据得分进行排列推荐。根据用户的偏好得分进行划分,最终输出和游戏偏好用户。和地图偏好用户标签通过自有业务配置模型,对存量用户进行和地图偏好预测根据模型算法分析最终输出用户对和地图的偏好得分,根据得分进行排列推荐。根据用户的偏好得分进行划分,最终输出和地图偏好用户。热点内容偏好标签功能描述视频类内容偏好用户标签通过热点内容配置模型,对存量用户进行视频类偏好预测根据模型算法分析最终输出用户对视频类内容的偏好得分,根据得分进行排列推荐。根据用户的偏好得分进行划分,最终输出视频类内容偏好用户。音乐类内容偏好用户标签通过热点内容配置模型,对存量用户进行音乐类偏好预测根据模型算法分析最终输出用户对音乐类内容的偏好得分,根据得分进行排列推荐。根据用户的偏好得分进行划分,最终输出音乐类内容偏好用户。社交类内容偏好用户标签通过热点内容配置模型,对存量用户进行社交类偏好预测根据模型算法分析最终输出用户对社交类内容的偏好得分,根据得分进行排列推荐。阅读类内容偏好用户标签通过热点内容配置模型,对存量用户进行阅读类内容偏好预测根据模型算法分析最终输出用户对阅读类内容的偏好得分,根据得分进行排列推荐。根据用户的偏好得分进行划分,最终输出阅读类偏好用户。 游戏类内容偏好用户标签通过热点内容配置模型,对存量用户进行游戏类内容偏好预测根据模型算法分析最终输出用户对游戏类内容的偏好得分,根据得分进行排列推荐。根据用户的偏好得分进行划分,最终输出游戏类内容偏好用户。用户运营类标签功能描述潜在4G用户流失标签通过潜在4G用户流失识别模型,对存量4G用户进行预测根据模型算法分析最终输出潜在4G流失用户的列表。潜在4G用户新增标签通过潜在4G用户新增识别模型,对存量非4G用户进行预测根据模型算法分析最终输出潜在新增4G用户的列表。渠道偏好标签功能描述错误重定向渠道偏好用户标签通过渠道配置模型,对存量用户进行错误重定向渠道偏好预测根据模型算法分析最终输出用户对错误重定向渠道的偏好得分,根据得分进行排列推荐。根据用户的偏好得分进行划分,最终输出错误重定向渠道偏好用户。Toolbar渠道偏好用户标签通过渠道配置模型,对存量用户进行Toolbar渠道偏好预测根据模型算法分析最终输出用户对Toolbar渠道的偏好得分,根据得分进行排列推荐。根据用户的偏好得分进行划分,最终输出Toolbar渠道偏好用户。微信渠道偏好用户标签通过渠道配置模型,对存量用户进行微信渠道偏好预测根据模型算法分析最终输出用户对微信渠道的偏好得分,根据得分进行排列推荐。根据用户的偏好得分进行划分,最终输出微信渠道偏好用户。互联网渠道偏好用户标签通过渠道配置模型,对存量用户进行互联网渠道偏好预测根据模型算法分析最终输出用户对互联网渠道的偏好得分,根据得分进行排列推荐。根据用户的偏好得分进行划分,最终输出互联网渠道偏好用户。掌厅渠道偏好用户标签通过渠道配置模型,对存量用户进行掌厅渠道偏好预测根据模型算法分析最终输出用户对掌厅渠道的偏好得分,根据得分进行排列推荐。根据用户的偏好得分进行划分,最终输出掌厅渠道偏好用户。支付宝渠道偏好用户标签通过渠道配置模型,对存量用户进行支付宝渠道偏好预测根据模型算法分析最终输出用户对支付宝渠道的偏好得分,根据得分进行排列推荐。根据用户的偏好得分进行划分,最终输出支付宝渠道偏好用户。飞信渠道偏好用户标签通过渠道配置模型,对存量用户进行飞信渠道偏好预测根据模型算法分析最终输出用户对飞信渠道的偏好得分,根据得分进行排列推荐。根据用户的偏好得分进行划分,最终输出飞信渠道偏好用户。邮箱渠道偏好用户标签通过渠道配置模型,对存量用户进行邮箱渠道偏好预测根据模型算法分析最终输出用户对邮箱渠道的偏好得分,根据得分进行排列推荐。根据用户的偏好得分进行划分,最终输出邮箱渠道偏好用户。百度渠道偏好用户标签通过渠道配置模型,对存量用户进行百度渠道偏好预测根据模型算法分析最终输出用户对百度渠道的偏好得分,根据得分进行排列推荐。根据用户的偏好得分进行划分,最终输出百度渠道偏好用户。客户标签数据接入设计客户标签的数据分为内部系统或者外部系统接入,内部系统包括:经分数据、VGOP平台数据、流量平台数据等等,外部系统包括:互联网爬取到的数据,客户行为数据,客户位置数据,行业数据等等。客户标签的数据全部汇集到大数据中心,探索平台通过Hive直接连接大数据中心,使用客户标签原子数据进行挖掘。所有接入的客户标签来源数据需要统一集中到数据中心。由数据中心完成数据的开发流程,即数据的清洗和准备,准备好的数据作为指标宽表存储在数据仓库。探索平台根据相关标签的需求,对客户标签原子数据进行数据挖掘。通过样本数据提取、模型指标的探索及构建、算法参数探索、模型训练、效果检验和模型优化等步骤完成客户标签的挖掘,最终生成客户标签用户群。标签展示和使用的时候,根据标签定义信息,到COC存储库中提取相应的标签数据,来进行客户群提取。标签平台按照标签的周期,通过定时的调度,到标签挖掘库中获取相应的标签。然后,根据配置好的规则,算出标签的值,作为标签宽表存储在数据中心的COC存储库中。内容管理建设内容 功能概述内容管理中心是基于互联网的内容素材,建立内容信息为主的互联网标签体系,并将套餐、APP、号卡、终端等产品信息和自由业务和第三方业务等业务信息与内容标签建立关系,作为营销系统的营销产品的来源,助力互联网渠道的精准营销。互联网数据采集接收互联网采编请求ICA获取最新的采编需求,执行采编任务。接收内容:用户选择的采集范围ID、采编频率、采编周期。定向爬取根据用户选择的采编范围ID,调用爬取模板,例如用户在模板上选择的爬取范围为“音乐-百度音乐-音乐库-新歌榜”,用户选择的爬取周期为“周更新”。调用爬取模板,生成待爬取URL进行内容爬取。对于爬取失败的URL,将放在爬取队列中,再次进行爬取,第二次再爬取失败会将此URL进行丢弃。爬取程序会保存爬取日志,包含爬取URL个数,爬取成功个数,爬取失败个数,以及具体失败的URL。爬取结果生成文件爬取结果以文件方式生成至指定目录下,供内容管理中心使用。互联网爬虫功能 通过网站内容进行识别和文本处理、语义分析,对网站发布的营销活动的访问量、影响力和用户反馈及评论的分析,辅助营销活动效果评估,指导后续营销活动开展。 通过采集和分析一些有影响力的社会化媒体如新浪微博、百度贴吧、天涯社区(营销活动影响力信息),监控和分析企业自身以及竞争对手营销活动,有助于提升企业的自身营销。 互联网爬取的功能框图如下:网站爬取定向爬取提前针对网站开发爬取模板,在爬取时调用该网站模板,可针对性抽取主要的参数和属性,亚信的定向爬取目标的爬取效率为每秒钟150个网页。全量爬取对网页中的文本进行分段抽取,抽取title、kewords等网页关键字,不必开发爬取模板,所有网页都适用。深度爬取对于同一个网站,会包含许多链接子网站。针对网站进行爬取,支持将往网站中的所有链接子网站进行深度爬取.将网站下所有子网站的内容也爬取出来。动态爬取目前网站技术和内容多种多样,会包含静态和动态网站。针对动态网站(如AJAX生成的网站)进行定制爬取。爬取处理网页合并有的网站内容需要进行多个页面的合并,例如商品的信息在商品列表,商品的详情首页,商品的参数页都会有,需要把多个页面的结果合并。网页去噪针对于非结构化网页,采用先去嗓(剔除网页页面四周无意义的信息,包括广告、推荐),提高爬取内容的有效性。爬虫防封策略由于现互联网环境下的各网站均设置了反爬虫策略,且对爬虫IP的检索和查封力度不断加大,网站对于爬虫IP的识别主要通过一段周期内的访问频率而定,故配置爬虫集群对同一网站页面信息爬取的频率(如每IP对同一页面每小时爬取限定1次)可有效解决爬虫IP被封的风险。模拟登陆有些网站的资源信息需要登录才可以访问和采集,例如小米、魅族等电商网站。通过模拟登录,用于突破账号限制采集数据。还原用户原始UA信息判断用户实际上网环境的UA设置,并还原实际UA信息进行网页爬取。模板配置开发定向爬取的模板,完善定向爬取模板库,包括各类如音乐类、图书类、影视类、电商类、商户类等主流的网站,网站样式更新后,会及时调整对应模板。模板调用当定向增加爬取的网站时,需要配置相应网站对应模板。然后调用模板,通过程序实现页面元素的抽取工作。数据接入根据指定格式适配输入格式,包括爬虫接入数据格式和外部配置的爬虫参数等。数据输出将输出结果按照客户要求的格式进行存储,并存储到要求的介质上。输出介质支持文本、关系型数据库、HDFS等多种。文件接口根据数据存储的输出介质,灵活定义接口。爬取地址的过滤策略对爬取范围内的非目标网页进行过滤,剔除无意义的网页,提升爬取价值,适用于全量爬取。爬取机制定时处理用于控制爬虫程序周期性的定时启动。更新机制针对定向爬虫用户可自定义更新需求,爬虫将按周期更新爬取结果,保障及时的获取互联网资源,适用于定向爬取。网页文本解析文本抽取提取用户访问网页的内容,针对于非结构化网页,采用先去嗓(剔除网页页面四周无意义的信息,包括广告、推荐),而后对网页中的文本进行分段抽取(标题、时间、正文)。资源抽取对行业权威网站爬取,抽取对应资源的主要属性和参数,多采用模版抽取方式,即每个资源对应一种模版,将对应信息形成资源标签体系,以便在网页解析时了解用户对什么资源感兴趣。亚信在文本解析上积累了多年经验,采用先进的自然语言处理技术(NLP),通过特定的方法,不仅能基于中文词汇对爬取下的网页内容进行良好的切分,更能运用上下文关联和机器学习,对新词进行发现。还可以针对分词匹配产生词库数据进行频率统计。中文分词对网页抽取的内容文本进行智能分词,可通过以内容标签为基础的分词词库进行辅助,以确定网页内容语意方向。语义解析根据网站文本信息分词,通过文本语义信息特征进行解析分类。分类聚类支持将分析网站中的文本信息自动识别出来,按照已经定义好的类别进行匹配;支持将分析网站中多篇文章或文本信息进行相似性的比较,将比较相似的文章或文本信息归为同一类。全文搜索支持用户对关注的相关信息进行搜索,满足条件的所有相关网站信息或新闻信息都能够取到。依赖于积累的搜索库信息。网页分类通过URL对应网页的爬取、信息抽取、分类后形成URL分类实例进行保存。爬取内容加工对爬虫爬取的内容进行二次加工,使其成为可直接使用的素材。集群管理消息分发通过消息分发机制,实现爬虫分布式管理,可根据爬取需求动态增加节点。集群管理支持对爬虫分布式集群管理。效率提升互联网内容深度采编基于原有一期采集范围基础上,爬取内容增加资源简介和资源图片等信息。其中图片信息存储支持多种方式,包括以图片链接方式、以图片二进制码流方式、将图片保存到本地服务器等。采集图片信息对于流量消耗、本地服务器容量均会有影响,实际需根据用户的需求和项目情况而定。互联网内容广度采编系统可以通过配置文件,限定爬虫的采集路径,控制不同网站的采集深度,支持深度优先遍历策略、广度优先遍历策略、宽度优先遍历策略、反向链接数策略等采集策略。系统支持7*24小时全天候不间断的自动采集功能。在一期采集范围基础上,增加下列网站的定向爬取功能:网站分类网站名称网站信息阅读多看阅读图书名称、作者等详细信息懒人听书书旗小说塔读文学网易云阅读苏宁阅读QQ创世小说QQ云起小说起点中文小说网百度纵横小说视频土豆视频名称、简介、主演等详细信息腾讯pptv时光网豆瓣迅雷看看音乐类QQ音乐音乐名称、演唱者等详细信息电商类凡客商品名称、分类、价格等详细信息京东商城一号店乐蜂网易迅网淘宝互联网热点采编对于互联网热点信息的爬取,爬虫系统打破各网站对爬虫的封锁和移动端对采集的制约,实现高质量的抓取,具有如下特征:信息采集面广:不但支持四大信息源(网络社区、网络媒体、博客网站、SNS社区),还支持微信、移动APP等信息抓取信息采集层级深:支持对指定网络媒体进行深层次数据采集采集数据类型多:支持表、文本、图、语音、视频等结构化、半结构化和非结构化数据采集采集频率可定制:支持自定义信息采集数据源及采集频率通过丰富的流处理、大数据处理技术应用到数据抓取及处理过程中,提升热点数据采集与处理的及时性,具有如下特征:数据源实时采集:利用流处理技术完成数据源实时采集数据实时处理:利用流处理、大数据计算完成数据实时处理实时分析:完成对突发事件、热点事件的实时分析内容管理内容管理模板化分阶段实现内容素材的模板化,满足IAB广告素材的规范要求和《中国移动互联网广告标准》中的接口要求。素材分类管理按照素材的类别实现分类管理,如视频广告素材、网幅广告素材、文本链接素材、富媒体素材等。支撑实现现有的营销位进行识别适配。素材预审支持素材的接入管理和广告素材的预审,规避不合法不合规的素材应用于广告。内容管理提升素材查看:可通过选择素材类型等,实现素材选定,通过点击,查看素材内容。素材模糊查询:可通过关键字、素材类型筛选进行素材模糊查询,支撑一线策划人员快速定位所需素材。挖掘算法协同过滤算法开展产品智能推荐,可借鉴互联网公司开展协同过滤算法挖掘产品目标用户。如果您现在想看个电影,但不知道具体看哪部,您会怎么做?可能绝大部分人会请周围朋友推荐,从口味类似的朋友处得到的推荐更有效,此为协同过滤的核心思想。协同过滤(CollaborativeFiltering,简称CF),一般是在海量的用户中发掘出一小部分和你品位比较类似的,在协同过滤中,这些用户成为邻居,然后根据他们喜欢的其他东西组织成一个排序的目录作为推荐给你。实现协同过滤算法的三个核心步骤:收集用户偏好、找到相似的用户或物品、计算推荐收集用户偏好用户偏好要素由显示和隐式两部分组成:在实际分析中,用户偏好收集工作已在用户偏好分析节完成找到相似的用户或物品基于用户的协同过滤,通过不同用户对物品的评分来评测用户之间的相似性,基于用户之间的相似性做出推荐。简单来讲就是:给用户推荐和他兴趣相似的其他用户喜欢的物品。其中,主流的相似度计算模型包括:欧几里德距离(EuclideanDistance)、皮尔逊相关系数(PearsonCorrelationCoefficient)、Cosine相似度(CosineSimilarity)、Tanimoto系数、余弦相似度Cosine-basedSimilarity基于用户相似度的推荐原理基于用户的CF的基本思想相当简单,基于用户对物品的偏好找到相邻邻居用户,然后将邻居用户喜欢的推荐给当前用户。计算上,就是将一个用户对所有物品的偏好作为一个向量来计算用户之间的相似度,找到K邻居后,根据邻居的相似度权重以及他们对物品的偏好,预测当前用户没有偏好的未涉及物品,计算得到一个排序的物品列表作为推荐。基于物品相似度的推荐原理基于物品的CF的原理和基于用户的CF类似,只是在计算邻居时采用物品本身,而不是从用户的角度,即基于用户对物品的偏好找到相似的物品,然后根据用户的历史偏好,推荐相似的物品给他。从计算的角度看,就是将所有用户对某个物品的偏好作为一个向量来计算物品之间的相似度,得到物品的相似物品后,根据用户历史的偏好预测当前用户还没有表示偏好的物品,计算得到一个排序的物品列表作为推荐。图3给出了一个例子,对于物品A,根据所有用户的历史偏好,喜欢物品A的用户都喜欢物品C,得出物品A和物品C比较相似,而用户C喜欢物品A,那么可以推断出用户C可能也喜欢物品C。计算推荐计算推荐的过程,实际上就是根据相似度矩阵给用户推荐物品的过程,也是用户偏好挖掘的过程。下面以应用偏好为例说明。聚类算法聚类分析用户已有通信和上网行为区分出不同的消费群体来,聚类分析以相似性为基础,按照某个特定标准(如距离准则)把一个数据集分割成不同的类或群组,使得同一群组内的数据对象的尽可能相似;不同群组内的数据对象具有明显的区别。k-means是划分方法中较经典的聚类算法之一,以k为参数,把n个对象分成k个簇,使簇内具有较高的相似度,而簇间的相似度较低;首先,随机地选择k个对象,每个对象初始地代表了一个簇的平均值或中心;对剩余的每个对象,根据其与各簇中心的距离,将它赋给最近的簇;然后重新计算每个簇的平均值;这个过程不断重复,直到准则函数收敛。关联分析关联分析是一种简单、实用的分析技术,就是发现存在于大量数据集中的关联性或相关性,从而描述了一个事物中某些属性同时出现的规律和模式。关联分析是从大量数据中发现项集之间有趣的关联和相关联系。关联分析的一个典型例子是购物篮分析。该过程通过发现顾客放人其购物篮中的不同商品之间的联系,分析顾客的购买习惯。通过了解哪些商品频繁地被顾客同时购买,这种关联的发现可以帮助零售商制定营销策略。其他的应用还包括价目表设计、商品促销、商品的排放和基于购买模式的顾客划分。Apriori算法是挖掘产生布尔关联规则所需频繁项集的基本算法,也是最著名的关联规则挖掘算法之一。Apriori算法就是根据有关频繁项集特性的先验知识而命名的。它使用一种称作逐层搜索的迭代方法,k—项集用于探索(k+1)—项集。首先,找出频繁1—项集的集合.记做L1,L1用于找出频繁2—项集的集合L2,再用于找出L3,如此下去,直到不能找到频繁k—项集。找每个Lk需要扫描一次数据库。产品适配管理建设思路平台用户中心产品适配管理模块通过与本地相关产品进行适配使用,如数据业务、流量产品和终端等。通过客户标签适配用户群供业务人员进行精准营销使用。产品适配管理模块与现有营销活动策划流程集成方案如下:客户群管理模块生成用户群的同时,将用户群列表同步至产品适配模块,产品适配模块与本地产品进行适配,业务人员对适配的产品进行精准营销。业务人员在策划营销活动过程中,产品适配模块支持通过2种方式输出产品推荐建议——基于客户标签预测的潜在产品需求推荐列表。——基于客户偏好得分的产品偏好得分列表。数据业务适配数据业务产品适配,通过对数据业务的分析适配出潜在需求数据业务的用户群,把预测的用户群同步到产品适配模块中,业务人员可以根据用户群对数据业务进行精准营销。如飞信、139邮箱等数据业务。流量产品适配流量产品适配,通过对流量产品的分析适配出潜在需求流量产品的用户群,把预测的用户群同步到产品适配模块中,业务人员可以根据用户群对流量产品进行精准营销。如流量加油包、流量套餐等流量产品。终端适配终端适配,把终端机型偏好标签用户数据同步到产品适配中,业务人员可以通过预测的终端机型偏好进行终端的个性化运营。外部接口与大数据中心接口数据探索,从大数据中心获取客户标签的所有原子数据,包括用户基础信息数据、用户上网行为信息数据、用户通话行为数据、用户资费信息数据等。这些客户原子数据都是通过B域、O域和M域数据汇集到大数据中心,数据探索通过Hive数据库直接获取。与内容中心接口数据探索,进行客户标签挖掘时需要使用一些互联网方面的数据,需要从内容中心提取用户的互联网内容浏览行为以及APP使用行为等数据。内容中心的数据汇集到大数据中心,数据探索通过Hive数据库直接获取。与营销管理平台接口通过协同营销接口实现互联互通,可实现营销管理平台营销活动在互联网渠道的部署,并回传互联网渠道宣传接触等数据至营销管理平台。时机管理建设内容功能概述时机管理中心主要是对多时机事件源进行处理,引入流计算、分布式内存等数据处理技术,接收各类实时事件源的基础数据并进行解析,同时对实时时机事件进行累积计算,最终将实时复杂事件数据及标签数据加载到分布式内存中,进行符合规则的用户匹配。事件采集 事件是有一定意义的信息集合,是用户所表现出来的带有明确指向性的特征或者社会群体性特征。它由事件中心采集触发,根据预定义的事件规则识别,并由事件中心决定下一步采取动作。 互联网使用事件的采集,包括访问网站类型、使用APP的数据信息,包括,手机号、IMSI、时间、接入方式、承载层协议、业务使用方式、网站类型、应用协议、APP类型、上行流量、下行流量、接入点、计费ID。 业务办理事件的采集,包括订购/退订、渠道接触、过户、用户换卡的数据信息,包括手机号、IMSI、事件类型、事件时间、产品编码。 业务使用事件的采集,包括用户位置、通话行为、短信行为、开、关机行为的数据信息,包括手机号、IMSI、事件类型、事件时间、产品编码,包括手机号、信令时间、主叫号码、被叫号码、主叫IMSI、被叫IMSI、协议、事件类型、当前小区、目前小区、事件结果、通话时长。 基于对评估监测中的指标进行监测,需要从各个渠道执行反馈的结果中获取相应的数据信息。事件标准化 支持对各个事件源系统差异化的事件格式进行标准化转换,转换为统一化的事件体结构,即包含多个差异化事件体转化为标准事件体的逻辑。包括互联网使用事件标准化、业务办理事件标准化、业务使用事件标准化。事件解析 对互联网使用事件、业务办理事件、业务使用事件的数据信息,进行解析转译。支持对标准化事件数据根据事件规则进行内容解析,解析内服包括事件策略解析引擎信息、同步异步标志。支持对实时数据进行加、减、汇总等数据运算之后,形成目标事件。支持所有原始事件以及之前运算得到的事件作为事件运算的数据源。事件分发 对互联网使用事件、业务办理事件、业务使用事件的数据信息,进行分发。支持根据事件解析结果将事件分发给相应的事件营销策略解析引擎;支持同步、异步传输机制;支持单事件分发和批量事件分发。事件规则管理 事件规则定义、审批、监听与评估、辅助管理。事件规则定义 描述事件触发生成的规则和条件,由事件中心把采集到信息与事件规则进行过滤匹配,当满足某事件的规则条件时就会触发该规则事件。事件监听与评估 事件监控是指以准实时的方式分析事件中心的日志数据,对事件中心中的各类事件进行监测,能方便的查看到某一个时间区内,各类事件己触发状态以及待触发状态的整体情况。 事件评估是指结合营销管理平台的营销策略以及营销执行结果数据,以事件为中心的各类统计和评估报表。事件辅助管理 指实现事件的查询、编辑、上下线、停用、以及版本管理等基本功能,业务人员可以快速修改事件各种属性,做好事件库的基础管理工作。事件规则库 事件规则库分为:通讯类、位置类、上网行为类、客户接触类、业务办理类、用户状态变更类。规则配置流程 根据实时营销的场景,进行原子事件的开发,并注册原子事件,通过API接口将规则预制到事件处理中心。营销业务人员在营销策划时,通过界面将原子事件组合成实例,营销管理平台通过API接口提交实例到事件处理中心。触点管控建设内容功能概述在一期已经实现的网厅接入基础上,拓展和丰富接入渠道的种类,包括自有渠道(错误重定向、Toolbar、微信、掌厅、飞信、邮箱、短信后缀、红包、政企渠道)和合作渠道(广告联盟、百度、支付宝),提供多元化的营销渠道,在互联网渠道上向客户进行信息的推广和宣传,拓展营销方式,提升客户感知、降低客户投诉,在竞争中赢得主动,提升企业竞争力。渠道接入在一期接入了网厅基础上,二期扩展和丰富接入渠道的种类。接入九个渠道,包括错误重定向、Toolbar、微信、邮箱、掌厅、飞信、支付宝、DSP广告联盟、百度。渠道接入管理触点管理中心提供渠道接入管理功能,可统一管理接入互联网集中运营平台的前端渠道。确保前端渠道接入的规范性、安全性。渠道创建:渠道申请接入互联网集中运营平台后,由场景管理中心通过调用触点管理中心的渠道创建服务为渠道创建渠道号,并生成接入认证Key。渠道接入认证:渠道调用触点管理中心接口时,需要传入渠道号和认证Key,由触点管理中心对接入渠道进行认证,认证通过予以访问。同时为了保证系统对接的风险,将为每个渠道约定一个32位的MD5加密串,防止非法渠道恶意操作。接入渠道管理:可查看已接入的渠道,并对渠道配置描述信息。渠道的管理功能开放给场景管理中心,运营人员可在场景管理中心后台即可操作管理功能。渠道管理采用统一中心库中心表,管理系统和前台应用系统(包括跨子系统)均在一个数据库中操作,减少表与库之间的数据同步造成的数据实时和数据安全。渠道接入方式内部渠道接入方式可支持的内部渠道接入方式包括:

1、接口方式:系统提供webservice,Rest

两种接口,系统对于接口业务的处理采用异步队列处理模式,防止由于接口阻塞造成的系统异常。异步队列工作模式如下图:首先接口的处理流程采用异步模式,调用方不用等待业务真实处理完成,而是将业务调用的指令发出后立即反馈调用方,避免由于接口阻塞造成的系统响应超时。而接口的真实处理采用多种业务队列并发的方式排队处理,也就是说相同的业务处理同步,但是不同的业务并发处理的模式进行处理。2、页面方式:提供PC标准页面接入和终端页面接入(兼容ios和安桌)。短厅只支持接口方式的接入。提供多接入方式的目的主要是方便渠道的快速接入,提供多样的接入方式在其它系统对接过程中,能尽量做到改造量的最小化,节约开发成本。内部渠道的定义:包括湖北移动电子渠道建设的内部电子渠道系统,如错误重定向,Toolbar、微厅,掌厅,邮箱,飞信等。错误重定向用户在手机端输入的网址链接错误后,跳出错误重定向页面。通过此页面上的频道,引导用户进行点击,达到营销的目的。Toolbar用户使用手机,进入某些指定的站点时,右下角跳出toolbar,从左往右依次提供四个频道,包括流量查询、优惠信息、热门影视、网站推荐。通过不同的频道,提供广告位,在互联网渠道上向客户进行信息的推广和宣传。微信打开湖北移动的微信公众号时,营销广告位会自动加载数据,调用触点管理系统的服务(包括页面和接口两种方式),触点系统会根据渠道关键信息传入的参数(URL或接口入参),如营销位的位置,用户号码,渠道编号,日期等,自动去处理营销位应该加载的广告位信息,并通过不同的请求方式(页面方式则直接post页面,接口方式则返回出参由渠道自己渲染)返回渠道。移动互联网终端页面,考虑到适配多系统多适配的情况,返回页面采用HTML5+CSS3进行页面反馈。掌厅登录掌厅APP,首页上的图片营销位,渠道接入方式同微信的接入。短信后缀通过移动自有短信端口发送提醒、服务等短信通知时,后缀相关宣传信息。示例:尊敬的**客户:您已开通了**业务,您还可通过编辑**发送到10086办理**业务。中国移动。红包新增红包营销位接入,实现相关素材配置功能。政企渠道包括聪明号簿、兴业云等政企业务渠道接入。外部渠道接入方式外部渠道的定义:包括湖北电子渠道以外的外部系统,如支付宝,百度,DSP广告联盟等等。外部渠道接入方式:1、接口方式:系统提供webservice,Rest

两种接口,系统对于接口业务的处理采用异步队列处理模式,防止由于接口阻塞造成的系统异常。2、页面方式:提供PC标准页面接入和终端页面接入(兼容ios和安桌)。和内部系统接入的区别在于,内部系统在物理域和外部接入系统分开建设。外部对接系统由于开放在互联网公网出口域下,需在系统之上建设安全防护方案,考虑对接安全和风险控制。具体措施如下:针对于外部系统的接入增加IP安全拦截、防欺诈访问安全管控措施确保外部渠道接入的安全性。渠道接入安全策略访问安全:监控的对象主要为业务类对象,如当前参加某活动的访问数,业务数据动态跟踪,访问端详情。活动访问数:主要为当前活动的PV,UV等,纬度以业务为对象,分析整个业务是否正常运行,如在活动开展时间点上,PV和UV为0,则系统将可能存在问题;业务数据动态跟踪:主要为对某活动的业务的业务关键点进行实时跟踪,如某正在开展的秒杀活动当前已秒杀的数量,剩余数量,数量变化曲线等业务关键点;访问端详情:主要从客户端为关注点,关注周期内客户端访问的数据情况,对客户端IP,时间,频率等进行统一管理和查看,为后续安全策略加固提供数据参考。安全策略配置:通过多纬度的数据作为参考,提供配置页面对系统安全类进行配置管理。配置管理的对象暂定为对接入端进行控制,对IP进行控制,对号码进行控制以及达到配置阀值后,根据安全库策略进行安全隔离和报警。对IP进行控制:客户端IP在配置的特定时间段内如达到配置的阀值,将自动阻断该IP访问系统,并产生告警短信发送至管理员;对号码进行控制:配置号码黑/白名单,在黑/白名单中的号码将在配置的时间段内不能访问系统,直到系统解锁或手动解锁。渠道接入实现方式页面嵌入实现样例:由触点中心提供一段js代码,互联网渠道根据情况做一些修改(如放入加密串)放置到主页面区域中(如放在预留区域的div中),JS会调用触点中心的服务进行验证,如鉴权成功,则创建相应的Iframe及推荐内容,填充到互联网渠道的主页面。首先,将以下js的引入放在要调用的页面的<head></head>中。<script src="http://ip:port/load.js"type=text/javascript></script>其次,当调用时首先创建一个js对象如下格式:<scripttype="text/JavaScript">/**加载营销推荐信息,需要传递参数有:互联网渠道编号、手机号、运营位编号(与合作式渠道约定)、渠道TOKEN/ 监听空数据:本接口提供emptyDataListener()方法监听加载页面后没有推荐的广告位时的事件,使用时在页面中声明一个emptyDataListener()方法,用来捕获此事件,如:渠道协同渠道协同调度能够提供基于全渠道的多协同营销服务能力,通过打通与渠道协同系统的接口,实现协同规则、协同任务和客户清单信息的同步。渠道协同调度是指针对营销执行任务,按照渠道协同规则和协同流程来实现跨渠道的营销执行,达到形成一致的客户体验的业务目标。渠道协同调度按照协同规则和协同流程分解营销执行任务,实现跨渠道的多波次的立体式营销,提供协同任务管理、协同流转、协同撤销功能。渠道协同配置渠道协同配置实现对协同规则和协同流程的管理。支持协同规则和协同流程的增加、删除、修改,发布最终配置好的协同规则到ComFrame工作流。可通过服务集成或页面集成的方式实现此能力。渠道协同质量管理 渠道协同质量管理,通过协同接触过滤、协同接触合并、质量规则配置,对各渠道上协同执行的营销服务,进行质量把控,保障多渠道共同完成营销任务的执行调度顺利执行下去。执行优先级决策 在渠道推送前,通过执行优先级决策,来控制执行渠道的优先级和渠道间的频次控制,降低跨渠道的营销活动,重复接触,重复打扰。多波次营销协同 对多波次营销进行营销渠道和营销频次的控制管理,加强多波次营销活动开展的能力,充分利用营销资源。广告排期管理互联网渠道排期管理是运营人员按照互联网渠道的信息推广策略,进行具体的互联网渠道运营计划安排,支持为指定渠道、指定运营位、指定时间,设置特定的推荐信息。支持对排期进行创建、修改、删除、查询;支持查询当前的渠道、运营位、时间的排期情况;支持选择互联网渠道和该渠道上的具体运营位;排期时段设置排期管理支持时段设置支持选择具体日期和时间段,最小可以支持到小时级,支持多个时间段的选择,支持连续时间段和不连续时间段选择:连续时间段选择:选择开始时间和结束时间,时间段内都进行指定信息的推荐;不连续时间段选择:选择若干个不连续的时间,在各个时间段内都进行指定信息推荐;排期地市设置排期管理支持地市设置支持省级排期和地市排期:省级排期:由省公司统一排期,全省客户在同一时间、同一运营位看到省公司统一排期的推荐信息;地市排期:由地市公司自行排期,不同地市客户在同一时间、同一运营位看到地市自行排期的推荐信息;投放频次策略设置排期支持投放频次的策略配置支持配置投放频次策略排期预览支持排期配置后的页面预览支持页面预览排期状态变更支持排期状态变更可对未进行中的排期停用;也可对停用的排期活动启用。排期审批可对未审批的排期进行审批支持对排期的审批;运营位管理触点管控模块提供营销位管理功能,可管理接入渠道的营销位,对渠道的营销位进行定义、分类和管理,并开放给营销平台管理使用。支持广告相关渠道多个运营位信息的配置,包括运营位编码、运营位名称、运营位类型(如:链接、广告位)、运营位描述等,如互联网渠道上可能有多个展现区域,每一个区域都可以称作运营位,不同的运营位可以放置不的推荐信息;支持图形、文本、图文方式的运营位;运营位详情查看查看运营位的详细信息,仅供查看。支持运营位信息的展示,包括运营位编码、运营位名称、运营位类型(如:链接、广告位)、运营位描述等运营位状态变更支持运营位状态变更。运营位状态包括:启用,禁用;禁用的运营位在排期中不可使用。运营位的类型可根据运营位的类型把所管理的运营位分为PC端运营位和移动端运营位,对不同的运营位进行分别管理。系统对于门户网站,网厅以及商城等通过PC端访问的运营位分配到PC端运营位里PC端图片示例:系统对于手机,Pad等移动终端访问wap,微厅等通过移动端访问的运营位分配到移动端运营位里移动端图片示例:广告素材管理广告素材是广告平台最终展现给用户的包含产品特征的图片或文字信息,用户通过广告素材的外在表现了解产品的内涵,触点管控模块负责管理系统中所有的素材,定义素材的名称、素材描述、素材跳转链接等。素材库建设支持素材库的管理和维护。支持素材分类和素材的新增,修改和删除。支持素材的查询,包括名称、素材文本信息、图片链接(可上传)、点击跳转链接、描述等信息。分渠道素材支持对不同渠道来源的素材的管理。支持素材信息,区分不同的渠道,进行录入、修改、删除。支持按照渠道分类,进行查询,包括名称、素材文本信息、图片链接(可上传)、点击跳转链接、描述等信息。图片类素材管理管理图片类型的素材。支持图片类素材信息的录入、修改、删除;素材信息包含:名称、图片链接(可上传)、点击跳转链接、描述等信息。文字类素材管理管理文字类型的素材。支持文字类素材信息的录入、修改、删除;素材信息包含:名称、素材文本信息、点击跳转链接、描述等信息。动画类素材管理管理动画类型的素材。支持动画类素材信息的录入、修改、删除;素材信息包含:名称、动画链接(可上传)点击跳转链接、描述等信息。素材预览查看素材的详细信息。支持素材详细信息的查看;可查看内容包含:名称、素材文本信息、点击跳转链接、描述等信息。素材的自适应对同类运营位的素材投放到广告页面,可以按照运营位尺寸的大小实现素材大小的自适应。支持投放素材对同等类型的广告位,实现自动收放功能,例如通栏类、按钮类审批流程优化优化活动审批界面:活动发布前,设置审批流程界面,在此界面中进行营销关键信息展示,支撑审批人决策。评估监测建设内容功能概述湖北移动互联网渠道一期仅对网厅的营销效果进行了监测评估,随着二期接入的互联网渠道更加丰富,需要进一步挖掘用户行为特征,评估监测模块需要从以下几个方面进行新增或者优化:增加分析维度,分析方法,多角度剖析营销位的流量情况和转化情况。提供实时的流量分析,包括趋势分析,访客分析、来源分析等。对多渠道,不同类型的监测数据,提供标准化的处理方法,并能够区分PC版,移动版等不同平台数据。提升评估监测模块界面体验。技术架构评估监测模块应用技术架构如下:趋势分析提供某个时间段内访客对营销渠道的访问情况,帮助了解该时间段内访客数和浏览量等指标。时间段选择及对比:可点击选择不同的时间段(今天、昨天、最近7天、最近30天,还可任选时间段),下面即展示不同时段的数据。还可选择与其他时间段进行对比:选择对比之后下面的折线图即可展示两个时间段的对比趋势图。指标切换:点击“按流量分析”“访客分析”“按吸引力分析”“按转化分析”,即可展示相应的指标数据。“按转化分析”中展示的转化次数及转化率为所设置转化页的总转化次数及转化率。指标注释:鼠标移动到相应指标旁边的问号即可显示指标的口径解释。指标图表展示筛选:筛选不同的指标,下方的趋势图即可展示指标的趋势变化。选择某一天时,折线图显示的每个小时的趋势。选择一个时间段是,折线图显示的是每天的趋势情况。自定义指标:在此处筛选不同的指标,点击“确定”,下方的表格即可展示所选定的指标的数据。点击“恢复默认指标”即可回复到原来的指标状态。表格筛选框:表格筛选框包括转化页面筛选、来源类型筛选、地域筛选、访客类型筛选;转化目标页面筛选中,此处的转化页目标与转化次数及转化率为对应关系。选择了不同的转化页目标,转化次数及转化率即为相应页面的转化次数及转化率;来源类型筛选可选择不同的来源类型,表格即可显示相应的数据;地域筛选可选择不同的地域,表格即可显示不同地域的数据;访客类型可选择全部访客、新访客、老访客三种类型。数据导出及发送邮箱:有权限的用户,可将表格的数据进行导出或直接发送到邮箱。渠道评估提供接入的不同源渠道的状况,主要包括各个时间维度相关指标(浏览量、访客数、访问次数、广告数量、广告点击量等)的趋势。时间切换:点击不同的时间,即可显示不同时间的指标数据。选择某一天时(如“今天”“昨天”),表格中显示每个渠道某一天的数据,折线图显示的这一天中每个小时的趋势;选择一个时间段时,表格中显示的是这个时间段内的汇总数据,折线图显示的是这个时间段内每天的趋势情况。指标选择:可通过指标筛选框选择指标,选择某一个指标时,折线图则显示在相应的时间内的趋势情况。问号注释:鼠标移到“?“,即可显示相应指标的解释。营销活动评估从营销活动的角度出发,评估营销活动在不同互联网渠道上、不同时间段、不同运营位上的监测指标情况。分析维度:时间、营销活动ID、渠道ID、运营位ID分析指标:PV(浏览量)、UV(访客数)、IP数、点击率、转化率、曝光率等页面分析页面流量分析是指访客对网站各个页面的访问情况,通过页面流量分析能够精确分析到每一个页面的各个流量指标情况。页面流量分析包括受访页面分析和入口页面流量分析。入口页面流量分析可以判定访客从哪个URL最先进入访问,此功能详细的披露了入口页面流量情况和变化趋势。受访页面流量分析可以判定整个网站各个页面的访问情况,此功能详细的展示了受访页面的流量情况和变化趋势。功能说明页面流量分析分为三块功能:受访页面分析:受访页面是指访客所访问的网站各个页面,受访页面从不同的维度展示了页面流量的各种指标:包括基础流量指标(浏览量(PV)、访客数(UV),IP数,访问次数),访客指标(新访客数、老访客数、新访客比例,活跃用户数),吸引力指标(跳出率、平均停留时长)和转换指标(转换次数、转化率)。受访页面提供当前页面访问IP来源明细下载功能。入口页面分析:入口页面是指访客访问网站的第一个入口,即每次访问中的第一个打开的页面,主要以“按流量分析、按新访客分析、按吸引力分析、按转化分析”四种形式作为分析维度。入口页面提供当前页面访问IP来源明细下载功能。页面历史趋势:页面历史趋势以图表的形式展示当前页面在一定时间内的流量变化情况,可以从浏览量,访客数,跳出率,平均访问时长,贡献下游浏览量等形式分析,明细数据支持发送邮件和下载。维度指标该功能支持按照时间(天/周/月/自定义)维度分析,并提供浏览量(PV)、访客数(UV)、跳出率、平均访问时长、入口页次数和贡献下游流量等指标展示。界面示意截图页面流量分析截图如下:页面流量分析截图如下:页面流量分析截图如下:页面历史趋势截图如下:页面元素分析页面元素分析是指对页面上的文字链接、图片广告或者按钮等进行流量分析。对于站内页面元素采用如下两种技术方案进行流量分析。方式一:链接追加参数方式此方式适用于文字链接、图片以及按钮能跳转并有站内页面的情况。通过在链接后追加参数(比如?type=button1)的形式,通过站内目标页的流量过滤出来type=button1的流量即为此按钮流量。方式二:调用API此方式适用于文字链接、图片以及按钮没有跳转情况。通过调用特定API获取页面元素流量信息。维度指标该功能提供时间(天/周/月/自定义)维度分析,并提供流量基础指标(浏览量(PV)、访客数(UV)、IP数、访问次数),访客属性指标(新访客数、老访客数、新访客数占比)和转换指标(转化次数)展示。界面示意截图页面元素分析截图如下:营销位点击分析营销位点击分析是对各互联网渠道的营销位的点击情况按照特定维度进行分析。功能说明展示特定时间或者时间段用户访问互联网渠道营销位的点击情况等指标,包括营销位名称、营销活动名称、广告素材名称、点击情况(pv,点击量等)、用户访问行为(uv,点击营销位的独立访客数量)等指标内部渠道的定义:包括湖北移动电子渠道建设的内部电子渠道系统,如错误重定向,Toolbar、微厅、掌厅、邮箱、飞信等。维度指标该功能支持从时间(天/周/月/自定义)展示,该功能支持按照渠道过滤。访客分析实时访客实时访客是针对到具体某个访客的实时访问情况,包括访客的地域、访问时间、来源、访客标识码、访问IP、访问时长和访问深度等。评估监测模块根据实际情况提供最近30分钟实时访客列表。功能说明实时访客列表:提供近30分钟内各互联网渠道访客的地域、访问时间、来源、访客标识码、访问IP、访问时长和访问深度等指标。实时访客支持按照流量来源、地域、访客、访问深度和访问时长过滤访客行为。访客行为跟踪支持列表发送邮件和导出。维度指标该功能提供按时间(天/周/月/自定义)维度分析,并提供地域、访问时间、来源、访客标识码、访问IP、访问时长和访问深度等指标展示。界面示意截图实时访客-列表截图如下:访客行为跟踪访客行为跟踪是针对到具体某个访客的访问行为,包括进入页面、主要访问页面、离开页面、感兴趣的关键字等,访客行为能跟踪能捕获用户整个访问轨迹,并统计所有用户行为,为网站营销、产品推广、转化率提升和网站优化提供依据。功能说明访客行为跟踪共分为两块功能:访客行为跟踪:访客行为跟踪汇总了互联网渠道所有访客访问网站路径,包括访客的地域、访问时间、访问来源、入口页面、离开页面、访问时长和访问页数。访客行为跟踪支持按照流量来源、地域、访客、访问深度和访问时长过滤访客行为。访客行为跟踪支持列表发送邮件和导出。访客行为跟踪路径明细:访客行为跟踪路径明细指某一个访客的所有访问路径明细。访客行为跟踪路径明细支持发送邮件和导出。维度指标该功能提供按时间(天/周/月/自定义)维度分析,并提供地域、访问时间、来源、入口页面、离开页面、访问时长和访问页数等指标展示。界面示意截图访客行为跟踪-列表截图如下:访客行为跟踪-明细截图如下:地域分布地域来源分布是指各个地域(国籍\省\直辖市\特区、地级市等)带来的访客数及流量情况,帮助运营分析人员了解网站访问的地域分布,特定地域用户偏好,可进行针对性的运营和推广。功能说明地域来源分布共分为两块功能:地域来源分布概况:地域来源分布概况是指对各个地域的访客和流量情况用地图的形式展示,地域

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论