Microsoft SQL Server成功案例——雅虎_第1页
Microsoft SQL Server成功案例——雅虎_第2页
Microsoft SQL Server成功案例——雅虎_第3页
Microsoft SQL Server成功案例——雅虎_第4页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、Yahoo!雅虎通过大数据解决方案提高竞标效率,提高广告收入组织规模:11400员工组织简介雅虎是全球领先的数字媒体公司,提供了一系列的在线服务,其中包括一系列流行的消费者网站。业务状况雅虎希望能够为其广告客户提供更多更有用的分析数据,以提高数据处理性能。解决方案雅虎通过与微软合作,实施了将雅虎Hadoop数据处理框架与微软SQL Server 2008 R2集成的解决方案。收益· 提高广告活动的有效性,推动广告客户增加广告支出· 每季度产生24TB的多维数据,使其成为世界上最大的SQL Server分析服务多维数据集· 每天处理超过3.5亿次的广告显示,以小时进

2、行刷新硬件· IBM x3560服务器计算机软件和服务· Microsoft SQL Server 2012企业版· Microsoft SQL Server 2008 R2分析服务· Microsoft Excel 2010· Microsoft SQL Server 2008 R2企业版· Microsoft SQL Server PowerPivot for Microsoft Excel垂直行业数字媒体国家/地区美国业务需求商业智能和报表语言英语总部位于加州的雅虎公司经营着世界上最受欢迎的网站之一,每个月在全球有超过700万的

3、独立访问者。该公司拥有并运营为广大客户提供的在线广告服务,这些服务通过雅虎一系列的网站进行提供。他们从这些访问交换当中来更好地定位和提高客户广告投放的效率和收益。致力于更快地为客户提供更多更有意义和更有用的数据分析,雅虎专门实施了一个数据处理解决方案,将其庞大的存储在Apache Hadoop开源框架中的数据,整合到微软SQL Server 2008 R2当中。通过这一解决方案,雅虎成功地帮助客户提高了广告投放的效率,同时雅虎的广告商们增加了在雅虎网站的广告投放费用,公司还提供了更多更相关的广告数据,解决方案所采用的分区的设计,意味着可以支撑更快地加载大规模的数据集。业务状况雅虎公司总部位于加

4、利福尼亚州的桑尼维尔市,是一家互联网公司,经营一些非常受欢迎的网站。这些网站包括搜索引擎、门户网站、新闻推送等,拥有每月超过700万独立访问者,达到全球在线总数47以上。“雅虎公司现在可以为客户提供更相关的广告数据,从而提高了广告投放费用和广告活动的有效性。我们通过把处理大数据集的Hadoop和Hive技术与由Microsoft BI平台提供的强大的分析洞察力实现了这一目标。”Dianne CantwellTAO开发领导雅虎受到大量的在线观众的吸引,广告客户纷纷涌向这些网站。为了帮助广告客户更好地分析消费者相关的数据并成功地吸引客户,雅虎构建了定位、分析和优化(Targeting、Analyt

5、ics、Optimization,TAO)解决方案,构建了一个功能强大的,可扩展的广告分析工具。TAO基于雅虎网站,如汽车、财经、健康、邮件、新闻、搜索、体育和旅游活动等频道,通过Right Media Exchange(Right Media Exchange,RMX)为成千上万在雅虎网站上投放广告的客户提供报表。TAO平台的一个组成部分是开源软件框架Apache Hadoop,构成了可靠的、可扩展的、分布式的计算环境。Hadoop平台由雅虎创建,被用以分析大量的非结构化的数据,采用商业的服务器计算机并将数据实时分发至应用程序。在过去的几年中,Hadoop成为公司广告分析中大数据管理的主要工

6、具。每天,Hadoop处理着超过3.5亿次的广告显示,以每小时进行刷新。TAO的源集群每个季度处理着4640亿行的数据。尽管Hadoop正在帮助雅虎成功地处理着大规模的数据集,该公司依然需要从大数据当中提取更多更有意义的分析信息,以开展更多的热点和深入的分析。有了这项功能,公司能够快速地对客户的需求做出响应。具体而言,雅虎的广告客户希望能够为消费者提供更具相关性的广告推送,这类的广告将会被视为有价值的建议。例如,针对性更强的广告能够为访问雅虎网站的消费者留下更为深刻的印象,促使他们采取更进一步的行动,如查看广告或点击了解更多详情等。要提供这些信息,雅虎需要能够从消费者的行为当中获得更多的信息,

7、例如访问的网站、一天之内的访问次数、性别、年龄、位置和兴趣等,并根据这些信息来为不同的消费者提供不同的有针对性的信息。通过提供深入到这一层次的分析,雅虎能够帮助广告客户快速找到他们的目标客户,以实现最佳的投资回报。此外,雅虎希望能够提高其TAO数据库的性能,来更快地为客户提供更多的数据。更低的延迟将能够更加频繁地帮助用户优化他们的广告效率,这对于只持续数天的热点广告投放而言至关重要。2010年上半年,雅虎决定寻求新的、性能更高的、能够与Hadoop协同工作的商业智能解决方案。解决方案多年以来,雅虎都是微软公司的重要客户之一,在为其解决方案选择新的技术时,基于其与微软公司多年的合作关系,雅虎与微

8、软紧密合作,利用微软SQL Server 2008 R2企业版数据管理软件,创建了一个新的BI解决方案。通过使用SQL Server 2008 R2,雅虎增强了其TAO基础架构,现在能够从一个Hadoop集群当中抽取数据并加载到一个第三方的数据库当中,并最终把数据加载到一个SQL Server 2008 R2分析服务的多维数据集当中。多维数据集支持来自客户端,如Tableau Desktop业务分析软件、内部自定义的应用程序等工具的连接。员工可以使用这一软件来创建交互式的数据仪表板并实现热点分析。新的基础架构部署在IBM x3560服务器计算机上,同样采用了新的分区方法,针对提高超大型数据集的

9、查询功能做出了优化。在这个模型中,源数据被加载到关系型数据库当中,在该数据库中,数据被存储在一个分区表当中,每个分区相当于大约等同于每小时可以处理的数据量,然后每天在多维数据集端合并及分配到四个分区。通过采取这种方式存储和读取数据,赋予SQL Server 2008 R2分析服务以更快的速度读取和处理数据,如果数据没有被存储在分区表当中的话,性能将远远低于采用分区表的方式。因此,对于非常大的数据集,查询的性能得到了极大的提高。TAO基础架构现在包含了一个2PB级的Hadoop集群,每天发送1.2TB的原始数据到11G真实应用程序集群中的第三方数据库。从这里开始,每天经过压缩之后的135GB的数

10、据会被发送到一个SQL Server 2008 R2分析服务数据集当中,多维数据集每个季度会产生24TB的数据,使其成为世界上已知最大的SQL Server分析服务多维数据集。微软已经开发出了针对Apache Hadoop的SQL Server连接器,其设计目的是实现在Hadoop和SQL Server 2008 R2之间的高效数据传输。通过使用该解决方案,企业客户将能够把大量的Hadoop数据移动到SQL Server 2008 R2平台上,从而实现从结构化的和非结构化的数据当中获得更为深刻的业务洞察力。SQL Server Connector for Hadoop能够为雅虎提供潜在的、更快

11、的数据加载能力。雅虎公司计划采用熟悉的分析工具,如微软SQL Server 2008 R2分析服务,来对Hadoop大数据处理作业所产生的结果进行分析。雅虎也在与微软合作以确定把从Hadoop中获得的数据迁移到SQL Server 2008 R2分析服务多维数据集中的最佳方式。通过把Hadoop与微软商业智能环境进一步融合,微软一直致力于开发针对Hadoop Hive的连接器原型,Hive是一个构建在Hadoop之上的数据仓库基础架构。研究的一个领域是使用Hadoop Hive Open Database Connectivity(ODBC)驱动程序,它是一个针对Hive提供的采用ODBC A

12、PI标准的软件库。通过使用这一驱动程序(现阶段还处于原型状态),雅虎将能够直接把数据从Hadoop当中抽取到SQL Server 2008 R2分析服务多维数据集当中。微软也在使用相同的Hive ODBC驱动程序来与PowerPivot for Excel中的xVelocity内存驻留分析引擎(VertiPaq)进行整合。该连接器还将结合xVelocity提供的内存优化的列存储索引功能,在SQL Server 2012当中加速对数据仓库查询的处理。企业收益新的TAO解决方案已经帮助雅虎提高了广告投放的效率,并提升了其广告客户在广告上的投入。此外,雅虎还可以为其客户提供关联度更高的广告数据,并且

13、以比过去快得多的速度来加载和检索分析数据。提高广告客户的广告投入和广告活动的效率通过引入SQL Server 2008 R2并将其作为一个核心组件,雅虎已经从新的TAO基础架构当中在广告客户广告投入和广告投放效率两个领域看到了很大的好处。由于广告客户已经从他们在雅虎平台上的广告投放当中提高了投资的收益,他们很乐于增加自己的广告投放。在供应方面,TAO可以帮助雅虎通过在一系列的维度上进行数据切片,实现对诸如每千次有效的广告投放的成本(eCPM)等信息的跟踪,来提高量化的分析。在一般情况下,eCPM越高,意味着雅虎和它的广告客户越能够从他们的广告投放当中获得越大的收益。雅虎广告业务主管将这些收益归

14、结为SQL Server 2008 R2分析服务多维数据集的使用,这为雅虎的广告客户提供了一个更为精准地细分目标网络用户市场的方法。提供关联度更高的广告数据通过从新的微软解决方案当中获得的增强的广告分析功能,雅虎可以提供关联度更高的广告数据,这些数据可以转化成为广告客户的收益和更好的性能,并最终为雅虎带来更高的收入。由于引入新的增强的TAO基础架构,雅虎现在可以为广告投放经理和广告客户提供关联度更高的数据。在实施新的解决方案之前,雅虎的广告投放经理和广告客户在衡量广告活动的收益方面效果较差。现在,通过引入SQL Server 2008 R2分析服务多维数据集、自定义的Web应用程序,以及和Ta

15、bleau之间的相互作用,提供了一个更为清晰地了解某个广告投放的效果如何,以及雅虎的网站在如何为公司创造收入。总体而言,新的解决方案可以帮助雅虎更好地分析广告数据,为其带来更多的企业广告客户,帮助广告客户增加广告投入,并帮助雅虎最终从中收益。更快地加载数据、处理更快速的查询新的TAO基础架构所采用的分区设计对于加快把数据加载到多维数据集当中至关重要。分区是新的微软解决方案成功的基础,因为它有助于加快从源当中的临时数据到分析多维数据集处理的吞吐量。分区的策略也有助于更快的查询时间。对于雅虎TAO用户而言,从Tableau Desktop客户端提交的查询结果返回的平均时间为6秒,而从公司定制的优化的应用程序提交的查询结果返回的平均时间为2秒。雅虎计划继续扩展这一解决方案,将来将会添加更多的数据和更多新的功能到解决方案当中。微软服务器产品家族要了解更多与微软服务器产品家族相关的信息,请您访问:更多信息要了解更多微软产品和服务相关的信息,请您致电:(800)426-9400 致电:(800)426-9400。如果您来自加拿大,请您致电微软加拿大信息中心:(877)568-2495 致电

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论