千万用户架构之混合型数据库的应用_第1页
千万用户架构之混合型数据库的应用_第2页
千万用户架构之混合型数据库的应用_第3页
千万用户架构之混合型数据库的应用_第4页
千万用户架构之混合型数据库的应用_第5页
已阅读5页,还剩1页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、云视互动-千万用户架构之混合型数据库的应用随着云视互动平台用户规模的扩展,针对千万甚至上亿用户的可伸缩扩展的数据平台架构就显得非常关键和迫切。从产品初期到现在完善的过程中,经历了很多次的技术选型和迭代升级,逐渐的沉淀和完善自有的一套体系,其中包括mysql,mongo,redis,memcached,hbase等技术。一、 什么是nosqlnosql,泛指非关系型的数据库,它是“not only sql”的缩写。它的意义是:在传统关系型数据库无法实现和满足某些业务场景的情况下,可以用nosql来代替部分功能,它是 为弥补关系型数据库的不足应运而生。nosql数据库具有如下几个大的特点

2、:1) 没有模式:不需要事先定义数据模式,预定义表结构。2) 无共享架构:各节点数据独立。3) 弹性可扩:动态增加或者删除结点。4) 异步复制:异步解耦,提升数据处理性能。5) base特性:非acid特性,最终一致性和软事务。nosql数据库并没有一个统一的架构和产品规范,不同nosql数据库之间的不同,远远超过两种关系型数据库的不同。可以说,各个nosql数据库各有所长,成功的nosql数据库必然特别适用于某些场合或者某些应用,在这些场合中会远远胜过关系型数据库和其他的nosql数据库。二、 为什么用nosql目前我们都生活在一个庞大的而复杂的信息化大数据时代,传统的关系数据库在应对海量数

3、据存储和检索分析的时候,基于其自身的一系列规范化设计,没法对数据进行更高效的管理和读写操作,包括硬件能力的限制,这种问题更加突出。而nosql的优势在此就体现出来,具体如下几点:2.1 易扩展nosql数据库种类繁多,但是一个共同的特点都是去掉关系数据库的关系型特性。数据之间无关系,这样就非常容易扩展。也无形之间,在架构的层面上带来了可扩展的能力。2.2 大数据量,高性能nosql数据库都具有非常高的读写性能,尤其在大数据量下,同样表现优秀。这得益于它的无关系性,数据库的结构简单。一般mysql使用query cache,每次表的更新cache就失效,是一种大粒度的cache,在针对web2.

4、0的交互频繁的应用,cache性能不高。而nosql的cache是记录级的,是一种细粒度的cache,所以nosql在这个层面上来说就要性能高很多了。2.3 灵活的数据模型nosql无需事先为要存储的数据建立字段,随时可以存储自定义的数据格式。而在关系数据库里,增删字段是一件非常麻烦的事情。如果是非常大数据量的表,增加字段简直就是一个噩梦。这点在大数据量的web2.0时代尤其明显。2.4 高可用nosql在不太影响性能的情况,就可以方便的实现高可用的架构。比如cassandra,hbase模型,通过复制模型也能实现高可用。nosql数据库在以下的这几种情况下比较适用1、数据模型比较简单;2、需

5、要灵活性更强的it系统;3、对数据库性能要求较高;4、不需要高度的数据一致性;5、对于给定key,比较容易映射复杂值的环境。在以上场景中采用nosql数据库会比获得更高的吞吐量。三、 nosql产品分类3.1 键值存储数据库这一类数据库主要会使用到一个哈希表,这个表中有一个特定的键和一个指针指向特定的数据。key/value模型对于it系统来说的优势在于简单、易部署。如:tokyocabinet/tyrant, redis, voldemort, oracle bdb,memcached。3.2 列存储数据库这部分数据库通常是用来应对分布式存储的海量数据。键仍然存在,但是它们的特点是指向了多个

6、列。这些列是由列家族来安排的。如:cassandra, hbase, riak.3.3 文档型数据库文档型数据库的灵感是来自于lotus notes办公软件的,而且它同第一种键值存储相类似。该类型的数据模型是版本化的文档,半结构化的文档以特定的格式存储,比如json。文档型数据库可 以看作是键值数据库的升级版,允许之间嵌套键值。而且文档型数据库比键值数据库的查询效率更高。如:couchdb, mongodb. 国内也有文档型数据库sequoiadb,已经开源。3.4 图形数据库图形结构的数据库同其他行列以及刚性结构的sql数据库不同,它是使用灵活的图形模型,并且能够扩展到多个服务器上。nosq

7、l数据库没有标准的查询语言(sql),因此进行数据库查询需要制定数据模型。许多nosql数据库都有rest式的数据接口或者查询api。如:neo4j, infogrid, infinite graph。四、 rdbms和nosql整合在目前和可以预见的将来,rdbms和nosql绝对不是一个自我矛盾的结合体,也绝对不是谁替换谁取代谁,在各自领域内而是相辅相成,共同构筑一个完备的数据生态系统。云视互动平台在针对移动互联网高并发大数据的千万级用户,通过了几次数据平台的迭代升级,当前已经形成自有的一套完整数据平台解决方案。Ø 巨量静态数据请求cache化,采用memcached集群用于缓存常用数据,减少db的io压力。Ø 消息数据cache结构化,采用redis集群,结合list,hash,sortedset等丰富的内存结构进行离线消息和实时消息的缓存。Ø 采

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论