Twitter:我们已经亲手打造自己的数据库解决方案

来源:ZDNet存储  
2014/4/8 17:27:55
Twitter已经步步发展并且走向成熟,因此在即时可用性之外、他们也开始意识到数据一致性保障的重要意义。该公司已将打造全新的“曼哈顿”数据管理软件这一诉求摆上了核心地位,并在上周的博文中正式披露了这套基础存储系统的诞生。

本文关键字: Twitter 数据库 Cassandra
Twitter公司已经步步发展并且走向成熟,因此在即时可用性之外、他们也开始意识到数据一致性保障的重要意义。
 
至少该公司通过打造的全新“曼哈顿”数据管理软件将这一诉求摆上了核心地位,并在本周三的一篇博文中正式披露了这套基础存储系统的诞生。
 
虽然博文并没有提到,但根据我们掌握的消息、Twitter正在开发一套所谓次级索引方案。这是一项被囊括在曼哈顿软件中、具备巨大潜力的功能,能够帮助公司员工在搜索社交网络的庞大存储数据时提供出色的灵活性,足以成为这家上市公司进一步推进商业运作的重要利器。
 
我们首先来分析Twitter本周在博文中所公开的相关信息。
 
“在过去几年当中,我们发现自身对于一套能够每秒处理百万级别查询并能在实时环境下实现极致低延迟的存储系统的需求正变得愈发迫切。系统的可用性及速度当然同样非常重要,不过这套存储系统不仅要具备出色的性能表现、同时也需要拥有跨越全世界多个地区的卓越可扩展能力,”Twitter在其网站上写道。
 
曼哈顿是一款由该社交网络自家工程师所打造的软件方案,旨在应对每秒接近六千条推文所带来的巨大系统压力。尽管六千条推文本身所涉及的数据量并不是很大,但这部分信息存在多种复杂特性,因为曼哈顿软件还需要处理与之相关的回复以及针对每条推文的转发——如果某位名人发布了新动态,数百万关注者的回复将立即汹涌而来,这就让原本看似简单的问题变得复杂起来。
 
在这项技术的帮助下——也许曼哈顿软件最终会走上开源道路——Twitter得以利用Cassandra的最终一致性功能外加其它工具通过单一大型系统实现坚实的一致性保障,而这也正是推动社交网络下决心更替存储系统的主要理由。根据我们掌握的情况,曼哈顿的开发工作已经持续了一年以上。
 
开发人员可以在从曼哈顿中读取或者向其写入的过程中选择数据一致性级别,从而通过创建新服务的方式在可用性(即如何快速实现访问)与一致性(即如何确保查询结果的准确性)之间找到平衡点。
 
有鉴于此,Twitter的程序员们能够访问“高一致性服务”,它会将一致性算法与副本日志结合起来、从而确保事件按照实际顺序对副本产生影响。
 
到目前为止,Twitter已经推出了LOCAL_CAS(单一数据中心内部的高一致性)与GLOBAL_CAS(跨越多个设施间的高一致性)。它们将“在应用程序以及数据建模方面采取不同的平衡点选取方式,”Twitter在一篇讨论曼哈顿项目的博文中指出。
共2页: 上一页1 [2]
责编:李玉琴
vsharing微信扫一扫实时了解行业动态
portalart微信扫一扫分享本文给好友

著作权声明:畅享网文章著作权分属畅享网、网友和合作伙伴,部分非原创文章作者信息可能有所缺失,如需补充或修改请与我们联系,工作人员会在1个工作日内配合处理。
最新专题
流动存储 为大数据而生

伴随信息技术的突飞猛进,更大量级的非结构化数据与结构化数据构成的大数据成为企业级存储所面临的最大挑战:一方..

磁盘阵列及虚拟化存储

利用数组方式来作磁盘组,配合数据分散排列的设计,提升数据的安全性。虚拟化存储,对存储硬件资源进行抽象化表现。

    畅享
    首页
    返回
    顶部
    ×
      信息化规划
      IT总包
      供应商选型
      IT监理
      开发维护外包
      评估维权
    客服电话
    400-698-9918