|
磁带迎来第二春 巨头谷歌依然青睐磁带磁带一直处于生死挣扎的边缘——但如今它似乎又迎来了自己的第二春。磁带经历了过去五年多之中磁盘拥护者们的口诛笔伐、忍受长久以来磁盘重复数据删除技术的轮翻轰炸,然而磁带的价格远低于磁盘,其可靠性也更为出色,磁带的存储容量即将迎来新一轮飞跃。 最近几年来,磁带一直处于生死挣扎的边缘——但如今它似乎又迎来了自己的第二春。经历了过去五年多之中磁盘拥护者们的口诛笔伐、忍受长久以来磁盘重复数据删除技术的轮翻轰炸,这些极具针对性的攻势确实给磁带造成严重的负面影响。然而磁带的价格远低于磁盘,其可靠性也更为出色;最重要的一点,磁带的存储容量即将迎来新一轮飞跃。 事实上,IBM公司最近正准备将LTO-6的存储容量一举提升接近四十倍,相比之下磁盘产品的容量增长速度显然要慢得多。 磁带是我们目前能够拿出的惟一有机会跟上数据量增长速度的存储介质。各类事务、图像、音乐再加上合规性需求、社交媒体会话以及设备对设备消息已经成为IT系统日常运行的必然产物。当然,在这些数据访问频率较高时我们仍然需要利用闪存及磁盘进行存储,但当这些数据逐渐过时、变得冷门之后,我们只能把其中需要保存的部分交给磁带了。 现状 作为曾经的备份介质,磁带如今已经成为归档领域的主力。与此同时,随着数据总量的爆炸式增长,归档体系对存储空间的需求也水涨船高。 过去市场上出现过十几种各不相同的磁带及卷轴格式,将数据写入到磁带中的方式也多种多样,但目前仍在使用的只有三大类,分别为:IBM机制、LTO机制以及甲骨文机制,惠普的DAT虽然仍有一定影响力、但已经严重衰落。 IBM的专有TS1140格式能够在一卷磁带上提供高达4TB的原始数据存储容量,而且蓝色巨人还推出了一系列配备磁带库、帮助用户使用这些存储设备。其中包括拥有15000个磁带接口的高端TS 3500,这套设备由机器人负责拾取磁带盒并将其插入驱动器,数据经过压缩后的总容量可达2.7 EB(即艾字节)。虽然甲骨文在收购了Sun/StorageTek公司后获得了雄厚的技术实力与稳固的生存空间,但大型机的磁带业务仍然是IBM一家独大。 第二种仍然幸存的专有磁带格式来自甲骨文公司。其T10000d能够容纳8.5TB原始数据,而且与IBM类似,甲骨文同样为其高端StreamLine 8500高端产品提供一系列配备库。甲骨文的单一系统中包含有一千多卷磁带,并通过将十套系统并联起来构建起由一万多卷磁带组成的超级存储体系。目前最知名的甲骨文产品客户当数谷歌公司。 LTO-6磁带 LTO的全称为线性磁带开放协议,由惠普、IBM及希捷三家公司共同开发,最初于2000年8月由IBM推向市场。 当时的想法在于为配备介质及驱动器产品的Windows及Unix服务器创建一种开放磁带格式,并让三者之间能够随意相互更换。这一优秀技术方案的出现给其它机制带来了毁灭性的打击,倒在其铁拳之下的专有磁带格式包括DLT、Super-AIT以及VXA等等。 随着竞争对手的相继崩溃,LTO成为笑到最后的王者。昆腾公司于2005年通过收购Certance(即希捷旗下的前磁带部门)加入了LTO阵营。目前只有IBM与惠普两家仍在生产磁带驱动器,昆腾只销售LTO驱动器但并不从事制造工作。 IBM、甲骨文、惠普/昆腾是当前磁带库领域的三大主要供应商,紧随其后的是SpectraLogic公司。谈到磁带的再度复兴,Spectra曾于2012年下半年推出过容量达550PB的磁带存储产品。 磁带原本只是一种顺序存取介质,但IBM已经为其开发出一套虚拟文件:文件夹访问系统,也就是LTFS(即线性磁带文件系统)。这套系统允许用户通过与Windows类似的文件:文件夹拖拽操作从磁带中读取并写入文件。 这意味着普通用户在理论上能够在无需涉及备份软件包的前提下在磁带上完成文件的写入与读取,且每项操作都提供独立的用户界面。这有望彻底改变磁带的使用方式,从而令其访问真正走近我们普通人身边。 这就是目前处于运行当中的磁带技术。但未来还有哪些值得期待的新亮点? 未来趋势 前面提到的三大主流格式各自拥有路线图,分别指向未来的一到两代产品。未来产品的总体关注重点分为两大方面,一者为提高容量、二者为增加数据传输速度。举例来说,LTO供应商目前推出的是LTO-6产品,也就是最新一代。后续将逐步与我们见面的则是LTO-7与LTO-8。 二者在容量与速度方面均得到显著提升。LTO-7提供6.4TB原始数据容量(按2.5:1的常见比例进行压缩后,实际存储空间为16TB);原始数据传输速度则为315MB每秒,远高于LTO-6的210MB每秒。LTO-8应该能够带来12.8TB的容量以及427MB每秒的传输速度,而且二项数值均来自原始数据。 一般来说,新旧两代产品之间的相隔周期约为三十个月,事实也基本证明了这一点。从历史角度看,每一代LTO驱动器都能够在写入方面向下兼容前两代驱动器,而在读取方面则能够向下兼容前三代驱动器,这样就简化了用户向最新格式方案进行迁移的流程。 我们预计未来几代LTO,例如LTO-9与LTO-10,与前代产品相比将在传输速度与容量方面迎来倍增,这也正是LTO联盟努力打造下的结果。 甲骨文对于自家T10000格式也准备了类似的路线图。即将面世的T10000e将提供12-20TB容量,传输速度在每秒400MB到600MB之间——不过我们认为每秒300MB到350MB应该更为可信。可以肯定的是,甲骨文在面对实际客户时会给出更为精确的数字。 IBM呢?虽然蓝色巨人并未着力宣传,但我们确信其方针也不会有太大区别。我们同时预计,IBM的TS1150与TS1170格式与现有TS1140相比,基本上会在容量及传输速度上迎来倍增。 IBM已经展示了一套原始容量达35TB的磁带,而目前他们正积极筹备公布一款仍旧沿用现有钡铁氧体磁带介质(注意,绝不是什么新型记录技术)创建的125TB磁带产品。假如IBM的消息确实可靠,那么搭载该磁带的TS3500库将能够容纳总计84 EB数据。这样的存储能力实在令人为之目眩,而且其每GB使用成本将把市场上的所有存储竞争对手远远甩在身后——没错,是远远。 假设LTO能保持每三十个月左右实现传输速度及容量倍增,那么我们在12年到13年之内(也就是2025到2026年)就会迎来容量达102TB的LTO-11。 说到这里,大家一定会起疑:如何判断我们的猜测属于合理推断而非痴人说梦?这是因为磁带中保存1 bit数据所使用的物理尺寸要远远大于磁盘产品。简单来说,磁带上可资利用的物理空间更大,而且缩小物理尺寸之后磁带上数据信息的稳定性不会受到影响——事实上,这与新近兴起的PMR磁盘记录技术非常类似,该技术正是在竞争压力之下所诞生。125TB磁带项目包含两条发展途径,其一为缩小磁带的bit尺寸,其二则是将存储密度提升至每平方英寸100Gb——相比之下,目前最先进的高密度磁盘也只能带来每平方英寸620Gb到690Gb存储容量。 在本文中,我们不打算详细讨论DAT。随着磁盘及云备份的全面崛起,它的悲惨命运已经注定、毫无回转余地。 磁带是一种归档介质,目前常被规模最大的数据归档服务商用于处理此类工作,其中最典型的代表就是谷歌与Amazon。 磁带与云计算 谷歌公司似乎在自家位于勒努瓦的北美数据中心内采用了一部分甲骨文StreamLine 8500库;感兴趣的朋友可以通过以下视频截图做出判断。 谷歌的勒努瓦数据中心内惊现约六套甲骨文StreamLine 8500磁带库。 此外,谷歌公司还利用磁带成功恢复了2011年总部在遭遇邮件系统中断时所损失的数据。如果向来以出色的成本效益与可靠性著称的谷歌IT部门真的使用了磁带,那么我想磁带的重要性与实际表现已经不言而喻。也许Amazon对磁带的地位也很认同?……答案应该是肯定的,虽然云巨头从未明确表态。 去年由Amazon推出的Glacier云归档服务正式上线,其中采用的就是SpectraLogic T-finity磁带库。那么他们到底使用了多少套磁带库? 根据Amazon的说法,Glacier服务将数据存储在多套设施以及各套设施的多台设备当中。Glacier服务只在Amazon的几个业务区向客户供应: ? 美国东部——北弗吉尼亚州 ? 美国西部——俄勒冈州 ? 美国西部——北加利福尼亚州 ? 欧盟地区——爱尔兰 ? 亚太地区——东京 每个地区的数据中心数量会随着当地可用区数量发生变化,而且Amazon并不会对此做出具体说明。不过通过谷歌搜索,我们发现美国东部(即北弗吉尼亚州)拥有五个可用区与十家数据中心。美国西部的俄勒冈州则拥有至少三家数据中心。为了粗略计算,我们假设每家数据中心内拥有两套磁带库、每个地区建有四家数据中心,那么Amazon手头正在使用的SpectraLogic库大约达到40套。 SpectraLogic公司刚刚公布的结果同时令人振奋。 全球规模最大的两家云服务供应商都在使用磁带归档方案,因为磁带在扩展性、可靠性、性能表现以及成效效益方面拥有显而易见的优势,所以促使二者做出了采购大量磁带库的决定。我想这样的结论足够供各位进行参考了。 磁带的实际表现 数据归档领域的重中之重在于安全性,而磁带的优异表现甚至可以说标志着数据中心的未来发展方向。但要彻底证实这一结论,我们还需要更多像谷歌及Amazon这样具有强大说服力的磁带客户。 (Facebook在归档需求方面与Amazon及谷歌非常接近,但他们似乎更乐于利用闪存机制进行图片归档——这显然是为了获得更出色的归档访问速度。该公司在今年一月召开的开放计算峰会上公布了这一决定。) 库中的磁带必须由机器人进行拾取,并负责插入到驱动器当中。整个流程可以概括为拾取磁带、插入驱动器、驱动器启动、将磁带快进至对应位置。这种处理方式不可避免,除非磁带卷能像磁盘那样拥有属于自己的独立驱动器——不过出于成本考量,为每卷磁带配备驱动器的可能性极低。 从长远角度来看,磁带归档的最大威胁来自廉价闪存,也就是每单元存储3-bit的三层单元(简称TLC)NAND。不过NAND的容量扩展仍是个问题(3D NAND芯片堆栈是在NAND无法进一步缩小制造工艺之外显著提升容量的惟一方式,但其实际效果尚缺乏验证),而且相变存储器及电阻式内存等替代方案的发展前景也并不明朗。 几十年来,士兵在战场上厮杀时所使用的主要武器仍然是远距离射击敌人的致命子弹。由于替代产品难以广泛普及、枪械制造工艺自身也在不断发展,因此在很长一段时间内,这样的现状仍然不会发生本质变化。磁带这一长寿存储方案的角色与枪械类似,其在数据保护领域的生命力依旧顽强、未来也将继续作为令人安心的首选机制。 磁盘归档机制需要利用重复数据删除技术才能提供足够的存储空间,但该技术所带来的昂贵使用成本也让磁盘陷入进退两难的境地。相比之下,磁带无疑是回避矛盾、物美价廉的绝佳解决途径。 责编:王珂玥 微信扫一扫实时了解行业动态 微信扫一扫分享本文给好友 著作权声明:畅享网文章著作权分属畅享网、网友和合作伙伴,部分非原创文章作者信息可能有所缺失,如需补充或修改请与我们联系,工作人员会在1个工作日内配合处理。 |
最新专题 |
|