框架应对“大数据”的潮流,微软在它的SQL服务器数据库和并行数据仓库平台上增加支持开源的Hadoop,好进行大规模数据处理。
根据本周官方SQL服务器团队博客的一篇文章报道,连接器将很快可以在社区技术预览(CTP)形式下适用。
大数据指的是来自企业,特别是来自传感器和网站的流量上日益增长的大量的数据。
“我们的客户已经要求我们帮助存储、管理、并分析结构化和非结构化的数据 — 特别是储存在Hadoop环境里的数据,”微软在博客的文章中说。
有了新的连接器,客户将能够在Hadoop环境,SQL服务器和并行数据仓库之间交换数据,微软说。
Hadoop,托管在Apache软件基础(Apache Software Foundation)上,由雅虎开创并且部分基于由谷歌开发的MapReduce程序模型。越来越多的大型商业生态系统已经围绕Hadoop出现,同时有Cloudera这样的公司提供服务和专业的框架分布。
微软的行动很有道理,因为它的数据仓库供应商,如EMC的Greenplum和Teradata已经接受了Hadoop,Forrester研究公司的分析师James Kobielus说。
他补充说,越来越多的企业正运行Hadoop集群,而且他们想要从这些系统的下游中发送数据到他们的数据仓库系统。但没有一家供应商能宣称有完全外置的Hadoop产品,这样的产品应该包括分布、与Hadoop有关的连接器诸如Cassandra数据存储,建模工具和其他组件,他说。 “毫无疑问”,正如其他供应商,微软已经很认真地对Hadoop做出了规划,但它还没有公开一个长期的路线图,Kobielus补充道。
微软并不是以牺牲自身的产品为代价而接受Hadoop,它已于最近发布了一款基于MapReduce的程序模型,Daytona项目,用于它的Azure云平台。
本周,微软还宣布它已经发布了平行数据仓库的第二个更新设备。这些更新结合了硬件和软件组件的新功能。发布的产品包括针对第三方商业智能(BI)和来自SAP,Informatica和Microstrategy的数据整合工具的新连接器。
此外,一个基于戴尔硬件的PDW版本目前已上市,微软说。价格从不到12000美金每TB(terabyte)起。
责编:亢晋芳
微信扫一扫实时了解行业动态 微信扫一扫分享本文给好友