大数据服务!IBM推进Apache Spark项目

来源:中关村在线 原创  作者:畅享网
2015/6/23 9:04:33
从IBM方面了解,承诺大力推进Apache Spark项目,该项目为以数据为主导的,未来十年最为重要的新的开源项目

本文关键字: IBM 大数据

IBM方面了解,承诺大力推进Apache Spark项目,该项目为以数据为主导的,未来十年最为重要的新的开源项目。这一承诺的核心是将Spark嵌入IBM业内领先的分析和商务平台,并将Spark作为一项服务在IBM Bluemix平台上提供给客户。

大数据服务!IBM推进Apache Spark项目

图片来源tehnovosti.ru

IBM还将投入超过3500名研究和开发人员在全球十余个实验室开展与Spark相关的项目,并将为Spark开源生态系统无偿提供突破性的机器学习技术--IBM SystemML,同时,IBM还将培养超过100万名Spark数据科学家和数据工程师。

据了解,Spark无疑为大规模数据处理带来了革命性的突破。首先,它极大的提升了数据依赖型应用程序的性能;其次,它从根本上简化了由数据驱动的智能应用程序的开发流程。

为了加速Spark生态系统的开源创新进程,IBM将采取Spark构建在自有的分析与商务平台的核心中,同时Spark作为沃森健康云洞察平台的核心基础之一,以便医疗服务人员和研究人员在围绕新的人口健康数据进行分析时,更快地将数据转化为价值。

大数据服务!IBM推进Apache Spark项目

Bluemix平台上服务目录

另外,对IBM突破性的IBM SystemML机器学习技术开源,并与Databricks协作提高Spark的机器学习能力。作为一项服务在Bluemix平台上提供给客户,任何开发人员都可以快速加载数据、建模,并导出预测性工具用于他们的应用程序。

IBM将通过与AMPLab、DataCamp、MetiStream、Galvanize 和MOOC,等多种合作方式,培养至少100万名Spark数据科学家和数据工程师。

Spark已受到开发者与数据科学家们的热烈追捧。作为一个可以帮助企业便捷整合大数据至应用程序中的重要平台,Spark势头强劲,充分为IBM的客户提供业务转型的决策。

IBM是UC Berkeley AMPLab的4家创始成员之一,Spark正是于2009年初创于此,经过夜以继日的研究实验、提供建议、结合务实的洞察,并与研究人员就共同感兴趣的话题密切互动,Spark应运而生。UC Berkeley AMPLab的总监Michael Franklin教授表示,“作为AMPLab的赞助者,IBM致力于发展Spark社区,并为Berkeley Data Analytics Stack的持续发展与改进提供指导,对于该开源平台,Spark是不可或缺的关键组成部分。”

Spark具有敏捷快速,便于应用的特征。良好的开源属性使其可以在全球范围内持续改进。在接下来的几个月里,IBM的科学家和工程师将与Apache Spark开放社区合作,迅速推动先进机器学习技术的普及,并加快智能业务应用开发的创新速度。

通过无偿提供SystemML,IBM将帮助数据科学家提高迭代速度以应对不断变化的业务需求,并为不断发展壮大的应用程序开发人员生态系统提供支持,使智能技术在所有领域得到深度应用。

责编:何鹏
vsharing微信扫一扫实时了解行业动态
portalart微信扫一扫分享本文给好友

著作权声明:畅享网文章著作权分属畅享网、网友和合作伙伴,部分非原创文章作者信息可能有所缺失,如需补充或修改请与我们联系,工作人员会在1个工作日内配合处理。
最新专题
流动存储 为大数据而生

伴随信息技术的突飞猛进,更大量级的非结构化数据与结构化数据构成的大数据成为企业级存储所面临的最大挑战:一方..

磁盘阵列及虚拟化存储

利用数组方式来作磁盘组,配合数据分散排列的设计,提升数据的安全性。虚拟化存储,对存储硬件资源进行抽象化表现。

    畅享
    首页
    返回
    顶部
    ×
      信息化规划
      IT总包
      供应商选型
      IT监理
      开发维护外包
      评估维权
    客服电话
    400-698-9918