IBM通过超算机使用大数据来解决大问题

来源：腾讯科技

2014/4/9 10:23:18

IBM喜欢大数据，获取的越多，就越能向用户销售出更多的服务器、存储和服务。但是由于IBM获取的大数据容量已经过大，导致这家公司的研发人员很难驾驭这些数据。

本文关键字： IBM 大数据

举例来说，IBM位于硅谷阿尔马登研究中心的专家劳拉·哈斯(Laura Haas)去年就曾询问同事，她为什么不能使用更大的数据集。哈斯当时就曾表示，单是准备数据就花费了他80%的时间。哈斯意识到，IBM研究时间被数据分析耗费的越多，该公司的专家就会耗费更多的时间和精力用于扩展数据集，从而放缓研发的步伐。

很明显，这种事情应当交付给专业的数据科学家来解决，但是这样的循环只能让情况变得更加糟糕。还有，它似乎有悖于大数据的常规，因为依据存储能力的扩展或是传感器成本的下滑，大数据的价值并不受摩尔法则或是克来德法则(Kryder's Law，每10.5年硬盘驱动器的信息密度就要增长1000倍，也就是说，每13个月存储密度就要翻一番)支配。

当然，大数据更适用于“麦特卡夫定律” (Metcalfe's Law)。该定律指出，网络的价值等于网络用户数的平方数；增加网络和其他通讯技术的接入用户数量，将获得巨大效益。对IBM的研发人员而言，情况也确实如此。为解决这一问题，IBM硅谷阿尔马登研究中心在去年秋季推出了“加速发现实验室”(Accelerated Discovery Lab)。这个实验室有着非常大、开放的空间，能够装配舒适的家具、白板以及许多的屏幕，更别提循环参与的项目团队、系统管理员、访问客户、人类学家和IBM Watson超级计算机。正如这个实验室的名称所暗示的那样，它的目标是使用多元化、邻近、物理空间的最优组合破解代码。

目前担任该实验室技术和运营总监的哈斯对此表示，“我们把它称为哺育‘战略意外发现。’这就如同是在淋浴时或饮水机旁找到灵感一样。我们希望把人们聚集在足够宽阔的环境中，让他们享受于此。通过利用房间的连接，数据的连接以及能够掌握用户正在做什么的能力，培育意外发现。”

加速发现实验室的第一个项目是利用Watson超级计算机在新领域的自然语言处理能力，药物研究则是首选。通过与贝勒医学院计算机生物学家的合作，IBM的数据科学家开始在数以百万计的论文、专利和临床研究中采集数据，并最终把他们的注意力集中在了脑肿瘤抑制基因TP-53上。在几个月之内，研发团队就找到了四个候选产品。“加速发现实验室”展露额和项目开发总监杰夫·威尔瑟(Jeff Welser)表示，“通常找到一个产品就需要约一年的时间。”

这个速度确实已相当快，但能否更快一点？该实验室的使命之一，便是对自有空间的研究假设。哈斯表示，“我们当前尝试在项目开始就记录下来，看看这些白板和显示屏能否会获得明显的成效。”

虽然IBM当前还没有计划在其它研发中心建造类似的实验室，但是哈斯希望有朝一日能够开发出一款软件工具，帮助公司管理自有资源。

责编：李玉琴

微信扫一扫实时了解行业动态

微信扫一扫分享本文给好友

收藏到畅享打印全文复制链接添加到收藏投稿邮箱

分享到：新浪微博腾讯微博

著作权声明：畅享网文章著作权分属畅享网、网友和合作伙伴，部分非原创文章作者信息可能有所缺失，如需补充或修改请与我们联系，工作人员会在1个工作日内配合处理。

IBM通过超算机使用大数据来解决大问题

通过咨询项目或年度顾问方式，帮助您架起业务和IT的桥梁，解决业务和IT创新融合、现有系统取舍难、IT架构、建设路径、IT治理、IT支出优化等IT策略问题。

与您签订总包或三方合同，帮您解决业务和IT规划落地走样、IT详细设计缺失、难以寻觅靠谱的技术供应商、多个供应商协调难、维护升级服务保障难等棘手问题。

与您签订监理合同，以里程碑专家评审、项目变更协调、风险控制研讨、供应商关系协调、CIO智力网络等为主要服务内容，与甲乙方一起实现上线成功。

畅享IT帮助寻找可靠的、性价比高的开发力量，签订外包合同或三方合同，为企业提供可信赖的开发量，为IT供应商解决开发力量不足的问题。

畅享IT帮助寻找靠谱的、性价比高的维护力量，签订外包合同，对客户满意度负责，为客户解决维护运营服务保障难的问题。

对IT系统、IT项目或IT管理进行评估，出具中立评估报告，解决IT评价难、取舍难的问题。