BAT"做"大数据,企业"用"大数据

来源:中国软件网  
2014/4/30 11:05:56
随着百度开放“大数据引擎”,超级互联网公司们正在向全社会提供大数据的基础设施服务。敢用、会用,就可以创造更多类似的商业突破和民生福利。

本文关键字: BAT 大数据
BAT三家大数据比较
 
百度、阿里巴巴、腾讯,三家都把大数据升级为集团级战略。但是,如果略作比较,还是存有很大差异。它不仅与其拥有的数据性质有关,也与技术基因、战略优先级和生态系统能力有关。
 
马云曾公开说,“阿里管理好,腾讯产品好,百度技术好”。确实高,切中要害。在BAT中,以搜索引擎为核心的百度技术积累最深厚。作为大数据领域的“技术派”,这让它帮助企业实现“数据资产化”有了相对优势。
 
“我们有一整套在世界上都不逊色的大数据技术,包括数据存储、数据管理、人工智能等方面。这十几年,也有了全网数据、用户查询数据的积累。相对来说,更容易打造大数据引擎,并将能力开放出来。”百度内部人士表示。
 
从三大巨头的数据源看,百度是基于用户搜索行为的需求数据,阿里掌握着交易及信用数据,腾讯则掌握着社交关系数据。“其实深入分析就会发现,搜索已经成为网民最普遍的行为,它包含的数据层面是非常广、非常深的。阿里的数据相对只聚焦于交易数据,腾讯只聚焦社交关系数据,其实缺乏立体维度,实用面不如我们。”上述人士表示。
 
当然,也不是谁拥有最多的用户、流量或数据,谁就在大数据领域最牛。所有关于大数据的论断都认为,大数据并不在于大,质量、性质以及谁拥有它,将决定大数据能被挖掘出来的价值和难度。
 
大数据必成“终极技术之争”
 
再大的数据没分析技术也不行,利用大数据的难点归根结底在于技术。
 
简单说,从数据的收集到存储到清洗,再到脱敏,归类,标签化、结构化,以及最后的建模分析、挖掘利用,均是技术活儿。需要服务器集群、数据利用模型和数据处理算法来保障,然后才是挖掘出来的结果的包装、变现。
 
来看一个例子,最近让业界印象深刻的是“百度迁徙”这样的公益项目,将其应用在民生、新闻等领域。在4月24日的百度技术开放日上,李彦宏宣布百度首次开放核心数据能力。计划通过大数据引擎的“开放云”、“数据工厂”、“百度大脑”三大组件,为传统产业提供大数据存储、分析及处理的能力。
 
阿里巴巴则对外宣称已经拥有100PB数据,并“以令人欣喜的速度”增长。在技术层面阿里也有飞天计划、Apsara分布式计算系统,还有数据委员会这样的架构。马云最新内部邮件将阿里战略阐述为“云端+大数据”,要整体进入大数据时代。但在深度学习、智能语言和图像识别方面还要加速突破。
责编:李玉琴
vsharing微信扫一扫实时了解行业动态
portalart微信扫一扫分享本文给好友

著作权声明:畅享网文章著作权分属畅享网、网友和合作伙伴,部分非原创文章作者信息可能有所缺失,如需补充或修改请与我们联系,工作人员会在1个工作日内配合处理。
最新专题
流动存储 为大数据而生

伴随信息技术的突飞猛进,更大量级的非结构化数据与结构化数据构成的大数据成为企业级存储所面临的最大挑战:一方..

磁盘阵列及虚拟化存储

利用数组方式来作磁盘组,配合数据分散排列的设计,提升数据的安全性。虚拟化存储,对存储硬件资源进行抽象化表现。

    畅享
    首页
    返回
    顶部
    ×
      信息化规划
      IT总包
      供应商选型
      IT监理
      开发维护外包
      评估维权
    客服电话
    400-698-9918