大数据“润物无声”大产业

来源: 求是理论网   
2013/11/7 20:49:33
在工信部发布的物联网“十二五”规划中,作为四项关键技术创新工程之一的信息处理技术中包括海量数据存储、数据挖掘、图像视频智能分析,这些都是大数据的重要组成部分。

本文关键字: 存储 大数据 数据挖掘

数据显示,从现在起直到2018年,全球大数据市场的年均复合增长率将达到26%,从148.7亿增至463.4亿美元。中国工程院院士邬贺铨也表示,继云计算后,大数据成为信息技术领域最为热门的概念之一。在工信部发布的物联网“十二五”规划中,作为四项关键技术创新工程之一的信息处理技术中包括海量数据存储、数据挖掘、图像视频智能分析,这些都是大数据的重要组成部分。

然而,大数据究竟是怎么回事?在现实场景中又有哪些应用?这个“时髦”的新产业,将给我们的生活和工作带来哪些巨大的变化?

取之不尽的“数据金矿”

什么是大数据?《大数据时代》的作者之一舍恩伯格将之定义为“不用抽样调查的捷径,而采用所有数据的分析方法”,简单来说,就是利用互联网和计算机对海量数据进行抓取、管理和处理,并且从中提取出有意义的讯息。

大数据有什么用?一方面大数据技术可以扎扎实实地用数据说话,打破直觉和思维定式。舍恩伯格曾经举例说,人们常常会说冬天要记得戴帽子和手套,避免着凉感冒,但大数据会告诉你,感冒来自于病毒,跟戴帽子手套没有直接关系。二是大数据技术可以让人们对未来进行“预测”,通过对所有可能的数据进行分析,而找到数据之间的关联性,并由此预测出趋势。

日本SS制药公司运营的网站Kazemiru正是大数据技术应用的一个生动写照。这个网站通过对数万条推特信息的抓取,找到日本各地可能正在感冒的人,并通过与昨天的数据进行对比,并结合气温和湿度变化来预测感冒在不同地区的流行情况,为每个登录该网站的用户提供“感冒日历”,通过与日本国立感染症研究所对全国5000个医疗机构的感冒患者的统计数据对比,Kazemiru的预测与实际情况基本一致。

大数据技术在今时今日的“井喷”也事出有因。大数据,首先要有足够多的数据产生。随着互联网的高速发展和成熟,互联网产生内容和数据的能力不断增强,百度技术委员会理事长陈尚义曾透露,百度每天处理的数据量接近100PB,而1PB相当于5000个国家图书馆的信息量总和,此外在每分钟内,新浪和腾讯微博发送出数万条微博,淘宝卖出了近10万件商品……来自市场研究机构IDC的数据显示,2011年全球数据总量已经达到1.8ZB,这个数值还在以每两年翻一番的速度增长,预计到2020年全球将总共拥有35ZB的数据量,增长近20倍。而每个ZB的数据,都相当于装满10亿个1TB的移动硬盘。

其次,还要有储存和分析这些数据的能力。从硬件设备来看,计算机性价比的提高,磁盘价格的下降,大幅降低了大数据存储和处理的门槛,数据显示,2000年的硬盘驱动器平均每GB容量的单价约为16美元到19美元,而现在却只有7美分。在重量上,1982年世界第一台超GB存储器容量为1.2GB,重113千克,而现在,32GB的微型SD卡仅有0.5克。从处理能力来看,云计算成为最重要的推手,数据被搬到了“云”上之后,更容易被收集和获得,而云计算强大的处理能力也使更多行业和企业有机会对数据进行整理和分析。

“真金白银”领跑行业应用

去年11月份,北京公务员胡晓璐摇到了车牌号,在网上四处查询和对比各种汽车型号之后,她惊讶地发现,自己看到的汽车网络广告变多了。

胡晓璐所不知道的是,在她点开某个网页的瞬间,一场“拍卖”正在悄无声息地进行着。广告交易平台迅速地向各大需求方平台发出“这儿有个广告位”的信息,需求方平台则根据她之前的浏览行为判断出“这个人可能要买车”,然后迅速出价,谁出价最高,胡晓璐就会在点开的网页上看到谁推送的广告,一切都在0.1秒内完成。

这就是RTB(实时竞价)技术,利用大数据,它可以根据每个用户的具体偏好来精准地投放互联网广告。和这项技术一样,与营销、电子商务、互联网金融等等“真金白银”相关的大数据技术最早被投入到对商业模式的变革之中。

1号店负责生鲜业务的副总裁郭冬东告诉本报记者,通过对海量数据的分析、判断和整合能力,1号店可以精确地预测第二天生鲜货品的订货数量,然后向供货商下订单,产品第二天早上8点进库。“综合折算下来,仅在仓储环节,损耗率可以控制在个位数,而传统线下渠道的损耗率一般是30%左右。”借助大数据,电子商务平台得以进军传统零售业的“腹地”。

共2页: 上一页1 [2]
责编:王雅京
vsharing微信扫一扫实时了解行业动态
portalart微信扫一扫分享本文给好友

著作权声明:畅享网文章著作权分属畅享网、网友和合作伙伴,部分非原创文章作者信息可能有所缺失,如需补充或修改请与我们联系,工作人员会在1个工作日内配合处理。
最新专题
流动存储 为大数据而生

伴随信息技术的突飞猛进,更大量级的非结构化数据与结构化数据构成的大数据成为企业级存储所面临的最大挑战:一方..

磁盘阵列及虚拟化存储

利用数组方式来作磁盘组,配合数据分散排列的设计,提升数据的安全性。虚拟化存储,对存储硬件资源进行抽象化表现。

    畅享
    首页
    返回
    顶部
    ×
      信息化规划
      IT总包
      供应商选型
      IT监理
      开发维护外包
      评估维权
    客服电话
    400-698-9918