数字宇宙规模激增 大数据仍有待挖掘

来源:eNet硅谷动力  
2013/3/12 16:58:39
大数据无论对个人还是企业来说都已不再是新鲜的词汇,随着全球新兴市场中不断增长的互联网访问量,以及各种终端设备产生的海量数据,数字宇宙的规模在近两年内实现了翻倍增长

本文关键字: 数字 大数据

大数据无论对个人还是企业来说都已不再是新鲜的词汇,随着全球新兴市场中不断增长的互联网访问量,以及各种终端设备产生的海量数据,数字宇宙的规模在近两年内实现了翻倍增长。近日,据市场研究机构IDC的报告显示,目前的数字宇宙规模达到2.8ZB,它们还预计到2020年,这个数字将高达40ZB之多。

在IDC本次研究报告中,提及了以下几项值得关注的焦点,以及一些具体的数值。

到2020年,数字宇宙的规模将超出预期,达到40ZB,这相当于全球所有海滩上沙粒数的57倍,且人均数据预计将达到5247GB。数字宇宙出现大幅度膨胀的主要原因是机器生成的数据量的增长;IDC研究显示,2005时机器产生的数据量仅占数字宇宙的11%,而到2020年将超过40%。

数字宇宙规模激增 大数据仍有待挖掘

数字宇宙规模远超预期

大数据的前途取决于从大量未开发的数据中提取价值,然而大多数新的数据是基于文档未被标记的非结构化数据,人们对此还知之甚少。2012年,若经过标记和分析,数字宇宙中23%的数据将成为有效数据,大约为643EB;但事实上只有3%的潜在有效数据被标记,大量的有效数据不幸丢失。此外,到2020年,若经过标记和分析,将有33%(13000EB)的数据成为有效数据,具备大数据价值。

相比于有效数据的丢失,数据安全更值得关注。目前,需要保护的数据量的增长已超过了数字宇宙自身的增长。早在2010年,仅有不到1/3的数据需要保护,到2020年这一比例将超过2/5;2012年的统计显示,虽然有35%的信息需要保护,但实际得到保护的不到20%。同时,在新兴市场,数据保护的缺失比较严重,数据得到的保护级别也因地区而异。由于威胁的不断升级,以及安全意识和技术的不足,将使消费者和企业面临的数据安全挑战更加严重。

数字宇宙这个概念过去曾是发达国家的一种现象,目前这种情况将随着新兴市场中人口的呃数字影子增长而变化。2010年,新兴市场只占数字宇宙的23%,2012年达到36%;根据IDC预测,到2020年,这个比例将猛增到62%。IDC还公布了目前数字宇宙的全球比例:美国32%、西欧19%、中国13%、印度4%、其他国家32%;值得注意的是,中国成为全球仅次于美国的占数字宇宙比例最多的国家,预计到2020年中国将产生全球21%的数据。

此外IDC研究还显示,随着数据量的爆炸式增长,以及云计算在大数据管理中扮演的角色日渐重要,全球范围内的服务器数量将增长10倍,而由企业数据中心直接管理的信息量将扩大14倍。

本次IDC数字宇宙研究报告是由云计算领导厂商EMC赞助的,该报告是IDC第一次显示数字宇宙中的信息来源地,即它们是在哪里被首次抓取或利用的,并揭示出如以上提及的一些正在发生的重大转变。数字宇宙报告创立6年以来包含了对“大数据鸿沟”的研究,阐释了那些价值被隐藏起来的数据量和价值被真正挖掘出来的数据量之间的差距。

EMC公司产品运营与市场营销高级副总裁Jeremy Burton表示,大量复杂的数据不断地干扰业务运营,促使IT部门必须做出选择:要么因信息过载而瘫痪,要么采取措施以利用这些数据流的巨大潜力。今年的研究报告强调了数据可以为企业带来大量商机,它不仅发现了数字宇宙的潜在效益,而且强调了通过技术、安全实践和IT技能的正确组合来驾驭数字宇宙的重要性。

责编:李红燕
vsharing微信扫一扫实时了解行业动态
portalart微信扫一扫分享本文给好友

著作权声明:畅享网文章著作权分属畅享网、网友和合作伙伴,部分非原创文章作者信息可能有所缺失,如需补充或修改请与我们联系,工作人员会在1个工作日内配合处理。
最新专题
流动存储 为大数据而生

伴随信息技术的突飞猛进,更大量级的非结构化数据与结构化数据构成的大数据成为企业级存储所面临的最大挑战:一方..

磁盘阵列及虚拟化存储

利用数组方式来作磁盘组,配合数据分散排列的设计,提升数据的安全性。虚拟化存储,对存储硬件资源进行抽象化表现。

    畅享
    首页
    返回
    顶部
    ×
      信息化规划
      IT总包
      供应商选型
      IT监理
      开发维护外包
      评估维权
    客服电话
    400-698-9918