大数据一体机融入数据仓库架构的解决方法

来源: TechTarget中国   
2014/2/12 14:58:32
在当今的商业化的IT系统中,我们会收集存储越来越大量的数据。同时要能够获取、分析这些数据,大多数企业开始转向专有硬件、软件解决方案。这也是一体化设备开始流行的一个原因,针对特定应用场景的硬件数据存储与业务分析软件的耦合度越来越高。

特定的用例

超快的数据分析听上去不错,但很多企业尚没有为分析开发特定的查询或系统。这就导致了很多时间花费在数据加载和查询测试上,而没有产生切实的成果。

合理成本会迅速转化为效益吗?

大多数业务数据分析包括以下一系列步骤:

1.业务分析人员审查报表,查询以及其他数据并形成基于他们分析的逻辑问题;

2.然后开发一个或多个查询用来分析大型数据存储;

3.执行查询;

4.分析人员审查并阐释结果。

一体化的解决方案可以显着减少步骤3的执行时间。但是,其他步骤依然存在。例如,假设以上的每个步骤要耗费一小时,那么总的消耗时间就是四小时。部署一体机可能会将查询执行时间减少为几分钟。虽然这是一个非常显着的时间降低,但是总时间也只缩减为三个小时多一点。

总之,减少查询执行时间肯定是有好处的,但是可能不像之前所认为的那样效果明显。

业务数据“消费”群体

大多数业务数据“消费者”可分为以下三类:

1.技术用户直接运行查询。这些用户会使用SQL针对数据表创建查询,然后使用一个在线SQL执行工具来运行查询并在原始数据表格中生成结果,这样他们便可以直接观察或是下载到一个电子表格以供进一步分析之用。这些用户熟悉这些数据表,拥有SQL相关知识,并且会用简单工具来提炼结果。

2.复杂报表分析人员。这些消费者通常会使用一个复杂的报表工具来显示数据的一个图形数据模型。然后他们会通过拖拽表和字段到一个报表窗口来操纵此模型。此工具接着会创建基于模型和其他参数的适当SQL语句,执行此查询,并显示结果。这些用户熟悉数据,通常不具备SQL专长,而且需要一些高级查询和统计报告的技术。

3.数据集市的消费者。这些用户拥有他们自己的高度专业化的业务数据分析软件。他们会直接从源头提取业务数据并将之存储在一个本地服务器上。然后他们会使用专门的软件来分析数据 任何一个大数据解决方案都必须将这些不同的群体需求考虑进来。

共2页: [1]2 下一页
责编:王雅京
vsharing微信扫一扫实时了解行业动态
portalart微信扫一扫分享本文给好友

著作权声明:畅享网文章著作权分属畅享网、网友和合作伙伴,部分非原创文章作者信息可能有所缺失,如需补充或修改请与我们联系,工作人员会在1个工作日内配合处理。
最新专题
流动存储 为大数据而生

伴随信息技术的突飞猛进,更大量级的非结构化数据与结构化数据构成的大数据成为企业级存储所面临的最大挑战:一方..

磁盘阵列及虚拟化存储

利用数组方式来作磁盘组,配合数据分散排列的设计,提升数据的安全性。虚拟化存储,对存储硬件资源进行抽象化表现。

    畅享
    首页
    返回
    顶部
    ×
      信息化规划
      IT总包
      供应商选型
      IT监理
      开发维护外包
      评估维权
    客服电话
    400-698-9918