|
BI与搜索技术的融合应用 门户当道最近几年来,BI厂商一直在寻找让BI应用更加平民化或大众化的方法,但直到BI与企业搜索技术交叠之后,才使用户看到了BI应用下行的最绚丽曙光。 “企业实施‘BI+搜索’项目的难点体现在,如何把两种不同的技术自然地‘缝合’起来。开发人员必须熟练掌握这两种技术,目前,同时掌握两种搜索技术的人才并不多。同时,要完整呈现不同层面、种类的关联信息,并做出科学的决策,这需要大量的定制开发工作,在目前的情况下实施难度还很大。这些都决定了BI与搜索结合尚不自然的现状。”张天峰说。 门户当道 尽管推进困难重重,但BI与搜索的融合已成一个明确的技术方向。在BI领域,搜索技术炙手可热。Gartner的一位分析师说:“从没见过BI厂商如此急切地寻找搜索技术,今天不会向你谈论其BI软件与企业搜索产品集成的BI厂商是太少见了。”另一方面,搜索厂商也在积极拓宽企业级搜索引擎的覆盖范围,企业BI系统中高质量的结构化数据正好弥补了其搜索的数据源。因此,无论是BI厂商还是搜索厂商,都在寻找合适的落脚点,企业门户正是这样一个能够兼顾双方利益、兼容不同技术框架的战略选择。 “应该说,目前市场上我们所见到的‘BI+搜索’的产品基本上都是围绕门户展开的”张天峰说。文章前面提到的产品大都集中在门户和内容管理方面,在门户平台之上,结构化与非结构化数据搜索、乃至更高层次的信息检索技术形成了多种集成化的解决方案。 在结构化数据的语义关联方面,一些BI软件已经通过模板的使用和数据关联定义等方法,部分地解决了在结构化数据查询中提供上下文关联信息的问题。以此为基础,一些企业级搜索引擎,比如Google、X1,可以将检索出的结构化数据交付BI系统,然后将其结果与自身的搜索索引项建立联邦性的关联。与此同时,BI厂商也在不断强化数据的挖掘和定向交付能力。比如Information Builders支持从流程交易环节获取数据,并且使之对Google企业搜索引擎可用。而在目前,面向结构化和非结构化数据查询结果的联邦技术有望成为BI与搜索技术融合的一个关键部件。 安全与算法问题 在技术演进带来搜索容量提升、BI软件覆盖范围扩大等可喜成果的同时,信息安全问题更加无法逃避。当企业的IT部门在企业范围内部署了搜索工具,并使之与BI决策分析系统连接起来,数据泄漏的风险随之陡然增大。BI分析与搜索功能集成后,企业员工将获得更多的数据查询途径,但跨系统数据的访问控制问题也随即出现。人们发现,为不同部门、级别的员工在这个集成化的系统中定义权限并不容易。 其实,在BI领域,访问控制机制是非常成熟的。目前最需要解决的问题是,如何保证BI与搜索集成之后的系统能够交付员工需要的所有数据。同时准确地屏蔽那些机密的、不在权限允许的范围之内的数据。有安全专家认为,在理想的技术框架下,单点登录(SSO)技术可以解决向员工交付所需完整数据的问题,LDAP访问目录服务器可以解决访问权限控制的问题。但在实际部署时,数据泄漏的问题仍然会在执行环节出现,系统中的很多数据所接受的访问控制并没有被企业范围的访问机制所严格限制。 一些“BI+搜索”解决方案简单地在BI包后面或其他的后端应用中添加用户信任机制,并且依赖这些应用内置的访问机制去限制反馈结果。这种做法显然不够全面,在实际部署时,企业安全策略的调整,在BI系统中搜索引擎添加位置的选择,都是访问控制环节需要关注的细节问题。 在参与技术融合的问题上,每个厂商都是自己的切入角度,而这往往是基于其专有技术的。这在一定程度上导致了目前这个领域所展开的技术研发并不是非常秩序化的,正如前面提到的技术标准化问题。今天,厂商之间已经围绕搜索运算法则展开了较量。 Google一直努力在企业级搜索领域确立如Web搜索世界中的“权威”地位,并表示不会公开自己的算法。而IBM则宣称新推出的基于企业搜索引擎内部相关权重因子的新算法。有关的因子包括客户点击特性、格式、文档进入位置、元数据等。很多产品还提供增强特定文档或URL相关性的方法,以便他们在既定搜索中占据首位。针对企业搜索的特性,一些软件还允许企业针对某些特定术语进行个性化定制,以方便企业实现对关键业务词汇的定向搜索。“在这个领域,你会遇到各式各样的问题,它们与Web搜索有很大不同。比较幸运的是,在这里你至少不会遭遇到有些企业利用卑鄙的手段欺骗你的算法的情况。”Google企业级产品部门的一位负责人风趣地说。 责编:流沙 微信扫一扫实时了解行业动态 微信扫一扫分享本文给好友 著作权声明:畅享网文章著作权分属畅享网、网友和合作伙伴,部分非原创文章作者信息可能有所缺失,如需补充或修改请与我们联系,工作人员会在1个工作日内配合处理。 |
热门博文 |
|