有句老话说,人一胖他就喘,而企业一旦有了很多数据,就想做些分析。前几年,数据仓库项目先是在电信、金融行业广泛开展;近两年,在零售、制造业中也不断传来建设数据仓库的消息。这就是因为这些企业已经沉淀了足够数据的缘故。
当然,有些企业是出于经营分析的需要,有的企业则可能是看着竞争对手上了个数据仓库,唯恐自己落后紧赶着上的。而不管如何,当企业开始它们首个数据仓库(或称商务智能)项目时,大都会被一个问题困扰――应该使用什么样的产品组合。
“洋玩意儿”何其多
在选型之前,不妨数数现有的BI主流产品都有哪些。
数据库方面,有DB2、Oracle、SQL Server、Teradata,早先还有专门用于数据仓库的Redbrick(被IBM收编以后,退出历史舞台)。
ETL工具上,像Datastage、Powercenter都是比较主流的,此外,还有很多公司也有自己的ETL产品,例如SAS的ETL Server、BO的Data Integrator等。
OLAP 工具上,则还可以细分为MOLAP(MuiltDimension OLAP,多维度型在线分析系统)和ROLAP(Relational OLAP,关系型在线分析系统),前者可以选择Hyperion、Cognos、Microsoft公司的产品,而后者可供选择的余地就不多,像 Microstrategy可能是目前能够看得见市场份额比较大的,以前和Redbrick一起。此外,还有一个叫Metacube的ROLAP工具,早在2000年以后也退出市场。
数据挖掘产品领域,有SAS、SPSS等两大厂家,而像IBM、Teradata也都有自己的挖掘工具。除此之外,在报表服务器、前端工具上的选择可就多了,其中,Cognos、BO、Brio是比较主流的。
从这些主流产品来看,大多是舶来品。国内也有研发BI产品的,但多限于ETL、前端以及数据挖掘产品。这种局面和国内以往的产品选型有着莫大关系,因为在这三块领域很多项目都曾经自主从头开发过。
说的要比唱的好
从目前各类用户的产品选型过程来看,问题多出在以下几个方面。
其一,只见树木不见森林,只顾得降低单个工具的成本,却忽视了总体成本。有些大企业在IT建设上一掷千金,从不在乎在购买产品上投入多少,每一块都是选用最好的。但是,更多的企业则不得不出于成本考虑,能省则省。除了数据库和OLAP工具两项之外,经常动心思的地方就是,设想如果把ETL和前端展现自己来开发是不是会省点资金出来。
然而问题是,如果仅仅从单个产品的成本考虑而忽视综合的项目成本,最后很可能会被难以维护的程序所困扰,甚至要完全推翻重来,这样的成本恐怕会更高。而对于那些财大气粗的大企业来说,即便选择了每个领域最好的产品,组合起来也不一定就是最好的。
其二,全方位解决方案并不受待见。如今几乎每家公司都号称可以提供全方位解决方案,提供一站式服务。像IBM、Oracle、SAS都称自己是这样的全方案提供商,也就是说它们的产品线已经包含了数据库、OLAP、ETL等各类工具。直接选用它们,就不用再为工具选型烦恼了。事实上,这样的厂家还在渐渐增多,它们有的靠OEM专业产品,有的则直接购并专业工具厂商。
选择这样的产品组合可能是明智的,然而在国内还没有完全能够吃得开。因为中国人讲究制衡,所有的蛋糕都给你一家拿去了,以后你J起来,我岂非很被动?因此,通常还是要引入多家原厂商,让它们合作并竞争着吧。
其三,评估报告难以客观。企业负责产品选型的人,通常要求厂商提供一份评估报告,要列出几种方案选择,各自优劣何在,最后得出哪种方案是最适合自己的。
如果从字面上理解此报告,某种产品哪方面比较好,哪方面不好,这纯属扯淡。此种报告,不可能指望它的客观性。想想,对于厂商来说,这就是一笔单子,当然将自己产品吹上天去;而对于集成商来说,或许它就在代理某种产品,当然会推荐特定产品;对于这个选型负责人来说,也许他早就对某种工具有好感,或是跟某个厂家的关系不错,甚至有更进一步的交易。这样的情况,想客观一点不容易。
自己就曾遇到过一件事,一次客户的系统升级,原先的系统使用几年了。客户提出希望连带工具一并换了,在提出方案之后(当然是我们熟悉的方案),对方负责人也提出一个小小的要求,看ETL工具是否能够用某某产品。不巧的是,那个工具我们公司根本没人会,而且国内也没几个应用案例,没敢答应。没想到会后,销售说到:“你们都傻啊,这不是明摆着吗,人家已经做工作了,咱们要是能用那个产品就用吧,犯不着得罪客户。”
四项要点帮助企业做好BI产品选型2
选型四要点
其实,如果是选择这些主流的产品的话,大家知道一句话,“没有最好的,只有最合适的”。什么是最合适?抛开上面提到的幕后因素,其实也就
是四点需要考虑――产品成本、开发人员对这个产品的熟悉程度、有没有类似案例,以及你跟人家厂商关系谈的好不好。
首先看成本。NCR、 IBM和Oracle的产品线完整,但J贵。微软的产品便宜些,可如果你的数据量够大,恐怕又不太敢用它,就更别谈那些不要钱的开源产品了。当然,成本不光是产品本身的价格决定的,后面人员学习、项目延期、客户满意度低都要作为成本考虑,这些隐型成本才是难以计算的。
再看人员的经验。人的学习曲线是不可避免的,不要妄想人们接触一个新产品就能立马成为高手,能够基于陌生的产品做出良好架构。这方面,显然Oracle和微软有优势,因为在这两家产品上有经验的人多,好找。当然,如果你们原来的业务系统用的就是这几家产品之一,不妨仍然用它。
案例比白皮书更重要。当你决定不使用一家产品,为了平衡利益关系选择不同的产品组合时,要考虑他们之间是否兼容。但如果你要是从产品的白皮书里去寻找此类信息,会发现说得很美,互相之间会如何完美地“无缝”兼容,但实际上却不是那么回事。因此,不要去看这些文字的东西,要去寻找同行业类似的案例,如果同行业没有,就去寻找数据量类似、业务复杂度类似以及相似应用的其他行业案例。
最后还得看你和厂家的关系,项目实施过程中免不了要人家支持。如果你是一个大企业,还好,厂家跟在你屁股后面跑,如果你是个小单位,项目预算小,对不起,那些大厂的销售也不太愿意低下他们高贵的头。因此,还是观察观察,哪个厂家会可能给出更大的支持吧。
如果从这四方面还是没有决定该选哪些组合,你或许只有最后一招:掷骰子。