BI选型应该注意哪些?产品,性能,服务缺一不可! 扬帆大明 - 综合 - 金网新闻网

BI选型应该注意哪些?产品,性能,服务缺一不可!

2020-06-29 23:56:48 IT产业网 分享

  本文作者挑选了市面上6款比较常见的BI产品,分别从产品的定位、性能、功能等方面展开了使用测评并进行了总结,与大家分享。

  伴随着ERP、CRM、OA、支付、会员等信息系统的普及落地,国内企业的信息化已经步入快速发展阶段,同时,企业对于商业智能(BI)的需求大量释放。然而,如何选择一款适合自己的BI产品一直是困扰很多企业的难题。

  我们先来了解一下什么是BI。我们可将其定义为:将存储于各种商业信息系统中的数据转换成有用信息的技术。BI的实现包含了“数据→信息→知识→行动→智慧”这一过程所运用的技术和方法。

  BI最早来源国外,国内技术起步较晚,所以国内BI市场最初也被国外的产品所霸占。而随着近几年本土BI产品的崛起,国内企业的选择变得更加丰富。很多企业从国外产品试到国内产品,从明星产品试到小众产品,花费了大量时间和精力才找到适合自己公司当前发展趋势的BI服务商。今天,小编挑选了市面上6款比较常见的BI产品,将分别从产品的定位、性能、功能等方面为大家进行使用测评,希望可以帮助有需要的朋友选择到合适的BI产品。

  测评产品

  本次,我们选择了三款老牌的国外BI产品(Tableau、PowerBI、Qlik)和三款在国内认知度较高的BI产品(帆软、观远数据、永洪)。首先我们从产品定位、聚焦行业以及服务模式对比下这几款产品的差异之处。

  总结来说,因为都是工具型产品,国外老牌的3款BI产品适用的行业会更加广泛。但同时也存在一个问题,都需要依赖第三方公司来落地实施,然而第三方公司的实施水平是参差不齐的,实施的质量和售后服务无法保障。

  再者,本土的帆软、观远数据、永洪,从覆盖行业来说都有自己的侧重点。帆软因为是从报表起家,所以在模式上类似于国外的Tableau和PowerBI,偏向工具层面,覆盖行业也较为全面。观远服务领域相对聚焦,深耕零售消费领域,除了敏捷BI,另外加入了AI的元素,也是中国BI市场融入AI的一个代表。永洪主推是敏捷BI,覆盖行业也较为全面,政府类也是主打的行业之一。

  在产品功能层面,使用者可以从以下几个层面去对比这几款产品的差异。

  01 产品架构

  从国外的产品来说,Tableau和PowerBI在C/S端开发,开发完成后发布至服务器,可在B/S端查看,对于用户来说,灵活性相对较差。

  QlikSense的C/S端和B/S端皆可用于数据分析和看板开发,例如Enterprise Server版本可在浏览器端开发,Desktop版开发者需安装独立客户端,使用本地计算机资源。当开发人员开发同一个项目时,协同性较差,使用产品对源数据进行数据处理后,较难将中间数据集分享进行同步开发。QlikView是通过Qlik Desktop开发,开发后发布至服务器,可在B/S端查看。

  再看国内的产品,FineReport的设计器设计开发报表模板在C/S端进行,需要专门的客户端安装,相对来说兼容性比较差,开发和维护成本较高。FineBI、观远是纯 B/S 端架构,数据分析与可视化构建均在浏览器端完成,维护升级成本降低。永洪也是B/S架构,平台基于MPP(大规模并行处理)架构,但没有数仓作为可承载的容器。

  02 产品性能

  Tableau 的性能一直饱受诟病。2018年发布的 Hyper(收购改造后)一定程度解决了此问题,但面临国内的大数据体量规模依然无法有效承载。

  再看PowerBI,根据Gartner报告,通过受访者访问收集到,PowerBI的数据连接功能常有不稳定的情况。使用者需要将数据导入到PowerBI中,但PowerBI计算性能较差。

  Qlikview的内存计算方式导致了当数据量大的时候,对机器内存的消耗是异常巨大的。Qlikview Community中部分用户举例,当处理上亿行数据时,哪怕使用了256G的内存,依然需要耗费几十分钟去打开。Qlikview虽然有集群,但是本身并不支持任务的水平扩展,且这种高配置机器的投入成本是巨大的。

  FineBI的话,性能在千万级,亿级的数据量下,性能体验是比较慢的。帆软官网给出的速度提升方式是通过建立FineIndex,将数据抽取到硬盘上,但数据会加倍存储,例如原先1G的数据FineIndex需要1.5G~3G的存储空间。

  观远最新的架构是采取Spark + delta lake的架构,Spark 为计算引擎,delta lake为分布式数据库。Spark 是专为大规模数据处理而设计的计算引擎,已形成一个高速发展应用广泛的生态系统。Delta lake是数据湖的概念,作为一个存储层,减少垃圾数据,增加处理性能。最新的产品功能“极速分析引擎”,能够实现1亿明细数据2~3秒返回计算结果,做到亿级数据秒级响应。

  永洪能够支持大数据量下的分组性能优化,避免出现内存占用过高的情况,目前支持千万级数据秒级响应。产品层面也带有“检测性能”的功能,可以提醒用户哪些操作导致性能过慢。

  03 系统集成

  Tableau的话,旧版本Tableau集成能力不开放。系统集成需要美国原厂开发人员支持,尤其对于国内客户来说交付时间长。新版本提供开发人员工具和API,可对 Tableau 进行集成、自定义、自动化和扩展。

  PowerBI仅支持Azure服务器部署,极大限制了IT选购灵活性,基于国内大部分企业现状,部分数据放在本地服务器,数据的连通性将会是较大的桎梏。

  Qlik view支持SSO集成,但值得吐槽的一点是官方文档也存在不准确的情况。Qlik管理控制台(QMC)提供了面向Qlik Sense中全部区域的中央管理与监控点,包括多地理部署。Qlik Sense也可以和Qlik view进行集成,但得先处理好Qlik view报表的权限管控,不是所有的用户都能进行访问。

  总结来说,国外的产品都会存在本地化支持差,例如不支持钉钉、企业微信的集成、以及国内代理商无法针对客户需求进行需求管理和版本迭代更新这样的现状。

  国内的几款产品基本上都可以做到和钉钉、企业微信集成和API接口嵌入支持。

  04 数据接入

  Tableau提供通用的文件数据导入与国际主流的数据库接入,整体来说接入的数据源种类还是比较全的,一些细节上,例如对SAP BW无法进行接入。

  PowerBI提供通用的文件导入与国际主流数据库接入,一般需要通过ODBC连接来接入,不支持方言解析,更无性能调优。例如,Power BI Desktop中的大多数数据连接都需要Internet Explorer 10(或更高版本)进行身份验证。链接的数据源种类多,但常常会有一些验证和限制。

  Qlik提供通用的文件导入与国际主流数据库接入,对本土数据库产品支持能力差。Qlik Sense不支持直连模式的数据接入,类似功能需要使用On-Demand App构建“大数据”的子集加载到服务器内存后才能开始后续计算,构建方式比较复杂,且无法实现计算逻辑下推。在某些动态分析场景下无法预先构建数据子集时,没有可行的方案。QlickView通过单独安装OLE DB和ODBC连接外部数据源,多用户关系型数据库,可能需要安装更多允许客户端电脑访问服务器上数据库的 DBMS软件。

  和tableau一样Power BI和Qlik可对接部分国外主流SaaS数据源,但对国内SaaS数据源无原生支持,定制开发成本非常高。总结来说,国外产品对本土数据库产品支持较差。

  (Tableau截图)

  帆软能够接入来自大数据平台、多维数据库、关系型数据库、No SQL数据库和文件数据源。但无法直连数据库进行跨数据源的连接,在业务包里进行ETL操作后,需要更新FineIndex后才能看到结果。管理员能够进行BI数据连接以及分级权限,支持连接国际主流数据库。

  (帆软截图)

  观远能够接入文件类的excel、csv,支持国际主流数据库的和国产主流数据库的通用接入与定制接入(例如TiDB,MaxCompute, AnalyticDB, Doris等)、以及各种国产HR系统、ERP、POS、CRM等SaaS云平台数据接入。云平台的数据接入在当今的业务发展需求下实际意义更为明显。

  (观远截图)

  永洪也支持接入主流数据库,其他数据库也可以通过 GENERIC 进行连接。

  (永洪截图)

  05 数据预处理(ETL)

  Tableau前不久刚推出了Tableau Prep, 分为两个部分,负责创建数据流的Tableau Prep Builder 和管理调度的Tableau Prep Conductor,在Tableau Server和Tableau Online基础上单独收费,不支持Tableau Desktop,在使用时需要还需单独安装。功能上来说,支持筛选、添加、重命名、拆分、分组或移除字段等清理操作。Tableau Prep Builder 会将数据传递到 R 的 Rserve 或 Python 的 Tableau Python 服务器 (TabPy),并将生成的数据以表形式返回到流程,可以在此基础上继续清洗与分析输出。

  Qlikview具有ETL功能,能够实现数据的抽取,转换和加载,优于大部分传统BI。Qlikview的ETL结果存储于Qlik文件中,当加载相应文件时运行,导致了ETL的复用性比较差,且不具备单独的ETL调度的能力。所以Qlikview的ETL仅能支持简单的关联和聚合,对于复杂指标的计算、数仓的构建,还是需要依赖传统的ETL工具来完成。

  FineBI的ETL主要通过JEP(Java Expression Parser)实现,也可以通过SQL语句实现,但两者不能交互使用。细节上来说,对于多表处理仅支持左右合并,整体用起来逻辑会有点混乱。

  观远有内置智能数据处理模块(SmartETL),支持对多数据源进行数据处理操作与数据融合;并且是拖拽的可视化方式,使用门槛低,对于没有SQL基础的业务人员比较友好。

  永洪和Tableau类似,没有ETL,多数据源的融合相当于做了一张视图数据集,是逻辑上的融合非物理上的数据融合。再者,比较致命的一点是没有数仓建模,数据只是直接抽取到MPP进行列式存储。

  06 分析仪表板

  Tableau作为主流的一款数据可视化工具,有自己的VizQL(数据图形语言),不过使用起来对终端使用者有一定的IT背景要求,一些可视化图表的制作需要多种模块的组合形成。在做自主分析的推广时会因为产品对使用者的要求遇到较大阻力。

声明:本站部分资源来源于网络,版权归原作者或者来源机构所有,如作者或来源机构不同意本站转载采用,请通知我们,我们将第一时间删除内容。本站刊载文章出于传递更多信息之目的,所刊文章观点仅代表作者本人观点,并不意味着本站赞同作者观点或证实其描述,其原创性及对文章内容的真实性、完整性、及时性本站亦不作任何保证或承诺,请读者仅作参考。
编辑: