麦粉社区
>
帖子详情

构建安全易用的数据资产目录管理体系,助力企业实现全...

独家观点 发表于 2021-10-11 09:42
发表于 2021-10-11 09:42:33
  基于数据能给企业带来的巨大效益,越来越多的企业都重视起来数据分析。而随着BI需求响应时间越来越短,BI的普及度不断扩大,同时使用数据分析的人员也在不断的扩大,原来可能只是IT人员使用,现在需要业务人员也要参与进来,全员数据分析迫在眉睫!

1.png

  为了让业务人员也能参与进来进行数据分析,很多企业尤其是大型的企业,都会面临着和构建业务熟悉的数据仓库模型,数据查找、数据资产开放、数据安全等等相关的问题。

1、 如何构建业务人员的数据仓库?对于业务人员来说,他对业务熟悉,但是对技术不熟悉,但是他想进行自主的数据分析,就必须构建业务熟悉的数据仓库模型,这个数据模型应该是由数据资产团队封装好的,业务人员可以很方便的拿来使用。

2、 如何解决业务用户寻找数据的困难?虽然数据仓库模型构建好了,但是对于业务人员,进行数据分析要面对的第一个问题,就是“找数据”,用户通常会有这些疑问:平台已有哪些数据?怎样快速找到我要的数据?我找到的数据到底是不是我想要的?

3、 如何保证进行数据分析时数据的安全性?业务人员要进行数据分析,首先要有这个数据的权限,而数据本身又需要有安全的保证,这样就产生了数据应用和数据安全的一个冲突,需要我们在两者中找到一个平衡点。那么如何开放这个数据权限?开放到什么程度?以什么方式开放?等等,都是我们需要考虑的问题。

  如果能把以上问题都解决了,我们才能在企业实现全员数据分析上打通第一个关卡。那具体怎么解决呢,听我一一道来:

一、 构建企业的数据资产
1、企业数据资产的定义
  首先,我们先来了解一下什么是企业的数据资产。

  广义的数据资产包含产品、模型、算法、服务、数据等相关资源,数据分析的一半工作实际就是资源转化为资产的过程。近两年的中台概念其中一点,就是将这些数据资产整理与暴露给一线(前台)用户。

  这里我们讲的企业的数据资产,是指为了企业全员进行数据分析而封装好的一个数据中台。

2.png

2、语义虚拟层
  为了实现业务人员进行数据分析,这个数据中台需要构建语义虚拟层。语义虚拟层 Semantic Virtual Tier,是Gartner明确定义的概念。 跟语义模型差不多,但虚拟层不存储数据。语义模型应该由IT建立是指能涵盖整个仓库或者分析范围的的逻辑视图

3.png

3、数据资产的构建
  若是企业有较好的数据处理方式,已经在数据库层次创建好数据仓库,而且他们得到的数据质量是非常高的,那么只需要使用业务主题封装好能涵盖整个仓库或者分析范围的逻辑视图供业务人员使用即可,不需要存储数据。

  Smartbi业务主题虚拟的背后是物理数据库,无论是数据仓库还是数据库,无论是一种数据库,还是多种数据库,在这里都可以统一管理,而对于其他产品比如BO,都是需要存储的,并不是逻辑业务上的封装。

  若是企业创建的数据仓库质量不高,或是没有创建数据仓库,可以使用Smartbi自助ETL来处理数据,然后再使用业务主题封装。还可以提供针对不同对象的数据集来直接查询分析数据。

  原则上是针对企业不同的需求,面面俱到给与不同的解决方案,构建覆盖整个仓库或是分析范围的数据资产,以供企业全体人员使用并进行数据分析。这样的数据资产我们称之为企业的数据资产,在我们Smartbi产品中,企业的数据资产概况包含数据源、业务主题、各种数据集、透视分析、即席查询。

二、 解决业务人员的数据查找困难
  我们明确了企业的数据资产概念,并根据不同的需求构建好这样的资产后,业务人员就可以去使用这些资产,而使用这些资产的过程就是把企业的资产“变成“我的资产”的过程。这个过程顺利执行需要解决下面问题:

1、需要先知道有哪些数据。
  我们准备好企业的数据资产后,先根据不同的用户群进行类别的划分,然后根据这些类别进行资源权限的控制,即设置哪些用户允许概览哪些数据。

  说明:概览是一种权限粒度,是指以脱敏的方式查看数据结果。

4.png

  设置完成后,业务人员权限内的数据资产树就可以通过“数据导航”界面进行规划统筹。在这个界面,业务人员可以清晰的看到有哪些数据。

5.png

2、如何快速找到我要的数据
  “数据导航”是以资源树的方式展示数据资产的,那如果有具体的数据要求,我怎么能快速查到呢?这里我们可以通过搜索功能,以全文检索的方式快速查找有平台内部有哪些数据可以使用,以实现快速定位数据。

6.png

3、我找到的数据到底是不是我要的?
  用户在查找到哪些数据可用后,可以对数据进行数据快查,确定是否是自己需要的数据。数据快查包含数据结构、数据预览、血统分析。其中通过数据预览快查的数据,均处于脱敏状态。这样再次保证了数据的安全。

7.png

  用户确定了是自己需要的数据后,可通过数据权限申请流程快速获取需要的数据。当授权通过后,即可使用这些数据进行数据分析了。

三、 解决数据应用时的安全问题
  数据不安全会带来很多危害,企业尤其是金融企业对数据安全性的重视是非常高的。那对于BI产品,我们如何在推进数据分析普及度中又能保证数据的安全性呢?其实我们在上面的章节中也有这方面的设计,下面我们具体说一下:

1、 数据安全第一道屏障
  l 使用操作权限,根据不同的对象划分角色,比如可以分为系统管理员、技术人员、业务人员等。比如系统管理员负责数据源的连接和权限的分配;技术人员负责数据处理、逻辑模型、数据集等的创建;业务人员使用权限内的资产进行数据的分析。

  l 使用资源权限,实现企业数据资产的分配。比如信用卡用户只能看到信用卡相关的数据资产。

8.png

  l 使用数据行权限,控制不同维度下数据行的不同,比如不同区域下同类用户下只能看到本区域的数据。

  这些权限设置属于BI工具中最基础的权限设置。 

2、 数据安全第二道屏障。
  通过资源权限粒度,来控制权限内资源的数据开放情况。比如资源设置为概览权限业务人员在权限受控的前提下进行数据快查,这个时候看的数据是脱敏并抽样的。

9.png

3、 数据安全第三道屏障。
  我们知道通过数据快查的数据是只能看到脱敏的采样的数据,用户确定了是自己需要的数据后,可通过数据权限申请流程快速获取需要的数据。

10.png

  这个操作是非常简单的,我们在数据快查界面可以直接点击申请授权按钮,进入审批流程。而在以前,往往需要通过其他方式进入企业设置的比较复杂漫长的流程申请,数据的审批会需要很长的时间才能完成。

  当审核通过后,用户就可以拿到数据去进行数据分析了。

11.png

  出于数据安全的考虑,传统的“预授权”方式需要额外的权限申请系统,业务人员每次有需求就要提流程,这与“自助分析提高效率”的初衷相违背。而EAGLE通过开放企业数据资产目录、提供脱敏预览和内置权限申请流程三个功能,完美解决数据安全前提下的数据资产开放应用的效率问题。

高级模式
B Color Image Link Quote Code Smilies
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

0回帖数 0关注人数 983浏览人数
最后回复于:2021-10-11 09:42
快速回复 返回顶部 返回列表