请选择 进入手机版 | 继续访问电脑版
麦粉社区
>
帖子详情

[基础操作] 两大杀手锏!大数据轻松拿下

智分析 发表于 2021-9-27 11:13
发表于 2021-9-27 11:13:20
  大数据是现在非常热的一个词,听起来是非常高端的东西,但实际上很多人都没接触过,那么什么叫大数据呢?就是很大的数据,哈哈,开个玩笑。其实大数据的概念非常深奥,我们这里就不谈那么宽泛的东西了,只谈一下和工作有关的大数据吧。例如我们平时工作都会接触到一些数据量很大的表格,可能是几百万甚至是几千万条的数据,如果不用一些特定的工具是很难完成分析的,对于不会这些工具的小白来说,无疑是一个非常头疼的事情。

1.png

  此时我手上有一份汽车行业的数据源,一共有9800万条数据,接近一亿条数据,如果用EXCEL去处理的话,根本是不可能完成的事情,不要说分析了,就连打开文件也没办法做到。我们之前的文章说过,EXCEL只能处理轻量级的数据,如果数据量超过百万行就会非常吃力,这是EXCEL的通病,也和EXCEL的人群定位有关,只适合小型企业或者个人去使用,中型以上的公司就会用其他的工具去分析大数据,例如会用到PYTHONR语言、MYSQL等大数据处理工具

2.png

  但是这些工具不好的地方就是要写代码,你要知道,大部分人都并非是学计算机出身的,如果要理解这些代码都绝非是一件非常容易的事,更不用叫你写代码了,所以对于一般人来说,最实用的方法是直接用现成的数据处理软件,例如BI软件。BI软件的优点就是可以直接与数据库进行相连,又可以提供强大的数据可视化组件,所以很多企业都是直接购买这些软件,既可以提高效率,又可以节省人力成本。市场上有很多非常强大的BI软件,例如TableaupowerBISmart BI等,这里以Smart BI的智分析为参考,直接上干货,教你如何高效率地去处理大数据,下面介绍的是两个非常好用的方法。

1、 即席查询
  所谓即席查询,基本的含义就是可以查询明细数据及明细数据导出,通过简单的鼠标勾选数据字段与拖拽条件字段快速获得所需数据,并提供聚合计算、告警规则、重定义表关系、改变条件组合逻辑等高级功能。这段话有点复杂,那我们通过案例去解释一下。

  比如我们把上那份汽车的数据源连接好了,我们就可以对数据源进行字段的拉取,你可以自由筛选你需要分析的字段,而不需要把所有的字段都选上。筛选好了数据字段之后,你就可以把这个当成是一个数据集,保存在云端里。这个有点类似于你在MYSQL里写select的查询语句,但这里不一样的是你不用通过手写语句去查询,而是通过鼠标去拉拽就行了,非常地简单和高效率。

3.png

4.png

  把相应的字段拉拽完成后,点击保存,便可以进入下面的透视分析了。

2、 透视分析
  透视分析是什么呢?用过EXCEL的人都知道,透视图是EXCEL里非常好用的一个功能,可以把整份数据源进行透视和分析。那么透视分析也是类似Excel透视表的方式,可以任意拖拽字段到行区、列区、度量区、待选列、过滤条件区域等,并且支持多维度,多角度钻取、切片、条件筛选、排序、告警、图表联动、复杂逻辑计算等操作。

  下面我们以汽车数据源为案例进行说明,这里再强调一下,这份数据是接近一亿行的数据量。我们接下来点击即席查询里的透视,就可以对数据源进行透视分析了。

5.png

  打开透视分析之后,会出现一个新的界面,这个界面和EXCEL里的透视表差不多,可以在右边进行数据字段的选取,只要把分析字段拉拽到行区、列区、度量区,点击刷新,便可以得到你想要的分析结果。例如我这里选取了车系、行业和销售量,不到几秒钟的时间,便把几千万行数据量的表格完成了透视,是在是太惊人了。

6.png

  如果你想增加其他的字段,这里也提供了非常智能和人性化的功能,例如你想增加同期值、环比增长等数据,透视分析也可以快速实现,不需要写任何代码和公式,是不是非常方便呢?

7.png

  通过以上介绍的即席查询和透视分析两个非常强大的方法,你便可以快速对大数据进行分析和处理,在时间成本变得愈来愈重要的今天,这两个方法无疑是非常好的选择,非常适合在实际的业务场景中去使用。

8.png

高级模式
B Color Image Link Quote Code Smilies
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

0回帖数 0关注人数 1319浏览人数
最后回复于:2021-9-27 11:13
快速回复 返回顶部 返回列表