拿到一份数据怎么去分析(如何在一堆数据中找到想要的)
"如果你不能量化它,你就不能理解它,如果你不能理解就不能控制它,不能控制也就不能改变它。”
做数据分析经常会遇到一个问题:
- 从一堆海量数据,不知道怎么分析,怎么得出结论;
- 经常空有一堆数据,却无从下手;
- 面对问题,没有思路;
- 做了很多图表,却发现不了业务中存在的问题;
- 谈起使用工具的技巧头头是道,但是面对问题,还是不会分析。
那么面对一个业务场景,通过什么样的方式才能够寻找到正确的数据分析思路呢?所谓正确的分析思路,本质上就是站在一定高度的业务思维逻辑。
01
明目的
数据分析,要带着目的去推进。
一般在日常工作中,数据分析的任务都会以需求的方式呈现,如果在需求中有对背景和分析目的进行交代,无论是有数据还是没数据,至少有了大概的方向。
问目的,就是向需求提出方抛出问题“分析的背景是什么?分析目的是什么,为什么要做这次分析?期望的结果是什么?给谁看?”,明确目的,就能限定分析的“范围”,范围缩小了,才能有思路。
比如说:针对本月1号新上线了一门课程,看一下销售情况如何?”这个需求,分析目的是报告新课销售情况,“思路”就是销售情况。那与“销售情况”相关的指标有哪些呢?时间范围、销售量、销售额、与其他课程同比、对总销售的贡献度、转化率是多少等。
问目的,是为了限定需求范围明确分析方向,有了方向就有了“思路”,分析师再利用自己的特长,将期望的结果翻译成“数据指标”。
02
找指标
我们所做的每个任务、每份工作,都应该有数据指标来衡量。一样东西,如果你不能衡量它,那么你就不能有效增长它。
比如你是HR,那么重要工作就是为公司储备和保留优秀人才,但如果你每次跟老板汇报工作,说的都是自己做了什么工作任务,比如今天组织了员工座谈、明天组织员工跑步,对方肯定是无感的。你需要一些指标来衡量,比如关键人才的流失率是不是降低了,比如人才招聘的速度是不是加快了,比如人效是不是提升了,等等。
所以,关键是找到那些数据指标。你可以想一下,自己的工作任务应该用哪些数据指标来衡量?
只要找到这个,你才有数据分析的基础。
03
懂方法
有了数据指标之后,就可以进行分析了,下面列举了一些工作中熟练掌握分析和洞察数据的方法。
1、相关性分析法:两种指标的关联度如何;
两个指标之间是否有相关性,相关关系包括了线性相关和非线性相关,最常见的就是线性相关,也就是描述当一个连续变量发生变化时,另一个联系变量也相应地呈线性变化。
2、对比分析法:与别人对比,寻找差距;
通过与目标对象的对比,知道自身指标的好坏,寻找差距,定位优劣势。
3、漏斗分析法:由上到下环环相扣转化;
漏斗分析能够科学反映用户行为变化状态,是一个分析从起点到终点各阶段用户转化率情况的重要模型。用于评判漏斗上各个环节的转化效率,准确定位哪些环节出现问题,并通过转化用户和流失用户的画像分析,找出用户流失的原因,帮助提升转化率和降低流失率。
4、分类分析法:物以类聚,人以群分;
将具有相同特征的用户分成一组或一类,与其他组进行分析,如城市分组等;通过分组,可以帮企业发现重点/次要业务或产品、客户等。
5、同期群分析法:同类群体特征在不同时间是如何变化的
同期群分析主要分析相同的用户群体随着时间延续的发展变化情况,它是分类方法在时间上的延伸,强调相同用户群体随时间变化的变化情况。
6、逻辑树分析法:像树枝一样,将复杂问题拆解成若干简单子问题
逻辑树分析法是一种像树枝一样,将复杂问题拆解成若干个子问题进行分析的方法。
7、核心指标拆解法:像剥洋葱一样,将核心指标层层剥离找到问题本质
核心指标拆解法其实是逻辑树分析在企业实际业务中的一个应用,对企业的核心指标通过公式的层层拆解,像剥洋葱一样定位核心指标出现波动的问题和原因。
8、AB Test:小样本灰度测试寻找最优方案
AB Test是一种小样本的后验方法,需要先确定测试目标,并为测试目标设置几种方案,通过观察几种方案的用户表现,找出最受用户青睐的方案做为最终改善产品的方案。
04
可视化
数据的可视化也非常重要,因为如果没有可视化,就是一些数字罗列,那就跟文字信息没什么差异了。
数据可视化的几个原则:阅读门槛别太高,不要过多颜色,突出关键信息,文本与数据呼应。
可以用Excel表格、图表、PPT、POWERBI等形式将数据进行呈现,无论是饼形图还是折线图,还是组合图,目的是要能有形象和有逻辑的说明问题。
怎么样用更加合适的数据图表类型?这里有些常用表格适用范围分享给大家:
- 散点图(适合相关)
- 折线图(适合趋势)
- 横的和竖的条形图(适合对比)
- 瀑布图(适合演变)
- 热力图(适合聚焦)
- 雷达图(适合多指标)
- 词云图(适合看分布)等等
05
出决策
单单是数据的呈现是没有用的,关键是通过数据能发现什么问题,作出什么决策。这个才是最重要的。
第一步是通过观察现象把问题定义清楚,只有明确了问题,才能围绕这个问题展开后面的分析。如果一开始问题就定义错了,那么再怎么分析,也只能是白白浪费时间在明确问题时,也要保证数据本身是准确的,才能进行后面的步骤。可以从时间、地点、数据来源确认问题表现为哪些现象,还可以通过向相关人员提问的方式来沟通清楚。
第二步是分析问题发生的原因,影响问题的原因可能有很多种,在分析原因的过程中,要优先分析那些关键的因素。可以通过“核心指标拆解法”对问题进行拆解,将复杂问题细化成各个子问题,对拆解的子问题,可以使用“对比分析法”找到哪里出了问题,找出问题后,可以通过下面两个问题把原因搞清楚:(1)哪里出了问题?(2)为什么会出现这个问题?
找到原因就完事了吗?还不行,要找到对应的解决办法才是分析的终点。
所以,第三步是找到原因以后,还要针对原因给出建议,或者提出可以实施的解决方案。在决策这一步,常用的分析方法是回归分析或者AARRR分析。
当完成这3步,才能把分析的过程清楚呈现给决策者。这就是使用数据进行有条理的分析,从而准确做出决策的能力。
所以实际数据分析不只是看数据,是有目的,有分析,有反馈还要结合业务的。先想个大方向,然后思考相关数据指标是怎样的,梳理体系。
比如说我们要拉活跃,你可能跟同事说的是,目前DAU的新老用户结构是xxxx,新用户流失怎样,不同渠道区别,对用户做分层,为什么某类用户会出现这样的原因,因为什么原因离开,根据这个原因我们要不要考虑下balabala,看看能不能灰度测试abtest走起balabala。
数据分析不是狭义的,能涵盖的东西有很多,先不要局限在数据,先想某些业务我们觉得哪里有问题,能做什么,再思考数据能用来干什么,怎么抽象出来。