一般聊到如何做数据分析的数据文章,都会从各个视角去介绍数据分析的分析思路和流程。但今天这篇文章,想做先避新手不会告诉你怎么按1234的数据步骤做数据分析,而是分析告诉你在数据分析中,不要做什么。想做先避新手
正如查理芒格所言:“在生活和事业中,数据很多成功都来自于你避免了某些事情:比如早逝、分析糟糕的婚姻等。” 我相信,和“要做到好而深入的数据分析”相比,“不在数据分析中踩坑”会是更易于执行的事情,这是也这篇文章的诞生原因。
以下的错误集合,都是从身边的真实案例总结而来的。从错误出发,也会给出我们认为正确的做法和思路,希望能对大家的真实工作场景有所启发。
错误1:最后一刻才想起要数据分析
典型的场景是,领导和你说:明天交一个总结ppt给我。这时候你才想起来去提数和分析,很可能为时已晚。如果是常规的数据可以看内部的数据平台去获取;但如果是个性化的看数需求,就必须经历以下这些步骤:确定埋点方案、开发埋点、与数据分析师的具体提数需求沟通、实际提数、整理数据、最终分析。在这么长的链路中,如果有哪一步漏了,都有可能导致你拿不到想要的数据。
解法:从项目初始阶段便需要有数据思维
正确的方式是怎样的呢?应该是从项目开始,就根据你的方案,去定义你应该看什么数据来衡量最终的设计成败。这样一来的好处是,首先会倒逼我们从考虑方案的时候,就专注于能带来实际数据提升的方案,避免自嗨型方案、没有办法衡量结果成败的方案;其次是这样才能保证,我们在埋点的时候不会漏掉本该埋的数据,避免最终上线出现没有埋数据,导致无法衡量结果的情况。
错误2:对基础数据指标的定义不了解
不了解基本的数据指标概念,也是一个常犯的错误。例如说我们常遇到团队中的新人会有这样的疑问:客单价和 UV 价值有什么差别?UV 点击率和曝光点击率有什么差别?这就是对于数据指标的基本概念理解不足造成的。如果连指标都的含义都没有了解清晰,对于进一步的数据分析一头雾水也是难免的。
解法:从定义来初步认识,从影响因素和场景来加深理解
首先,最简单粗暴的方式,就是通读指标解释。一般数据平台都有地方专门解释这个指标的背后公式,这些解释会帮助我们建立对不同指标的初步理解。之前也写过一篇文章《电商设计,你必须懂的10条数据指标》,希望能加深大家对于数据指标的理解。
更进一步,有两个角度可以尝试去思考。例如以客单价和单 UV 价值的案例来说,第一个角度,是看这个指标的关键影响因素。像客单价,是更容易受到货的属性影响的,奢侈品的客单价天然就会趋向于比消费品的客单价更高;单 UV 价值,更容易受到流量质量的影响,比如把促销敏感型的用户导入了奢侈品的频道,这个时候,一般 UV 价值是会极低的,而客单价可能没有太大的变化。第二个角度是看这个数据指标的使用场景。如客单价,可以用来看这个业务的品类特征如何,UV 价值,是用来看流量与业务匹配度,以及判断业务的潜力。比如,看要不要给到这个业务更多的资源,就可以看 UV 价值,因为 UV 价值高,就代表了给这个地方更多的同类流量,它的 GMV 就会更高。
错误3:分析逻辑链缺失
一个典型的案例,是只看了 GMV 上涨,就下定论说代表我的策略是成功的。为什么有问题呢?因为 GMV 上涨是各种变量综合导致的结果,如果不去深入分析其中到底是什么变量导致了 GMV 上涨,是不能直接跳过中间的逻辑链去下判断的。
解法:拆公式、拆链路
首先是从公式上直接开始分析。假设你之前的策略是提升转化率——那么在如上图的公式拆解中,虽然最终的gmv是提升的,但因为gmv提升主要是由浏览UV的提升带来的,因此转化率相关的策略可以说是失败了。
第二个思路,是由宏观到微观的方式去排查问题的方式。电商场景中,我们可以先看交易数据,看下是否达到了当初的预期,与历史对比是涨还是跌;然后再看流量数据,因为流量是影响 gmv的最大因素之一,这时候就可以分析交易数据的涨跌,是否是因流量的涨跌导致的;或者说是流量质量导致的转化率低等等;如果分析完,发现流量的影响不大,这时候可以进入下一级,去分析核心的节点是否存在问题。比如在电商黄金流程场景中,我们看搜索、商详、加购等核心页面的漏斗;而在大促场景中,我们可能会去看主会场的主推楼层们是否达成了预期的产出。这个就是以宏观到微观去排查问题的思路。
错误4:只抓了一条变量,忽略其他关键变量
有时候,我们的分析看起来有理有据、是有数据支撑的,初步看起来逻辑没有大问题。例如说,根据以下这个点击率的图表,似乎可以直接推测出这个页面里,除了XX楼层以外,其他的楼层表现不佳。于是我们可以直接下结论说:未来还做这样的页面的时候,迭代的方向,就是直接把表现不佳的楼层去掉,只留下这个表现好的楼层了吗?——这样的结论是失之轻率的。那到底问题出在哪里呢?
问题在于:我们似乎建立了一个前提,即这样的数据结论是仅仅源自“楼层的定位或者设计”这一个变量而导致的。因此数据好=楼层的定位和设计成功,要延续;数据差=楼层的定位和设计成功,要复用。但是现实情况,永远比我们设想的要复杂。仅抓了一条变量就贸然下结论,风险是比较大的。
解法:找到各种关键变量,排除或确认这个变量的影响
回到真实业务场景,会发现还有更多变量。在这个案例中,我们第二个要考虑的变量,是流量渠道。以上图表是APP的楼层数据,那么M端是否是一样的趋势呢?拉出来M端的点击率图表一看,会发现趋势完全是不一致的:
此时有了第一个猜测:APP端流量更多内部自流量,M端更多外推流量,因此我们可以得出,这个点击率反映的是JD自有流量和外推流量对于这个页面完全不同的行为特征。
那为什么外推带来的用户和站内的用户,对同一个页面的需求差异那么大呢?因为这是一个以 IP 内容为主的页面,页面大部分区域都是 IP类商品,是带有一定粉丝向的。直到页面很下方才有非 IP 角度的商品,这里的商品是全品类的。说到这里,大家应该意识到了:这里还有第三个变量——楼层的内容差异。此时把第二个变量与第三个变量交叉判断,就是本次数据分析的关键问题:楼层内容与流量渠道的匹配度高低。
根据上面的分析,我们可以得出最终的结论:
以上就是一次如何排除各自变量影响的分析案例。基本的思路是:不要满足于你手上抓住的那条变量,而是尽可能多地找到这个场景里的关键变量,再一个个变量去排除或者确认它的影响,最终才得到较合理的结论。
小结:跨过分析门槛→深挖分析深度
总结以上的问题,发现这些问题本质上是从分析小白→到分析进阶者之间遇到的一些门槛。就如下图一样,要输出一份符合逻辑、能对业务有实际帮助的数据分析,我们就需要避免踩到这些坑。
而我们的解法,就只有踏实做好以下的事情:
以上就是关于数据分析如何才能不踩坑的个人心得,如果有任何数据相关问题想讨论,欢迎在文章下方留言~
责任编辑:未丽燕 来源: 优设 数据分析数据思维错误(责任编辑:热点)
Interview: China can play vital role in stimulating global growth in 2023, says UN economist
Rio Tinto apologises for loss of tiny radioactive capsule in Australian outback
insta360 One X记录自驾途中,期待新品更多乐趣 房车露营G318
Asteroid to come 'extraordinarily close' to Earth: NASA
Chinese embassy deeply concerned about UK gov't's attitude to Japan's nuclear
Trump pleads not guilty in 2020 Georgia election case