于是我希望,在七周成为数据分析师的系列后,把数据化运营作为第二个系列来完成。每次写文章,对自己也是一种总结和提升。
下面是一份「简略」的大纲,更恰当地说是草稿。当不久的将来开始正式写作时,肯定会更好。
——————
我们将数据化运营分成四个环节:数据收集,数据加工,数据运营,数据反馈。它是运营和产品视角的闭环。
将闭环简化成四个模型,那么它们分别是:
数据收集:以用户和产品的交互为输入,原始数据(行为、业务、流量、外部)为输出。
数据产品:以原始数据为输入,以加工数据(标签、画像、维度、指标、算法结果)为输出。
数据运营:以加工数据为输入,以运营策略(用户、内容、活动、电商)为输出。
用户触达:以运营策略为输入,以反馈行为(转化率、点击率、响应率)为输出。
数据收集
虽然数据收集是技术的事,但是产品和运营人员也应该了解相关的细节。什么是网页参数,什么是服务器日志,数据是如何被收集起来的…下图就是一段服务器日志,是收集数据的方式之一。
255.255.255.255 - - [18/Sep/2016:00:00:00 +0000]
"GET /images/my.jpg HTTP/1.1" 200 19939
"http://www.aaa.cn/bbb"
"Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/29.0.1547.66 Safari/537.36"
如果不了解,当你问到研发:为什么这一块数据没有收集到啊,研发大哥只会翻一个白眼说:你没有要求布置啊。
布置即是埋点,埋点不是一项新兴的技术,它在Web时代就有了。
很多场景中,业务方是埋点需求的发起者。这也是我强调的,运营和产品需要了解埋点,否则,这一块很容易变成坑。
在数据化运营体系,对埋点的要求只会更高。前端埋点、后端埋点、可视化埋点、服务器埋点,各类方式层出不穷。技术问题不需要担心,担心的是应用。
虽说,给我一组行为埋点数据,我用Excel也能写出
协同过滤。可如何最大价值的发挥效用,在埋点初期就应该考虑清楚。所以埋点需要花稍微多一点的篇幅介绍。
最后,学会爬虫,爬虫是一种高性价比高体力活的技能。爬虫有三种主要方式,静态网页爬取,JSON/API 爬取,动态 JS 爬取,再加上各种反爬虫机制的应对。当爬虫水平能爬取微信和淘宝时,已经是草木竹石皆可为剑了。
利用爬虫,运营能做很多好玩的事情。比如出现一个热点新闻,大家马上抓取相关数据,然后新媒体同学洋洋洒洒一篇文章:《大数据告诉你,XXX是什么样的》,《我们分析十万条影评后,得出这部电影XXX》,《XX网站最火热的十条内容》。比憋内容好多了。
数据加工
这依旧是技术研发的范畴。
数据加工的业务核心是指标,我们首先得熟悉各种主流指标的含义和应用。
上图是网上扒来的
数据架构,好消息是并不需要学会。但你总归要理解一个概念,比如什么是 MapReduce,什么是离线什么是实时,什么是缓存,什么是 T+1。
这是为了降低沟通成本,也是方便大家理解数据化运营背后的逻辑。为什么有些报表和数据不能立马获取,为什么有些个性化推荐,如网易云音乐,只能每天定时更新?
一个好的数据化运营体系,需要业务人员和技术不断磨合才能搭建起来。此时,你也会是一位合格的数据产品经理了。
一些数据产品的设计逻辑可以选择性学习,包括
用户画像、广告、CRM 等。它们在一定程度上是相通的,比如
用户画像和广告的人群定向,区别于静态和动态。
用户画像是集大成者的时髦应用,不同公司的
用户画像也不相同。有些用 No
SQL 、有些则是宽表。
用户画像应基于业务出发,切记避免形式主义的画像,你卖保健品的,知道用户喜欢军事有什么用?
机器学习是更时髦的应用,我认为,产品和运营了解些
机器学习相关的知识挺有帮助,这是数据化运营的方向之一。
当你理解
机器学习/
数据挖掘能够做什么,你才能与数据、技术配合它落地。永远别期待数据部门凭空优化业务,他们需要业务部门提供方向和指导。一个懂
机器学习的运营,起码值他们请三顿饭。
话说回来,单纯理解,哪怕是一个文科生,一个月也能懂几个主流的算法模型了。比如
决策树,就是 if-then 的集合,非常简单,因为简单,所以运算速度快,速度快就可以应用在一些特定的场景,比如新用户的内容
推荐系统。这种理解,有助于设计更好的产品。
数据运营
终于轮到业务的环节,这里将着重介绍如何将数据转换成策略。
首先,需要数据化运营的思维。如果运营还是用老虎机、大转盘、抽宝箱的「三板斧思维」,业务走不长远。
我曾经说过,运营和 Growth Hacker 只差一个数据运营的距离。无需特地吹捧国外的增长黑客,只要数据化用的好,人人都是增长黑客嘛,哈哈。
接下来以实际的工作内容解构数据化运营。
用户运营的数据化,分为用户行为和用户体系。
用户行为通过埋点数据分析。
桑基图是最合适的图表(偷懒拿旧图了),上图只是活跃状态的变化。不妨想一下,同样的图表,用来分析用户在产品上的操作路径,比如某个功能模块的使用、退出、跳转,是否能优化产品呢?
除了行为,还要挖掘用户数据,之前一篇文章的分层和分群,就是其中之一。另外也包括用户流失预测等。
活动运营,我准备把流量合并在这块,因为活动都是 Web 页面的形式,两者的道理是相通的。这块也有不少专门的技巧。
大家知不知道,微信会在第三方分享出来的web页面上,打上 &from=timeline 、groupmessage 、singlemessage 的参数。分别对应朋友圈分享、群分享、好友分享。大家有没有研究过,哪些运营活动或者内容,更容易被分享到朋友圈,哪些内容更容易被分享到群?如果加上用户参数,你还能监控到哪类用户的分享效果特别好。我就基于此 AB 测试优化朋友圈的内容点击率,提高了 30% 左右。
同样的,活动运营也能用统计学进行优化,怎么计算活动中奖的概率模型,预估成本?它是典型的二项分布。不同的中奖概率,对应什么样的用户数学期望?如何调整概率达到效果最优,玩法也有很多。
内容运营是数据化的一个难点,因为文本很难量化。从大层面考虑,我们能监控舆情数据,而细节,我们将进行文本分析。
不需要专门学会自然语言处理。而是当用户评论你的产品时,如何判断他们评论的情绪是积极还是消极?当评论有十万条时,怎么去更好的分析?
除了上述最主要的工作内容,我们还要学习商业化运营。这里的商业运营,是涉及到各类营收、GMV 的运营策略。包括电商、广告、会员等。
除了技巧,得花些时间,把策略变成产品和工具。这一块,就涉及到运营后台/平台的搭建了。
数据反馈
最后就是数据反馈了。
AB 测试是数据化运营的大杀器。好的 AB 测试,需要设计相应的运营策略。如何设置对照组和控制组,如何划分出流量,怎么样的样本才能满足置信度的要求。何种手段能够证明运营策略成功了?
除了 AB 测试,得继续熟悉各类反馈指标,点击率、转化率、响应率。包括
机器学习的精确率、准确率、
召回率、AUC 和 ROC 曲线、Lift提升图。这会把大家的思维,从单纯的转化,带到更高层的维度。
比如用户购买商品,转化率是 30%,这是普通运营的视角。数据化运营会怎么看待这个数据呢?他会把用户切割到一个维度,叫做购买可能性。比如用户有 90% 的可能性购买,用户有 80% 的可能性购买,用户有 10% 的可能性购买…这些可能性都是
机器学习预测出来的概率,不同概率的转化率不同。最终划分出一个区间,譬如选择 40% 以上可能性的用户才去做强营销。
好的运营平台,运营人员会获得这类基于预测的数据,告诉你用户对某些运营活动、策略、营销的响应会怎么样,运营人员就基于此选择用户,做到性价比最优化。
于此,数据化运营是阶段性的结束了,之后则是优化改进策略,作为新的开始。
作者 秦路
本文为原作者原创作品,转载需授权
CDA数据分析师考试相关入口一览(建议收藏):
▷ 想报名CDA认证考试,点击>>>
“CDA报名”
了解CDA考试详情;
▷ 想加入CDA考试题库,点击>>> “CDA题库” 了解CDA考试详情;
▷ 想学习CDA考试教材,点击>>> “CDA教材” 了解CDA考试详情;
▷ 想查询CDA考试成绩,点击>>> “CDA成绩” 了解CDA考试详情;
▷ 想了解CDA考试含金量,点击>>> “CDA含金量” 了解CDA考试详情;
▷ 想获取CDA考试时间/费用/条件/大纲/通过率,点击 >>>“CDA考试官网” 了解CDA考试详情;