淘宝网,是全球最受欢迎的网购零售平台之一,拥有近5亿的注册用户数,每天有超过6千万的固定访客,同时每天的在线商品数已经超过了8亿件,平均每分钟售出4.8万件商品。
作为电商行业的标杆,淘宝网的用户行为数据,一定程度上反映了用户的购买行为规律。本项目利用MySQL对淘宝用户行为数据进行分析,探索不同用户的消费习惯,结合店铺营销策略,以实现精准化运营,减少运营成本,增加店铺营收。
探索目标:每日不同时段流量走势,质量如何?用户行为转化情况怎样?如何提高留存、增加复购?如
何判断高价值用户,针对不同用户如何进行个性化营销?
分析思路:
1.数据获取
数据集来源于淘宝APP移动端,2014年11月18日至2014年12月18日的用户行为数据。
2.数据理解
表中有7个字段:用户ID、商品ID、商品类目ID、用户行为类型、用户所在地理位置、用户行为时间、金额,一共有12256905条数据。限于电脑性能,仅提取前1048575条记录用作分析。
3.数据清洗
3.1建表导数:
create database taobao;
use taobao;
create table UserBehavior(
user_id int,
item_id int,
item_category int,
behavior_type varchar(10),
user_geohash varchar(10),
times datetime,
amount decimal(5,2)
);
load data infile "C:/ProgramData/MySQL/MySQL Server
8.0/Uploads/UserBehavior.csv"
into table UserBehavior
fields terminated by ','
ignore 1 lines;
3.2缺失值处理:
查询结果中发现user_geohash字段存在缺失值,缺失比例超过50%。缺失严重的数据在后续分析中意义不大,可做删除处理。
3.3异常值检查
检查发现该数据集中不存在异常值。
3.4重复记录处理
该数据集有86478条重复记录,筛选不重复的记录共962097行。
3.5字段处理:
根据times字段增加计算字段用户行为日期、周和小时,排除后续分析不需要的user_geohash字段,并将筛选后的结果保存到新表。
清洗后的数据集共962097条记录,展示了2014-11-18至2014-12-18这一个月内,8477位用户对7095个类目下701609个商品产生的902050次点击,29016次加购,20930次收藏,10101次购买行为。
1.流量指标分析
查询结果中发现浏览量PV、访客量UV和人均浏览量的总体变化趋势是相同的。11月18-29日,PV在25000-28000之间,UV在5800-6200之间,人均浏览量在4.1-4.6之间,成交量在260-320之间,销售额在20000-28000之间;11月30日-12月10日,PV在27000-31000之间,UV在6000-6400之间,人均浏览量在4.4-4.9之间,成交量在280-370之间,销售额在22000-30000之间;12月11日、12日因双12的缘故,PV分别达到了35851、51034,UV分别为6576、7049,人均浏览量分别为5.5、7.2,成交量分别为409、569,销售额分别为32022.71、46100.93;而在双12之后,PV也稳定在28000-30000之间,UV在6000-6200之间,人均浏览量在4.6-4.8之间,成交量在280-340之间,销售额在22000-28000之间,远远优于11月29日之前的数据,说明双12的营销活动对用户行为有显著影响。
同时,在11月21、28日,12月5日,浏览量PV、访客量UV、人均浏览量、成交量和销售额都出现了不同程度的下滑。细查发现以上三天都是周五,观察流量的周期性变化中发现,每周二到周四数据比较稳定,周五到周一会出现小幅度下滑,这跟大部分用户的工作和生活习惯息息相关。
从每天的时间段来看,21点和22点是用户活跃的高峰时间,人均浏览量在10次以上,22点之后一路下降,一直到凌晨4点降到最低值,4点到10点渐渐回温,10点到18点基本稳定,18点之后开始一路攀升,商家可以集中资源,在用户活跃度较高的时间段采取一些引流手段。
2.行为转化分析
浏览人数:点击产品详情页的用户数
收藏人数:收藏产品产品详情页的用户数
加购人数:将产品添加到购物车的用户数
购买人数:下单的用户数
在所有用户行为数据中浏览产品详情页后产生购买行为的用户只有4330人,占浏览用户的51%,也就是说,还有49%的用户行为是没有转化为成交的,用户在浏览商品详情页后出现了大量的流失。那么从浏览到购买,每个环节的转化率是多少?用户主要是在哪个环节流失的呢?
对比发现,从浏览到收藏的转化率仅为38.73%,而浏览到加购的转化率为61.41%。因为收藏和加购行为之间并没有直接的先后关系,且加入收藏后并没有可以下单的入口,如果需要购买必须重新点击商品进入详情页才能下单,所以用户更愿意将感兴趣或有购买意向的商品添加到购物车。
在浏览-加购-购买的购物行为路径中,加购转化率为61.41%,购买转化率为83.21%,也就是说大部分的用户更偏向于将商品添加到购物车后下单,可能是为了凑单参加满减优惠。
分析每天浏览-加购-购买的转化率情况发现,浏览-加购的转化率变化并不明显,双十二之前稳定在10%-13%之间,仅在双十二当天达到17.26%,且在双十二之后转化率明显下降。而加购-购买的转化率波动较大,在感恩节、服饰焕新和双十二活动前后分别达到了45.48%、44.21%、42.81%,而双十二之后的数据表现也明显优于双十二之前,说明部分商品在双十二之后依然有返场活动,促进用户消费。
3.消费偏好分析
根据二八法则即20%的产品贡献了80%的销售额甚至更多,将产品的贡献定量分析,哪些类目的商品贡献了多少的消费额。
在2066个商品类目中,销售额排名前623个类目贡献了646009.09的销售额,可集中人力和财力优化这些类目的商品及渠道。
4.用户价值分析
通过对用户价值的细分,进行差异化的精细运营,从而提升运营效率和用户体验。RFM模型是衡量客户价值和客户创利能力的重要工具,通过客户的消费时间间隔(Recency)、消费频率(Frequency)以及消费金额(Monetary)三项指标来描述客户的价值状况。
-- 查询每个用户消费时间间隔、消费频次、消费金额
+-----------+--------------+----------+----------+----------+
| user_id | 最近消费时间 | 间隔天数 | 购买次数 | 消费金额 |
+-----------+--------------+----------+----------+----------+
| 101260672 | 2014-11-20 | 29 | 1 | 72.55 |
| 116730636 | 2014-12-18 | 1 | 4 | 372.04 |
| 104811265 | 2014-12-09 | 10 | 1 | 120.71 |
| 106230218 | 2014-12-16 | 3 | 3 | 132.73 |
| 100684618 | 2014-12-12 | 7 | 3 | 203.67 |
| 103802946 | 2014-12-18 | 1 | 2 | 139.38 |
| 103891828 | 2014-12-15 | 4 | 6 | 496.24 |
| 116678892 | 2014-11-23 | 26 | 1 | 129.20 |
| 106557109 | 2014-11-22 | 27 | 1 | 38.06 |
| 104221274 | 2014-11-30 | 19 | 2 | 138.21 |
+-----------+--------------+----------+----------+----------+
-- RFM评分
+-----------+-------+-------+-------+
| user_id | R评分 | F评分 | M评分 |
+-----------+-------+-------+-------+
| 101260672 | 1 | 1 | 1 |
| 116730636 | 5 | 4 | 4 |
| 104811265 | 4 | 1 | 2 |
| 106230218 | 5 | 3 | 2 |
| 100684618 | 4 | 3 | 3 |
| 103802946 | 5 | 2 | 2 |
| 103891828 | 5 | 5 | 5 |
| 116678892 | 1 | 1 | 2 |
| 106557109 | 1 | 1 | 1 |
| 104221274 | 2 | 2 | 2 |
+-----------+-------+-------+-------+
-- RFM均值
+------------+------------+------------+
| avg(R评分) | avg(F评分) | avg(M评分) |
+------------+------------+------------+
| 3.5984 | 2.1039 | 2.2051 |
+------------+------------+------------+
-- RFM用户价值
+-----------+-------+-------+-------+-------+-------+------+------------+
| user_id | R评分 | F评分 | M评分 | R程度 | F程度 | M程度 | 用户价值 |
+-----------+-------+-------+-------+-------+-------+------+------------+
| 101260672 | 1 | 1 | 1 | 低 | 低 | 低 | 一般挽留用户 |
| 116730636 | 5 | 4 | 4 | 高 | 高 | 高 | 重要价值用户 |
| 104811265 | 4 | 1 | 2 | 高 | 低 | 低 | 一般发展用户 |
| 106230218 | 5 | 3 | 2 | 高 | 高 | 低 | 一般价值用户 |
| 100684618 | 4 | 3 | 3 | 高 | 高 | 高 | 重要价值用户 |
| 103802946 | 5 | 2 | 2 | 高 | 低 | 低 | 一般发展用户 |
| 103891828 | 5 | 5 | 5 | 高 | 高 | 高 | 重要价值用户 |
| 116678892 | 1 | 1 | 2 | 低 | 低 | 低 | 一般挽留用户 |
| 106557109 | 1 | 1 | 1 | 低 | 低 | 低 | 一般挽留用户 |
| 104221274 | 2 | 2 | 2 | 低 | 低 | 低 | 一般挽留用户 |
+-----------+-------+-------+-------+-------+-------+------+------------+
对用户进行价值分层后,针对不同价值类型的用户实行不同的营销策略。
一般挽留用户占比34.36%,占比最高,其交易时间间隔长,交易频率低,消费金额低,存在流失风险,可以及时与用户取得联系,明确流失原因或了解用户需求,想办法挽回用户。
一般发展用户占比31.29%,占比排名第二,其交易时间间隔短,但消费频率和消费金额都很低,可以利用推荐系统推荐其平时浏览的同类商品,或与此类客户有相同购买属性人群购买的商品,发送满减优惠券等,避免用户流失。
重要价值客户占比23.86%,其交易时间间隔短,消费频率高,消费金额高,应加强交流与互动,深入了解用户需求,提供个性化服务,增加用户粘性。可以对该类用户提供VIP服务机制,提升用户体验与忠诚度。
根据流量数据指标分析,每天的18-22时是用户活跃高峰期,可集中资源在该时间段进行引流与营销活动,如推送爆款及畅销商品,同时发送商家折扣优惠、直播带货及促销活动消息,提高商品购买率。
从用户行为转化漏斗分析,浏览到加购的转化率远远高于浏览到收藏的转化率,且加购到购买的转化率高达83.21%。交易流程越多,用户流失的可能性就越大,瞬间购买欲望的涌现,往往时效性较短,每多一步流程,就多一份流失率。所以删除不必要的跳转界面,让交易的完成时间更短,不要给用户过多的犹豫时间。例如优惠券的选择,还需要繁琐的领取步骤,满足优惠条件默认领取相应最大的优惠,并在最后付款界面突出优惠券带来的满减信息,促使用户的成交花费时间更短。关于购物车,可以增加一个清理机制,比如加入购物车以后多少天不成交就清除,每隔一段时间就提醒用户购物车内还有什么商品未下单,什么时间商品将被清除。收藏和购物车的功能有一定的同质性,关于这一点,淘宝没有做明显的区分,导致购物车只是简便版的收藏。反观同电商领域的拼多多,没有设置购物车功能,并且成交环节缩短至4步。
根据用户消费偏好分析,将流量更多地聚焦于畅销的商品,通过明星效应/网红推荐,结合主题活动和节日,打造爆款的产品,并利用爆款产品带动整体商品的销售。
根据RFM用户价值分类结果,一般挽留用户存在流失风险,可适当给予折扣或捆绑销售政策,通过一些补贴优惠,培养用户的购买习惯。一般发展用户存在价值潜力,要想办法主动联系客户,如短信、邮件、push提醒等方法,进行好物推荐等,提高用户的复购率。重要价值客户其交易时间间隔短,消费频率高,消费金额高,应加强交流与互动,比如优化个人信息界面,加入成长值系统,到达一定等级,享受一些特权或优惠,可参考腾讯游戏的心悦会员制度。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在职场中,许多言辞并非表面意思那么简单,有时需要听懂背后的“潜台词”。尤其在数据分析的领域里,掌握常用术语就像掌握一门新 ...
2025-01-04在当今信息化社会,数据分析已成为各行各业的核心驱动力。它不仅仅是对数字进行整理与计算,而是在数据的海洋中探寻规律,从而指 ...
2025-01-03又到一年年终时,各位打工人也迎来了展示成果的关键时刻 —— 年终述职。一份出色的年终述职报告,不仅能全面呈现你的工作价值, ...
2025-01-03在竞争激烈的商业世界中,竞品分析对于企业的发展至关重要。今天,我们就来详细聊聊数据分析师写竞品分析的那些事儿。 一、明确 ...
2025-01-03在数据分析的江湖里,有两个阵营总是争论不休。一派信奉“大即是美”,认为数据越多越好;另一派坚守“小而精”,力挺质量胜于规 ...
2025-01-02数据分析是一个复杂且多维度的过程,从数据收集到分析结果应用,每一步都是对信息的提炼与升华。可视化分析结果,以图表的形式展 ...
2025-01-02在当今的数字化时代,数据分析师扮演着一个至关重要的角色。他们如同现代企业的“解密专家”,通过解析数据为企业提供决策支持。 ...
2025-01-02数据分析报告至关重要 一份高质量的数据分析报告不仅能够揭示数据背后的真相,还能为企业决策者提供有价值的洞察和建议。 年薪 ...
2024-12-31数据分析,听起来好像是技术大咖的专属技能,但其实是一项人人都能学会的职场硬核能力!今天,我们来聊聊数据分析的核心流程,拆 ...
2024-12-31提到数据分析,你脑海里可能会浮现出一群“数字控”抱着电脑,在海量数据里疯狂敲代码的画面。但事实是,数据分析并没有你想象的 ...
2024-12-31关于数据分析师是否会成为失业高危职业,近年来的讨论层出不穷。在这个快速变化的时代,技术进步让人既兴奋又不安。今天,我们从 ...
2024-12-30数据分析师在现代企业中扮演着关键角色,他们的工作内容不仅丰富多样,还对企业的决策和发展起着重要的作用。正如一个经验丰富的 ...
2024-12-29数据分析师的能力要求 在当今的数据主导时代,数据分析师的角色变得尤为重要。他们不仅需要具备深厚的技术背景,还需要拥有业务 ...
2024-12-29随着技术的飞速发展与行业的持续变革,不少人心中都存有疑问:到了 2025 年,数据分析师还有前途吗?给你分享一篇阿里P8大佬最近 ...
2024-12-29如何构建数据分析整体框架? 要让数据分析发挥其最大效能,建立一个清晰、完善的整体框架至关重要。今天,就让我们一同深入探讨 ...
2024-12-27AI来了,数分人也可以很省力,今天给大家介绍7个AI+数据分析工具,建议收藏。 01酷表 EXCEL 网址:https://chatexcel.com/ 这是 ...
2024-12-26一个好的数据分析模型不仅能使分析具备条理性和逻辑性,而且还更具备结构化和体系化,并保证分析结果的有效性和准确性。好的数据 ...
2024-12-26当下,AI 的发展堪称狂飙猛进。从 ChatGPT 横空出世到各种大语言模型(LLM)接连上线,似乎每个人的朋友圈都在讨论 AI 会不会“ ...
2024-12-26数据分析师这个职业已经成为了职场中的“香饽饽”,无论是互联网公司还是传统行业,都离不开数据支持。想成为一名优秀的数据分析 ...
2024-12-26在数据驱动决策成为商业常态的今天,数据分析师这一职业正迎来前所未有的机遇与挑战。很多希望转行或初入职场的人士不禁询问:数 ...
2024-12-25