动态条形图大火了一阵子,尤其是那种对比世界各国历年来的GDP或者军事实力的动态条形图,配上激动人心的音乐,眼看着中国从后往前排名不断考前,作为爱国的人,集体荣誉感爆棚的那种,真的是心潮澎湃自豪到仿佛国力的提升我也做出了不可磨灭的贡献一般(捂脸)。
虽然我没有对国力提升做出什么不可磨灭的贡献,但是我可以探索下动态条形图是怎样绘制的,应该也算是传播知识了吧(笑哭)。
先看下数据,依然是英超各球队的积分数据,制作动态条形图,对数据量要求会稍微大一些,对于有时间维度的数据来说,时间越长,能体现的变化和信息量就会越多,这里我们只选取了从2010–2019年英超各球队的积分数据,这个数据量不算大,但是不影响学习原理和实现步骤。
选取每年前十的球队进入数据集,最终的数据集长这个样子:
我们一步一步来,先绘制一个简单的条形图,比如绘制2019年排名前十球队积分的条形图,准备数据,把2019年的数据提取出来然后进行排序并选择前十名的球队数据,具体代码如下:
year = 2019 dff = (df_t[df_t["年份"].eq(year)] .sort_values(by='积分', ascending=True) .tail(10)) dff
结果:
简单解释下,这里并没有复杂的代码,都是常用的语法,除了一个df.eq(),这个方法主要是进行对比,将df中符合括号内变量要求的数据并提取出来,原始的数据中包含了从2010–2019的所有数据,这里只需要2019年的,所以通过这种方式把2019年的数据提取出来。
后边的排序语法选择升序排序,这样排在第一位的是积分最少的球队,所以要选取排名前十的球队不能用head(10),而是用tail(10),选取结尾的10行。之所以这么操作,还是由于条形图绘制过程中是从下往上画,为了条形的排序是从下往上条形越来越长,所以采用这样的操作。
来看一下上边截取出来的数据集绘制出来的条形图是什么样子的:
plt.figure(figsize=(10,6)) plt.barh(dff['球队'], dff['积分']);
ok,画出来是符合要求的条形图!
如果不设置颜色,画出来的所有条都是一个颜色,就像上边的那幅图。
为了让图形更美观,对各个球队的积分变化看起来更明显,还是要设置一下颜色。这里有两个选择,一是对排名设置颜色,即无论哪个球队是第一名,只要排到第一名就会被指定这种颜色,还有一种是给每个球队指定颜色,无论这个球队排名是多少,它的颜色都不会变。
实践证明第二种方法更复杂一点,但是更容易被接受,所以这里采用的第二种方法来设置颜色。
names = df_t10.球队.unique() #查看排名进过前十的球队都有哪些 names
返回结果一共24个球队:
array(['曼联', '切尔西', '曼城', '阿森纳', '热刺', '利物浦', '埃弗顿', '富勒姆', '阿斯顿维拉', '桑德兰', '纽卡斯尔', '西布罗姆维奇', '斯旺西', '西汉姆联', '南安普敦', '斯托克城', '水晶宫', '莱斯特', '伯恩茅斯', '西布朗', '伯恩利', '莱斯特城', '狼队', '谢菲尔德联'], dtype=object)
生成24个不同的颜色:
import matplotlib.cm as cm c = [] for i in range(len(names)): c.append(cm.nipy_spectral(float(i)/len(names))) colors1 = dict(zip(names,c)) # 每个球队对应一个颜色
由于颜色种类比较多,一一指定太费时间和精力,所以引入matplotlib.cm色谱,cm.nipy_spectral()函数,赋给它不同的浮点数数值能够生成不同的颜色。
plt.figure(figsize=(12,6)) #给不同的条形添加不同颜色的时候注意颜色列表有24中颜色,不能直接让颜色等于颜色列表 for i in range(len(dff)): plt.barh(dff['球队'].iloc[i], dff['积分'].iloc[i], color=colors1[dff['球 队'].iloc[i]],alpha = 0.5) # 在画布右方添加年份 plt.text(1, 0.4, current_year, transform=ax.transAxes, size=46, ha='right',alpha=0.5);
效果图:
其实大家都知道,所谓视频也是由一帧一帧的画面组成按照顺序播放形成视频的,而我们的动图运用的也是这个原理,所以只需把绘制条形图的代码封装成一个函数,然后重复调用这个函数在不同的数据集上绘制图形就可以实现动态展现。
fig, ax = plt.subplots(figsize=(12, 6)) #同时建立画布和子画布,没有设置默认为一个子画布 def draw_bar(year): ax.spines['right'].set_color('none') #把右边的边框颜色设置为无色,隐藏右边框 ax.spines['top'].set_color('none') #把上边的边框颜色设置为无色,隐藏上边框 ax.spines['left'].set_color('none') #把右边的边框颜色设置为无色,隐藏左边框 ax.spines['bottom'].set_color('none') #把上边的边框颜色设置为无色,隐藏下边框 #准备数据 dff = (df_t[df_t["年份"].eq(year)].sort_values(by='积分', ascending=True).tail(10)) ax.clear() #清空已存在的图像 for i in range(len(dff)): colors =cm.nipy_spectral(float(i)/len(dff)) ax.barh(dff['球队'].iloc[i], dff['积分'].iloc[i], height=0.7, color=colors1[dff['球队'].iloc[i]],alpha = 0.5) ax.text(dff['积分'].iloc[i]-3,i+0.1,dff['球队'].iloc[i]) ax.text(dff['积分'].iloc[i]-2,i-0.3,dff['积分'].iloc[i]) ax.text(1, 0.4, year, transform=ax.transAxes, color='#777777', size=46, ha='right',alpha=0.5, weight=800) ax.xaxis.set_major_formatter(ticker.StrMethodFormatter('{x:,.0f}')) ax.xaxis.set_ticks_position('top') ax.tick_params(axis='x', colors='#777777', labelsize=12) ax.set_yticks([]) ax.margins(0, 0.01) ax.grid(which='major', axis='x', linestyle='-') ax.set_axisbelow(True) ax.text(0.2, 1.1, '2010--2019英超各球队年度积分', transform=ax.transAxes, size=20, weight=600, ha='left'); draw_bar(2019)
函数已经封装好了,接下来是激动人心实现动图的操作了,需要matplotlib中的animation模块,运用该模块中的FuncAnimation方法重复调用前边定义好的画图函数,实现动画效果:
import matplotlib.animation as animation #导入animation模块 from IPython.display import HTML #导入HTML模块 fig, ax = plt.subplots(figsize=(10, 6)) animator = animation.FuncAnimation(fig, draw_bar, frames=range(2010, 2020),interval = 600) #interval控制更迭速度,默认200毫秒 HTML(animator.to_jshtml()) #将渲染的HTML输出嵌入到iPython输出中 animator.save('yingchao.gif',writer='imagemagick') # 保存 gif 动态图
动态条形图就完活儿了,代码没有很复杂,完整的过程就最后的两段代码,前期的代码主要是分解了中间的过程,方便理解而已,有兴趣的小伙伴可以深入研究或者换个数据集看下实现效果。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在当今这个数据驱动的时代,几乎每一个业务决策都离不开对数据的深入分析。而其中,指标波动归因分析更是至关重要的一环。无论是 ...
2025-02-18当数据开始说谎:那些年我们交过的学费 你有没有经历过这样的场景?熬了三个通宵做的数据分析报告,在会议上被老板一句"这数据靠 ...
2025-02-17数据分析作为一门跨学科领域,融合了统计学、编程、业务理解和可视化技术。无论是初学者还是有一定经验的从业者,系统化的学习路 ...
2025-02-17挖掘用户价值本质是让企业从‘赚今天的钱’升级为‘赚未来的钱’,同时让用户从‘被推销’变为‘被满足’。询问deepseek关于挖 ...
2025-02-17近来deepseek爆火,看看deepseek能否帮我们快速实现数据看板实时更新。 可以看出这对不知道怎么动手的小白来说是相当友好的, ...
2025-02-14一秒精通 Deepseek,不用找教程,不用买资料,更不用报一堆垃圾课程,所有这么去做的,都是舍近求远,因为你忽略了 deepseek 的 ...
2025-02-12自学 Python 的关键在于高效规划 + 实践驱动。以下是一份适合零基础快速入门的自学路径,结合资源推荐和实用技巧: 一、快速入 ...
2025-02-12“我们的利润率上升了,但销售额却没变,这是为什么?” “某个业务的市场份额在下滑,到底是什么原因?” “公司整体业绩 ...
2025-02-08活动介绍 为了助力大家在数据分析领域不断精进技能,我们特别举办本期打卡活动。在这里,你可以充分利用碎片化时间在线学习,让 ...
2025-02-071、闺女,醒醒,媒人把相亲的带来了。 我。。。。。。。 2、前年春节相亲相了40个, 去年春节相亲50个, 祖宗,今年你想相多少个 ...
2025-02-06在数据科学的广阔领域中,统计分析与数据挖掘占据了重要位置。尽管它们常常被视为有关联的领域,但两者在理论基础、目标、方法及 ...
2025-02-05在数据分析的世界里,“对比”是一种简单且有效的方法。这就像两个女孩子穿同一款式的衣服,效果不一样。 很多人都听过“货比三 ...
2025-02-05当我们只有非常少量的已标记数据,同时有大量未标记数据点时,可以使用半监督学习算法来处理。在sklearn中,基于图算法的半监督 ...
2025-02-05考虑一种棘手的情况:训练数据中大部分样本没有标签。此时,我们可以考虑使用半监督学习方法来处理。半监督学习能够利用这些额 ...
2025-02-04一、数学函数 1、取整 =INT(数字) 2、求余数 =MOD(除数,被除数) 3、四舍五入 =ROUND(数字,保留小数位数) 4、取绝对值 =AB ...
2025-02-03作者:CDA持证人 余治国 一般各平台出薪资报告,都会哀嚎遍野。举个例子,去年某招聘平台发布《中国女性职场现状调查报告》, ...
2025-02-02真正的数据分析大神是什么样的呢?有人认为他们能轻松驾驭各种分析工具,能够从海量数据中找到潜在关联,或者一眼识别报告中的数 ...
2025-02-01现今社会,“转行”似乎成无数职场人无法回避的话题。但行业就像座围城:外行人看光鲜,内行人看心酸。数据分析这个行业,近几年 ...
2025-01-31本人基本情况: 学校及专业:厦门大学经济学院应用统计 实习经历:快手数据分析、字节数据分析、百度数据分析 Offer情况:北京 ...
2025-01-3001专家简介 徐杨老师,CDA数据科学研究院教研副总监,主要负责CDA认证项目以及机器学习/人工智能类课程的研发与授课,负责过中 ...
2025-01-29