动态条形图大火了一阵子,尤其是那种对比世界各国历年来的GDP或者军事实力的动态条形图,配上激动人心的音乐,眼看着中国从后往前排名不断考前,作为爱国的人,集体荣誉感爆棚的那种,真的是心潮澎湃自豪到仿佛国力的提升我也做出了不可磨灭的贡献一般(捂脸)。
虽然我没有对国力提升做出什么不可磨灭的贡献,但是我可以探索下动态条形图是怎样绘制的,应该也算是传播知识了吧(笑哭)。
先看下数据,依然是英超各球队的积分数据,制作动态条形图,对数据量要求会稍微大一些,对于有时间维度的数据来说,时间越长,能体现的变化和信息量就会越多,这里我们只选取了从2010–2019年英超各球队的积分数据,这个数据量不算大,但是不影响学习原理和实现步骤。
选取每年前十的球队进入数据集,最终的数据集长这个样子:
我们一步一步来,先绘制一个简单的条形图,比如绘制2019年排名前十球队积分的条形图,准备数据,把2019年的数据提取出来然后进行排序并选择前十名的球队数据,具体代码如下:
year = 2019 dff = (df_t[df_t["年份"].eq(year)] .sort_values(by='积分', ascending=True) .tail(10)) dff
结果:
简单解释下,这里并没有复杂的代码,都是常用的语法,除了一个df.eq(),这个方法主要是进行对比,将df中符合括号内变量要求的数据并提取出来,原始的数据中包含了从2010–2019的所有数据,这里只需要2019年的,所以通过这种方式把2019年的数据提取出来。
后边的排序语法选择升序排序,这样排在第一位的是积分最少的球队,所以要选取排名前十的球队不能用head(10),而是用tail(10),选取结尾的10行。之所以这么操作,还是由于条形图绘制过程中是从下往上画,为了条形的排序是从下往上条形越来越长,所以采用这样的操作。
来看一下上边截取出来的数据集绘制出来的条形图是什么样子的:
plt.figure(figsize=(10,6)) plt.barh(dff['球队'], dff['积分']);
ok,画出来是符合要求的条形图!
如果不设置颜色,画出来的所有条都是一个颜色,就像上边的那幅图。
为了让图形更美观,对各个球队的积分变化看起来更明显,还是要设置一下颜色。这里有两个选择,一是对排名设置颜色,即无论哪个球队是第一名,只要排到第一名就会被指定这种颜色,还有一种是给每个球队指定颜色,无论这个球队排名是多少,它的颜色都不会变。
实践证明第二种方法更复杂一点,但是更容易被接受,所以这里采用的第二种方法来设置颜色。
names = df_t10.球队.unique() #查看排名进过前十的球队都有哪些 names
返回结果一共24个球队:
array(['曼联', '切尔西', '曼城', '阿森纳', '热刺', '利物浦', '埃弗顿', '富勒姆', '阿斯顿维拉', '桑德兰', '纽卡斯尔', '西布罗姆维奇', '斯旺西', '西汉姆联', '南安普敦', '斯托克城', '水晶宫', '莱斯特', '伯恩茅斯', '西布朗', '伯恩利', '莱斯特城', '狼队', '谢菲尔德联'], dtype=object)
生成24个不同的颜色:
import matplotlib.cm as cm c = [] for i in range(len(names)): c.append(cm.nipy_spectral(float(i)/len(names))) colors1 = dict(zip(names,c)) # 每个球队对应一个颜色
由于颜色种类比较多,一一指定太费时间和精力,所以引入matplotlib.cm色谱,cm.nipy_spectral()函数,赋给它不同的浮点数数值能够生成不同的颜色。
plt.figure(figsize=(12,6)) #给不同的条形添加不同颜色的时候注意颜色列表有24中颜色,不能直接让颜色等于颜色列表 for i in range(len(dff)): plt.barh(dff['球队'].iloc[i], dff['积分'].iloc[i], color=colors1[dff['球 队'].iloc[i]],alpha = 0.5) # 在画布右方添加年份 plt.text(1, 0.4, current_year, transform=ax.transAxes, size=46, ha='right',alpha=0.5);
效果图:
其实大家都知道,所谓视频也是由一帧一帧的画面组成按照顺序播放形成视频的,而我们的动图运用的也是这个原理,所以只需把绘制条形图的代码封装成一个函数,然后重复调用这个函数在不同的数据集上绘制图形就可以实现动态展现。
fig, ax = plt.subplots(figsize=(12, 6)) #同时建立画布和子画布,没有设置默认为一个子画布 def draw_bar(year): ax.spines['right'].set_color('none') #把右边的边框颜色设置为无色,隐藏右边框 ax.spines['top'].set_color('none') #把上边的边框颜色设置为无色,隐藏上边框 ax.spines['left'].set_color('none') #把右边的边框颜色设置为无色,隐藏左边框 ax.spines['bottom'].set_color('none') #把上边的边框颜色设置为无色,隐藏下边框 #准备数据 dff = (df_t[df_t["年份"].eq(year)].sort_values(by='积分', ascending=True).tail(10)) ax.clear() #清空已存在的图像 for i in range(len(dff)): colors =cm.nipy_spectral(float(i)/len(dff)) ax.barh(dff['球队'].iloc[i], dff['积分'].iloc[i], height=0.7, color=colors1[dff['球队'].iloc[i]],alpha = 0.5) ax.text(dff['积分'].iloc[i]-3,i+0.1,dff['球队'].iloc[i]) ax.text(dff['积分'].iloc[i]-2,i-0.3,dff['积分'].iloc[i]) ax.text(1, 0.4, year, transform=ax.transAxes, color='#777777', size=46, ha='right',alpha=0.5, weight=800) ax.xaxis.set_major_formatter(ticker.StrMethodFormatter('{x:,.0f}')) ax.xaxis.set_ticks_position('top') ax.tick_params(axis='x', colors='#777777', labelsize=12) ax.set_yticks([]) ax.margins(0, 0.01) ax.grid(which='major', axis='x', linestyle='-') ax.set_axisbelow(True) ax.text(0.2, 1.1, '2010--2019英超各球队年度积分', transform=ax.transAxes, size=20, weight=600, ha='left'); draw_bar(2019)
函数已经封装好了,接下来是激动人心实现动图的操作了,需要matplotlib中的animation模块,运用该模块中的FuncAnimation方法重复调用前边定义好的画图函数,实现动画效果:
import matplotlib.animation as animation #导入animation模块 from IPython.display import HTML #导入HTML模块 fig, ax = plt.subplots(figsize=(10, 6)) animator = animation.FuncAnimation(fig, draw_bar, frames=range(2010, 2020),interval = 600) #interval控制更迭速度,默认200毫秒 HTML(animator.to_jshtml()) #将渲染的HTML输出嵌入到iPython输出中 animator.save('yingchao.gif',writer='imagemagick') # 保存 gif 动态图
动态条形图就完活儿了,代码没有很复杂,完整的过程就最后的两段代码,前期的代码主要是分解了中间的过程,方便理解而已,有兴趣的小伙伴可以深入研究或者换个数据集看下实现效果。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
Excel是数据分析的重要工具,强大的内置功能使其成为许多分析师的首选。在日常工作中,启用Excel的数据分析工具库能够显著提升数 ...
2024-12-23在当今信息爆炸的时代,数据分析师如同一位现代社会的侦探,肩负着从海量数据中提炼出有价值信息的重任。在这个过程中,掌握一系 ...
2024-12-23在现代的职场中,制作吸引人的PPT已经成为展示信息的重要手段,而其中数据对比的有效呈现尤为关键。为了让数据在幻灯片上不仅准 ...
2024-12-23在信息泛滥的现代社会,数据分析师已成为企业决策过程中不可或缺的角色。他们的任务是从海量数据中提取有价值的洞察,帮助组织制 ...
2024-12-23在数据驱动时代,数据分析已成为各行各业的必需技能。无论是提升个人能力还是推动职业发展,选择一条适合自己的学习路线至关重要 ...
2024-12-23在准备数据分析师面试时,掌握高频考题及其解答是应对面试的关键。为了帮助大家轻松上岸,以下是10个高频考题及其详细解析,外加 ...
2024-12-20互联网数据分析师是一个热门且综合性的职业,他们通过数据挖掘和分析,为企业的业务决策和运营优化提供强有力的支持。尤其在如今 ...
2024-12-20在现代商业环境中,数据分析师是不可或缺的角色。他们的工作不仅仅是对数据进行深入分析,更是协助企业从复杂的数据信息中提炼出 ...
2024-12-20随着大数据时代的到来,数据驱动的决策方式开始受到越来越多企业的青睐。近年来,数据分析在人力资源管理中正在扮演着至关重要的 ...
2024-12-20在数据分析的世界里,表面上的技术操作只是“入门票”,而真正的高手则需要打破一些“看不见的墙”。这些“隐形天花板”限制了数 ...
2024-12-19在数据分析领域,尽管行业前景广阔、岗位需求旺盛,但实际的工作难度却远超很多人的想象。很多新手初入数据分析岗位时,常常被各 ...
2024-12-19入门数据分析,许多人都会感到“难”,但这“难”究竟难在哪儿?对于新手而言,往往不是技术不行,而是思维方式、业务理解和实践 ...
2024-12-19在如今的行业动荡背景下,数据分析师的职业前景虽然面临一些挑战,但也充满了许多新的机会。随着技术的不断发展和多领域需求的提 ...
2024-12-19在信息爆炸的时代,数据分析师如同探险家,在浩瀚的数据海洋中寻觅有价值的宝藏。这不仅需要技术上的过硬实力,还需要一种艺术家 ...
2024-12-19在当今信息化社会,大数据已成为各行各业不可或缺的宝贵资源。大数据专业应运而生,旨在培养具备扎实理论基础和实践能力,能够应 ...
2024-12-19阿里P8、P9失业都找不到工作?是我们孤陋寡闻还是世界真的已经“癫”成这样了? 案例一:本硕都是 985,所学的专业也是当红专业 ...
2024-12-19CDA持证人Louis CDA持证人基本情况 我大学是在一个二线城市的一所普通二本院校读的,专业是旅游管理,非计算机非统计学。毕业之 ...
2024-12-18最近,知乎上有个很火的话题:“一个人为何会陷入社会底层”? 有人说,这个世界上只有一个分水岭,就是“羊水”;还有人说,一 ...
2024-12-18在这个数据驱动的时代,数据分析师的技能需求快速增长。掌握适当的编程语言不仅能增强分析能力,还能帮助分析师从海量数据中提取 ...
2024-12-17在当今信息爆炸的时代,数据分析已经成为许多行业中不可或缺的一部分。想要在这个领域脱颖而出,除了热情和毅力外,你还需要掌握 ...
2024-12-17