
Matplotlib是Python中广泛使用的绘图库之一。它具有丰富的图形功能,可以用于绘制各种类型的图表,包括线条图、散点图、饼图、柱状图和热度图(heatmap)等。
热度图是一种用颜色来表示数据值大小的二维图表。通常,热度图用于可视化矩阵或表格式数据,并以不同的颜色来区分不同数值的数据。在本文中,我们将介绍如何使用matplotlib制作热度图。
首先,我们需要准备一个数据集来绘制热度图。这里我们将使用numpy包生成一个随机的 $ 10 times 10 $ 的矩阵来模拟一个数据集:
import numpy as np
data = np.random.rand(10, 10)
生成的 data
矩阵如下所示:
array([[0.82028575, 0.76881294, 0.71971194, 0.30491486, 0.67111979,
0.17771597, 0.80438331, 0.27302774, 0.18129643, 0.63314806],
[0.77143625, 0.63551487, 0.56306356, 0.41241424, 0.47234638,
0.30451328, 0.65190823, 0.47868446, 0.03420709, 0.39056214],
[0.88830154, 0.0510874 , 0.04667507, 0.63655448, 0.1009649 ,
0.53011341, 0.88860116, 0.8072012 , 0.2627727 , 0.16129027],
[0.03957677, 0.88986948, 0.29828759, 0.34845264, 0.07125663,
0.85638637, 0.08063718, 0.65769739, 0.41561651, 0.82219976],
[0.01306113, 0.02081601, 0.00762399, 0.52039123, 0.36600046,
0.24940888, 0.21817512, 0.94152895, 0.14410661, 0.5584188 ],
[0.18524447, 0.86325457, 0.70310962, 0.17384236, 0.56810572,
0.05814711, 0.14610126, 0.76581545, 0.36524594, 0.0123577 ],
[0.69838845, 0.54777405, 0.51271685, 0.74905936, 0.04087629,
0.60057023, 0.27027469, 0.7392686 , 0.04315166, 0.09859514],
[0.79271592, 0.69936978, 0.17137361, 0.63954807, 0.19399017,
0.38978258, 0.3345555 , 0.33223096, 0.03575185, 0.527903 ],
[0.20489367, 0.00811152, 0.35635863, 0.67832791, 0.0613843 ,
0.70448221, 0.85365584, 0.88137019, 0.14431136, 0.59657908],
[0.28042776, 0.765406 , 0.53737002, 0.89526902, 0.61241154,
0.2861603 , 0.69044175, 0.11878924, 0.75902697, 0.28845139]])
接下来
,我们可以使用matplotlib.pyplot.imshow()
函数来绘制热度图。此函数接受一个二维数组作为输入,并将其以颜色编码的形式显示出来。
import matplotlib.pyplot as plt
plt.imshow(data)
plt.show()
执行上述代码后,会生成一个如下所示的热度图:
在热度图中,每个单元格的颜色表示该单元格对应的值大小。默认情况下,imshow()
会根据数据范围自动选择颜色映射(colormap)。
我们可以通过设置cmap
参数指定不同的颜色映射。常用的颜色映射包括'viridis'、'plasma'和'magma'等。例如,如果使用'magma'颜色映射,则可以通过以下方式进行设置:
plt.imshow(data, cmap='magma')
plt.show()
运行上述代码会生成以下热度图:
通常,在绘制热度图时,我们可能需要添加行列标签以更好地解释数据。这可以通过设置xticks
和yticks
参数来完成。我们可以在imshow()
函数之前添加以下两行代码来设置行列标签:
plt.xticks(range(10), ['a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'i', 'j'])
plt.yticks(range(10), ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H', 'I', 'J'])
上述代码将行列标签分别设置为字母'a'到'j'和大写字母'A'到'J'。然后再次运行imshow()
函数,就可以得到带有行列标签的热度图:
最后,我们可以通过添加一个颜色刻度表来说明热度图中每种颜色代表的数据值范围。这可以通过使用colorbar()
函数来完成。
plt.colorbar()
plt.show()
上述代码使热度图显示一个颜色刻度表,其中最小值为0.0,最大值为1.0。
本文介绍了如何使用matplotlib制作热度图。我们首先准备了一个随机的 $ 10 times 10 $ 的数据集,然后使用imshow()
函数绘制了热度图,设置了行列标签和颜色映射,并添加了一个颜色刻度表以说明颜色代表的数据值范围。
热度图是一种可视化工具,可用于探索数据集中的模式和趋势,或者比较不同数据集之间的差异。使用matplotlib绘制热度图非常简单且灵活,可以根据需求自由调整样式和布局,进而提高数据可视化的效果。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
MySQL 执行计划中 rows 数量的准确性解析:原理、影响因素与优化 在 MySQL SQL 调优中,EXPLAIN执行计划是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 对象的 text 与 content:区别、场景与实践指南 在 Python 进行 HTTP 网络请求开发时(如使用requests ...
2025-09-15CDA 数据分析师:激活表格结构数据价值的核心操盘手 表格结构数据(如 Excel 表格、数据库表)是企业最基础、最核心的数据形态 ...
2025-09-15Python HTTP 请求工具对比:urllib.request 与 requests 的核心差异与选择指南 在 Python 处理 HTTP 请求(如接口调用、数据爬取 ...
2025-09-12解决 pd.read_csv 读取长浮点数据的科学计数法问题 为帮助 Python 数据从业者解决pd.read_csv读取长浮点数据时的科学计数法问题 ...
2025-09-12CDA 数据分析师:业务数据分析步骤的落地者与价值优化者 业务数据分析是企业解决日常运营问题、提升执行效率的核心手段,其价值 ...
2025-09-12用 SQL 验证业务逻辑:从规则拆解到数据把关的实战指南 在业务系统落地过程中,“业务逻辑” 是连接 “需求设计” 与 “用户体验 ...
2025-09-11塔吉特百货孕妇营销案例:数据驱动下的精准零售革命与启示 在零售行业 “流量红利见顶” 的当下,精准营销成为企业突围的核心方 ...
2025-09-11CDA 数据分析师与战略 / 业务数据分析:概念辨析与协同价值 在数据驱动决策的体系中,“战略数据分析”“业务数据分析” 是企业 ...
2025-09-11Excel 数据聚类分析:从操作实践到业务价值挖掘 在数据分析场景中,聚类分析作为 “无监督分组” 的核心工具,能从杂乱数据中挖 ...
2025-09-10统计模型的核心目的:从数据解读到决策支撑的价值导向 统计模型作为数据分析的核心工具,并非简单的 “公式堆砌”,而是围绕特定 ...
2025-09-10CDA 数据分析师:商业数据分析实践的落地者与价值创造者 商业数据分析的价值,最终要在 “实践” 中体现 —— 脱离业务场景的分 ...
2025-09-10机器学习解决实际问题的核心关键:从业务到落地的全流程解析 在人工智能技术落地的浪潮中,机器学习作为核心工具,已广泛应用于 ...
2025-09-09SPSS 编码状态区域中 Unicode 的功能与价值解析 在 SPSS(Statistical Product and Service Solutions,统计产品与服务解决方案 ...
2025-09-09CDA 数据分析师:驾驭商业数据分析流程的核心力量 在商业决策从 “经验驱动” 向 “数据驱动” 转型的过程中,商业数据分析总体 ...
2025-09-09R 语言:数据科学与科研领域的核心工具及优势解析 一、引言 在数据驱动决策的时代,无论是科研人员验证实验假设(如前文中的 T ...
2025-09-08T 检验在假设检验中的应用与实践 一、引言 在科研数据分析、医学实验验证、经济指标对比等领域,常常需要判断 “样本间的差异是 ...
2025-09-08在商业竞争日益激烈的当下,“用数据说话” 已从企业的 “加分项” 变为 “生存必需”。然而,零散的数据分析无法持续为业务赋能 ...
2025-09-08随机森林算法的核心特点:原理、优势与应用解析 在机器学习领域,随机森林(Random Forest)作为集成学习(Ensemble Learning) ...
2025-09-05Excel 区域名定义:从基础到进阶的高效应用指南 在 Excel 数据处理中,频繁引用单元格区域(如A2:A100、B3:D20)不仅容易出错, ...
2025-09-05