大数据可视化 让一张图胜过千言万语
谈到大数据,就必然要谈到可视化分析,因为大数据分析的目的是发现有价值的信息,供决策者和业务人员使用,更好地做出企业的决策。
所以每次Teradata不论在国内还是国外的峰会上,都会设置一个大数据可视化展示区域。浏览这些抽象的图形,你甚至可能把它们看成是一副副艺术作品。
当天为我讲解的是Teradata天睿公司大中华区大数据事业部华东区高级顾问张玉瑞,他还有另外一个身份“数据科学家”,在他看来如何把信息传达给相应的人,这就需要一种深入浅出、图文并茂的形式,一张图甚至可以胜过千言万语。
Teradata天睿公司大中华区大数据事业部华东区高级顾问张玉瑞
在这些范例图形中,当然并不能单纯停留在好看的层面,大数据可视化的目的是需要反映出真实的情况,让用户及时注意并防范这些问题以及更好的进行营销。所以这些抽象的图像在真正的系统中可以实现缩放,每一个点都可以看到是哪个客户,以及客户的一些信息,如行业、规模、地区、存款等,线条上也可以看到具体的交易金额。
资金喷泉
“资金喷泉”展示了不同公司之间的资金流动关系,是一个可以清晰发现客户层级的资金视图,图中所展示的是中国一家大型银行的企业银行业务其中一个分析项目,使用转账交易数据了解风险和发现市场机会。
市场营销人员可以利用它切入核心企业,了解上下游关联关系,开展供应链金融。在纷繁复杂的交易过程中,寻找合适的营销目标,捕捉适当的营销时机;风险人员则可以根据它识别客户异常资金交易,防范风险,通盘考虑相关参与方,而不是单单交易对手一方。
图中每一个点代表公司,线代表两家公司之间的资金转移,箭头代表资金的流向。张玉瑞对两个方向进行了描述,在营销和供应链角度,需要从图中找到核心企业,再延伸到上下游;在风险角度,一方面衡量市场变化,一方面监控资金流向。
谈到“资金喷泉”的形成,因为每家公司每天资金流量都是非常大,怎么删繁就简,把一些比较主要的问题呈现出来,需要经过大量的计算后提炼出一些比较有价值数据。如果把几百万个客户都展现在一张图中,解读起来也很困难,因此需要分门别类,这里就需要通过一些业务和分析进行提炼。
担保圈焰火
汽车信贷业务的超常规发展确实为银行带来了利润,但在分享车贷“蛋糕”喜悦的同时,不断攀升的车贷违约率也向银行业敲响了警钟,因为越来越多的车贷存在一些不易规避的风险。“担保圈焰火”展现了在某家银行的汽车厂商、4S店和个人客户之间建立的担保关系网络。
图中点代表车贷客户或者车贷担保人,线代表担保人和被担保人的担保关系,不同颜色用来区分相应的担保网络。
图中比较明显的是黄色、蓝色、紫色三个群体,黄色群体比较正常,中心是4S店,周围是一对一的个人客户。而左下角的蓝色和紫色群体存在重叠,也就是有些客户在两家以上的公司申请汽车贷款,存在一定的骗贷可能,需要银行高度关注。
这里只是使用银行的数据进行图形显示,并没有使用汽车公司的数据。张玉瑞指出,以往的分析都是单独看每笔贷款,其实贷款之间并不是独立的,现在我们把他们关联起来,就很容易发现之前很难发现的问题。
担保圈之谜
挥别了黄金时代的房地产行业,未来房地产价格将在不同地区出现分化。目前一、二线城市住宅地产需求旺盛,价格坚挺,三、四线城市市场低迷,部分区域价格下滑,销售不畅。为了促进销售,部分开发商或者房产中介为购房者提供担保,降低购房门槛,低首付甚至零首付,一旦房价出现大幅波动,这些房贷将给银行带来巨大的风险。
“担保圈之谜”揭示了房地产开发行业所产生的潜在风险,每一个辐射源是房地产公司,散开的点是个人客户。不同颜色可以区分不同担保网络。你会看到一些房地产开发商为大量的客户提供贷款的担保。
“最近央行和银监局要求银行降低首付贷,说明政府对房贷的加杠杆高度关注。”张玉瑞说道。房贷本来是银行优质的资产,如果购房者或者炒房者变成一两成首付或者零首付,杠杆就会陡增,风险就会放大。
所以通过担保圈之谜,让银行展现和监控风险暴露的规模和真实的特性。银行可以对高风险客户采取措施,这些措施包含收紧贷款审批,甚至拒绝贷款。
Teradata Aster如何做可视化分析
“资金喷泉”是使用Teradata Aster和Aster的Lens。装载的交易数据是非常大,涵盖超过 670,000 公司的 60,802,990 记录。公司记录包含行业分类代码,因此我们可以理解他们的业务活动。
“担保圈焰火”和“担保圈之谜”展示了在Teradata Aster分析探索平台做的Sigma图形,所用的数据源包含担保人企业ID、担保合同信息、担保金额、企业信用评级等。这里用的分析方法是社交媒体分析,以发现有影响力的客户和识别担保模式。
其实整个社交圈非常复杂,传统的分析需要采样,但像资金链、担保圈、社交群就没办法抽样。张玉瑞解释道,因为网络大庞大,抽样会使一些关系切断,所以需要将所有数据一起进行分析。
因为所有数据的分析,数据的体量非常庞大,举一个通俗易懂的例子,Google搜索资料会把相关性高得内容显示在前面,这中间会通过一些数据进行计算,算出一个PageRank值,越好的会排到越前面以达到更准确,而且计算速度非常快。Teradata Aster图分析(社交媒体分析)算法里就有PageRank算法,我们通过它来找出网络中有重要影响力的客户 。
不只是以上三个可视化图形,还有很多大数据可视化都是用Teradata Aster来实现。Aster数据库预装了200+个SQL-MR函数,快速高效地支撑库内的数据挖掘和大数据探索分析,它包括了路径与模式分析(Path/Pattern Analysis)、图分析(Graph Analysis)、文本分析(Text Analysis)、统计分析(Statistical calculations)、数据转换(Transformation)、关联及关系分析(Relational Analysis)等。
张玉瑞同时也还原了整个可视化分析的过程,数据来自不同的数据源,把它们加载到分析工具中,可能会有一些数据质量的问题,所以还需要进行清洗。之后建模是一个重要的工作,最后是分析,如果企业数据基础较好,准备的时间也会较短,分析质量也会很高。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在现代商业环境中,数据分析师的角色愈发重要。数据分析师通过解读数据,帮助企业做出更明智的决策。因此,考取数据分析师证书成为了许多人提升职业竞争力的选择。本文将详细介绍考取数据分析师证书的过程,包括了解证书种类和 ...
2025-03-03在当今信息化社会,大数据已成为各行各业不可或缺的宝贵资源。大数据专业应运而生,旨在培养具备扎实理论基础和实践能力,能够应 ...
2025-03-03数据分析师认证考试全面升级后,除了考试场次和报名时间,小伙伴们最关心的就是报名费了,报 ...
2025-03-032025年刚开启,知乎上就出现了一个热帖: 2024年突然出现的经济下行,使各行各业都感觉到压力山大。有人说,大环境越来越不好了 ...
2025-03-03大数据分析师培训旨在培养学员掌握大数据分析的基础知识、技术及应用能力,以适应企业对数据分析人才的需求。根据不同的培训需求 ...
2025-03-03小伙伴们,最近被《哪吒2》刷屏了吧!这部电影不仅在国内掀起观影热潮,还在全球范围内引发了关注,成为中国电影崛起的又一里程 ...
2025-03-03以下的文章内容来源于张彦存老师的专栏,如果您想阅读专栏《Python 数据可视化 18 讲(PyEcharts、Matplotlib、Seaborn)》,点 ...
2025-02-28最近,国产AI模型DeepSeek爆火,其创始人梁文峰走进大众视野。《黑神话:悟空》制作人冯骥盛赞DeepSeek为“国运级别的科技成果” ...
2025-02-271.统计学简介 听说你已经被统计学劝退,被Python唬住……先别着急划走,看完这篇再说! 先说结论,大多数情况下的学不会都不是知 ...
2025-02-27“我们的利润率上升了,但销售额却没变,这是为什么?” “某个业务的市场份额在下滑,到底是什么原因?” “公司整体业绩稳定, ...
2025-02-26在数据分析工作中,你可能经常遇到这样的问题: 从浏览到消费的转化率一直很低,那到底该优化哪里呢? 如果你要投放广告该怎么 ...
2025-02-25近来deepseek爆火,看看deepseek能否帮我们快速实现数据看板实时更新。 可以看出这对不知道怎么动手的小白来说是相当友好的,尤 ...
2025-02-25挖掘用户价值本质是让企业从‘赚今天的钱’升级为‘赚未来的钱’,同时让用户从‘被推销’变为‘被满足’。询问deepseek关于挖 ...
2025-02-25在当今这个数据驱动的时代,几乎每一个业务决策都离不开对数据的深入分析。而其中,指标波动归因分析更是至关重要的一环。无论是 ...
2025-02-25以下文章来源于数有道 ,作者数据星爷 SQL查询是数据分析工作的基础,也是CDA数据分析师一级的核心考点,人工智能时代,AI能为 ...
2025-02-25“最近复购率一直在下降,我们的营销力度不小啊,为什么用户还是走了?” “是不是广告投放的用户质量不高?还是我们的产品问题 ...
2025-02-25在数据分析中,地图是一种非常直观的可视化工具,能够帮助我们更好地理解数据在地理空间上的分布情况。无论是展示销售数据、人口 ...
2025-02-25春风拂面,金三银四的求职季如期而至。谁都想在这场竞争里拿下心仪offer。 一份亮眼简历是求职敲门砖,面试紧张则可能让机会溜 ...
2025-02-24当数据开始说谎:那些年我们交过的学费 你有没有经历过这样的场景?熬了三个通宵做的数据分析报告,在会议上被老板一句"这数据靠 ...
2025-02-17数据分析作为一门跨学科领域,融合了统计学、编程、业务理解和可视化技术。无论是初学者还是有一定经验的从业者,系统化的学习路 ...
2025-02-17