从央企财会到数据分析师,都经历了什么
我以前其实是做财务会计的,在座可能有的人对财务会计有些了解,它和数据分析师中间差别很大。大家会好奇,我是为什么要从财务会计到一个数据分析师呢?
跟大家分享一下我自身思维的转变。我以前是在一个央企做财务会计的,当时负责整个项目,包括会计的核算、税务的管理,整个项目下来大概半年多到一年,通过这份工作对自己大学、研究生的知识有一个充分的应用。但是通过工作会发现,在工作中和你自己想象其实是不太一样的,我个人对于我自身的一个定位始,终是要将我所学到的一些知识应用到企业的管理上,能够发挥自身的一些价值。但是在工作中,我发现其实长期看,我的工作会是一个项目一个项目下去,对一个财务人员来说,跟我的性格不太相符。我想转变,想发挥自己更大的作用。
怎么做呢?当时我刚一开始并没有想一步跨越到数据分析师这个职业上来,当时我是想做偏向于财务预算的,但是在不断地了解过程中,发现我原来上学时,对于工具使用和数据分析方面的知识储备不足,后来我找工作的时候都会提出要求懂一些数据库的东西,当时就感觉蒙了,就不知道自己原来差得这么多。
经过几个月的考量,我最后决定用一段时间去系统地学习一下这个东西,做数据分析相关的工作。这样可以让数据的应用发挥一个更大的价值,而不仅仅是对于一些事务性的简单的处理。就这样,我从一个财务人员逐步地走到了数据分析这个行业里来了。
要做数据分析,我们要学习的东西其实还是很多的,包括一些工具、数据库,还有一些财务统计的知识,以及一些算法。
从工具来说,我们首先会应用到的是Excel。我们在后期应用一些专业的工具进行处理的时候,对于数据的格式还是有要求的,还有数据的拆分。我们所应用到的最基础的工具就是Excel,除了可以数据拆分,还能进行数据分析。
当时我做的一个工作就是将数据产品拆分出来,刚开始我想用SAS进行拆分,我的机子比较老,就带不动,后来我发现Excel可以轻松地搞定。Excel有很多函数,可以进行一对一的匹配。另外,Excel有些数据透视表,对分类的汇总,以及后期把数据带入到工具里面是很有用的;数据透视图,可以做可视化展现的方式。如果你对Excel的VBA再熟悉一些的话,处理数据就很方便了。
另外,学完Excel之后,我又学了STATA和SAS。这些软件相对来说比较菜单化,能够做很多东西,包括一些简单的统计分析,求一下最大值、最小值,中位数,还有可以做一些上学学到的分析检验等。但不仅仅停留在这个层次,数据分析会涉及到包括回归、聚类和分类、时间序列等方法。
比如回归,学的就是一个方程,这是最基本的,其实还可以扩展。它是干什么用的呢?就是对于发生额的预测。比如说一条订单记录会有一些变量,包括性别、年龄、收入等等。通过它其实我们就可以列出一个方程来,预测一个未来值,在我们销售和一个发生值相关的时候,就可以定位。可以把客户分成几类,哪些人属于高价值的客户,哪些人属于相对来说一般的。
还有一个与此相关的逻辑回归,看名字很相似,之所以放到一块是因为它最后的展现形式。不同的是逻辑回归是一个事件的发生概率,这个事情发生不发生,他会不会购买,这是我们常会遇到一个问题。通过逻辑回归就可以根据原有数据归纳出结论。
回归和逻辑回归通常来说都是综合结合来用的,比如说我们把预测出来的金额分成十个档,第一是金额最大的,那么在分析的时候还会有一个问题,这就是种购买金额最高的人,他购买的发生概率是什么?这需要做一个横向的匹配,这样的话我们就会归纳出在实际应用中,发生额和发生概率的排序。我们企业资源都是有限的,在实践应用中我们会根据排序截取前50%的比例,或者20%的比例进行资源投入,这样会获得最大的收益。
聚类和分类,这两个东西看起来很相似,都是跟类别有关系,它们的不同在于聚类是一个无监督学习,分类是一个有监督学习。
聚类是干吗的?我们其实不知道这里边有几类,弄到一堆这就是聚类。这对一些未知领域的探索很有帮助,我们在聚类的时候都会把它规划成一圈,在聚类之前做一个分析。这样的话可以降低纬度,避免一些纬度灾难。
做好了聚类之后下面就可以分类了,比如说可分成三堆,又来了一个东西,看看它跟哪个是一堆的,就分类了。其实我们常用的算法,包括前面提到的逻辑回归,到决策树、神经网络都是可以用来分类的。
还有第三类就是时间序列,炒股的话就会发现股票的价格会随着时间的波动而波动。还有销量,从某种意义上讲时间是有相关性的。
数据并不是直接拿过来就能用。更多的情况下,企业会把数据放在数据库,量大的话还会放在数据仓库里面。我在面试的时候遇到的两个常见的问题,第一个你为什么会做数据分析师,另外一个就是你的数据库应用能力。数据库的接收是不需要掌握的,主要是数据库的查询,数据库里面各种资料的认识是必须要具备的,我们常用的一个整体查询就是各种字段,从哪个表分类一下,分类端再做一个排序,一般都会涉及到多张表。
对于数据库这块还是要多掌握一些知识。常用的数据库都是关系型数据库,如果有能力非关系型数据库还是要多学习一下,还没有工作的同学可以把精力投入一些,找工作数据库不行的话就直接被Pass掉了。
除了数据分析的工具,也懂数据库,在数据分析里边还有一些内在的思想,包括一些传统的统计方法,还有算法。算法很多,因为时间有限,我不打算多讲。逻辑回归、决策树、神经网络都可以学一下,这些算法有一些是常用的和非常用的,有些是针对同一个问题有不同的角度,如果时间有限的话,可以专精于某一类。不管是做回归,还是做分类、聚类,你可以挑一两个算法进行研究,算法研究精了之后对数据分析可以有很深刻的理解。
下边一个问题是数据的可视化的问题。不管你是用了回归还是聚类,最后一个问题就是展现,展现给你们的Boss你到底做了什么?不见得要展示你的成果,更多的是对于企业里面的各种信息的生动展示。
我个人用得多的是Excel和Tableau,我们从集团到各个下面的子公司都在用这个东西。我觉得在数据可视化这一块要遵循两点,第一点就是化繁为简。我们每个月报给最高层有一份报告是50多页,当时我看了都头大。最后我们同事之间大家相互协作,把50多页的东西弄成了9页,它的纬度却可以细化到中层子公司。不要再把一堆Excel表、PPT拿出来了,那样就很Low了,你要想到的第一个问题如何将你的大量的工作成果展现在很少的一个界面上。
第二带你就是直观。最简单的,比如在Excel里用数据透视图,做一个柱状图和一个线,反映未来的趋势,或者横向的对比,都是一个直观的展现,你能做到化繁为简、深入浅出,你的可视化是很成功的。
说了这么多,我们最终还是要有一个系统的数据应用。
第一步是获取数据,数据的来源很多,包括Excel表、数据库,还有通过其他的一些网上的抓取,包括爬虫、网络分析等。
第二步是处理数据。在我实际的工作中,包括我与其他同行沟通,数据处理的过程可以占到整个工作任务的将近70%多。为什么呢?数据价值的认知是一个逐步完善的过程,很多企业原先对于数据的认识没那么强,可能就是某个部门,比如企划、风控、运营等部门,会把数据库里面有关的数据拿出来,自己做报告。现在又上升到一个更高的层次,做数据分析、数据可视化的时候,就发现数据乱七八糟,看了之后就头大,就需要通过各种工具,用SAS,Python进行整理,一方面把数据整理成自己需要的形式,整理成一定的字段和纬度,这样才可以做分析。
其实目前我在工作的这一段时间中并没有用到很复杂的算法,应用的主要是三个方面。
第一,我会用Python、Tableau对数据进行处理。我和同事进行了反复的沟通,不断地了解这些高层人员到底想看什么,我按照自身的理解把它展示出来,后来老板说这个东西没有把核心的需求拿出来。
这其实就犯了一个毛病,我在刚一开始的需求分析就不够深入。其实也是可以理解的,因为刚一开始接触工作,对于整个行业也是一个初步的认识,你可能拿捏不好。随着业务的逐步深入,你首先要了解你这个业务整体老板的需求是什么,再去通过数据、分析、展示,这样才能有的放矢。老板其实不太关心你用了什么复杂的方法做了这个东西,他关心的就是我想要展示什么。
上周我还遇到一个问题。从2015年1月份到2016年6月份整体业绩的达成情况,最初是用柱状图展示折现额,老板说这个东西对我来说没用,因为我更关心的是同期之间的对比。我就只能去改了,其实这就反映一个问题,我们要抓住领导所关心的关键的业务需求。
第二就是数据共享中心的建设,我司目前的系统有很多,包括财务组织系统、还有AGC、ERP的,数据很分散,整体系统是由IT系统管理。我自身在做Tableau所以可视化也在做,我就找到一些接口,它其实并不完备。从总公司的角度来说,不仅要掌握财务数据,还要掌握运营的数据,前端企划的数据,包括风控的数据等。建设数据共享中心就是要把各个数据做一种整合。
其实这就是一个数据字典的问题,我们原来有200多个指标,好多重复的、口径不同的。做数据分析的时候,如果同一个问题有不同的名称、不同的口径,后期根本就干不了。我在入职之前有一个同事做预算的时候就很头大,最简单的一个业务费用,分解到中心子公司之后,从企划或者其他方面拿过来的口径是不同的,需要再反复各处去了解,调整口径的调整。这是分析人员最怵的问题,很耗费精力。
因此我觉得,在工作中一方面就要加强自己对于需求端的理解,不跑偏,少走弯路。第二,如果公司的数据现状不好,你要发挥利用自己的一些知识和整体地推动公司建设,这个推动过程中不仅对公司的管理有很深入的认识,对于数据分析能力的提高也很有帮助。
数据分析咨询请扫描二维码
在准备数据分析师面试时,掌握高频考题及其解答是应对面试的关键。为了帮助大家轻松上岸,以下是10个高频考题及其详细解析,外加 ...
2024-12-20互联网数据分析师是一个热门且综合性的职业,他们通过数据挖掘和分析,为企业的业务决策和运营优化提供强有力的支持。尤其在如今 ...
2024-12-20在现代商业环境中,数据分析师是不可或缺的角色。他们的工作不仅仅是对数据进行深入分析,更是协助企业从复杂的数据信息中提炼出 ...
2024-12-20随着大数据时代的到来,数据驱动的决策方式开始受到越来越多企业的青睐。近年来,数据分析在人力资源管理中正在扮演着至关重要的 ...
2024-12-20在数据分析的世界里,表面上的技术操作只是“入门票”,而真正的高手则需要打破一些“看不见的墙”。这些“隐形天花板”限制了数 ...
2024-12-19在数据分析领域,尽管行业前景广阔、岗位需求旺盛,但实际的工作难度却远超很多人的想象。很多新手初入数据分析岗位时,常常被各 ...
2024-12-19入门数据分析,许多人都会感到“难”,但这“难”究竟难在哪儿?对于新手而言,往往不是技术不行,而是思维方式、业务理解和实践 ...
2024-12-19在如今的行业动荡背景下,数据分析师的职业前景虽然面临一些挑战,但也充满了许多新的机会。随着技术的不断发展和多领域需求的提 ...
2024-12-19在信息爆炸的时代,数据分析师如同探险家,在浩瀚的数据海洋中寻觅有价值的宝藏。这不仅需要技术上的过硬实力,还需要一种艺术家 ...
2024-12-19在当今信息化社会,大数据已成为各行各业不可或缺的宝贵资源。大数据专业应运而生,旨在培养具备扎实理论基础和实践能力,能够应 ...
2024-12-19阿里P8、P9失业都找不到工作?是我们孤陋寡闻还是世界真的已经“癫”成这样了? 案例一:本硕都是 985,所学的专业也是当红专业 ...
2024-12-19CDA持证人Louis CDA持证人基本情况 我大学是在一个二线城市的一所普通二本院校读的,专业是旅游管理,非计算机非统计学。毕业之 ...
2024-12-18最近,知乎上有个很火的话题:“一个人为何会陷入社会底层”? 有人说,这个世界上只有一个分水岭,就是“羊水”;还有人说,一 ...
2024-12-18在这个数据驱动的时代,数据分析师的技能需求快速增长。掌握适当的编程语言不仅能增强分析能力,还能帮助分析师从海量数据中提取 ...
2024-12-17在当今信息爆炸的时代,数据分析已经成为许多行业中不可或缺的一部分。想要在这个领域脱颖而出,除了热情和毅力外,你还需要掌握 ...
2024-12-17数据分析,是一项通过科学方法处理数据以获取洞察并支持决策的艺术。无论是在商业环境中提升业绩,还是在科研领域推动创新,数据 ...
2024-12-17在数据分析领域,图表是我们表达数据故事的重要工具。它们不仅让数据变得更加直观,也帮助我们更好地理解数据中的趋势和模式。相 ...
2024-12-16在当今社会,我们身处着一个飞速发展、变化迅猛的时代。不同行业在科技进步、市场需求和政策支持的推动下蓬勃发展,呈现出令人瞩 ...
2024-12-16在现代商业世界中,数据分析师扮演着至关重要的角色。他们通过解析海量数据,为企业战略决策提供有力支持。要有效完成这项任务, ...
2024-12-16在当今数据爆炸的时代,数据分析师是组织中不可或缺的导航者。他们通过从大量数据中提取可操作的洞察力,帮助企业在竞争激烈的市 ...
2024-12-16