数据科学从业三大原则:坚持、投入、改变
默谱科技数据总监李艳
导读
在这个知识技术快速迭代的数据科学领域里,要保证自己的技术从业之路“基业长青”,靠的不仅是某些具体技术的精通,更要掌握一些原能力,比如说,坚持的信仰、投入的决心、以及改变的勇气。
对面这位年轻的默谱科技数据总监李艳,和他的年龄成反比的是他丰富的从业经历,从业6年,从数据分析到算法工程,从机器学习到大数据架构,从数据部门经理到数据总监,基本这些另现在诸多从业者都分不清具体区别的数据岗位李艳都曾亲历过。并且在这背后,是自身实力和行业地位也稳步的提升,直至今日在一家具有高校背景的AI科技创新公司—默谱科技中担任数据总监要职。这样的一条从业之路与他现在所站在的职业高点看似矛盾,但放在具体数据行业又合情合理,在他看来,他的从业心得可总结为以下三条
- 选择一条道路并勇于坚持
- 面对具体工作要敢于投入
- 更重要的是,在面对快速更迭的数据科学技术体系,面对新兴技术要保持好奇心,并时刻最好改变的准备。
一、坚持
“首先,你要选择一个方向并坚持下去”,李艳说到,“我从08年开始接触并学习数据相关技能,到今年已经差不多有10年的时间了,10年间遇到过不少困难,也遇到过不少诱惑,但我很庆幸,自己在数据从业道路上坚持了下来。”
其实人生的本质也就是选择与坚持,谁能在更大的时间尺度下把握好自己,谁就能在人生的马拉松中占得先机。
“那坚持的收获呢?是经验的积累和技术的进步么,还是另有其他。”
“行业经验的积累、技术的长足进步,这都是最基本的,最重要的是随着时间增加,你会发现自己对行业的理解与判断都会发生变化,只有通过长期的学习和实践,才能真正看清行业未来发展方向,才能把握住技术和实际业务的结合形式。”
或许,这也就是坚持的意义,可以什么可以作为技术从业的信仰,坚持可以算一个。
“刚刚谈到学习,那您能分享下您的数据技术成长路径么?”
“我个人觉得数据技术学习可以归纳为以下三个阶段:1、数据分析基础理论知识学习积累,2、具体数据分析工具的学习,3、对现实问题抽象、分解与转换为数据分析问题的能力培养,并且,我觉得第三点可能更为重要。”
二、投入
“关于您说的第二方面,要敢于投入具体的工作这一点,其实在任何岗位从事任何技术都要投入具体工作,这里面的敢于二字从何谈起呢?”
“这里我说的敢于投入到具体的工作当中,一个是指对具体的工作要全身心的投入,当然,更重要的是,无论职位高低、从事技术工作难度如何,都要全身心的投入。数据科学技术体系中算法、架构处在上层,SQL、ETL、BI工具则处于技术难度相对较低且所能价值有限,因此,更多从业者更倾向于找算法和架构方面的工作。但实际情况是,一方面算法与架构岗位要人不多,另一方面大多数此类岗位实际工作内容与大多数人的期望还是有些差距,这既是技术特性所决定,同时也受限于技术科学当前发展阶段。因此,这类岗位在招聘时,除了要求掌握对应算法或架构技术之外,更多的是会综合考察你的从业经验、数据敏感程度和数据思维,而这些,如果你曾有一段哪怕是基础数据处理的工作经历,都将是加分项。更进一步的说,其实就是任何和你发展方向一致的具体工作,无论技术难度和创造价值高低,都值得全身心的投入。”
确实,如果两点之间有时候不存在直线,但全身心的投入当下的工作始终是自我增值最高效的办法。“黑夜给了我黑色的眼睛,我却用它来寻找光明”,要心怀梦想,也要脚踏实地。其实这也回答了很多就业班学员毕业后找工作时得疑惑,想要从事算法,却暂时只拿到了SQL工作的offer,此时或去或留,相信通过刚才这段对话会能够为迷茫的同学有所启发。
三、改变
“当然,最重要的是时刻做好改变的准备,并敢于改变自己。”李艳说到。
“去接受新兴的技术么?”
“是的,不仅要保持开放的态度看待新兴的技术,更要对新兴的技术保有好奇心,随着技术的更迭站在行业的前沿往前看。很多时候表面的技术更迭其实代表着更深层次的技术发展趋势,不是说,要洞见趋势,才能把握未来么。”李艳笑道。
很多时候,改变比坚持更难,坚持你只需要知道一件事就行,而改变不仅需要有足够的智慧确定一个方向,还需要有勇气迈出改变的第一步。不过表面技术更迭如何代表深层发展趋势,我还要进一步追问。
“您能否举个例子说明一下?”
“比如前阵子,Python和R的争论甚嚣尘上,表面上看是谁的用户多、谁的社区完善、谁的功能强的问题,但实际上是Python所代表的机器学习和R所代表的数理统计分析之争,近几年机器学习算法越来越多、应用面越来越广、效果也不错,当然迟早要和原先的算法霸主—数理统计分析叫叫板,叫板不是要和R针尖对麦芒,更多的是宣誓Python机器学习用户已经足够多、机器学习算法效果已经足够好,好到可以和R一决高下,而这背后,其实就代表着Python和机器学习这几年的发展成果。如果你理解了这点,你就能以此洞见整个机器学习发展趋势,就知道应该通过改变去适应大环境的变化,更重要的是这种变化往往带来了一种更高效的价值创造方式。就像昊天你常说的,只有改变才能看见未来,我们也要相信改变的力量。”
其实如此这般,其实还有早年的Spark和MapReduce之争,以及现在的Spark和Flink、Python和Julia之争,其实通过表面的技术碰撞都能看出底层技术发展趋势:Spark和Flink是计算效率之争,大数据领域计算效率高者为王,Flink其实就代表着更高效的数据处理方式;而Python和Julia则是数据科学编程语言的易用性之争,分工细化带来运作效率提升,语言易用性的提升将进一步的深化算法研发和使用者的分工,同时也必然带来效率的进一步提升。当然相比之下,我更看好拥有能够调配分布式计算资源的一站式数据分析处理框架IBM Waston。
“不要去信仰任何一门具体的技术。”这是我在每一期毕业学员临近毕业之际都要嘱咐的话,或许很多通过技术改变自身命运的人并不接受,但在这个技术和技术理念都在飞速更迭的时代,过度相信会丧失改变的勇气,而拒绝改变则会抑制技术的价值。“做知识的游牧民族,到水草最丰美的地方去。”知识如此、从业如此,人生亦是如此,勇敢的去改变、勇敢的走出自己的心理舒适区,你就会遇见一个更好的自己。
最后,简单总结一下本篇访谈录的主要内容,要选择一条路并坚定不移的坚持下去,对于具体的工作要全身心的投入,无论简单或复杂,这是在面对不确定性社会的最高效自我增值方式,最后,还好能够保持一颗好奇心,随时准备走出心理舒适区、接受新技术和新思路,才能永保技术发展之路“基业长青”。