《财富》精选:2014年大数据行业最顶尖的20位明星人才
大数据不只是要处理很多的数字,还得要通过这些数字建立模型、深入挖掘,并且寻找那些有可能改变企业运营方式的信息。以下谨为大家介绍20位大数据领域的顶尖人才。
Pinterest是一家以图片为主的社交网络,数据科学家安德莉亚•伯班克主要负责该公司的A/B测试,评估公司网站、APP的外观或功能变化会对它的6000万全球用户产生哪些影响。如果Pinterest网站上的某个小模块让你想邀请朋友也来玩一玩,或是某一封它发来的推荐邮件让你关注了更多话题,那么这很可能就是伯班克团队的那只“看不见的手”起了作用。她在今年三月的一次行业会议上表示:“为了今后能为几十亿用户提供服务,我们已经针对几百万用户做了数百次试验。”试验还拓展到了Pinterest自身的运营上。伯班克最大的成就之一,就是给Pinterest的其他员工赋权,让他们也能开展试验。她表示:“以前只有一个故障点,但也只有一个知识点,现在不同了。”——Andrew Nusca
阿诺•康代尔从小就生长在一个科研氛围浓厚的环境中。他出生于瑞士一个叫做下锡根塔尔的小村子,这个村子恰好位于拥有欧洲顶级粒子加速实验室的保罗谢尔学院(Paul Scherrer Institute)和欧洲大陆最著名的科技院校苏黎士联邦理工学院(ETH Zürich)之间。在学习粒子物理学和超级计算机学期间,康代尔曾经在电脑上建立过宇宙的模型。后来他搬到美国加利福尼亚州,在斯坦福大学直线加速器中心的全国加速实验室中工作(SLAC National Accelerator Laboratory),后来又开始创业,成为Skytree公司的创始工程师,并且设计了几套高性能的机器学习算法。现在他是Oxdata公司h2o数据分析平台的核心开发者,他开发的这个h2o平台,被编程社区GitHub的成员誉为最优秀的开源Java机器学习项目,而且它还可以兼容流行的统计编程语言——R语言。他在Oxdata公司的头衔是“物理学家兼黑客”。——Robert Hackett
阿兰•默西最早在雅虎公司(Yahoo)工作,现在已然用途极广的开源存储和处理软件Hadoop在那时尚处于早期原型阶段。默西的团队的任务就是扩展Hadoop的功能,让它用于雅虎的网页搜索。于是默西研发了一个名叫YARN的资源负载管理系统,它的作用大致相当于Hadoop的一个操作系统。默西表示:“第一版的Hadoop看起来就像还在用Notepad的Windows,但是我们真正想要的是能用Powerpoint、Word和Excel的Windows。”这正是YARN的魅力所在:它允许用户向Hadoop中插入多种应用以存储各类信息。默西表示:“我家里有两个孩子,但YARN就像是我的第三个孩子。”——Robert Hackett
很多科技公司都想发起一场技术革命,但是很少能获得上一波技术革命领导者的支持。马萨诸塞州剑桥市的NuoDB公司却一举网罗了上一波数据库革命“四大天王”的其中之三——Ingres公司前CEO加理•摩根泰勒、Sybase公司前CEO米切尔•克兹曼、Informix公司前CEO罗杰•斯普尔。只有最后一名“天王”,也就是甲骨文(Oracle)的CEO弃权了,但他也身在投资人之列。这么一家名不见经传的公司何以有这么大的号召力?因为NuoDB的技术解决了一个多年来被行业视为“圣杯”的问题:如何让一个数据库在多个服务器上运行。“关键在于用更多的机器,而不是更大的机器。”该公司CEO巴里•莫里斯表示:“那个问题听起来虽然简单,但一直没得到解决。”DuoDB公司成立于2010年,现在这家公司已经签下了一个大客户——欧洲第二大软件厂商达索系统公司(Dassault Systèmes)。另外莫里斯认为,公司正在飞速朝着一个“新的聚焦点”迈进。他认为DuoDB将走上舞台的中央。“它的意义不在于数据的规模或运行速度,而在于形成一种数据导向型模式。持续改进的能力才是它的革命性所在。”——Andrew Nusca
要想让布莱恩•罗格斯基谈谈他在Beats Music公司的工作细节真是不容易,不过Beats Music刚被苹果(Apple)收购,考虑到苹果一向神神秘秘的作风,倒也没什么可奇怪的。(这笔交易于今年五月宣布,上周五完成。)不过罗格斯基依然是三句话不离本行。他表示,现在企业都有兴趣更深入地进行实时数据分析,而且也有兴趣在企业内部加大数据的分享力度。另外很多公司也想利用大数据提高APP的个性化体验。那么罗格斯基打算如何在Beats公司跟上这股潮流呢?他表示:“你必须自己理解其中的奥妙。由于我目前的角色,我对这个问题不能说太多,现在还是说说大趋势吧。”——Robert Hackett
小时候,达尼埃尔•凯西亚最想当一名警察,为此他还买了一辆玩具摩托车。不过现在在雅虎实验室(Yahoo Labs),他对城市的了解绝对细致入微——尽管只是在数码层面上。凯西亚拥有计算机科学博士学位和麻省理工学院(MIT)城市研究专业的博士后学位。目前他主要进行广域的城市研究。比如他构建了一款游戏,问人们喜欢哪种城市景观,然后把评分放在Facebook上进行病毒式传播。凯西亚会对结果进行研究,以确定人们喜欢或不喜欢哪种城市景观,以便最终设计出更好、更漂亮的城市。他认为:“计算机科学就是一门构建工具的学问。我想做一些新的事情,一些能对现实造成影响的事。而全球有超过一半的人口都住在城市里。”——Shalene Gupta
微软(Microsoft)内部有一个叫做“比尔评论”(Bill Reviews)的保留节目,也就是员工们可以在创始人兼董事长比尔•盖茨面前提出自己的创意。当微软研究院剑桥实验室(Microsoft Research’s Cambridge Labs)的计算机学负责人史蒂夫•艾默特在一次“比尔评论”中提出,要由剑桥实验室出资,在公司内部建立一个生态学研究小组时,“那真是一次糟糕得出名的会议。”——时任普林斯顿大学(Princeton University)生态学家的德鲁•帕维斯如是说。但是最后比尔•盖茨改变了主意,很快微软聘请了帕维斯作为这个小组的领头人,负责建立地球生态系统的预测模型。自从微软的“蓝天”研究部门成立后,帕维斯已经带领科研团队开发了一个模拟地球所有生命的“马丁利模型”。这个项目可谓雄心勃勃,虽然有些“唐吉诃德”色彩,但它的部分成果说不定最终也能应用于实际。帕维斯表示:“国民经济中发生的每一件事,都可以放在一定的环境因素中考量。”他随口道出全世界面临的几大最严重的挑战,包括人口老龄化、癌症、食品安全、气候变化和替代能源等问题。对于生态学和生物学,帕维斯补充道:“这些东西将成为21世纪经济的核心驱动力。”
自从IBM的“智能”电脑系统沃森(Watson)在电视智力节目Jeopardy中战胜了人类对手之后,IBM还想试试它到底能把智能计算的边界推到多远。最近IBM决定让沃森进军烹饪界。作为一名受过专业训练的厨师,弗罗里安•皮内尔也是IBM的“认知烹饪”团队的一员。皮内尔表示:“我们之所以把重点放在美食上,是因为美食是大家都关心的东西,而且我们可以很容易地创造出原型产品。现在我能把对食物和计算机科学的热情融合在一起,这令我大喜过望。”这个团队首先从各种食材和调料着手,但是他们研发的各种食物的组合呈指数级增长,催生出了大量潜在的美食食谱。比如在今年德州奥斯汀的SxSW大会上,沃森系统就在IBM的美食卡车上发明了一种澳洲巧克力卷饼,食材包括巧克力、牛肉糜、青豆和大豆。听起来虽然是一道很难吃的菜,不过皮内尔却表示:“它大获成功,非常好吃。所以我们的目的就是要启发用户,帮助他们开发他们自己永远想不到的美食配方。”——Robert Hackett
身为西奈山医院(Mount Sinai Hospital)基因与基因组学的助理教授,杰夫•汉默巴切虽然没有这个专业的博士学位,但丰富的经验让他绝对称职。他曾是Facebook最优秀的数据学家之一,后来他放弃了被广告渗透到各个角落的社交媒体业,成了Cloudera公司的首席科学家。Cloudera是一家基于Apache Hadoop平台的企业软件供应商。现在汉默巴切又与西奈山医院的基因与基因组学负责人埃里克•沙特合作,试图把大数据分析带入到医疗保健领域。沙特指出:“他正在定义一个新的领域,以后这个领域将成为一门会发放博士学位的学问。现在没有任何一门学科在教授他所做的事。”汉默巴切正在构建管理和运算人体健康数据所需要的基础架构,以建立更好的医学预测模型。沙特表示:“对于医疗业和医疗机构来说,现在正是他们开始启用大数据分析引擎的时机。我们和杰夫这样的人才合作,充分说明了医学将来的走向。”——Robert Hackett
如果说互联网也有它自己的中央情报局,那么这块招牌可能要落到CloudFlare公司身上。这家旧金山的公司监控着全球5%的网络流量。公司创始人之一米歇尔•扎特琳2009年在哈佛大学(Harvard University)遇到了另外两个合作伙伴——马休•普林斯和李•霍洛维,并于同年创办了这家公司。CloudFlare扮演了一个网站与恶意用户之间的缓冲区的角色。如果CloudFlare判定一名用户为友好用户,它就会加快他所享受的服务的速度。如果它判定一名用户为垃圾邮件发送者或者机器人程序,它就会降低他的服务速度,或者是要求对方输入验证码。扎特琳表示:“十年以前,我知道我想成为一个大而重要的团队的一份子,但当时我并不确切地知道这意味着什么。但是现在我感到很幸运,因为我找到了CloudFlare。我想象不出还有比帮助客户更好地经营他们的业务更好的事了。”——Shalene Gupta
在Jawbone公司,莫妮卡•罗加蒂有两个职责。首先是弄清楚该公司的Up智能腕表收集的数据都代表了什么。其次,构建以智能方式使用这些数据的新产品。罗加蒂表示:“我们发现了关于我们如何睡觉、活动和进食的许多新的信息,它们都是之前无法发现的。以前我们只能对100个人进行睡眠研究,但是现在我们可以研究10万个人的睡眠信息。”也就是说,罗加蒂和她的团队能够了解人们为什么会失眠。比如华盛顿的居民可能会因为一次总统就职典礼而兴奋难眠;伊斯坦布尔的居民可能会因为中东爆发的抗议而睡不着觉;笃信天主教的罗德岛居民可能因为教皇的辞职而失眠——然后,该公司可以把这些信息反馈到Up智能腕表上,并调整他们的行为。罗加蒂指出:“我们充分地利用了这些数据反映出的见解,并且利用它们来鼓励人们保持最佳水平。”——Andrew Nusca
孩提时代,欧诺•佐伊特梦想着成为一名乐高积木的设计师。8岁时,他拥有了人生中的第一台电脑,它点燃了一个男孩对人工智能的兴趣。如今佐伊特已经进入施乐欧洲实验室(Xerox Labs Europe)工作,他研究的重点是如何缓解洛杉矶的交通拥堵。佐伊特表示:“我们对停车问题了解的不多,因为它需要大量时间来观察。”为此,佐伊特的团队在全市各处的停车场安装了大量传感器。传感器收集的信息会反馈到一款智能手机应用上,这样司机就可以随时了解哪些停车场已经停满了,哪些停车场的车位还空着。更妙的是,城市可以根据这些数据调节这些停车场的停车费,以降低高度拥堵地区的车流量。自从这个项目在2012年问世以来,洛杉矶的交通拥堵已经缓解了10%。——Shalene Gupta
帕特里克•普尔斯曾经告别科技业整整五年,这期间他转行做了一名职业扑克玩家。不过职业扑克市场在2010年萎缩得非常厉害,于是他决定重返科技行业。他并不为他的选择后悔,他说:“分析数据跟玩扑克很像。你玩了几千手牌,你也了解了人,你也处理了数据,而且你会留心寻找一些显眼的东西。这些都是共通的。”在Eventbrite网络售票公司里,普尔斯和他的团队开了一个推荐系统,能够根据用户已经浏览的内容,向他们推荐他们可能感兴趣的大型活动。这个系统的反响很不错,现在每周大约有100万人在Eventbrite上购票,其中近半数都是回头客。普尔斯的下个项目,是要想出怎样才能最好地卖掉需要预订座位的活动的门票。
有“神童”之称的西尔瓦诺斯•李只花了短短两年时间,就从斯坦福大学获得了计算机科学与数学的双学位。他在毕业后直接进入了金融行业,但是科技业的诱惑还是太强了,于是他在2012年加盟Dropbox。凭借其商业背景和科技知识,他成立了一支团队,专门从事数据学研究。他曾经负责过一个叫做Project Harmony的通讯软件,它使Dropbox的用户可以实时查看其他用户对共享文档的修改,并可与其进行讨论。另一个跟销售有关的项目是查看是否有来自同一家公司的员工在同时使用Dropbox,如果有就为他们提供超值套餐。西尔瓦诺斯•李的老板王晨立(音译)表示:“他的背景横跨科技、数学和商业实务,非常难得。这使他的数据科学研究鹤立鸡群。”——Shalene Gupta
苏拉比•古普塔非常喜欢旅行,经常替亲朋好友规划旅行线路。作为斯坦福大学(Stanford University)计算机科学专业毕业的研究生,她对摘要的艺术非常着迷——仅仅短短数语就能尽得其要,而无需阅读整篇文字。早先古普塔在谷歌(Google)工作期间就曾研究过租房服务公司Airbnb。她对Airbnb的数据所能提供的可能性很感兴趣,于是她主动联系了Airbnb跳槽到这家公司。短短四个月后,她就显著改进了Airbnb的搜索引擎。现在古普塔正在试图压缩Airbnb的所有列表,创建摘要,以便用户可以迅速了解不同城市的风情。她表示:“总的目标就是,当人们旅行时,我们怎样把他们吸引到Airbnb来?当他们想去旅行的时候,我们怎样让他们获得我们的信息?”——Shalene Gupta
斯瓦蒂•辛格的技术背景几乎无懈可击,其中包括从杜克大学(Duke University)获得的机器学习博士学位。但她的性格却热衷经商。她是美国运通(American Express)MyOffers服务背后的主要智囊,这项服务旨在让美国运通的会员在需要的时候获得他们想要的东西。比如现在是中午,你又恰好想吃墨西哥菜,美国运通就会送你一张附近墨西哥餐厅的优惠券。她负责的另一个工具可以让商家比较自己的年度表现。她的老板塞斯特里•杜尔瓦苏拉表示:“她有很强的技术背景,但是她也可以像一个领导者一样,和其他领导谈事情。每次我们讨论数据的时候,她都在场。”——Shalene Gupta
塔玛拉•加夫尼利用数据来预测未来。在Adobe数字系统公司,她的团队负责从使用Adobe云服务的用户那里反馈的数据来预测各种问题,比如哪部片子会获得奥斯卡奖,哪部大片会卖座,在冬季购物季有多少人会在网上购物等等。她的预测也的确非常了不起,在去年的圣诞购物季,加夫尼团队的预测只比实际情况低了1个百分点。她的经理朱莉•麦肯蒂表示:“她对科技的理解再加上她对人的行为的兴趣,使她非常与众不同。她好奇心很强,喜欢对数据划分模式、追踪线索,对事情的演变提出假设。”加夫尼的下一个项目,是对各种移动购物应用进行预测。——Shalene Gupta
第一眼看去,在这样一家经营时尚业务的公司里,维贾•苏伯拉马尼安的工作貌似并不光鲜。不过作为时装租赁服务Rent the Runway的首席分析官,恐怕很少有人对女性时尚潮流的理解比他更深了。2010年,他加入公司不久后,便构建了一个评估模型,能够估算漏掉的需求、产品寿命以及库存服饰的使用场合。由于公司每个季度都要从时装设计师那里购入成卡车的时装首饰租给顾客,因此维贾的模型可以说给公司省了一大笔钱。他表示:“如果你把三个数据来源放在一起,你就可以建立一个体现购物习惯的模型框架。它告诉我们应该去找哪种风格的衣服,才最有可能让我们穿出明星范。”——当然还有尽量要避免哪种搭配。维贾的下一个项目是整合Unlimited反馈的新型数据——Unlimited是该公司为了进军日常便服领域而推出的一个项目。维贾表示:“我们的经典模型都围绕着你要去的重大场合。你可能穿衣比较前卫,但如果你出席正式场合,你自己的穿衣风格就不重要了,重要的是适应场合。而Unlimited则是理解用户穿衣风格的开始。”——Andrew Nusca
很多人可能很难相信,曲艳(音译)的工作影响了95%的美国读者。曲艳在社交网站公司ShareThis开发了一个叫做“社交质量指数”(Social Quality Index)的指标,可以衡量围绕一定网络内容的社交活动,并帮助广告主和出版商锁定目标群体。曲艳表示:“技术方面并不难,难的是怎样发现一个商业问题,然后把技术应用上去。”曲艳在卡耐基梅隆大学(Carnegie Mellon University)获得了自然语言处理专业博士学位。在进入ShareThis工作前,她还曾领导过美国在线(AOL)的Advertising.com的Advance Research研究团队。现在,她很喜欢迎接移动电话带来的挑战,而且手机也不允许网站植入cookies来确认重复访客。这些都需要曲艳收集更多的数据。——Shalene Gupta
早在2011年的时候,扎卡里•博格与马特•奥克多就在旧金山湾区成立了一家风投公司,专门关注大数据领域的创业,这种眼光在当时无疑是非同一般的。从那时起,这家公司的业务也随着大数据的浪潮而水涨船高。博格表示:“成本曲线很快就被越过了。急速下降的成本使这些新方法得以冲击那些旧的行业。”今年,该公司又推出了自己的第三支基金,使它的总融资额达到将近2.5亿美元。该公司把赌注押在了短期借贷创业公司LendUp,以及内存数据库服务MemSQL等新锐公司上。据说MemSQL要比市面上现有的内存数据库便宜得多也快得多。博格表示:“科技为广大的市场和行业开放了前所未有的投资机会。我们的一个观点是,每个部门和行业都会被科技彻底扰乱,真是令人兴奋。”——Andrew Nusca
数据分析咨询请扫描二维码
Excel是数据分析的重要工具,强大的内置功能使其成为许多分析师的首选。在日常工作中,启用Excel的数据分析工具库能够显著提升数 ...
2024-12-23在当今信息爆炸的时代,数据分析师如同一位现代社会的侦探,肩负着从海量数据中提炼出有价值信息的重任。在这个过程中,掌握一系 ...
2024-12-23在现代的职场中,制作吸引人的PPT已经成为展示信息的重要手段,而其中数据对比的有效呈现尤为关键。为了让数据在幻灯片上不仅准 ...
2024-12-23在信息泛滥的现代社会,数据分析师已成为企业决策过程中不可或缺的角色。他们的任务是从海量数据中提取有价值的洞察,帮助组织制 ...
2024-12-23在数据驱动时代,数据分析已成为各行各业的必需技能。无论是提升个人能力还是推动职业发展,选择一条适合自己的学习路线至关重要 ...
2024-12-23在准备数据分析师面试时,掌握高频考题及其解答是应对面试的关键。为了帮助大家轻松上岸,以下是10个高频考题及其详细解析,外加 ...
2024-12-20互联网数据分析师是一个热门且综合性的职业,他们通过数据挖掘和分析,为企业的业务决策和运营优化提供强有力的支持。尤其在如今 ...
2024-12-20在现代商业环境中,数据分析师是不可或缺的角色。他们的工作不仅仅是对数据进行深入分析,更是协助企业从复杂的数据信息中提炼出 ...
2024-12-20随着大数据时代的到来,数据驱动的决策方式开始受到越来越多企业的青睐。近年来,数据分析在人力资源管理中正在扮演着至关重要的 ...
2024-12-20在数据分析的世界里,表面上的技术操作只是“入门票”,而真正的高手则需要打破一些“看不见的墙”。这些“隐形天花板”限制了数 ...
2024-12-19在数据分析领域,尽管行业前景广阔、岗位需求旺盛,但实际的工作难度却远超很多人的想象。很多新手初入数据分析岗位时,常常被各 ...
2024-12-19入门数据分析,许多人都会感到“难”,但这“难”究竟难在哪儿?对于新手而言,往往不是技术不行,而是思维方式、业务理解和实践 ...
2024-12-19在如今的行业动荡背景下,数据分析师的职业前景虽然面临一些挑战,但也充满了许多新的机会。随着技术的不断发展和多领域需求的提 ...
2024-12-19在信息爆炸的时代,数据分析师如同探险家,在浩瀚的数据海洋中寻觅有价值的宝藏。这不仅需要技术上的过硬实力,还需要一种艺术家 ...
2024-12-19在当今信息化社会,大数据已成为各行各业不可或缺的宝贵资源。大数据专业应运而生,旨在培养具备扎实理论基础和实践能力,能够应 ...
2024-12-19阿里P8、P9失业都找不到工作?是我们孤陋寡闻还是世界真的已经“癫”成这样了? 案例一:本硕都是 985,所学的专业也是当红专业 ...
2024-12-19CDA持证人Louis CDA持证人基本情况 我大学是在一个二线城市的一所普通二本院校读的,专业是旅游管理,非计算机非统计学。毕业之 ...
2024-12-18最近,知乎上有个很火的话题:“一个人为何会陷入社会底层”? 有人说,这个世界上只有一个分水岭,就是“羊水”;还有人说,一 ...
2024-12-18在这个数据驱动的时代,数据分析师的技能需求快速增长。掌握适当的编程语言不仅能增强分析能力,还能帮助分析师从海量数据中提取 ...
2024-12-17在当今信息爆炸的时代,数据分析已经成为许多行业中不可或缺的一部分。想要在这个领域脱颖而出,除了热情和毅力外,你还需要掌握 ...
2024-12-17