热线电话:13121318867

登录
首页精彩阅读王列娜:从记者到数据分析师
王列娜:从记者到数据分析师
2015-12-12
收藏

个人简介

  凯迪数据研究中心执行主编。毕业10年,在南方报社大院厮混8年。曾在21世纪经济报道、南都经济部、广州新闻部实习,在奥一网、南都广州新闻部正式工作过。从记者变成数据分析师已有五年,对职业道路未曾做过规划,都是由着性子来,哪个好玩做哪个。

  入选理由

  媒介即信息,记者是信息采集者、整合者,而用户(读者)不仅是受众,更是信源。王列娜在数据新闻领域钻研沉淀、厚积薄发,她以数为经、以据为纬,用数据爬格子,用文科生做理科活。大至中国企业社会责任的持续性全景式分析报道策划,近至深化改革元年大背景下涉及国企改革的国民情绪态度分析,以及威尔逊台风“舆论孤岛”等典型报道,都体现了信息革命下的新闻新常态,不仅讲得客观透彻,也讲得有料、有方法、有立场、有理想。

  记者感言

  从记者到数据分析师

  同一批进南都的同事说,当时就觉得南都尺度好大,光头女也招进来,还让她跑市委市政府线。好多人问,为啥剃光头?还有不少人揣测我是不是遭受人生打击了。我说其实好简单,我就想看看我剃光头啥样子。

  南都前同事,一位在同一部门当了近10年记者的姐们在得知我成为南方报业年度记者后调侃道:“姐至今还是记者,也没得过这个奖啊。”真是受宠若惊,又觉得自己似乎不怎么能承当得起“年度记者”的称号。我不当记者差不多5年了,少了一线采访,便也少了不少鲜活的、值得书写的职业经历和体验,怎么都觉得有点缺少底气。

  同事开导我:“记者是信息提供者,你们做数据挖掘数据分析也是给受众提供有价值的信息嘛。”呃,那好吧……其实我顺便偷偷地发现“记者”在我心中依然位置挺高,要不然我何以如此“惊惶”?

  应邀写这篇自述,秒觉会写得拉拉杂杂,回顾了一下在南方大院厮混的这8年,好多话一下子涌到嘴边,但又觉得多数太微不足道了。索性我就再任性一把,抛开什么谋篇布局、什么倒金字塔结构,顺着记忆来捋捋吧。

  一

  一个从小喜欢饲养昆虫(蝴蝶除外)、节肢动物、软体动物、蛇之类,并热衷做动物实验的小朋友,最后成了一名新闻系学生。这对她来说,是成为动物学家梦想的破灭。但因为跟猫一样,实在太好奇了,也太随性了,因此学新闻这个无奈之选也没困扰她多久。每天出去跑新闻,接触不同的人,感触到不同的心灵、精神,写不一样的人的故事,记录不同的事,有时候还能帮到别人,这感觉实在是太!棒!啦!新鲜、好玩、助人、各种新知识新玩意扑面而来……还有比干这个更让人每天清晨充满动力地醒来的职业吗?至于“铁肩担道义,妙手著文章”这话,甫一听到就让我热血沸腾了,真是好对我侠义的胃口。

  2003年,大二,我拎着铺盖第一次来广州,就是奔着南方报业而来的。那时的我已经习惯“新闻系学生”这个身份,而南方报业是每个新闻系学生内心的圣地。21世纪经济报道是我实习的第一站。编基金版,先跟编辑实习。但我对金融、财经这些领域的无知程度几乎跟马里亚纳海沟一样深。还记得我当时问过带我的老师,这个基金是不是宋庆龄基金会那个基金?老师甚至翻出英文名词跟我解释了一通。一位财经编辑则安慰我说:“小姑娘,不要担心专业不对口,我还是学爆破的呢。”这位爆破专业出身的财经编辑后来也经常说“Google是最好的老师。”我很感激他。

  再后来,我又在南都经济部、广州新闻部实习,毕业后在刚组建的奥一网成为一名牛客(Newsblog)编辑,编译外媒新闻、图片故事、媒体人博客、公民记者作品等。大量阅读外文新闻作品,不仅从另一层面上让我再学了一遍新闻写作,也在选题、操作角度方面拓展了我的视野。那时候,我一方面快乐地做着牛客编辑,一方面在业余时间大量写博客,写了一些神叨叨的魔幻色彩的文章,画了一些稀奇古怪的画,翻译一些美丽的诗。那时候,我通过奥一博客结识了一些可爱的人,知名的如梵高奶奶;也捧红了一些人,像“私家侦探”、“蝴蝶妹妹”。但“出去跑新闻”的念头仍然时不时跑出来让我心里痒一痒。

  二

  2006年,我正式加入南都广州新闻部,成为一名时政记者。还记得当年我顶着刚剃了一个多月的光头来面试,时任南都广州新闻部主任魏海波觉得我很豪放,但也没当面表现出来,而是给了我两个版的稿子,让我在限定时间内分别改写成两篇800字以内的消息。下午见到时任南都编委王钧,她问我想跑时政还是突发,我说:“都行吧,突发可能更刺激点。”她看看我的光头说:“你这么扎眼,突发现场不好混进去吧。”于是,我就成了一名时政记者,跟着当时的首席记者陈实跑市委市政府线。

  同一批进南都的同事说,当时就觉得南都尺度好大,光头女也招进来,还让她跑市委市政府线。好多人问,为啥剃光头?还有不少人揣测我是不是遭受人生打击了。我说其实好简单,我就想看看我剃光头啥样子。

  陈实是个好记者,采访好,文本好,有想法,对人对己要求极其严苛。所幸我的从业生涯总能遇到这样的贵人,那时候常跟同学用邮件交流从业感悟、疑惑和思考,也权当“日三省吾身”之记录,一年下来也有数万字。具体说的什么现在已不记得,只记得心潮澎湃,累,但觉得好有价值。

  还记得一次协助做关于华南虎的稿子,为了弄清楚华南虎和东北虎的区别,为了观察虎的习性,为了描写虎的时候下笔不至于空洞,我连续几天去动物园虎山观察,记录下公虎母虎的外形及动作差异等等。新光快速路开通前夜,我们在现场守了一夜,除了例行采访,我们还人工记录下开通第一天早高峰通过新光快速路的车辆数,以及通过华南快速路和洛溪大桥的车辆数,通过几方数据比对来做采访。陈实经常说采访要“扎实”,春运的时候,我数夜游荡在广州火车站周边,找各种人聊天,想记录多一些有意思的故事作为素材,虽然最后见报的故事可能只有10%,但那也是从100%的素材中精选出来的。这样扎实的采访我不认为是笨办法,相反我觉得这是必需的,就好比你想做一桌子好吃的,你得先采购更大量的材料。

  后来在参与汶川地震报道、北京奥运会报道期间,我又结识了钟跃东、胡群芳这样的良师益友,他们对我的帮助很大。地震采访中,我要去写别人的故事,必须让采访对象回忆最惨痛的一幕,我不忍心但又必须去做。事后我觉得良心上很不好过,甚至觉得媒体太残酷。

  当记者那几年,我几乎没哭过,但采访地震的工作之余,我不止一次流泪。做完北京奥运会报道,我就辞职了,我想暂时离开媒体。之后,我去了陕甘川交界的一个不怎么严重的震区短期支教,这似乎于我是一种内心的补偿。

  三

  2010年,在南都入主后,重组的凯迪网招募新人,工作地点就在289大院南都副楼。我的心又痒了。广州大道中289号的魔力是综合的、复杂的,向心力很大,不管离开多久,我还是会说“回”。

  凯迪网当时提出“网络言论价值化、产品化”,在国内算是比较早选择走数据之路的传统(社区论坛)媒体。但看到“数据分析师”这个岗位,我还是不清楚是要干嘛,分析什么数据,给谁看这些问题,对excel、SPSS这些东西也压根儿没接触过。

  在CEO陈谷川的介绍中,我只是隐约觉得数据分析是个很有前景、很有意义的东西,数据分析师听起来好牛叉的感觉。我找了些数据可视化作品来看,数据之美吸引了我。这种模模糊糊又美好的东西对一个好奇心爆棚的人来说,是致命的。没辙,再任性一次,我告诉自己“谁生来就会这些,还不是后来学的”,决定边干边学。于是,就在2010年3月,我成了一名数据分析师。

  摸索期是艰辛的,但成就感给人的力量更大。工作过程中,我也愈加发现很多事是相通的,比如我要画一个关于畜牧业如何影响环境的可视化草图,我会在纸上以行军棋的整体格局,按照推理的顺序,用箭头把一个个有价值的要素连接起来,并标注好它们之间的彼此关联。懒得写“二氧化碳和水”,就直接标上CO2和H2O,不想写“一头牛放了三个屁”,就直接画个牛,屁股后面飘着三朵云……结果出来很有趣、很直观、很简洁,感觉跟我读书时做生物课笔记差不多。

  当然,这些都是最基本的。后来我们还研究传播数据,也就是所谓的舆情数据分析,通过考量舆情事件发生各阶段的传播数据,及舆情应对后的舆论场数据变化,来评价舆情危机应对效果,并进一步给出策略建议。

  我们更看重的是采集网民不经意状况下的自然数据来对事件做量化分析。例如某垄断国企网络口碑不太好,出一个事情后面骂声一片,即便它出的这个事情是个好事。那么我们想知道,叫骂的网民到底是因为思维定势和刻板印象对该垄断国企抱有不佳评价,还是仅仅就事论事骂那个事情呢?我们会采集叫骂网民过去发布的所有微博,用“KCIS基于网民言论的情绪态度分析模型”去分析这些数据,看这些网民一直以来有没有谈论过该垄断国企,如果谈论过的话,他们的措辞、态度是如何的。

  我还参与翻译了《数据新闻手册》一书,这也给了我拓展视野的机会。数据分析不仅仅是研究传播、舆情,它可以涉及很多领域,例如天体物理学、地理学、气象学、医疗数据、城市规划领域、交通治理等。当然,数据分析也不全是高大上的,也可以通过分析你家猫咪的身体及行为数据,告诉你如何科学养猫。

  数据可视化或者说信息可视化也不仅仅是我们所熟悉的饼图、直方图散点图柱状图,在面对复杂或大规模异型数据集,比如商业分析、财务报表、人口状况分布、媒体效果反馈等,数据可视化所需处理的状况会复杂得多。可能要经历包括数据采集、数据分析、数据治理、数据管理、数据挖掘在内的一系列复杂数据处理,然后由设计师设计一种表现形式——是选择立体的、二维的、动态的、实时的还是允许交互的,再由工程师创建对应的可视化算法及技术实现手段。

  研发工程师邓立邦是我在凯迪遇到的良师益友,他的很多想法给了我启迪。例如他开发的顺公共单车APP,他提出的通过工商数据预测CPI,以及通过分析道路红绿灯时间间隔,结合高峰时段机动车通过量等数据,来让车主尽可能少的等待红灯……他的一个理念跟我不谋而合——即让数据便利人的生活。当然此理想的实现,还需要我们不懈的努力。

  (作者系凯迪数据研究中心执行主编)

  代表作品

  作品名称:KCIS发布2014年度观察:国企改革公众情绪态度分析报告

  刊载媒体:凯迪云情报频道

  发表时间:2014年12月27日

  作品影响:由国务院国资委主办的首届国企改革发展前沿论坛聚集众多专家论道。此报告是凯迪数据研究中心在调研问卷设计和舆论场数据挖掘相结合方面做的一次成功尝试,王列娜本人负责调研方向及维度把握。调研报告信息量巨大,通过KCIS问卷调查系统提供题目选项相关性、用户特性值与选项结果的相关性分析结果,进行数据挖掘的技术发现并提取调查结果的各类有价值信息,为国企改革提供数据支撑。调研报告被网易财经、新浪财经、财经网等媒体全文转载,获得多位专家好评。

  围观列娜

  治愈系的娜姐

  王蕾

  回顾2014,年初裹着小西装东奔西走地求职,在寒风中冻得瑟瑟发抖的感觉似乎还在,转眼却已工作了大半年。这过程中,认识了风格迥异的同事和领导,有温文尔雅的,有风风火火的,娜姐是他们中最为特殊的一个。

  初识娜姐的时候,我正在一轮又一轮的观察稿中苦苦挣扎,纠结于一个又一个选题值不值得写,纠结于一个又一个角度是不是恰当,纠结于一段又一段文字是不是适宜。苦于积累和见识所限,这些问题对我而言,大多是无解的。神奇的是,这些纠结与不安,往往在与娜姐的讨论中,很快烟消云散。思维局限这种东西,于她似乎并不存在。

  当我还在统计讨论总量、统计话题波动幅度、统计观点聚类、评价当事方处理是否稳妥中轮回的时候,娜姐就已经开始鼓励我们跳出对舆论场的观察,更多关注到事件本身。从观察稿的选题到具体操作,早前那段时间,她一直对我们悉心指导,而其中的不少观点和操作方法,也确实令人耳目一新。尤其是,通过这种思维的转换与调整,原本或宏大或复杂的选题,一下子变得不那么可怕,甚至轻松有趣了起来。

  比如说,每年夏季,高考都是个常规话题,其中牵扯到的数据很适合数据新闻的操作。而对2014年来说,政策的变动也令这个话题极具可操作性。按照原来的思路和手法,收集、归纳舆论观点倒也未尝不可,只是众说纷纭,要搜集的资料会太过细碎。但是到了娜姐的手里,仅高考加分改革这一项,就能激发出不少有意思的想法。最重要的是,当我还在纠结大层面上的政策规划变动时,她却直接将关注的焦点放在了具体的个体身上。这或许是曾经的记者经历使然,但政策终归是要对人发生影响。在注重数据的观察稿中,能从人的角度出发把握选题,这种思路恰是我所欠缺的。

  类似的案例还有很多。在指导我时,娜姐常说:“不要限制自己的思路,放手去做,要敢想 。”她在朋友圈里分享的那些有趣有料的内容,在让人增长了知识的同时,往往也会在选题、角度、研究方法等方面给予我们一些启示。

  除了工作上令我崇拜,生活中的娜姐注重细节,追求品质。她跟我们分享的那些小点心小零食,除了能够充实我们的下午茶时光,更常常惊艳到我们的味蕾。有时候,娜姐会在办公室里点上香烛,味道不大,清清淡淡却让人很舒服。不过给人印象最深的,还是那些妙趣横生的群聊,她总能在大家的七嘴八舌中找到一个有意思的点,再用或吐槽或调侃的方式点出来,群里的气氛立马就会轻松起来。

  办公室里,不少人爱猫。当我们对猫咪这种生物的认知还只是停留在娇傲和卖萌这个层面的时候,娜姐则用几年与喵星人共处的经验告诉我们,“养久了,它们很治愈。”

  嗯,碰上能从其身上学到知识学会工作的前辈,我也被治愈了。

  (作者系凯迪数据研究中心数据分析师)

  @邓立邦:她爱猫,据说有不少猫友,甚至各大系统的昵称都带猫;幽默,群组讨论总能冒出几句让人乐开怀的话;学识渊博,以至于大部分情况下为不显得白痴,我通常只点头不说话;棱角清晰不圆滑,在多年社会磨砺后还保持直率很罕见;如果说有那么一两位同事,他们的存在让你觉得踏实,那么她一定是其中一个。

  张东明点评

  大数据时代的新闻人,一样有方法,有情怀。

数据分析咨询请扫描二维码

最新资讯
更多
客服在线
立即咨询