专访英特尔中国研究院院长吴甘沙:期待数据开放带来真正的大数据时代
吴甘沙,2000年加入英特尔,2011年晋升为首席工程师,同年他共同领导公司的大数据中长期技术规划。在英特尔工作期间,他发表10余篇学术论文,有22项美国专利,14项专利进入审核期。
在英特尔中国研究院院长吴甘沙的微博上,有一句英文的自我简介,可大致译为“勇敢而与众不同地思考大数据”。自2011年担任英特尔首席工程师以来,他一直主持研究院大数据方面的研究。站在大数据思维和技术研发“潮头”的他认为,研究大数据的乐趣在于“当大多数人在考虑第N个阶段的时候,开始考虑N 1个阶段”。
当前,贵州也站在了大数据产业的“潮头”。而环顾全球,大数据正以燎原之势,从一个热词迅速转化为科研院所、政府、企业、个人共同关注、研究、应用的对象,一种新的生产力正蓬勃兴起。贵州、贵阳要引领发展趋势,对话大数据专家,从他们那儿汲取智慧是一种事半功倍的途径。为此,记者近日专访了吴甘沙。
大数据是指数社会的蛋白质
“如果以世纪之交作为分隔线,上世纪的数据文化、思维和方法论还停留在前大数据时代,真正意义上的大数据思想本世纪初才破茧而出。”吴甘沙说。
“2012年,大数据成为显学。”吴甘沙介绍,这一年,达沃斯的《大数据,大影响:全球发展的新可能》和奥巴马政府的《大数据研发计划》共同确立了大数据在世界范围的战略位置,而涂子沛《大数据》和舍恩伯格《大数据时代》在国内的出版,也使2012年被称作中国的大数据元年。
对于大数据,吴甘沙常常理解为:“摩尔定律是指数社会的基因,而大数据是指数社会的蛋白质。”上世纪60、70年代,英特尔创始人之一的戈登·摩尔提出:当价格不变时,集成电路上可容纳的元器件的数目,约每隔18-24个月便会增加一倍,性能也将提升一倍。这一定律常常被用来形容信息技术进步的速度。而吴甘沙认为,随着移动互联时代的到来,数据爆发式增长在量上也越来越符合摩尔定律的指数递增规律。
“基因决定生命特征,是初始点,而蛋白质是生命的物质基础,是生命活动的主要承担者,也就是说,大数据会越来越像原材料,像货币,变成社会生命活动的主要承担者,关系到每一个人的数据化生存。”吴甘沙断言。
他进而举例说,在大数据、云计算、移动互联网和物联网等现代前沿信息技术之中,大数据是根本和核心,云计算是方式和手段,移动互联网、物联网则是物化大数据和云计算价值的应用。
大数据发挥作用的关键在于数据开放
当下,“互联网+”这一名词及其对应的发展趋势正方兴未艾,而吴甘沙则提出了“大数据×”这一说法。他说,大数据与很多传统产业融合在一起能够产生乘法效应,不同产业之间融合还能产生数据外部效应,即一个产业的数据如果用于另外一个产业,能迸发出巨大价值。
在研究中,吴甘沙越来越发现,乘法效应要充分发挥,必须走数据开放之路,让不同领域的数据真正流动起来、融合起来。“最开始,大数据的主要矛盾是互联网公司或在线数据太多的问题,接着,主要矛盾变成人没有能力从数据中提取价值的问题,最后主要矛盾变成中小公司、传统行业无法获得数据,数据孤岛的问题。”吴甘沙说,正因为如此,最近四五年,他个人的研究方向也从关注数据与机器的关系到关注数据与人,再到眼下关注数据与数据的关系。
那么,哪些数据适合开放呢?吴甘沙认为:“不涉及个体的公共数据和科研数据都可以开放,涉及个体的数据要明确数据权属、隐私界定,获得拥有者授权,采用技术匿名化之后再考虑开放。”他同时建议,可以借鉴英美,开放原始数据,而非提炼数据,保证数据满足蒂姆·伯纳斯-李提出的数据开放五星标准。
目前,贵阳正通过宽带贵阳和全域公共免费WiFi城市建设,推动社会企业和个人动态数据的“块”上集聚。吴甘沙认为,WiFi采集数据的优点就是有数据发生所在地点的信息,方便把数据放到不同的语境中分析。但他也坚持,在数据集聚之后,同样需要明确获得用户对数据的授权。
数据交易定价机制仍待实践中摸索
广义的数据开放还包括数据的共享及交易。吴甘沙认为,在大数据时代,如何让数据变成政府决策、企业经营的第一要素,数据的交易显得尤为关键。
4月14日,贵阳大数据交易所完成了首批交易。在吴甘沙看来,这样一个基于市场进行价值发现和定价,连通大数据供需双方,让数据像股票交易那样高频率碰撞的交易市场,在大数据时代是大势所趋。
但他同时指出,无论是数据的交易,还是交易过程中数据的定价,现在都没有标准的答案,“一来要从实践中摸索,二来要有意识地跟经济界做思想碰撞。”他举例说,数据在公开市场交易的时候,是根据市场价值发现机制来定价,根据数据的种类来定价,还是根据数据访问API的调用次数来定价?企业的数据资产价值几何?个人数据是否也需要定价,它的价值是不是应该由个人自己来享受,而不是完全让互联网服务提供商从中获益……
尽管这些困惑尚无定论,但吴甘沙认为这也正是大数据的魅力所在。对于大数据,深耕多年的他认为,乐趣在于“当大多数人在考虑第N个阶段的时候,开始考虑N 1个阶段”。
对于正在争先发展大数据的贵阳,吴甘沙认为过去一年多的工作“非常棒”,他同时给出建议:要想在与北京等发达地区发展大数据的竞争中不落伍,人才聚集和可持续的供给非常关键。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
Python作为一门功能强大的编程语言,已经成为数据分析和可视化领域的重要工具。无论你是数据分析的新手,还是经验丰富的专业人士 ...
2025-01-10完全靠数据决策,真的靠谱吗? 最近几年,“数据驱动”成了商界最火的关键词之一,但靠数据就能走天下?其实不然!那些真正成功 ...
2025-01-09SparkSQL 结构化数据处理流程及原理是什么?Spark SQL 可以使用现有的Hive元存储、SerDes 和 UDF。它可以使用 JDBC/ODB ...
2025-01-09在如今这个信息爆炸的时代,数据已然成为企业的生命线。无论是科技公司还是传统行业,数据分析正在深刻地影响着商业决策以及未来 ...
2025-01-08“数据为王”相信大家都听说过。当前,数据信息不再仅仅是传递的媒介,它成为了驱动经济发展的新燃料。对于企业而言,数据指标体 ...
2025-01-07在职场中,当你遇到问题的时候,如果感到无从下手,或者抓不到重点,可能是因为你掌握的思维模型不够多。 一个好用的思维模型, ...
2025-01-06在现代企业中,数据分析师扮演着至关重要的角色。每天都有大量数据涌入,从社交媒体到交易平台,数据以空前的速度和规模生成。面 ...
2025-01-06在职场中,许多言辞并非表面意思那么简单,有时需要听懂背后的“潜台词”。尤其在数据分析的领域里,掌握常用术语就像掌握一门新 ...
2025-01-04在当今信息化社会,数据分析已成为各行各业的核心驱动力。它不仅仅是对数字进行整理与计算,而是在数据的海洋中探寻规律,从而指 ...
2025-01-03又到一年年终时,各位打工人也迎来了展示成果的关键时刻 —— 年终述职。一份出色的年终述职报告,不仅能全面呈现你的工作价值, ...
2025-01-03在竞争激烈的商业世界中,竞品分析对于企业的发展至关重要。今天,我们就来详细聊聊数据分析师写竞品分析的那些事儿。 一、明确 ...
2025-01-03在数据分析的江湖里,有两个阵营总是争论不休。一派信奉“大即是美”,认为数据越多越好;另一派坚守“小而精”,力挺质量胜于规 ...
2025-01-02数据分析是一个复杂且多维度的过程,从数据收集到分析结果应用,每一步都是对信息的提炼与升华。可视化分析结果,以图表的形式展 ...
2025-01-02在当今的数字化时代,数据分析师扮演着一个至关重要的角色。他们如同现代企业的“解密专家”,通过解析数据为企业提供决策支持。 ...
2025-01-02数据分析报告至关重要 一份高质量的数据分析报告不仅能够揭示数据背后的真相,还能为企业决策者提供有价值的洞察和建议。 年薪 ...
2024-12-31数据分析,听起来好像是技术大咖的专属技能,但其实是一项人人都能学会的职场硬核能力!今天,我们来聊聊数据分析的核心流程,拆 ...
2024-12-31提到数据分析,你脑海里可能会浮现出一群“数字控”抱着电脑,在海量数据里疯狂敲代码的画面。但事实是,数据分析并没有你想象的 ...
2024-12-31关于数据分析师是否会成为失业高危职业,近年来的讨论层出不穷。在这个快速变化的时代,技术进步让人既兴奋又不安。今天,我们从 ...
2024-12-30数据分析师在现代企业中扮演着关键角色,他们的工作内容不仅丰富多样,还对企业的决策和发展起着重要的作用。正如一个经验丰富的 ...
2024-12-29数据分析师的能力要求 在当今的数据主导时代,数据分析师的角色变得尤为重要。他们不仅需要具备深厚的技术背景,还需要拥有业务 ...
2024-12-29