李开复-中国人工智能行业的发展现状(附视频中字)
上月李开复受邀出席 MIT 麻省理工学院“人工智能与未来工作”峰会,对中国人工智能行业的发展现状发表了主题演讲。
CDA字幕组对该视频进行了汉化,附有中文字幕的视频如下:
李开复-中国人工智能行业的发展现状
针对不方便打开视频的小伙伴,CDA字幕组也贴心的整理了文字版本,如下:
今天在过来的路上,优步司机问我要去参加什么活动。我回答,去参加 MIT 的 "人工智能与未来工作"峰会。
他问我: "多久以后自动汽车会代替我的工作?"
我想了想说 "这里是美国,那么可能需要15到20年"。
他松了一口气说,"那时候我已经退休了"。
幸好我不是在中国被问到这个问题,不然我可能会说10年。
因此这个演讲会告诉你,为什么我对 AI 在中国的发展如此乐观,以及当中的一些担忧。内容会涉及关于 AI 方面的:科技、市场、产品、资本和政策。这不是一个科技性演讲,但是我需要从科技讲起。
一、技术
因为很多人可能会想到,在所有的 AI 领域图灵奖获得者中,所有的深度学习的发明者中,虽然当中没有很多中国人。很多是美国人或者加拿大人,他们领导着由顶尖 AI 演讲者组成的精英团队。虽然顶尖的学者主要是美国的研究者,但是中国的 AI 研究者数量在以惊人的速度增长。
当中也有我的一小份功劳,就是建立了微软亚洲研究院。这个机构已经培训了5000人,当中的核心工作主要围绕 AI 。
左侧列出来的九个人,都出身于微软亚洲研究院,他们如今是百度、阿里巴巴、腾讯、今日头条和海尔等公司的CTO,或 AI 方面的负责人。
AI 的知识传播开来,帮助中国企业步入 AI 时代。很多三、四十多岁的青年人投身于此。当中有些人是计算机视觉与模式识别大会(CVPR)等会议的委员会成员。许多年轻人在以令人惊讶的速度涌入这个行业。
讲个小故事。大概十年前,清华大学经济管理学院的院长曾告诉我,"今年那些特别聪慧的学生中,许多选择了商学院而不是计算机科学"。那是在2005年,我问他当中的原因。他说高盛在中国开始按照全球标准支付薪水。如此一个微不足道的信息足以使一半的状元选择就读经济管理专业。如今是 AI 时代,许多的状元选择了计算机科学作为专业。
最近我和一些毕业生交流,我问 "为什么你想从事 AI 领域?"。他们说 "工资更高"。 我问 "能高多少",他们说 "大概高出一半"。并不是所有的中国学生都是经济利益驱动的,但是薪酬是一个重要因素。
我们投资的一家公司,叫做Face++(旷视科技)。一周前,旷视科技研究院包揽了MS COCO竞赛的三项冠军。打败了其它世界顶尖团队。他们的首席科学家孙剑是ResNet的发明者之一。
这项技术用在AlphaGo Zero中,这家公司的估值已经超过十亿美元。他们能够在任意指定时间内识别三百万张脸,这项技术的部署在各行各业。比如安全应用等。
已经发布的iPhone X具有面部识别功能,很多中国的主要手机制造商都在奋力追赶 iPhone。在这里我不具体说是哪些厂商,但大部分都在这么做。当中许多都选择旷视科技的技术,他们没有iPhone高大上的3D技术,但是对于身份验证并不需要这项技术。
这个例子说明面部识别技术已经被中国企业大量应用。当中一些企业处于领先地位,他们的成功由于对该领域的专注。这需要大量的努力,这并不是发布优秀的论文,而是让论文能够用于实践。需要大量的数据和标记工作,这些工作最开始是人工的,最终是自动化。这种奉献和投入很符合中国企业。
这是面部识别方面的例子,我之前的研究领域——语音识别。百度和科大讯飞都声称自己的语音识别技术,与谷歌级别相差无几。因此中国的企业在应用软件方面正在追赶世界前沿科技。
但是论文情况如何呢?
10年、12年以前,中国 AI 论文作者的人数是非常少的,但现在华人作者参与的顶级 AI 论文被引用次数所占比例提升到53%。远高于中国人口在世界人口的占比,尽管最顶尖的研究者还不是中国人,但是中间水平的研究者数量在迅速增长。而不是一般的出版物,因此技术水平上虽然还有差距,但是正在努力追赶。很多人正在进入这个领域。
二、市场
数据集的大小对于 AI 算法十分重要,大多数 AI 算法是开源的。在应用中会发生这样的良性循环。首先如果你有许多数据,通过 AI 升级的产品会让你获得更多用户,带来更多的收入。之后你就可以雇佣更多科学家,购买更多机器,从而获得更多数据。这种循环是很多公司成功的关键因素。比如Facebook、Google、微软,在中国有百度、腾讯、阿里巴巴等公司。
有一个说法,数据从来都不嫌多。这要归功于Fred Jelinek。数据越多越好办事。
正如左图所示,说明了当增加数据量,随着横坐标变大每个算法的准确度都大大提高了。
因此如果认为顶级科学家对于特定 AI 问题能够创造奇迹。其实事实并非如此,不管是在任何时候,一个拥有大量数据的出色科学家最终会打败,只有少量数据的顶尖科学家。
中国有多少数据呢?
我们都知道,中国是全球手机和互联网用户人数最多的国家。你可能认为3倍的数量,意味着中国有极大的优势。比如百度比谷歌的搜索量更多,淘宝比亚马逊的交易量更多。可能是这3倍的因素之一。你觉得差距只是3倍,但不仅仅是3倍。事实比这个更大。
举两个例子,其中一个是中国的手机移动支付。中国人使用手机支付的次数是美国人的50倍,意味着支付时是拿出手机,而不是使用信用卡或现金。这就是手机支付。这些数据都会再用于训练 AI 模型。中国外卖次数是美国的10倍。
我没有时间去详细解释当中的原因,我只是想说作为生活的一部分,手机功能的扩展不管是线上还是线下,中国的速度要比美国快得多。
如果你来到中国度过一天,和中国人待上一天,你将为中国人所做的事情感到惊叹。
中国人不带现金,只是带部手机,可以用手机购买任何东西。不需要去餐厅,只需要点外卖。当下班时,打开手机应用点餐。等到家时你的外卖也刚好送到了,外卖从电动车上拿下来时还是热的。这些例子体现了,移动手机在中国的用途正在发生天翻地覆的变化。
还有关于共享单车的例子。共享单车是现象级的产品,既给用户带来价值,并且改善环境,这种商业模式将带来大量收入。虽然确实把道路弄得很乱,这个问题有待解决。
这张图向你们展示了5个应用,以及每天达到2千万订单需要多久。这不是日活跃用户也不是页面浏览量,这是完成消费的订单数。想象一下美国有多少APP达到了这个订单量。对于新的APP,要花多少时间达到这样的增长速度。
我们投资的一家叫摩拜单车的共享单车公司,他们花了10个月的时间从零开始到实现每天2千万订单。
这就是第三个浪潮。如今已有2200万辆自行车将GPS信息,以及其他的传感器信息发送到服务器。产生了20TB的数据可以从中挖掘各种指标。
滴滴同样每天发送2000万份数据,滴滴是类似Uber的打车APP。滴滴最近连接了交通信号灯,通过同步交通信号灯状态和确定有多少车辆在走哪条路,从而极大地缩短从A地到B地的时间。这些数据将使已有的应用更加高效,而且将驱动我们从未想过的新应用。
因此移动支付真的很重要,尽管它并不直接归属于 AI 主题。当你的手机可以进行移动支付后,会发生下面几件事情:
先需要理解什么是移动支付。
首先,这并不会像信用卡那样,银行会收取3%的服务费,基本上是免费的;其次是点对点,所有人都可以给其他人付款,并不一定要是商家和客户;第三是即时到账,并不需要等待信用卡验证通过。
这给我们的生活带来了巨大的变化,之前中国是存款经济,现在正在转向消费经济。因为操作太简单了,你想买什么东西就只管去买。
而且现在贷款也很简单,这也是我们投资一家智能贷款的公司的原因。每年他们要做3千万的贷款,这还只是一家公司的贷款量,像这样的公司有10家。
如今中国有了跨越式发展的机会,这仅仅发生在过去的两三年里。现在任何地方都可以用移动支付。
关于接下来要说的话题是,你们可能都在想亚马逊收购 Whole Foods。但是我们认为这是比较原始的方式。
在中国,线上与线下融合地十分完善,即OMO(Online-Merge-Offline)。有一些公司能够追踪线下用户,并且把用户行为发到线上,从而与线上行为整合起来。说的更清楚一些,当你用浏览器浏览Amazon时,Amazon会知道你在看哪个网页、点击了什么、买了什么、没有买什么、你是谁、你过去买了什么。
但是想像这发生在真实生活中,如果商店或者购物中心用摄像头,或者其他传感器来记录你做了什么。然后上传到数据服务器上,从而线上线下能够更好地预测用户想要什么。然后提交给商家,购买合适的商品库存,引入正确的供应链,并基于用户数据设计出新产品。所有这些环节都被连接起来,这不仅仅会发生在消费领域,也适用于教育等其他领域。
这就是中国正在发生的事情。我之前就这个话题,在《经济学人》杂志发表了一篇文章,这将是一个现象级的改变。
当Amazon GO(Amazon推出的无人便利店)成为最先进科技的典型代表。中国的自动商店也在各个地方涌现。我设想:之后你再去中国时,几乎一半的购物会发生在半自动或全自动商店,这就是中国企业的办事效率。
三、产品
那么产品方面呢?中国人是否能研发出好的 AI 产品呢?
很多人可能仍然记得,中国曾一度山寨别人的东西。15年前的确如此。
这里的山寨,并不是指盗用知识产权,而是指模仿产品的外观、质感以及功能。但是通过这一过程这些创业者学会了,如何创造适合用户的产品,随后他们会成为了好的产品经理。很快他们进入下一个阶段,受到美国创新技术的启发,他们开发出具备独有特点的产品。
比如微博、淘宝等虽然不是原创,但却在大量市场反馈的基础上发展更快。
中国企业创造了在美国从未有过的创新,共享单车就是例子之一。
今日头条是定制化新闻。当我还在Google工作时,我们花了很多年来研究定制化新闻。但是今日头条比Google更早实现了这一功能。VIPKID是远程教学,将美国教师和渴望学习英语的中国学生连接在一起。摩拜单车是共享单车。还有蚂蚁金服,蚂蚁金服旗下有很多金融产品,包括帮助获得比银行更高的利率。
接下来"Copy to China" 变成了"Copy from China”。很多产品开始借鉴中国产品的特色和灵感。因此中国的产品,至少是移动端产品已经赶上了美国企业的水平。
所以当看到中国公司的估值已经达到美国水平时,这并不值得惊讶。中美互联网公司市值接近1:1。Google比百度的估值更高,但是美团比Yelp更高。因此中国公司的估值正逐渐和美国公司旗鼓相当。
中国的 AI 产品是否会超越美国产品?
第一个浪潮,利用互联网数据。
总体而言中国的互联网公司,将超越美国互联网公司。并不是每一个都超过了。原因在于当人们有手机并且可以付款,新的创新产品应运而生。因为每个人都可以支付,就会相应产生很多赚钱的办法。贷款就是例子之一。因此数据和优质 AI 产品的价值,将促进互联网公司发展。
第二个浪潮,商业数据。
这方面中国落后于美国。主要是因为许多传统的中国企业,从未考虑过创建数据仓库。有些创建了但是效果不佳。对于他们而言,将其转化为价值相当困难。然而ELEMENT AI 、IBM Watson Palantir等公司能够基于美国公司存储的数据,生产销售 AI 软件。中国企业还未把数据结构化,这需要一些时间。但是在政策的力推下,未来还是有机会赶超美国公司,但不是现在。
第三波浪潮,现实世界数字化。
中国会实现跨越式发展并赶超美国。比如共享单车的例子,传输了很多GPS信息数据。重点在于硬件和传感器,在中国这些成本更低。
天猫精灵是一款类似Amazon Echo的智能语音助手,目前中国售价为15美元。海康威视(HiKVision),在中国销售60亿个监控摄像头,收入达60亿美元,不难估算其销量。这些摄像头都能捕捉高清视频,可以用于物体识别、元数据采集、 AI 预测以及人脸识别,这些足以让中国赶超美国。
第四波浪潮,全自动化。
自动驾驶和机器人方面,这两项技术美国遥遥领先。具体指的是两年以内,两年时间并不短。但中国企业在政府的扶持下发展迅猛,加之硬件成本低,不妨拭目以待谁会成为最后的赢家。我猜双方胜算各占一半。
四、资金
那么资金方面是什么样的呢?
大量的资金流入了 AI 企业。备受关注的是,中国政府在大力加大引导基金(matching fund)的投入,去年达到了3.53亿美元。什么是引导基金(matching fund)? 是指政府成为创业投资基金的有限合伙人,并且愿意比其他有限合伙人获得更少的收入。由此来帮助顶级创业基金花更少的时间募资,把更多的精力放在企业发展上面。这受以色列和新加坡的实践的启发,这是一种行之有效的方法。
中国的二级市场,AI 企业的股票价格,都迎来了疯狂的飙升态势。比如科大讯飞专注于语音识别技术,在很多方面都能与美国公司Nuance匹敌。
看到两家公司在资本市场的差距,科大讯飞的市值约100亿美元,Naunce则以40亿美元甘拜下风。而几年前 Naunce的市值是科大讯飞的两倍。提供监控摄像头的HIKVision公司,目前资本为500亿美元。UBTECH是一家制造玩具机器人的公司,目前市值为50亿美元。诸如此类。
大量资本的流入不可避免地造成了一些泡沫,但也为企业提供了动力,也激励了更多的有志青年加入 AI 领域。
五、政策
中国AI领域最重要的政策是今年七月颁布的《新一代人工智能发展规划》。报告中明确提出,中国到2020年,AI 技术与世界先进水平同步。到2030年,成为世界主要 AI 创新中心。
在今年召开的十九大会议中,反复强调了要加快发展先进制造业,推动互联网、大数据、人工智能和实体经济深度融合。
中国政府有强大的执行力,2010年中国提出要做高铁行业的领导者。很多人对此持怀疑态度。6年后,中国拥有了全球60%的高铁。
2015年推行了"双创计划”(mass entrepreneurial and innovation movement)。即让每个人都能成为企业家,换句话说鼓励大众创新。仅半年时间,中国的加速孵化基地由1700个增加到目前的8000个,单是高科技园区就有156个。我们可以期待 AI 计划将很快变成现实。
一些二 三线城市的政府机构,正着手投资1到2亿美元鼓励创办 AI 企业。这将获得相应成效。
中国政府支持技术发展。当新技术出现时,政府一定会予以扶持。中国政策有助于项目快速启动、快速迭代。
中国的整体思路是,启动项目、大胆尝试,出现问题找到方案解决,随着数据越来越多会不断改进,这将推动中国技术的发展进步。最终成为 AI 强国。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
“最近复购率一直在下降,我们的营销力度不小啊,为什么用户还是走了?” “是不是广告投放的用户质量不高?还是我们的产品问题 ...
2025-02-21以下文章来源于数有道 ,作者数据星爷 SQL查询是数据分析工作的基础,也是CDA数据分析师一级的核心考点,人工智能时代,AI能为 ...
2025-02-19在当今这个数据驱动的时代,几乎每一个业务决策都离不开对数据的深入分析。而其中,指标波动归因分析更是至关重要的一环。无论是 ...
2025-02-18当数据开始说谎:那些年我们交过的学费 你有没有经历过这样的场景?熬了三个通宵做的数据分析报告,在会议上被老板一句"这数据靠 ...
2025-02-17数据分析作为一门跨学科领域,融合了统计学、编程、业务理解和可视化技术。无论是初学者还是有一定经验的从业者,系统化的学习路 ...
2025-02-17挖掘用户价值本质是让企业从‘赚今天的钱’升级为‘赚未来的钱’,同时让用户从‘被推销’变为‘被满足’。询问deepseek关于挖 ...
2025-02-17近来deepseek爆火,看看deepseek能否帮我们快速实现数据看板实时更新。 可以看出这对不知道怎么动手的小白来说是相当友好的, ...
2025-02-14一秒精通 Deepseek,不用找教程,不用买资料,更不用报一堆垃圾课程,所有这么去做的,都是舍近求远,因为你忽略了 deepseek 的 ...
2025-02-12自学 Python 的关键在于高效规划 + 实践驱动。以下是一份适合零基础快速入门的自学路径,结合资源推荐和实用技巧: 一、快速入 ...
2025-02-12“我们的利润率上升了,但销售额却没变,这是为什么?” “某个业务的市场份额在下滑,到底是什么原因?” “公司整体业绩 ...
2025-02-08活动介绍 为了助力大家在数据分析领域不断精进技能,我们特别举办本期打卡活动。在这里,你可以充分利用碎片化时间在线学习,让 ...
2025-02-071、闺女,醒醒,媒人把相亲的带来了。 我。。。。。。。 2、前年春节相亲相了40个, 去年春节相亲50个, 祖宗,今年你想相多少个 ...
2025-02-06在数据科学的广阔领域中,统计分析与数据挖掘占据了重要位置。尽管它们常常被视为有关联的领域,但两者在理论基础、目标、方法及 ...
2025-02-05在数据分析的世界里,“对比”是一种简单且有效的方法。这就像两个女孩子穿同一款式的衣服,效果不一样。 很多人都听过“货比三 ...
2025-02-05当我们只有非常少量的已标记数据,同时有大量未标记数据点时,可以使用半监督学习算法来处理。在sklearn中,基于图算法的半监督 ...
2025-02-05考虑一种棘手的情况:训练数据中大部分样本没有标签。此时,我们可以考虑使用半监督学习方法来处理。半监督学习能够利用这些额 ...
2025-02-04一、数学函数 1、取整 =INT(数字) 2、求余数 =MOD(除数,被除数) 3、四舍五入 =ROUND(数字,保留小数位数) 4、取绝对值 =AB ...
2025-02-03作者:CDA持证人 余治国 一般各平台出薪资报告,都会哀嚎遍野。举个例子,去年某招聘平台发布《中国女性职场现状调查报告》, ...
2025-02-02真正的数据分析大神是什么样的呢?有人认为他们能轻松驾驭各种分析工具,能够从海量数据中找到潜在关联,或者一眼识别报告中的数 ...
2025-02-01现今社会,“转行”似乎成无数职场人无法回避的话题。但行业就像座围城:外行人看光鲜,内行人看心酸。数据分析这个行业,近几年 ...
2025-01-31