大数据与人工智能,未来计算决定着智能水平的发展
由中国计算机学会(CCF)主办,CCF大数据专家委员会承办,中科院计算所与CSDN共同协办,以推进大数据科研、应用与产业发展为主旨的2014中国大数据技术大会(Big Data Technology Conference 2014,BDTC 2014)暨第二届CCF大数据学术会议在北京新云南皇冠假日酒店盛大开幕。下面是百度研究院副院长,深度学习实验室主任,图片搜索部高级总监余凯发表的演讲“大数据人工智能”。
百度研究院副院长,深度学习实验室主任,图片搜索部高级总监 余凯
以下为演讲实录:
下面,我可能更多从实践的方面去跟大家分享一下百度在大数据、人工智能我们最近的一些工作,包括我们对这些方面的一些思考。
2014年8月14日,麻省理工学院科技评论杂志介绍百度的人工智能之梦,文章题目叫《一个中国互联网的巨人开始有梦想》,主要内容是介绍百度在最近两年在人工智能和大数据这些领域的的投入,包括在人才方面的一些举措。
互联网公司:“得人心者得天下”
互联网典型特征就是大数据,大数据公司也是人工智能公司,以搜索引擎为例,搜索引擎一边给用户提供免费服务,这个服务背后还有一个非常精致的商业模型。用户免费使用服务的同时,贡献数据给平台。另外一边,我们拿这个数据做商业化的变现,实现数据的价值。从数据到价值中间需要技术,需要基于大数据的人工智能。比如说大规模的机器学习,移动互联网中的语音识别、图像识别,还有用户建模等,这些技术能帮助你精准读懂用户心里想什么。以前我们说“得人心者得天下”,而在大数据时代的今天,对于互联网公司,只要读懂人心,就一览无余。
从学术层面到高科技公司,再到政府层面都对人工智能越来越关注,人工智能机器人可能是下一个产业革命的爆发点,比如像自动驾驶,自动问答,虚拟现实等都跟人工智能有关,将来是科技创新的主战场。
学习的能力是智能的本质
那么什么是人工智能?应该包括哪几个方面,比如我们看到的机器人,首先他有眼睛,有感觉,能感知环境是怎么样,完成它任务怎么样做,通过感知把数据记录下来以后,要做思考,想想怎么做,后面你就可以行动。所以,感知、思考和控制是人工智能几个重要的方面。
我们看到很多科技公司推出各种各样的产品,比如说我们看到有智能手机、智能水杯、智能手环等等,还有百度推出的智能快搜,谷歌在做的智能汤勺,但是真正想一想这些产品是不是真的具有智能呢?我们把这些产品和60、70年代的老式收音机放在一边,他们的不同在什么地方?思考这些问题能帮我们想清楚未来方向,也可以区别现在的这些产品它到底是不是真的智能。真正的智能系统应该能随着经验演化越变越聪明,学习的能力,是智能的本质!
经验就是数据
那么什么叫经验?经验就是数据,所以我们到今天看到一个振奋人心的时代来临,这也是我们济济一堂来到这个会议的原因,这个时代是什么?就是大数据时代。
从万物互联到万物智能
今天在座每一位可能都跟我一样,身上带了至少两三个移动设备,平均每个人连到两到三个设备。半个多月前,在乌镇孙正义有一个更加疯狂的预测,预测2020平均每个人要连接到一千个设备,一千个设备包括你随身带的设备,你的wifi,甚至是监控摄像头。在移动互联网时代,我们看到的未来是万物互联,人跟环境,人跟物,物跟物之间都会发生连接。这种连接同时也意味着数据爆增,到达前所未有的广度和数量,大数据的时代使我们从万物互联到万物智能。
深度学习与大数据
很多拥有大数据的互联网公司,包括谷歌、脸谱和百度,都在成立研究机构,这个机构机构最主要的研究方向就是大规模的深度学习,聚焦点就是大数据驱动的人工智能。在百度内部,一个横跨各个产品线大项目获得了今年的百度最高奖,这个项目就是百度大脑。拥有上千台PC服务器,和将近1000台GPU服务器,构建了世界上规模最大的深度神经网络,百亿级的参数。我们基于这些基础设施,去研发世界上最先进的深度学习算法,包括语音识别、图像识别、自然原理理解、广告竞争匹配、广告建模等等。
深度学习其实它不是一个新事情,在30年前80年代末的时候,深度学习就已经是得到了广泛关注,而到了大数据时代的今天,它获得了更多的成功和影响力。为什么呢?
第一方面,深度学习模拟了大脑的行为。一开始做深度学习这帮人,他们的想法受到卷积神经系统网络的影响,在80年代受到了神经科学家对于视觉神经系统理解的影响;
第二,从统计和计算的角度来看,深度学习特别适合大数据;
第三,深度学习是End-to-end学习;
第四,深度学习提供一套建模语言。
大数据时代传统深度学习的误区
我具体给大家讲讲第二点,深度学习特别适合大数据下。在统计上面分析机器学习系统效果时,一个最根本的角度叫推广误差,推广误差可以帮助我们找到误差来源,从而设计出更好的算法。一个经典的分解方法,把推广误差分解成两部分:
从Optimization error的角度来说,通常是学术界的观点是,开发研究非常精致的优化算法,但是这些算法存在一个大问题:不能覆盖大数据。比如,SVM的复杂度是在数据二次方到三次方之间的复杂度,今天处理一万个训练样本没问题,但是如果变成十万个训练样本,你需要一百倍到一千倍的计算资源,这是灾难性的问题,所以在大数据的时代,工业界反而要倡导的是desgin “an OK algorithm”。
深入百度大脑
我给大家举一些百度大脑的例子:
深度学习已经取得了关键性进展,首先在广告系统,这可能是世界上首次把深度学习成功应用于广告变现,并带来收入提升,在用了深度学习之后,我们跟竞争对手的差距是拉开了两倍还多。
在物体检测模型上我们取得了世界上最好的成绩,百度第一,谷歌第二。
未来的展望
人类大脑的平均重量是1.5公斤,占2%的身体体重,消耗20%的能量。最近的一个报道显示,谷歌的服务器消耗美国用电量的百分之几,美国的所有互联网公司占美国耗电量的9%。在中国,三大互联网公司也占中国耗电量百分之几,智能计算是非常耗能量的。而人类大脑有一千亿个神经原有5000个的连接,每个连接触发每秒钟两次,做一个简单计算,人类大脑计算能力是10的17次方。在过去人工智能发展过程中,计算能力是非常强大的东西,我们今天的计算能力跟20年、30年前更是不可同日而语的,能构造更好的计算方法。
未来计算决定着智能水平的发展,人工智能这个奇点临近连接了,
数据分析咨询请扫描二维码
《Python数据分析极简入门》 第2节 7 Pandas分组聚合 分组聚合(group by)顾名思义就是分2步: 先分组:根据某列数据的值进行 ...
2024-11-25数据分析需要学习的内容非常广泛,涵盖了从理论知识到实际技能的多个方面。以下是数据分析所需学习的主要内容: 数学和统计学 ...
2024-11-24数据分析师需要具备一系列多方面的技能和能力,以应对复杂的数据分析任务和业务需求。以下是数据分析师所需的主要能力: 统计 ...
2024-11-24数据分析师需要学习的课程内容非常广泛,涵盖了从基础理论到实际应用的多个方面。以下是根据我搜索到的资料整理出的数据分析师需 ...
2024-11-24《Python数据分析极简入门》 第2节 6 Pandas合并连接 在pandas中,有多种方法可以合并和拼接数据。常见的方法包括append()、conc ...
2024-11-24《Python数据分析极简入门》 第2节 5 Pandas数学计算 importpandasaspdd=np.array([[81,&n ...
2024-11-23数据分析涉及多个方面的学习,包括理论知识和实践技能。以下是数据分析需要学习的主要方面: 基础知识: 数据分析的基本概念 ...
2024-11-22数据分析适合在多个单位工作,包括但不限于以下领域: 金融行业:金融行业对数据分析人才的需求非常大,数据分析师可以从事经 ...
2024-11-22数据分析是一种涉及从大量数据中提取有用信息和洞察力的过程。其工作内容主要包括以下几个方面: 数据收集与整理:数据分析师 ...
2024-11-22数据分析师需要掌握多种技能,以确保能够有效地处理和分析数据,并为业务决策提供支持。以下是数据分析师需要掌握的主要技能: ...
2024-11-22数据开发和数据分析是两个密切相关但又有所区别的领域。以下是它们的主要区别: 定义和目标: 数据开发:数据开发涉及数据的 ...
2024-11-22数据架构师是负责设计和管理企业数据架构的关键角色,其职责涵盖了多个方面,包括数据治理、数据模型设计、数据仓库构建、数据安 ...
2024-11-22数据分析师需要具备一系列技能,以确保能够有效地处理、分析和解释数据,从而支持决策制定。以下是数据分析师所需的关键技能: ...
2024-11-22数据分析师需要具备一系列技能,以确保能够有效地处理、分析和解释数据,从而支持决策制定。以下是数据分析师所需的关键技能: ...
2024-11-22数据分析师需要具备一系列的技能和能力,以确保能够有效地处理、分析和解释数据,从而支持业务决策。以下是数据分析师所需的主要 ...
2024-11-22需求持续增长 - 未来数据分析师需求将持续上升,企业对数据驱动决策的依赖加深。 - 预测到2025年,中国将需要高达220万的数据人 ...
2024-11-22《Python数据分析极简入门》 第2节 4 Pandas条件查询 在pandas中,可以使用条件筛选来选择满足特定条件的数据 importpanda ...
2024-11-22数据分析师的工作内容涉及多个方面,主要包括数据的收集、整理、分析和可视化,以支持商业决策和问题解决。以下是数据分析师的一 ...
2024-11-21数据分析师必须掌握的技能可以从多个方面进行归纳和总结。以下是数据分析师需要具备的主要技能: 统计学基础:数据分析师需要 ...
2024-11-21数据分析入门的难易程度因人而异,总体来看,入门并不算特别困难,但需要一定的学习和实践积累。 入门难度:数据分析入门相对 ...
2024-11-21