百度高级副总裁王劲: 一朵花的大数据之旅_数据分析师
百度正在传统的搜索技术之外,利用“大数据+云计算”打造另一个驱动公司发展的新引擎——百度高级副总裁王劲接受21世纪经济报道记者采访时如是说。
百度大脑是“云计算+大数据”的载体:其由硬件和软件两部分组成,硬件部分是由云计算中心和服务器组成,软件部分是由大数据和人工智能算法组成。无论百度推荐引擎、BaiduEye,还是百度面对商家的直达号,均依赖百度大脑作为技术基础,是一切前端应用的backoffice。
王劲认为,百度的核心竞争力在于人工智能和大数据的结合。可能的场景是:用手机拍一朵花的照片,上传给百度,百度大脑把它转化成“0101”的数字流,然后输入到深度神经网络里,经过层层的分析、复杂的学习算法和大数据比对,最后还原并识别出它是一朵花,并告诉用户这朵花的名字,随后在百度百科里找到花的属性。
如何获得大数据?在百度看来,与第三方伙伴合作是较快获取大规模数据的方式之一。此前百度曾和中科院花卉研究所对接,获得花卉种类等近二十万条的数据。在电商领域,国内京东、当当、蘑菇街等电商平台伙伴向百度提供消费数据,同时获得百度入口的流量。当然,目前百度尚没有阿里巴巴系统的数据。
《大数据时代》作者舍恩伯格的判断是,目前正处在大数据时代的早期。对于百度来说,其通过搜索引擎积累了大量的数据“金矿”,人工智能则给予百度“挖矿”的能力。
百度做大数据,更是通过搜索引擎在为人工智能铺路。但并非所有的数据金矿都在百度手中,微信、微博等社交数据是一个例子,阿里巴巴手中的电商数据是另一个例子。
“百度在革自己的命”
《21世纪》:百度大脑研究现在进展如何?目前人工智能的研究方面在国际上处于什么位置?
王劲:人工智能一直到2010年都没有什么突破,当它的准确率不高的时候,它就无法应用。一直到这两年有了深度学习的新算法,这个新算法才被用到人工智能上,突破了以前很多瓶颈。在这个方面,百度是做得最早的,百度在全球都是在这方面进行投入的最早公司之一,我们跟国际最领先的公司在同一个起跑线上。
《21世纪》:人工智能从70年代、80年代末初就开始做了,为什么一直就没做起来?
王劲:在那个时候确实面临技术的瓶颈。人工智能在我读书的时候是规则制定阶段,人工智能要制定很多规则。深度学习以及机器学习的好处是,只要把模型建起来以后,就可让计算机自主学习、拼命去迭代。
百度现在拥有10亿规模的连接,人最多只能用几百个参数,我们没办法做人工的判断。百度就把大数据,把规则制定好,数学模型和算法做好,得出结果,人不需要知道为什么是这个结果。人工智能好就好在不需要程序员是每行每业的专家。这是为什么人工智能在这两年有一个飞速的发展。
另一个原因则是语音识别技术的飞速发展,过去两年,语音识别率从70%提高到了95%。今天两个自然人在讲话,其识别准确率差不多是98%。去年百度才刚刚到90%,现在就可以达到95%以上,接近自然人对话。
《21世纪》:推荐引擎的功能,现在的搜索引擎是不是也能做到?
王劲:搜索引擎也可以看成是一种推荐引擎,过去的搜索引擎给用户提供很多的结果。那时候搜索引擎都认为,搜得的结果越多越好。推荐引擎跟它做的正相反,最好只给用户一个最相关的结果。推荐引擎需要在人工智能再上一个台阶以后才可以做到。只有对用户有了更多了解,如时间、地点、人物的更多数据,才可以真正实现个性化推荐,成为真正的推荐引擎。
你可以看到这是新一代的技术,也可以看到百度是在革自己的命。
越开放会越强
《21世纪》:百度如何和线下的商场合作?也就是说,百度的大数据怎样考虑应用场景?
王劲:拿银泰和百度的合作来说,戴上Baidu Eye到银泰的人,年龄、性别、在哪一些货架停留的时间最长,商品有多少人买了,有多少人不买,这些银泰需要的数据,百度就可以帮它拿到并做出分析。
百度投资了一家室内定位的公司。通过室内定位,知道消费者在这个商场里面的走动轨迹,上述数据也都能够用百度大脑算出来。银泰可以通过数据进行商业决策,比如说,该怎么安排消费者在商场的路线,怎么导航能够让这个商场最优化,再把到商场里面的购买行为全部打通,未来购物体验会非常不一样。
大数据、百度大脑、推荐引擎是环环相扣的,最根本的是你要有基础架构,软硬件能力都要很强,数据要足够多,还有关键的是人才。大数据+百度大脑+推荐引擎,这三件要素加起来,百度就能够和传统产业合在一起,打开一个局面。
《21世纪》:很多公司对人工智能前景的描绘都非常好,以后它服务于企业还要克服哪些困难?
王劲:例如数据安全和用户隐私,这些是我们跟传统企业要一起来努力的。百度希望把技术和平台都开放出来,各行各业可以把他们的服务跟百度对接,形成共赢。
百度大数据可以变得越来越大,人工智能和大数据引擎是越用越好用。计算机里叫深度学习,通过数据把它训练得越来越准。我们希望越来越多的人能用人工智能,这是我们这些大数据引擎开放出来的一个重要的原因。另外,越开放它也会越强。
《21世纪》:百度将如何跟政府机构进行合作?
王劲:百度有很多的机会跟政府机构合作,包括和全球的机构。在公益事业上,如医疗,百度能够政府降低疾病的发生率,减少污染,找到污染源,对流行病,以及其他各样疾病的防控等等。再有中小企业景气指数预测,找出它的规律来,这可以帮助我们政府调整政策。
百度刚刚与联合国在一些绿色产业方面进行了大数据方面的合作。
人工智能刚刚起步
《21世纪》:你怎么看待百度在PC时代的数据优势,以及在移动互联时代面临的挑战?
王劲:我们认为移动互联网是一个机会。有一个证据,百度今天在移动端获得的收益超过30%,在中国互联网企业当中这是相当高的。我们有非常多的数据,这些数据加起来我们能够做精准的推荐,这种推荐就是不搜即得。这方面,百度的技术有优势。
移动互联网在生产非常大量的数据,百度数据处理能力和人工智能能力很强,这对我们又是一个很好的机会,这个时代才刚刚开始,这对大家来说既是挑战,也是机会。
百度依托在人工智能、大数据技术上的优势,打造核心竞争力,即人工智能与大数据的结合。
《21世纪》:目前来看,深度学习技术如何改善百度的用户体验和客户的投资回报率?
王劲:百度今天的盈利建立在推广技术上,绝大部分的收入也是从这上面来的。它有一个指标是点击率,如何做到推广的东西人们更需要,推荐的东西更靠谱,非常大比例的是由我们百度大脑实现的。
《21世纪》:人工智能最大的发展障碍是安全和隐私?
王劲:这不一定是最大的障碍,技术能力也需要不断提升。百度有一个通用的技术平台,还需要跟每一个传统行业学习。比如说我们跟海底捞合作,他是行业专家,我们给他一个数据,这个数据对他来说很有价值,而我只知道这是数据。
今天很多东西刚刚开始,它像滚雪球一样越滚越大,越早跟百度合作会越好,百度如果把这个技术越早完善,快速迭代,这其实也是一个机会。
人工智能还在刚刚起步的阶段,但是它有一个美好的未来。
数据分析咨询请扫描二维码
《Python数据分析极简入门》 第2节 4 Pandas条件查询 在pandas中,可以使用条件筛选来选择满足特定条件的数据 importpanda ...
2024-11-22数据分析师的工作内容涉及多个方面,主要包括数据的收集、整理、分析和可视化,以支持商业决策和问题解决。以下是数据分析师的一 ...
2024-11-21数据分析师必须掌握的技能可以从多个方面进行归纳和总结。以下是数据分析师需要具备的主要技能: 统计学基础:数据分析师需要 ...
2024-11-21数据分析入门的难易程度因人而异,总体来看,入门并不算特别困难,但需要一定的学习和实践积累。 入门难度:数据分析入门相对 ...
2024-11-21数据分析是一项通过收集、整理和解释数据来发现有用信息的过程,它在现代社会中具有广泛的应用和重要性。数据分析能够帮助人们更 ...
2024-11-21数据分析行业正在迅速发展,随着技术的不断进步和数据量的爆炸式增长,企业对数据分析人才的需求也与日俱增。本文将探讨数据分析 ...
2024-11-21数据分析的常用方法包括多种技术,每种方法都有其特定的应用场景和优势。以下是几种常见的数据分析方法: 对比分析法:通过比 ...
2024-11-21企业数字化转型是指企业利用数字技术对其业务进行改造和升级,以实现提高效率、降低成本、创新业务模式等目标的过程。这一过程不 ...
2024-11-21数据分析作为一个备受追捧的职业领域,吸引着越来越多的女性加入其中。对于女生而言,在选择成为一名数据分析师时,行业选择至关 ...
2024-11-21大数据技术专业主要学习计算机科学、数学、统计学和信息技术等领域的基础理论和技能,旨在培养具备大数据处理、分析和应用能力的 ...
2024-11-21《Python数据分析极简入门》 第2节 3 Pandas数据查看 这里我们创建一个DataFrame命名为df: importnumpyasnpi ...
2024-11-21越老越吃香的行业主要集中在需要长时间经验积累和专业知识的领域。这些行业通常知识更新换代较慢,因此随着年龄的增长,从业者能 ...
2024-11-20数据导入 使用pandas库的read_csv()函数读取CSV文件或使用read_excel()函数读取Excel文件。 支持处理不同格式数据,可指定分隔 ...
2024-11-20大数据与会计专业是一门结合了大数据分析技术和会计财务理论知识的新型复合型学科,旨在培养能够适应现代会计业务新特征的高层次 ...
2024-11-20要成为一名数据分析师,需要掌握一系列硬技能和软技能。以下是成为数据分析师所需的关键技能: 统计学基础 理解基本的统计概念 ...
2024-11-20是的,Python可以用于数据分析。Python在数据分析领域非常流行,因为它拥有丰富的库和工具,能够高效地处理从数据清洗到可视化的 ...
2024-11-20在这个数据驱动的时代,数据分析师的角色变得愈发不可或缺。他们承担着帮助企业从数据中提取有价值信息的责任,而这些信息可以大 ...
2024-11-20数据分析作为现代信息时代的支柱之一,已经成为各行业不可或缺的工具。无论是在商业、科研还是日常决策中,数据分析都扮演着至关 ...
2024-11-20数字化转型已成为当今商业世界的热点话题。它不仅代表着技术的提升,还涉及企业业务流程、组织结构和文化的深层次变革。理解数字 ...
2024-11-20在现代社会的快速变迁中,选择一个具有长期增长潜力的行业显得至关重要。了解未来发展前景好的行业不仅能帮助我们进行职业选择, ...
2024-11-20