百度专家解说:大数据到底有何用?
在硬件不挣钱服务挣钱的思想影响下,企业尤其是创业企业越来越重视大数据,企图最后利用大数据挣钱,然而,大数据是一个高高在上的存在,大多企业所做的,仅仅只是收集数据而以,至于后续怎么运用?其实至今还没有一个明确的可复制模式。近日,齐家网在北京组织了一场互联网泛家装论坛,百度资深数据专家吴海山分享了百度LBS大数据的运用,或许能够对大家有所启发。
以下内容根据吴海山演讲有所更改,未改变原意。
百度研究院分为大数据实验室、深度学习实验室和美国硅谷的人工智能实验室。大数据实验室,主要利用百度各个行业的数据分析用户的画像,为用户提供解决方案。
百度作为国内最大的搜索引擎公司,旗下产品众多,为其提供了大量数据:
1、每天的移动地图搜索请求上亿
2、百度移动互联网的搜索比重越来越高,如今每天有近30亿次移动互联网搜索
3、依靠百度地图等相关应用,百度每天可获得接近6亿用户超过250亿次的定位需求
4、累计有定位轨迹的用户,安卓16亿,IOS1.2亿
据称借助GPS、基站、Wi-Fi和传感器信息,百度地图的整体定位精度为50m,其中GPS定位精度达10m,WIFI与基站定位的精度为27m。
以上为2015年除夕,不加任何地图元素,仅仅依靠百度地图的定位数据所展现的上海外滩结果,路的形状完全被数据刻划出来,这也从另一方面体现了百度定位数据的巨大。
大数据的重要作用就是,根据这些数据结合网络上的搜索数据,可以对用户做非常详细的画像:
比如说在家装领域,根据这些数据,可以知道用户最近有没有装修的需求。同时还可以发现其中一些有意思的特征:男性居多,可能有比较强的购买力,女性仅占24%。而30到39岁人群是家装需求的主要人群,他们的购买能力最强,其次是29岁以下的结婚人群等。
这些用户直接关注哪些信息呢?对百度的搜索词进行文本分析,用机器学习和数据挖掘的方法可以发现大部分人很关心装修效果,这是现在很多年轻人比较关心的点,接下来是客厅、户型、背景、面积大小。
大数据可以了解每个人不同的需求,下图是五一当天北京游客的分布,一类是安卓手机用户,还有一类是苹果手机游客,这些游客的分布,呈现了非常有意思的差异。其中苹果手机用户主要的游玩地点是王府井等地,而安卓手机用户则是天安门等。同样的,外地人与本地人的差异也有造成了同样的规律,外地人主要游玩天安门等名胜。
因此,通过了解用户的居住地以及使用手机型号等大数据信息,是可以在一定程度上预测用户需求的,甚至还可以预测用户的行为轨迹。比如下图中蓝色的线代表用户线下的行为,根据这些用机器学习的方法建模,可以预测用户下一步做什么,即红线。
大数据选址
现在包括齐家网在内的众多企业都在做线下O2O的体验店,应该放在什么位置,在什么地方开体验店能更吸引潜在客户?
这个图反映的是用户去星巴克与海底捞的差异。星巴克用户周一到周五去的频率比较高,去海底捞周末频率比较高。包括大家在每一天的时间,对于像星巴克,大家下午三四点去的概率最高,去海底捞大家下午六点到九点去的频率比较高。对于地点的需求也不一样,用户宁可走远一点去选一个更合适的海底捞,而对于星巴克,他们更愿意选择近的地方。
为此,根据用户定位搜索,其实也可以为商家做选址的方案。
现在若想选一个新的位置,应该选在什么地方呢?首先看一下最近有需求的用户分布在什么地方,上图中黑色代表现有线下的体验店,把现有的线下体验店,比如说每一个体验店能够满足周边一两公里用户的需求,我把满足需求去掉,之后可以发现还有哪些地方人有很强的需求,但是他在周边找不到体验店,在这个地方开体验店成功的概率是比较高的。
另外一个应用,百度数据还可以反应空间上经济形态的分布。来看全国iPhone6的分布,通过做了分析,可以看见省级的GDP和省iPhone6的分布是高度相关的,比较不相关的地方是北京、上海、深圳,我们发现这几个地方用户的行为更加复杂,用户的消费和其他地方的差异可能更大一些。 这对企业拓展市场有一定的指导意义。
我们还可以用百度迁徙数据来看中国城市的发展,比如说可以看到周边城市群的发展。
通过百度数据也可以看中国住宅区的空置率到底是什么样的,中国有很多城市叫所谓的鬼城。但到底哪些区域的楼盘空置率比较高,哪些地方的楼盘空置率没有那么高。
通过定位数据分析用户的工作地、居住地,再分析用户居住楼盘的信息,根据网上的数据和百度结果看这个楼盘,知道这个楼盘的容积率、建筑时间,根据这样一个结果可以检测出来全国范围内地产行业的住宅空置率。
我们发现像三亚、威海,这些地方不应该是鬼城,他们在节假日的时候人口峰值涨的很高,但这是典型的季节性的旅游城市,它和美国的迈阿密和新泽西是一样的。这些城市的房地产行业并没有想象的那么严重。
另外,之前被媒体报道比较多的河南郑州新区。根据数据我们发现,这个地方的经济现在已经好转很多了,越来越多的年轻人搬到郑州新区去住,这个已经是复苏非常好的城市,这个地方的地产行业已经比较景气。
地产行业的发展,更重要的指标是应该是净增人口的变化。如果这个城市的楼盘比较多,但是人口还是在下降,那这便是比较危险的信号。如果说这个城市虽然有一定的存量楼盘,但是这个城市整体人口是上升的,我们认为这个城市在地产、家装家居方面还有很大的空间。
另外,通过百度数据来做智慧城市的管理也是比较可行的。
上图是通过百度大数据做的研究,基于上海外滩的踩踏事件,事后根据百度的数据做的研究,可以发现百度地图数据可以很好的预测将来人口流动的趋势。根据这样的结果可以提供一些方案,帮助政府能够做人群的实时监控和预警方案。人群流量数据与地点搜索数据高度相关,其背后的因果关系在于:人们先搜索地点,进行规划,然后到达。
数据分析咨询请扫描二维码
数字化转型是企业提升竞争力和实现可持续发展的关键路径。面对快速变化的市场环境,以及技术的飞速发展,企业在数字化转型过程中 ...
2024-11-15CDA数据分析师认证:CDA认证分为三个等级:Level Ⅰ、Level Ⅱ和Level Ⅲ,每个等级的报考条件如下: Le ...
2024-11-14自学数据分析可能是一条充满挑战却又令人兴奋的道路。随着数据在现代社会中的重要性日益增长,掌握数据分析技能不仅能提升你的就 ...
2024-11-14数据分析相关职业选择 数据分析领域正在蓬勃发展,为各种专业背景的人才提供了丰富的职业机会。从初学者到有经验的专家,每个人 ...
2024-11-14数据挖掘与分析在金融行业的使用 在当今快速发展的金融行业中,数据挖掘与分析的应用愈发重要,成为驱动行业变革和提升竞争力的 ...
2024-11-14学习数据挖掘需要掌握哪些技能 数据挖掘是一个不断发展的领域,它结合了统计学、计算机科学和领域专业知识,旨在从数据中提取有 ...
2024-11-14统计学作为一门基于数据的学科,其广泛的应用领域和多样的职业选择,使得毕业生拥有丰厚的就业前景。无论是在政府还是企业,统计 ...
2024-11-14在当今高速发展的技术环境下,企业正在面临前所未有的机遇和挑战。数字化转型已成为企业保持竞争力和应对市场变化的必由之路。要 ...
2024-11-13爬虫技术在数据分析中扮演着至关重要的角色,其主要作用体现在以下几个方面: 数据收集:爬虫能够自动化地从互联网上抓取大量数 ...
2024-11-13在数据分析中,数据可视化是一种将复杂数据转化为图表、图形或其他可视形式的技术,旨在通过直观的方式帮助人们理解数据的含义与 ...
2024-11-13在现代银行业中,数字化用户行为分析已成为优化产品和服务、提升客户体验和提高业务效率的重要工具。通过全面的数据采集、深入的 ...
2024-11-13在这个数据飞速增长的时代,企业若想在竞争中占据优势,必须充分利用数据分析优化其营销策略。数据不仅有助于理解市场趋势,还可 ...
2024-11-13数据分析行业的就业趋势显示出多个积极的发展方向。随着大数据和人工智能技术的不断进步,数据分析在各行各业中的应用变得越来越 ...
2024-11-13市场数据分析是一门涉及多种技能和工具的学科,对企业在竞争激烈的市场中保持竞争力至关重要。通过数据分析,企业不仅可以了解当 ...
2024-11-13数据分析与数据挖掘是数据科学领域中两个关键的组成部分,它们各有独特的目标、方法和应用场景。尽管它们经常在实际应用中结合使 ...
2024-11-13在如今这个数据驱动的时代,数据分析能力已经成为许多行业的重要技能。无论是为工作需要,还是为了职业转型,掌握数据分析都能够 ...
2024-11-13在如今这个数据驱动的时代,数据分析能力已经成为许多行业的重要技能。无论是为工作需要,还是为了职业转型,掌握数据分析都能够 ...
2024-11-13作为一名业务分析师,你肩负着将业务需求转化为技术解决方案的重任。面试这一角色时,涉及的问题多种多样,涵盖技术技能、分析能 ...
2024-11-13自学数据分析可能看似一项艰巨的任务,尤其在开始时。但是,通过一些策略和方法,你可以系统地学习和掌握数据分析的相关知识和技 ...
2024-11-10Excel是数据分析领域中的一款强大工具,它凭借其灵活的功能和易用的界面,成为了许多数据分析师和从业者的首选。无论是简单的数 ...
2024-11-10