百度大数据预测为何测不准_数据分析师培训
未来某一天,在你驱车前往公司的路上,导航系统通过预测交通流量,会自动帮你选择一条最合适的交通路线;根据以往精准的历史数据和参赛人员相关信息,互联网公司就能提前预知如欧冠、NBA等体育赛事下一场哪方夺冠;可穿戴设备和智能健康设备帮助网络收集人体健康数据,或许将提醒你身体罹患某种慢性病的风险……
但是,大数据预测也会遭遇“测不准”的失败。去年百度通过大数据预测电影《黄金时代》将热映,结果恰恰相反。
大数据在改变哪些行业?
今年清明小长假期间,想知道全国哪些景区最火热?各大5A景区舒适度如何?当游客在百度搜索“清明节旅游”等相关内容时,搜索结果页右侧则出现了全国景点拥挤度预测,在预测中,用红、橙、黄、绿等色块体现了不同景区的不同“热度”。
大数据也被逐渐应用于新闻领域。去年1月,央视“晚间新闻”推出《“据”说春运》《“据”说春节》等大数据新闻报道,成为国内最早系统、持续地通过大数据技术改进电视新闻播出形态的栏目,并尝试透过数据挖掘,讲述春运背后的故事。
其实远不只是这些行业,大数据在股市、健康、电影、餐饮等各个行业领域已无处不在。“普遍渗透到各行各业的现象,是当前大数据发展的重要表现,也是大数据从概念走向应用的明显标志。”清华大学新闻与传播学院教授沈阳表示。
央视综合频道新闻编辑部策划组副组长、“据说”系列大数据报道项目负责人郭俊义认为:“随着互联网技术迅速发展,各个行业领域的大数据价值正被逐渐挖掘出来。大数据广泛应用或许不一定给传统行业带来颠覆,但一定会带来巨大变化。如果传统行业不能适用‘互联网+’下的大数据技术,那么可能在竞争浪潮中就处于下风。”
以大数据对传媒领域的影响为例,郭俊义介绍,目前对电视节目的评价标准除收视率外,有些电视台还将网络影响力作为一个重要权重。因为电视节目在网络媒体传播、社交媒体评价等方面的效果反馈,很难通过人工方式收集,大多需要依靠大数据进行细致挖掘和分析。
此外,业界人士也指出,大数据已开辟了一个新闻报道的全新领域。“大数据让新闻表达方式更加数据化,图形、图表等的运用让新闻呈现形式更加可视化;同时新闻生产也更加实时化,依靠大数据挖掘手段,媒体从业人员能迅速准确地找到热门选题;此外,大数据还能帮助新闻产品完成在传播过程中的评估以及传播效果的反馈。”沈阳说。
客观看待大数据预测失准
有人说,就电影行业而言,大数据是市场拓展与经营的救命丹药——因为在对以往数据把握的基础上,大数据对电影票房的预测曾被业界认为“可圈可点”。不过,去年10月份电影《黄金时代》上映,大数据票房预测却遭遇了“马失前蹄”,这也让不少人纷纷质疑大数据预测的准确度。
大数据预测究竟靠不靠谱?重庆大学新闻学院院长董天策认为,大数据预测在不同领域的成熟程度不同,相比气象、经济、机器制造等领域,电影领域涉及的变量颇为复杂,预测过程中也带有较强的偶然性,出现预测偏差情况也属正常。
董天策进一步分析说,网络舆情很多时候和该领域的用户结构有莫大关联,因此,大数据网络用户结构和社会整体结构存在偏差,导致了现有数据积累不能代表整体社会心态。“和传统抽样调查相比,虽然大数据的数据量大、运作速度快,但很多时候存在‘变量遗漏’和‘样本偏差’等状况。即使将所有数据提取出来预测分析,其预测结果也不够准确。这个问题在各个领域都或多或少存在。”
除当前大数据总量普遍存在积累不足、数据收集不完整外,沈阳认为,现有数据中还存在很多“垃圾数据”“脏数据”等干扰信息,由于预测手段的局限,这些因素对预测结果造成了负面影响。
此外,沈阳还指出,在大数据预测过程中,各个行业中随时都可能出现社会突发事件以及人们心理变化等不可控变量,这些因素也会大大影响大数据预测的精准度。
大数据价值有待充分挖掘
作为“互联网+”的重要范畴,业界人士大多认同,大数据预测将是未来各行各业的重要趋势。不过,大数据预测在很多方面还有待进一步完善,大数据的潜在价值也有待进一步挖掘。因此,如何让大数据预测更加精准,更充分地服务社会生活,一直是业界思考的问题。
专家指出,各行业领域加强本身大数据积累的同时,还应该促进信息的开放和互联互通。“当前很多数据都是孤立存在,因为很多互联网公司的大数据都是其核心价值,由于涉及商业价值和商业秘密,要做到彼此间共享还有一定局限。”郭俊义说,“政府部门也应该加强交通、人口、经济等领域内的大数据公开,这样大数据积累才会越来越多。”
要加强互联网公司、各机构间的连接,打破“信息孤岛”状况。沈阳认为,应建立相关社会协调机构,设立比较好的数据连接标准,形成相关产业规范,不断鼓励数据研发创新;同时,逐渐形成科学的数据“清洗”方式,建立一套“垃圾数据”评估机制,确保每一部分数据来源的有效性。
如何减少数据预测过程中突发的变量干扰?“针对同一对象的预测,可通过不同来源的大数据预测结果交叉印证。”郭俊义表示,以对景区某一时间段人流量的测算为例,可通过游客WiFi热点、LBS手机定位、手机信号等多种方式进行数据收集分析,再将得到的多个预测结果相互印证,其准确度和可信度都会大幅提升。
而随着大数据积累以及测算手段的不断进步,对于如何在大数据安全和个人隐私保护方面持续跟进,郭俊义认为,“大数据安全和网络信息安全一脉相承,不仅需要健全法律规范,而且也需要相关行业的自律”。
数据分析咨询请扫描二维码
《Python数据分析极简入门》 第2节 8-1 Pandas 数据重塑 - 数据变形 数据重塑(Reshaping) 数据重塑,顾名思义就是给数据做各种变 ...
2024-11-26统计学基础 - 理解统计学的基本概念和方法是数据分析师必备的技能之一。统计学为他们提供了处理数据、进行推断和建模的基础。 数 ...
2024-11-25数据分析师在如今信息爆炸的时代扮演着至关重要的角色。他们不仅需要具备扎实的数据分析技能,还需要不断学习和适应不断发展的技 ...
2024-11-25数据分析师的工作职责涉及多个关键方面,从数据的获取到处理、分析再到可视化,旨在为企业的决策提供有力支持。让我们深入了解数 ...
2024-11-25数据分析师:洞察力量的引擎 数据分析师的兴起 数据分析师行业目前正处于快速发展阶段,市场需求持续增长,薪资水平也有所提升。 ...
2024-11-25数据收集与整理 - 从各种来源收集数据,清洗和整理以确保数据质量和可用性。 数据分析与建模 - 运用统计学方法和机器学习模型对 ...
2024-11-25数据分析是当今社会中不可或缺的一项技能,涵盖了广泛的工具和技术。其中,掌握各种数据处理函数对于数据分析师至关重要。本文将 ...
2024-11-25“大数据治理”是一个涵盖广泛的复杂概念,其核心在于确保大规模、多样化的数据资源能够被有效管理和利用。不仅涉及数据的采集、 ...
2024-11-25一、引言 背景介绍 随着信息技术的快速发展和互联网的普及,大数据已经成为现代社会的重要资产。大数据的兴起不仅推动了各行各业 ...
2024-11-25《Python数据分析极简入门》 第2节 7 Pandas分组聚合 分组聚合(group by)顾名思义就是分2步: 先分组:根据某列数据的值进行 ...
2024-11-25数据分析需要学习的内容非常广泛,涵盖了从理论知识到实际技能的多个方面。以下是数据分析所需学习的主要内容: 数学和统计学 ...
2024-11-24数据分析师需要具备一系列多方面的技能和能力,以应对复杂的数据分析任务和业务需求。以下是数据分析师所需的主要能力: 统计 ...
2024-11-24数据分析师需要学习的课程内容非常广泛,涵盖了从基础理论到实际应用的多个方面。以下是根据我搜索到的资料整理出的数据分析师需 ...
2024-11-24《Python数据分析极简入门》 第2节 6 Pandas合并连接 在pandas中,有多种方法可以合并和拼接数据。常见的方法包括append()、conc ...
2024-11-24《Python数据分析极简入门》 第2节 5 Pandas数学计算 importpandasaspdd=np.array([[81,&n ...
2024-11-23数据分析涉及多个方面的学习,包括理论知识和实践技能。以下是数据分析需要学习的主要方面: 基础知识: 数据分析的基本概念 ...
2024-11-22数据分析适合在多个单位工作,包括但不限于以下领域: 金融行业:金融行业对数据分析人才的需求非常大,数据分析师可以从事经 ...
2024-11-22数据分析是一种涉及从大量数据中提取有用信息和洞察力的过程。其工作内容主要包括以下几个方面: 数据收集与整理:数据分析师 ...
2024-11-22数据分析师需要掌握多种技能,以确保能够有效地处理和分析数据,并为业务决策提供支持。以下是数据分析师需要掌握的主要技能: ...
2024-11-22数据开发和数据分析是两个密切相关但又有所区别的领域。以下是它们的主要区别: 定义和目标: 数据开发:数据开发涉及数据的 ...
2024-11-22