大数据:一个未知的“方程式”_数据分析师
互联网时代,各种热词、概念满天飞。说到大数据,许多人搞不太懂,甚至有人直斥“大数据=大忽悠”。大数据到底是什么,产业现状和创业机会怎样?
去年底宣布的一个事情,将对未来有深远影响,现在大家还没意识到。2013年11月19日,国家统计局与11家国内企业签署战略合作框架协议,合作内容涉及大数据应用统计标准,以及企业数据补充政府统计数据等领域。有分析称,在大数据国家战略日益强烈的情况下,统计局介入将进一步推动大数据的应用落地。
大数据绝对不是忽悠,它是当下IT领域最时髦的词,简单说就是从各种数据中快速获取价值信息的能力。美国是最早发现和使用大数据科学价值的国家。2012年3月,奥巴马政府宣布投资2亿美元拉动大数据相关产业发展,将“大数据战略”上升为国家战略,奥巴马政府甚至将大数据定义为“未来的新石油”。当时美国政府声明说通过提高美国从大型复杂的数据集中提取知识和管理的能力,来加强整个国家的竞争力,这被认为是跟互联网同一个级别的时代。显然,大数据不止是一个词汇,更是一门技术,是一个产业时代。
而中国作为世界上人口最多、GDP排名第二的国家,成立大数据国家队是非常及时的。大数据的精髓在于“大”,它不是抽样而是全样,它不是盲人摸到的象腿或者是象鼻子,而是整个大象本身,大数据的精妙处在于用的人越多越增持,通过这样一个模糊的宏观判断,能够完成一个精准的个体推荐,从而会让整个生产效率得到极大提高。
不开放大数据,周边创业是无米之炊目前我国大数据应用还存在一些问题。首先,大数据不是IT公司的专利。第一批国家统计局引入的战略合作伙伴,大多数还是聚焦在IT公司,其实不是只有IT公司才有大数据,如线下零售巨头企业在实体经济中积累了很大的数据资源,他们数据的深度和广度不亚于甚至超过互联网公司。第一批进入的合作伙伴之一上海钢联其实掌握了煤炭钢铁在内的大宗商品数据,这是国家统计局没有涉及到的。因此,非IT类公司、拥有巨大的业务形态的企业,都可以成为第二批国家统计局大数据合作伙伴。我们也看到,国家统计局作为国家法定职能部门把姿态放平,主动寻求和民营企业的合作,这是非常可喜的进步。
第二,拥有大数据的IT公司和非IT公司应该打破数据格局。我们看BAT(百度、阿里、腾讯),近期围绕微信和淘宝发生新一轮互相屏蔽,在早前百度和淘宝进行了屏蔽,这三家掌握搜索、消费和社交的数据,本来是三方的数据汇总才能拼凑出比较完整的网上信息图谱,但是三家公司为了彼此的商业利益,并没有体现出数据合作的意愿,而是互相封杀,这将给社会数据的流动带来伤害。因此,在保证一定商业利益的基础上,巨头的眼光应该放远一点,打破数据割据。这看起来是一个很难实现的乌托邦。不过任何美好的事情都需要乌托邦的愿景作为起步的。我们看到许多美好的事情,比如说互联网,全世界的人通过互联网联结在一起,开始大家觉得乌托邦,现在已经形成现实。
第三,应该呼吁政府相关部门进一步开放市场。因为围绕大数据不管是应用还是创业,最核心的是要有数据的源头,然后才能进行采集、编辑,重新编制。据报道,现在大量的关于国民经济或者说民生的数据其实还在封闭状态,在工商部门、银行、保险、公安、医院、社保,包括电信运营商机构的手里。如何让这些数据流动起来,能让大家更方便,其实应该由政府带头实现等级制数据的开放共享。在不违反保密或者是国防的情况下,如果不开放大数据,那么相关研究和创业都是无米之炊。所以还是应该抓住这个机遇,进一步开放市场,不断试点,一步一步把数据开放转起来,带来更多的应用价值。
隐私保护与数据精准之间的平衡数据应该共融共通,还要开放市场。这个开放市场不仅仅是企业之间开放,企业对个人也要开放。为什么现在开放变得这么谨慎?因为开放有风险,一是安全问题,二是伦理问题。已经有专家指出,安全问题是对于国防、军事以及整个经济信息的保密顾虑而言;伦理问题是从个体角度而言,即网民的隐私。《大数据》作者曾经说过,在一个有组织的社会里,几乎每一则信息都在不同的时候,以不同的形式公开过。就公民而言,他的信息一次性在网上公开,和第一种情况有本质区别。
大数据平台在提供服务的同时,也在时刻收集用户的各种消费习惯、浏览习惯甚至生活习惯。如何保护用户的隐私成了大数据时代发展过程中不可回避的问题。因此,大数据的应用价值在于个人隐私保护与数据精准之间的平衡。要真正做到大数据的开放,还需要很长的路走。大数据会成为互联网之后,人类又一个技术乌托邦。大数据的启动跟互联网有着相同的逻辑,一开始大家谈,不知道怎么做,会有一轮甚至几轮比较明显的产业泡沫,但是随着那些看似乌托邦的愿景,一个技术、一个尝试的创业公司的进入,会一步一步变成现实。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
“最近复购率一直在下降,我们的营销力度不小啊,为什么用户还是走了?” “是不是广告投放的用户质量不高?还是我们的产品问题 ...
2025-02-21以下文章来源于数有道 ,作者数据星爷 SQL查询是数据分析工作的基础,也是CDA数据分析师一级的核心考点,人工智能时代,AI能为 ...
2025-02-19在当今这个数据驱动的时代,几乎每一个业务决策都离不开对数据的深入分析。而其中,指标波动归因分析更是至关重要的一环。无论是 ...
2025-02-18当数据开始说谎:那些年我们交过的学费 你有没有经历过这样的场景?熬了三个通宵做的数据分析报告,在会议上被老板一句"这数据靠 ...
2025-02-17数据分析作为一门跨学科领域,融合了统计学、编程、业务理解和可视化技术。无论是初学者还是有一定经验的从业者,系统化的学习路 ...
2025-02-17挖掘用户价值本质是让企业从‘赚今天的钱’升级为‘赚未来的钱’,同时让用户从‘被推销’变为‘被满足’。询问deepseek关于挖 ...
2025-02-17近来deepseek爆火,看看deepseek能否帮我们快速实现数据看板实时更新。 可以看出这对不知道怎么动手的小白来说是相当友好的, ...
2025-02-14一秒精通 Deepseek,不用找教程,不用买资料,更不用报一堆垃圾课程,所有这么去做的,都是舍近求远,因为你忽略了 deepseek 的 ...
2025-02-12自学 Python 的关键在于高效规划 + 实践驱动。以下是一份适合零基础快速入门的自学路径,结合资源推荐和实用技巧: 一、快速入 ...
2025-02-12“我们的利润率上升了,但销售额却没变,这是为什么?” “某个业务的市场份额在下滑,到底是什么原因?” “公司整体业绩 ...
2025-02-08活动介绍 为了助力大家在数据分析领域不断精进技能,我们特别举办本期打卡活动。在这里,你可以充分利用碎片化时间在线学习,让 ...
2025-02-071、闺女,醒醒,媒人把相亲的带来了。 我。。。。。。。 2、前年春节相亲相了40个, 去年春节相亲50个, 祖宗,今年你想相多少个 ...
2025-02-06在数据科学的广阔领域中,统计分析与数据挖掘占据了重要位置。尽管它们常常被视为有关联的领域,但两者在理论基础、目标、方法及 ...
2025-02-05在数据分析的世界里,“对比”是一种简单且有效的方法。这就像两个女孩子穿同一款式的衣服,效果不一样。 很多人都听过“货比三 ...
2025-02-05当我们只有非常少量的已标记数据,同时有大量未标记数据点时,可以使用半监督学习算法来处理。在sklearn中,基于图算法的半监督 ...
2025-02-05考虑一种棘手的情况:训练数据中大部分样本没有标签。此时,我们可以考虑使用半监督学习方法来处理。半监督学习能够利用这些额 ...
2025-02-04一、数学函数 1、取整 =INT(数字) 2、求余数 =MOD(除数,被除数) 3、四舍五入 =ROUND(数字,保留小数位数) 4、取绝对值 =AB ...
2025-02-03作者:CDA持证人 余治国 一般各平台出薪资报告,都会哀嚎遍野。举个例子,去年某招聘平台发布《中国女性职场现状调查报告》, ...
2025-02-02真正的数据分析大神是什么样的呢?有人认为他们能轻松驾驭各种分析工具,能够从海量数据中找到潜在关联,或者一眼识别报告中的数 ...
2025-02-01现今社会,“转行”似乎成无数职场人无法回避的话题。但行业就像座围城:外行人看光鲜,内行人看心酸。数据分析这个行业,近几年 ...
2025-01-31