融合?重构?区块链和大数据关系竟如此简单
最近一段时间,区块链和大数据这两大热词正在被越来越多地放在一起,随着各种言论的增多,两者的关系开始变得扑朔迷离。区块链将与大数据融合发展?区块链最终将重构大数据?围观群众纷纷表示想弄个明白。
“要弄清区块链和大数据的关系,首先要从两者的不同开始。”从事互联网技术研究20余年,人称互联网技术相面师的中国信息通信研究院云计算与大数据研究所所长何宝宏抛出了这一观点。他认为,区块链和大数据技术存在一定的共性,但是两者在技术处理方式上,更多的是不同。
何宝宏 中国信息通信研究院云计算与大数据研究所所长
何宝宏表示,区块链技术是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式,区块链处理的数据更小,是细致的处理方式。而大数据管理的是海量数据,要求广度和数量,处理方式上也会粗糙,重点是统计分析(如下图)。
“这个时代最大的特点就是变化。”对于区块链的兴起引发的业界的讨论、思考和担忧,何宝宏认为,我们擅长关注变化的东西,但是实际上很多变化背后的一些东西是不变的,比如——技术的规律。因而,在探讨区块链和大数据的关系时,我们需要跳出技术看技术。
客观而言,作为一个颠覆式的新兴技术,区块链要应用在大数据场景下,其本身还还不够成熟,需要进一步的研究而探讨。而区块链是否可能重构大数据?何宝宏认为基本不存在这一可能,因为大数据针对的是非结构化的数据,而区块链处理的是结构化数据。“两者的目标数据不同,要解决的问题也不同。”
在4月18日-19日即将于北京国家会议中心召开的“2018大数据产业峰会”上,何宝宏将发表题为“预见大数据的2018”的演讲,就大数据、区块链等技术发展背后的规律,以及2018年的市场动态和趋势进行展望。下面,小编收集了何宝宏博士近期的精彩观点,供大家提前养养眼、洗洗脑。
区块链:互联网的“大补丁”
草根、全球、自治、分布、开放、透明、对等、匿名、分享……二十年前,人们如此形容互联网;今天,这些却成为了区块链身上的标签。
这是为何?“区块链是互联网的发展和延续,是互联网的一块大补丁。”何宝宏认为,区块链颠覆不了互联网,更颠覆不了世界。如果非要认为区块链可以颠覆世界,只能说那可能是你的世界太小了。
要为区块链相面,我们能发现很多问题,如:性能低、能耗高、生态链、安全防护、隐私保护、监管缺失、标准缺失、不务正业等。“以我20多年的互联网相面经验来说,但凡是有这些问题的技术都是‘好技术’,这些缺点随着时间的推移都是可以克服和解决的。所以,每当有人批评区块链这些缺点时,我都会说这是优秀技术的典型特征。”
相比较区块链这样的颠覆式技术,何宝宏认为那些注定要失败的技术往往具备以下特征:
1、声称包治百病,一句话说不清楚它希望解决的具体问题;
2、概念模糊,一句话说不清楚它的基本思想和原理,与现有技术的明显区别或边界;
3、准备从主流市场,最赚钱的市场或存量市场开始;
4、需要建立以我为中心的生态链(技术富二代除外);
5、看起来过于完美,没有明显的取舍,回避需要付出的技术代价;
6、不考虑摩尔定律是否支持;
7、经济学规律模糊,历史案例牵强。
区块链的本质是分布式账本。何宝宏认为,分布式账本是“刚需”。过去的几百年,我们一直在使用集中式的记账方式,没有一种手段能够支持高效的分布式记账,直到区块链的出现。
“成年后的技术大多活成自己讨厌的样子。”区块链的特点是去中心化、防篡改、匿名性,但是随着其不断成熟和落地,这些特征需要从更深层次去理解。
分布式≠去中心
分布式不等于去中心。“高喊去中心的大多数是自己想成为新的中心。”何宝宏以比特币为例,其代码控制在Core小组手中,算力是高度集中的。同时,有报告显示,40%的比特币实际上是集中在1000个人手里,而另外一个报告则说,96.53%的比特币归属于4.11%的地址。因而,随着区块链的发展,去中心正在变成多中心。
防篡改≠不可修改
防篡改不等于不可修改。在何宝宏看来,人会犯错,数据因而也会出错。在会计体系里,不允许做假账但是允许改错账。在传统的数据库技术中,修改是很容易实现的,因而需要一些管理手段来防止篡改。但是今天,区块链技术是不可修改,那么如果数据出错了怎么办?因而需要在不可篡改的技术上加上“可修改”。
保护隐私≠匿名
保护隐私不意味着一定要匿名。何宝宏认为,匿名是保护隐私的一种方法和手段,但不是绝对。二十多年前的互联网是匿名的、全球化的,谁也关不掉,共享且自治。然而,到了今天,登陆一个网站,你就需要输入验证码,以证明自己是人,而不是机器或其他。
对共识机制难有共识
“对共识机制,难有共识。”何宝宏说,我们需要共识,但我们的共识机制本身却是分裂的、碎片化的。我们用POW比谁劲大,用POS比谁钱多,这是典型的从原始社会过渡到资本主义社会的“玩法”。后来钱多了人也太多了,于是又用DPOS搞出了代理人机制。
共识机制如何形成共识,属于控制层面范畴,这个共识特别难。要有这样的共识就必须要有共识之母,一个共识前面还得有一个共识才能形成后面的共识,共识也是链式结构的,信任也是链式结构的。因而,说区块链是去信任的,那是不可能的。
小产业、大变革
从技术的角度上看,区块链就是将原来的单个账本变成了现在的多个账本。原来,所有的数据库之间是主从关系,账本只有一个;今天多个数据库之间是对等关系,账本从一个变成多。
从一个会计到多个会计,以前记账可以读、写、改、删,今天记账只有读和写;以前记账要给会计发工资,进行外部激励,我们今天自己激励就可以了;以前所有公司的商务和财务都是分离的,付账过程特别繁琐;今天的智能合约是商务财务一体化,这就颠覆了我们很多的想法。
以前,代码就是技术;今天,代码变成了金融产品,所以就出现了新的机会。以前,数据主要是指信息,技术则就是如何帮它更广泛的传播;现在数据越来越成为资产,技术的走向就要发生很大的变化。
以前,二进制代码表达的是信息;今天,二进制代码表达的是一种财产。数据即资产,资产即数据。当二进制代码代表资产,技术的核心要义就要走向保护,要去管理和控制。技术的目的从最大限度的传播,转为考虑如何把代码圈起来。
区块链是小产业、大变革。它颠覆的是我们的经济、经济运营最底层的复式记账法。我们用了几百年的复式记账法将演进为三式记账法。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
俗话说的好“文不如表,表不如图”,图的信息传达效率很高,是数据汇报、数据展示的重要手段。好的数据展示不仅需要有图,还要选 ...
2025-01-24数据分析报告至关重要 一份高质量的数据分析报告不仅能够揭示数据背后的真相,还能为企业决策者提供有价值的洞察和建议。 年薪70 ...
2025-01-24又到一年年终时,各位打工人也迎来了展示成果的关键时刻 —— 年终述职。一份出色的年终述职报告,不仅能全面呈现你的工作价值, ...
2025-01-23“用户旅程分析”概念 用户旅程图又叫做用户体验地图,它是用于描述用户在与产品或服务互动的过程中所经历的各个阶段、触点和情 ...
2025-01-22在竞争激烈的商业世界中,竞品分析对于企业的发展至关重要。今天,我们就来详细聊聊数据分析师写竞品分析的那些事儿。 一、明确 ...
2025-01-22在数据分析领域,Excel作为一种普及率极高且功能强大的工具,无疑为无数专业人士提供了便捷的解决方案。尽管Excel自带了丰富的功 ...
2025-01-17在这个瞬息万变的时代,许多人都在寻找能让他们脱颖而出的职业。而数据分析师,作为大数据和人工智能时代的热门职业,自然吸引了 ...
2025-01-14Python作为一门功能强大的编程语言,已经成为数据分析和可视化领域的重要工具。无论你是数据分析的新手,还是经验丰富的专业人士 ...
2025-01-10完全靠数据决策,真的靠谱吗? 最近几年,“数据驱动”成了商界最火的关键词之一,但靠数据就能走天下?其实不然!那些真正成功 ...
2025-01-09SparkSQL 结构化数据处理流程及原理是什么?Spark SQL 可以使用现有的Hive元存储、SerDes 和 UDF。它可以使用 JDBC/ODB ...
2025-01-09在如今这个信息爆炸的时代,数据已然成为企业的生命线。无论是科技公司还是传统行业,数据分析正在深刻地影响着商业决策以及未来 ...
2025-01-08“数据为王”相信大家都听说过。当前,数据信息不再仅仅是传递的媒介,它成为了驱动经济发展的新燃料。对于企业而言,数据指标体 ...
2025-01-07在职场中,当你遇到问题的时候,如果感到无从下手,或者抓不到重点,可能是因为你掌握的思维模型不够多。 一个好用的思维模型, ...
2025-01-06在现代企业中,数据分析师扮演着至关重要的角色。每天都有大量数据涌入,从社交媒体到交易平台,数据以空前的速度和规模生成。面 ...
2025-01-06在职场中,许多言辞并非表面意思那么简单,有时需要听懂背后的“潜台词”。尤其在数据分析的领域里,掌握常用术语就像掌握一门新 ...
2025-01-04在当今信息化社会,数据分析已成为各行各业的核心驱动力。它不仅仅是对数字进行整理与计算,而是在数据的海洋中探寻规律,从而指 ...
2025-01-03又到一年年终时,各位打工人也迎来了展示成果的关键时刻 —— 年终述职。一份出色的年终述职报告,不仅能全面呈现你的工作价值, ...
2025-01-03在竞争激烈的商业世界中,竞品分析对于企业的发展至关重要。今天,我们就来详细聊聊数据分析师写竞品分析的那些事儿。 一、明确 ...
2025-01-03在数据分析的江湖里,有两个阵营总是争论不休。一派信奉“大即是美”,认为数据越多越好;另一派坚守“小而精”,力挺质量胜于规 ...
2025-01-02数据分析是一个复杂且多维度的过程,从数据收集到分析结果应用,每一步都是对信息的提炼与升华。可视化分析结果,以图表的形式展 ...
2025-01-02