
快速了解区块链背后的三项基本技术
如果问十个人"什么是区块链技术?",你可能会得到十种不同的答案。理解区块链的最佳方法是逐步了解当中的基本技术。
因此在本文中,我将介绍区块链技术的三个主要部分:区块链本身、点对点网络和共识机制。一旦缺少任何一个部分,比特币将无法存在。首先让我们看到区块链。
区块链 (blockchain)
简而言之,区块链只是数据结构化的一种方式。区块链是分类账:记录账务记录的文件。
可以把这个文件理解为一本永不会完的书。
书上的每一页都记录着信息,同时在底部标有页码。通过页码,你马上可以知道该页面所属的位置,比如49页显然位于48页与50页之间。
就像页面一样,区块也都充满了信息。尽管区块没有确切的编号,但它们附有时间戳,具有与编号相同的功能。新的区块总是加在具有最新时间戳的区块之后,因此形成了链。
区块链很棒的一点是当中使用了加密技术,因此当书中某一页的信息发生改变时,我们都会注意到。该属性使区块链成为很好的数据结构,用来跟踪记录任何有价值的事物。
区块链的用例
在比特币的区块链中,区块包含比特币的交易信息。区块中记录了谁发送给谁多少比特币。
由于区块链从一开始就被用于跟踪所有比特币的流向,因此通过检查分类账可以明确谁在某个时间拥有哪些比特币。在任何时间内"谁拥有多少"就是所谓区块链的当前"状态"。
交易只有在包含到区块中,并被添加到区块链中才会发生,因此,当一个区块被添加到区块链中时,区块链的状态就被更新。毕竟,比特币发送了移动。
这意味着如果我想验证某人是否真的对我做了交易,我必须能够检查区块链的状态。为了做到这一点,分类帐必须是公开的。这里就需要用到点对点网络。
点对点网络
(peer-to-peer networks)
为了将区块链作为交易数据的分类帐,我必须要检查区块链,查看是否有人对我的账号或钱包进行了交易。
如果区块链仅存储在一台计算机上,并且恰好被关闭了,那么这是很烦人的。因此,区块链的当前状态需要能够下载、同步并能被全球的计算机所提供。
这些计算机被称为"节点",它们在点对点网络中运行,用来确保区块链的安全性和最新性。每个节点都存储着区块链完整的最新版本。每当添加新的区块时,所有节点都会更新其区块链。
使用点对点网络具有以下优点:
·可以随时查看自己区块链的状态;
·无需通过某一方查看区块链的真实状态;
·无需依靠一台服务器的安全性去确保区块链是否安全;
·不法分子必须同时攻击数千台计算机,而不是一台服务器;
·区块链不会被删除,因为它必须被所有节点删除。
基于服务器的模型 vs 点对点网络
这很重要,但以上并不意味着区块链就足够安全,能够用于存储或交易任何有价值的事物。
例如,如何确认区块链中的(交易)数据是正确的?如何确认区块中没有无效的交易?如果存在不同版本的区块链,如何确认哪个显示了区块链的真实状态?
这些问题能够通过共识机制解决,这种机制是通过点对点网络实现的。
共识机制 (consensus mechanism)
Napster公司早在1999年就使用了点对点机制。
区块链在比特币出现之前就已经存在。
比特币神秘的匿名创始人——中本聪,在白皮书中通过基于密码学的共识机制,他巧妙地将两者结合起来。共识机制允许点对点网络中的节点一起合作,而不必相互了解或信任。
"共识算法的目的是根据特定的状态转换规则,考虑到安全的更新状态,其中执行状态转换的权利分布在用户中,这些用户能够通过算法共同进行交易。"
——以太坊创始人 Vitalik Buterin
如果你还是不太懂,那么这样理解,其实共识机制就是一系列规则,网络中的节点通过运行网络软件来达成一致。这些规则确保网络正常工作并保持同步。
共识协议规定:
· 如何将区块添加到区块链中;
· 区块何时被认为是有效的;
· 如何解决冲突。
添加区块
不同的区块链添加区块的方式各不相同。其中最广为人知的共识机制是比特币的工作量证明(Proof of Work )。
工作量证明的第一条规则是,平均每10分钟会在区块链中添加一个区块。
促进这一过程是所谓的"挖矿"。试图在区块链中链添加区块的节点(称为"矿工")使用计算机的计算能力尝试解决密码"难题"。规则规定,只有这个难题被解决时,区块才能被添加到区块链中。
解决这一难题的矿工"挖"新的区块,并增加到区块链中,同时矿工会得到网络的奖励。预定数量的新币将被创建,并奖励给矿工,以及该区块中包含的所有交易的成本。
随后,所有矿工将开始挖下一个区块。
比特币挖矿设备。为了获得足够的挖掘处理能力,你需要大量的GPU。
比特币的工作量证明不是唯一的共识机制。分布式账本中也常使用权益证明(Proof of Stake)。在基于权益证明的机制中,某人可以对他的币进行"下注",以便被选中从而添加下一个区块。从某种意义上相当于,一位赌徒说:"我用币打赌我正确添加了这个区块。" 如果他说谎就失去币。
关于哪种共识机制是最好的仍存在很大的争论。尽管如此,无论区块是如何创建的,网络中的其他节点仍需要决定该区块是否有效。
区块的有效性
当矿工解决这个难题并挖到区块时,网络中的所有节点将检查该区块是否有效,并将其添加到区块链的副本中。节点首先要对有效性达成一致。只有这样,网络才会同步并更新区块链的状态。
只有当遵循共识机制的规则时,节点才会将新的区块添加到区块链中。他们运行的软件将检查区块是否有效。无效的区块将被拒绝。
当然,区块与其中包含的交易有效性一致。以比特币为例,协议规定,如果首先没从他人那儿收到比特币,或者挖到比特币,那么你将无法发送比特币。
换句话说,如果发送者收到足够的比特币进行交易,节点将检查区块中的所有交易。为此,需要检查网络的状态。
假设我已收到1比特币,我之后将其发送给Alice。接着我试图将相同的比特币发送给Bob。只要我的第一笔交易被添加到链中,所有节点都会更新区块链,从而得出我已经没有那个比特币了。那么我给Bob的交易将会被节点拒绝。节点发现该区块不遵循规则时,则不会将该区块更新到区块链中。
规则还规定,交易只有在比特币所有者的进行数字签名时才有效。只有钱币的所有者才能对交易签字。因此,只有你可以花费你的比特币。
如何解决冲突
在偶然的情况下,两名矿工可能同时向区块链中添加有效区块。想象一下,一部分节点接受了一个有效的区块,其他节点接受了另一个区块。前者包括我与Alice的交易,后者包括我与Bob的交易。现在同时存在两种不同的区块链状态!
我们将其称为(无意)的"分叉(fork)":区块链分成两个不同的链。Alice和Bob谁才收到了我的比特币?两条链中的哪一条是'真正的'区块链?
通常会通过一条简单的规则解决这个问题:最长的区块链获胜。
区块链分叉的可视化
当出现分叉时,一些矿工将开始在其中一条上进行挖矿,而另一些开始在另一条上进行挖矿。不可避免的是,一条区块链将比另一条拥有更多的矿工,因此添加区块的速度会更快。其他的矿工将换到较长的区块链上,那么分叉的区块链将会消亡。这对主区块链没有任何损失。
为什么会这样?
因为矿工是以自我利益行事的经济行为者。矿工没有兴趣对会消亡的分叉区块链进行挖矿。分叉区块链上的所有交易从未在主区块链上发生,这意味着在分叉链上挖矿的矿工不会因为其工作而获得奖励。
在极少数情况下,分叉链上可能产生大量的挖矿能力。这时则需要一段时间才能确定哪条是主区块链。一般认为,在6个区块后确认交易是明智之举。
区块链分叉的可视化。一般不会超过5个区块。
在区块链中添加区块需要巨大的处理能力,以及最长的区块链取胜的规则,这保证了区块链的安全性。攻击网络的唯一方法就是回到区块链中的某个区块,进行分叉并从那里挖新区块。然而要做到这一点,攻击者必须重新完成矿工的所有工作,并赶上主区块链。如果没有比整个矿工网络更多的计算能力,这几乎是不可能实现的。简单地说,这种操作所需的电力和GPU成本非常昂贵。
原文链接:
https://hackernoon.com/3-steps-to-understanding-blockchain-8a285572daa3
如何掌握区块链技术
区块链创新的推动以及数字经济的蓬勃发展离不开人才的培育,而CDA数据分析师作为行业的领头羊,紧密结合当前区块链发展实际与人才需求结构,重磅推出CDA区块链学院。
扫描二维码,进入 CDA 区块链学院,学习区块链知识,选择很多,站对未来。
扫描二维码 加入CDA区块链学院
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在大模型从实验室走向生产环境的过程中,“稳定性” 是决定其能否实用的关键 —— 一个在单轮测试中表现优异的模型,若在高并发 ...
2025-10-15在机器学习入门领域,“鸢尾花数据集(Iris Dataset)” 是理解 “特征值” 与 “目标值” 的最佳案例 —— 它结构清晰、维度适 ...
2025-10-15在数据驱动的业务场景中,零散的指标(如 “GMV”“复购率”)就像 “散落的零件”,无法支撑系统性决策;而科学的指标体系,则 ...
2025-10-15在神经网络模型设计中,“隐藏层层数” 是决定模型能力与效率的核心参数之一 —— 层数过少,模型可能 “欠拟合”(无法捕捉数据 ...
2025-10-14在数字化浪潮中,数据分析师已成为企业 “从数据中挖掘价值” 的核心角色 —— 他们既要能从海量数据中提取有效信息,又要能将分 ...
2025-10-14在企业数据驱动的实践中,“指标混乱” 是最常见的痛点:运营部门说 “复购率 15%”,产品部门说 “复购率 8%”,实则是两者对 ...
2025-10-14在手游行业,“次日留存率” 是衡量一款游戏生死的 “第一道关卡”—— 它不仅反映了玩家对游戏的初始接受度,更直接决定了后续 ...
2025-10-13分库分表,为何而生? 在信息技术发展的早期阶段,数据量相对较小,业务逻辑也较为简单,单库单表的数据库架构就能够满足大多数 ...
2025-10-13在企业数字化转型过程中,“数据孤岛” 是普遍面临的痛点:用户数据散落在 APP 日志、注册系统、客服记录中,订单数据分散在交易 ...
2025-10-13在数字化时代,用户的每一次行为 —— 从电商平台的 “浏览→加购→购买”,到视频 APP 的 “打开→搜索→观看→收藏”,再到银 ...
2025-10-11在机器学习建模流程中,“特征重要性分析” 是连接 “数据” 与 “业务” 的关键桥梁 —— 它不仅能帮我们筛选冗余特征、提升模 ...
2025-10-11在企业的数据体系中,未经分类的数据如同 “杂乱无章的仓库”—— 用户行为日志、订单记录、商品信息混杂存储,CDA(Certified D ...
2025-10-11在 SQL Server 数据库操作中,“数据类型转换” 是高频需求 —— 无论是将字符串格式的日期转为datetime用于筛选,还是将数值转 ...
2025-10-10在科研攻关、工业优化、产品开发中,正交试验(Orthogonal Experiment)因 “用少量试验覆盖多因素多水平组合” 的高效性,成为 ...
2025-10-10在企业数据量从 “GB 级” 迈向 “PB 级” 的过程中,“数据混乱” 的痛点逐渐从 “隐性问题” 变为 “显性瓶颈”:各部门数据口 ...
2025-10-10在深度学习中,“模型如何从错误中学习” 是最关键的问题 —— 而损失函数与反向传播正是回答这一问题的核心技术:损失函数负责 ...
2025-10-09本文将从 “检验本质” 切入,拆解两种方法的核心适用条件、场景边界与实战选择逻辑,结合医学、工业、教育领域的案例,让你明确 ...
2025-10-09在 CDA 数据分析师的日常工作中,常会遇到这样的困惑:某电商平台 11 月 GMV 同比增长 20%,但究竟是 “长期趋势自然增长”,还 ...
2025-10-09Pandas 选取特定值所在行:6 类核心方法与实战指南 在使用 pandas 处理结构化数据时,“选取特定值所在的行” 是最高频的操作之 ...
2025-09-30球面卷积神经网络(SCNN) 为解决这一痛点,球面卷积神经网络(Spherical Convolutional Neural Network, SCNN) 应运而生。它通 ...
2025-09-30