SUI:躲避子弹:以太坊状态问题

这篇文章的目的是正式公开一个对以太坊平台的严重威胁,其危险性清晰而明确,直到“柏林”硬分叉才解除。

状态

我们先来了解一些以太坊和“状态”的背景知识。

以太坊状态是一棵帕特里夏-默克尔树。本文不会深入过多细节,你只要知道,随着状态数量的增长,这个树结构的分支会变得越来越密。以太坊区块链上每多一个账户,这棵树就多一个叶子节点。在树的根节点与叶子节点,是许多所谓的“中间”节点。

为了查找某个账户,或者说在这棵庞大的树上找到某片“叶子”,需要解析6~9个哈希值,从根节点开始,经由中间节点,最终解析到一个能够给予我们所需数据的哈希值。

用大白话来说:无论什么时候要在这棵树上查找某个账户,都要经过8~9次解析操作。每次解析操作都是一次数据库查询,而每一次数据库查询都意味着不确定数量的多次硬盘操作。硬盘操作的次数很难估计,但是因为状态树的“键”是密码学哈希值,所以这些键都是随机的,这对所有数据库来说都属于最坏的情况。

随着以太坊状态的增加,就有必要提高访问状态树的操作的Gas消耗量。早在2016年10月,我们就曾用“橘子口哨”分叉做过这样的事。EIP150大幅提高了特定操作的Gas消耗量,并引入了一系列的措施来保护网络免于DoS攻击;这是在所谓的“上海攻击”之后推出的。

Sui基金会宣布将发布初始代币分配等信息:据官方消息,Sui基金会现已启动,除了赠款计划,Sui基金会将发布更多关于Sui初始代币分配、获得Sui基金会质押委托的流程以及社区成员获得资金的其他途径。

接下来几周,Sui基金会将分享更多信息并宣布与去中心化和社区建设使命相关的未来计划。目前,Sui基金会正在设计一些新内容,包括传播Sui知识的教育和社区计划、研究计划以改进Sui的技术以及Validator和Move计划以增强Sui基础设施的采用。

据此前报道,10月25日,Sui基金会网站已上线,并开放开发者Grant申请入口。[2022/10/28 11:51:46]

另一次这样的Gas消耗量提升是在“伊斯坦布尔”分叉的时候,在区块高度?9069000?激活,引入了EIP1884。1884的内容包括:

SLOAD?操作码的Gas消耗量从?200?提高到?800?gas

BALANCE?消耗量从?400?提高到?700?gas

EXTCODEHASH?消耗量从?400?提升到?700?gas

问题

在2019年3月,MartinSwende测量了EVM操作码的性能。这一研究后来导致了EIP-1884的创建。在1884激活的几个月前,这篇以“BrokenMetre”为名的论文发表。

数据:以太坊分叉链EthereumFair交易量突破1000万笔:金色财经报道,据以太坊分叉链EthereumFair数据显示,其网络交易总量已突破1000万笔,本文撰写时达到10,904,695笔。此外,当前EthereumFair出块量为15,626,793个,平均出块时间12.7秒,当前网络钱包地址数为2,898,856个。[2022/10/12 10:32:39]

两位以太坊安全研究员——HubertRitzdorf和MatthiasEgli——与这篇论文的作者之一DanielPerez展开了合作,并“武器化”了一个漏洞,并提交给了以太坊的bug悬赏项目。那是在2019年10月4日。

我们建议你完整地阅读他们提交的报告,写得非常好。

在一个专门讨论跨客户端安全性的频道里,来自Geth客户端、Parity客户端和Aleth客户端的开发者被告知了这份报告,就在同一天。

该漏洞的本质是触发随机的树查找。一个非常简单的变体是:

美国取消对BTC-e运营商Alexander Vinnik的引渡请求:金色财经报道,Vinnik的法国律师Frederic Belot证实,将BTC-e运营商Alexander Vinnik从法国引渡到美国的请求于7月15日被取消。然而,根据贝洛特的说法,此举将使美国当局将文尼克关押更长时间,然后将他引渡到希腊。他于2017年首次被捕,并最终于2020年被加利福尼亚法院起诉到美国。

Vinnik被认为是BTC-e的运营商,它与比特币交易所Mt.Gox的黑客事件有关,该交易所在744,408 BTC被盗后从未恢复,并且于2014年关闭。Vinnik本人一直否认他经营BTC-e,声称他只在交易所工作。(coindesk)[2022/7/22 2:32:00]

在他们的报告里,研究员通过?eth_call?RPC端点对同步到主网的节点执行了这一负载,下面是它们消耗1000万gas所需的时间。

使用?EXTCOEHASH?耗尽1000万gas

Parity:约90秒

Geth:约70秒

使用?EXTCODESIZE?消耗1000万gas

Parity:约50秒

Geth:约38秒

显而易见的是,EIP-1884确实减少了攻击的效果,但还是远远不够的。

BlockFi 将Solana、Avalanche和Polygon等主要加密货币的利率减半:5月27日消息,加密借贷平台BlockFi已将非美国客户持有的一些市场加密货币的利率降低了一半。自6月1日起,Solana存款的利率将从10%降至5%,而Avalanche(AVAX)和Polygon(MATIC)的利率将分别从10%降至5%和11%至5%。(The Block)[2022/5/28 3:46:41]

那时候离大阪Devcon已经很近了。在Devcon期间,关于这一问题的知识在主网的客户端开发者之间传开来。我们也会晤了Hubert和Mathias,还有GregMarkou。ETC区块链的开发者们也收到了这份报告。

随着2019年接近尾声,我们发现,这问题比我们之前以为的还要棘手,恶意的事务可能导致出块时间延长到以分钟计。更难办的是,开发者社区已经对EIP-1884感到不满,它打破了一些合约,而且用户和矿工都希望提高区块的GasLimit。

此外,仅仅两个月之后,到了2019年12月,PartiyEthereum就宣布要退出了,OpenEthereum项目接管了Parity客户端的代码维护工作。

于是大家创建了一个新的客户端协作频道,Geth、Netheremind、OpenEthereum和Besu的开发者继续合作。

阿里巴巴成全球最大区块链专利持有者:金色财经报道,阿里巴巴集团已成为全球最大的区块链专利持有者。数据显示,这家中国电子商务巨头在2021年拥有2,588项有效或未决专利(在提交专利申请后至授予专利之前,接受专利和商标局审查的法律状态)。在此过程中,它在大多数与区块链技术相关的专利申请中名列前茅。(ednchina)[2022/5/16 3:19:49]

解决方案

我们意识到,只有双管齐下才能解决这个问题。一方面,我们要改进以太坊协议,也就是在协议层解决这个问题;最好是不要打破合约,也不要惩罚“善意”的行为,但又能防止攻击。

另一方面,我们可以依靠软件工程,改变客户端内的数据模式和结构。

协议层工作

处理此类攻击的第一个思路是这个。在2020年2月,其正式版本作为EIP2583发布。该提案背后的观念是增加一个惩罚措施,每次树查找导致miss时就触发。

不过,Peter找出了一个绕过它的办法——“shieldedrelay”攻击——使得本质上惩罚有了一个上限。

惩罚miss?方法的问题在于,必须先有查找的过程,然后才能确定要不要实施惩罚。但如果剩余的gas已不足于实施惩罚,则一个没有得到充分支付的消耗流程又已经执行了。即使这会导致抛出错误,这些状态读取也可以封装到嵌套调用中,使得外部调用者可以重复执行攻击而不必支付惩罚。

因此,这个EIP也被抛弃了,我们要寻找更好的替代方案。

AlexeyAkhunov研究了Oil的概念——一种次级的“Gas”,但与Gas完全不同的是,它对执行层是不可见的,而且可能导致事务全局回滚。

Martin提了一个类似的提案,称为“Karma”,在2020年5月。

虽然这许多方案都有进展,VitalikButerin提议仅仅提高Gas消耗量,并维护一个“访问清单”。在2020年8月,Martin和Vitalik开始迭代后来成为EIP-2929及其同伴EIP-2930?的想法。

EIP-2929在根本上解决了许多上面提到的问题。

与EIP-1884相反;1884是无条件提高Gas消耗量,但2929仅提高访问新对象的Gas消耗量。这使得净成本仅增加了不到一个百分点。

同样地,与EIP-2930配合后,就不会打破任何合约。

它还可以通过提高Gas消耗量来进一步调整

在2021年4月14日,这两个EIP都在“柏林”分叉时激活。

开发工作

Peter尝试用动态的状态快照解决这个问题,时值2019年10月。

快照是一个次级的数据结构,用来以扁平格式存储以太坊状态。快照可在Geth节点正常运行期间创建,无需下线专门执行。快照的好处是,它可以作为状态访问的一种加速结构:

不再是执行?O(logN)?次硬盘读取来访问一个账户/存储项,快照可以提供直接的,O(1)?级别的访问时间。

快照还支持以每个条目?O(1)?的复杂度迭代账户和存储项,这使得远程节点可以检索连续的状态数据,比以往便宜非常多。

快照的存在还支持其它更奇怪的用途,比如离线修剪状态树,以及迁移到另一种数据格式。

弊端是,快照等于是完全复制了账户和存储项的未经处理的数据。若在主网环境中使用,这意味着需要额外25GB的固态硬盘空间。

动态快照的想法从2019年中就有了,当时的主要目标是启用“快照同步”。那时候Geth团队还在开发许多“大项目”:

离线的状态修剪

同态快照+快照同步

通过共享状态实现LES状态分散

不过,后来他们决定一心一意做快照功能,推迟了其他项目。这些工作为后来的?snap/1?同步算法打下了基础。这一算法已在2020年3月合并到了代码库中。

有了“动态快照”功能,我们就能喘口气了。如果以太坊网络遭到攻击,那会是很痛苦的,但至少,我们能通知用户打开快照功能。生成快照需要花一些时间,而且还没有办法同步快照,但网络至少能继续运行了。

结合

在2021年3月/4月,?snap/1?协议已经在geth客户端推出,节点能够使用新的、基于快照的算法来同步区块链了。虽然还不是默认的同步模式,这是使快照能不仅作为攻击保护措施,也能显著提高用户体验的一部。

在协议层,“柏林”升级已于2021年4月激活。

在我们的AWS监控环境中,我们的基准测试结果如下:

“柏林”前,没有快照,处理2500万gas:14.3秒

“柏林”前,有快照,处理2500万gas:1.5秒

“柏林”后,没有快照,处理2500万gas:约3.1秒

“柏林”后,有快照,处理2500万gas:约0.3秒

这个的数字表明,“柏林”升级使攻击的效率降低了5倍,而快照使之降低了10倍,最终使其影响降低了50倍。

我们估计,在当前的主网上,不使用?快照的geth节点可能可以做到只需2.5~3秒就能执行一个区块。随着状态的增长,这个数字会继续恶化。

如果gas返还机制被用来造成单个区块的实际gas使用量提升,这个恶化的倍数是2倍。在EIP-1559实施后,区块的GasLimit会有更高的弹性,在短时间内可爆发出最大2倍的恶化乘数。

至于实施这种攻击的可行性,攻击者买断一个区块的成本大概在几个ETH这样的级别。

为何要在此时公开

这一威胁在很长时间里都是“公开的秘密”——因为疏忽,它至少被公开披露过一次;而且在核心开发者会议中也多次提到它,虽然没有公开细节。

因为我们已经激活了“柏林”升级,也因为geth客户端已经默认使用快照功能,我们认为,威胁已经足够低,而透明化才是更重要的了。所以是时候把幕后的工作都公开了。

重要的是,社区得到了一次理解和思考这些影响用户体验的变更的机会。

郑重声明: 本文版权归原作者所有, 转载文章仅为传播更多信息之目的, 如作者信息标记有误, 请第一时间联系我们修改或删除, 多谢。

金星链

[0:78ms0-1:66ms