写于2021年2月12日
以太坊协议所面临的一个最为长久且尚未解决的挑战,就是由于状态数据规模不断增长而带来的问题。以太坊区块链上的许多操作都会给以太坊添加状态内容,而所有全节点都必须存储全量的状态数据,这样才能验证新区块以及制造新区块。这些操作只需事务的发送者一次性缴交按gas用量来计量的手续费,但会给整个网络造成永久的持续性成本,因为节点需要存储这些新数据。
这是系统设计中的一个显著的失衡,可能会让以太坊系统变得越来越难用,因为状态中充斥着不再有用处的“垃圾数据”。本文的目的是详细解释问题产生的根源,以及一些解决该问题的方法。如果我们能实现某个解决方案,这将为安全地大幅提高区块Gas上限铺平道路。
本文所论述的研究领域仍在推进中,随时有可能出现更新、更好的想法和更优雅的权衡。
引言:问题出在哪?
“状态”指的是节点若想处理新产生的区块和事务就必须存有的信息。状态与“历史”完全不同,后者是关于过去时间的信息,节点可以保存这些信息以便日后重新广播或归档,但并不是处理区块链所必需的。
观点:BTC到2030年价值将达到150万美元:金色财经报道,ARK Invest首席执行官Cathie Wood表示,她和她的基金现在对BTC的“牛市”更有信心,到2030年价值将达到150万美元。
Cathie Wood表示,随着地区银行破产,股票全面暴跌,比特币从19,000美元上涨至30,000美元。这次反弹标志着投资者“逃向安全”,这是每个人最终都希望的,比特币既能防止财富被直接没收,也能防止财富被间接没收。直接没收是指用武力窃取个人财产,而间接没收则是指通货膨胀,尤其是通过增发货币使货币供应量膨胀到天文数字。比特币的供应量在程序上被限制在2100万个单位,因此不可能出现这种形式的通货膨胀。然而,即使在法币通货紧缩的环境下,比特币也能对冲交易对手的风险。比特币不会出现08、09年的情况。[2023/7/19 11:03:48]
在以太坊协议中,状态信息包括:
账户的ETH余额和nonce
智能合约的代码
智能合约的存储项
与共识机制相关的数据
历史信息则由旧的区块和收据组成。EVM中没有操作码可以让你访问旧区块、旧事务和内容和收据输出,所以节点丢弃这些数据也仍然能验证新区块,所以这些是历史信息。
观点:目前处于牛市中期,BTC半年内或再涨5倍:知名分析师PlanB发推称,尽管出现了土耳其禁令、美国税收、Faketoshi诉讼,马斯克关于比特币环境损害的言论等不利事件,但比特币比6个月前高出5倍;而且通过S2FX模型和链上数据表明,我们仍处于牛市的中期。 因此,在接下来的6个月内,BTC再涨至现在5倍的价格,我不会感到惊讶。[2021/5/14 22:04:10]
上述状态信息列表中的最后一项——共识机制相关数据——在设计上已经精心限制了其规模,因此我们不太需要为此困扰。但前面三项,就令人头大了。这三类状态信息的规模会随着时间推移而不断增大,因为不断会有新用户加入网络,他们会创建新的账户、新的合约,还会加入合约、收到token什么的。
难办的是,许多状态用过之后就会静静地躺在那里;一旦某个用户停用某个应用之后,就会产生一些“垃圾状态”——不会再派上用场,但会永远存在那里。
理论上,用户可以做到“垃圾不落地”。用户可以仅发布带有SELFDESTRUCT条件的合约,等他们再也用不上这个合约的时候,就调用这个操作码移除这个合约、清空其token余额;他们还可以使用智能合约钱包,通过一个已有的外部持有账户来发送交易,而无需生成一个新的EOA。
观点:本轮加密市场下跌为健康调整 起因是过度杠杆化:1月12日,IntoTheBlock分析师Lucas Outumuro发推称,本轮加密市场下跌,Compound的清算率超过了黑色星期四,仅次于11月26日DAI价格达到1.30美元时的清算率。这表明了近期市场价格上涨过程中存在过度杠杆化。与此同时,Compound日贷款额也创下了今年以来的新低,从9亿多美元降至仅3000万美元。这两个迹象表明,市场在一次健康的调整中淘汰了杠杆投资者。[2021/1/12 15:57:38]
但是在实践中,这样的激励非常少,而适当的状态清理的技术复杂性又太大了。在许多合约中,给任何人赋予这样调用SELFDESTRUCT的权限都是不合适的,而且,也会给用户体验和代码上也会增加很多复杂性。实际上,由于SELFDESTRUCT用处极其有限而副作用极大,我更倾向于永远移除这个操作码。如果我们真想控制状态数据的规模,我们需要的是一个网络中的节点可以默认丢弃不再被使用的“垃圾状态”的方法。
无状态客户端
这个问题的一类解决方案基于“无状态客户端”的观念。基本原理是,让区块验证不再以持有全局状态为前提。相反,区块会自带证据”),证明其所访问状态的值。就跟现在的设计一样,区块内会包含一个“状态根”,所访问的值可以对应着状态根得到证明。以太坊现在的状态树方案支持这样的证明技术,像二进制树或者VerkleTrie这样更高效的方案也可以。见证数据也会证明处理完该块后新状态根的正确性。
观点:比特币、美元纸币的区别在于确定支付单位的有效性:在美联储 12日的一篇博客文章中,经济学家Rod Garratt和Michael Lee等人概述了“基于帐户”和“基于代币”的数字货币系统的特征。作者指出,比特币、美元纸币和金币之间的区别在于,支付方能否“有相当高的信心”确定支付单位的有效性。他们写道,虽然美元钞票具有防伪特征,因此很难伪造,但加密用户无法“独立”的确定他们的代币是否有效。像比特币这样的区块链,使用强大的计算硬件,确保了矿工多次确认交易的有效性,消除了对每个单元进行独立验证的需要。[2020/8/13]
无状态性有两种形式:
弱无状态性:出块者仍然需要完整的状态,以为区块生成见证数据;但验证区块的阶段可以是无状态的;
强无状态性:没有任何节点需要完整的转台。反过来,是交易发送者需要提供见证数据,而出块者可以聚合这些数据。交易发送者自己负责存储为所关切的账户生成见证数据所需的部分状态树。
强无状态性是一个非常“优雅”的解决方案,因为它把责任完全转移给了用户,虽然为了保证实践中的良好用户体验,我们需要创造某些类型的协议来帮助不运行个人节点的用户维护状态、并处理用户需要与意料之外的账户交互的情形。打造这样的协议非常难。
观点:目前投资者进入比特币市场的原因已有所改变:Ambcrypto刊文称,一些加密分析师仍然认为,从长远来看,当今投资者对比特币市场的信心和行为将为比特币带来好处。目前比特币的储备风险水平也表明,比特币市场对其投资者而言具有诱人的风险/回报比率,该比率低表明市场信心更高。文章称,比特币最初具有较高的链上速度,这意味着该资产正在逐渐脱离交易所交易,并用于获取商品和服务。然而随着时间的流逝,随着交易所内交易变得越来越重要,链下速度成为了优先事项,并且人们只会在市场下跌时通过交易BTC来获取其他代币,或转换为USDT。可以推测出,进入比特币领域的新用户不是因为用户本身变得逐步进化,而是因为新用户认为持有比特币比在服务或商品上花费比特币更为赚钱。基于这些指标,比特币未来是否会盈利尚待观察,但是目前的比特币投资者很有可能与过去的投资者没有相同的意识形态。[2020/6/29]
此外,所有类型的无状态性都提高了网络所需的数据带宽;而强无状态性还需要交易声明其所交互的账户及存储项的键。
一个更温和的解决方案:状态过期
更温和的解决方案可以归结为不同形式的“状态过期”方案。必须持续得到访问的状态才能保持“激活状态”;而长期无人问津的状态会变成“失活”。具体用什么机制来更新状态,有很多选择,但一般原则是,除非某个状态对象被显式地更新,否则就以某种形式处于失活状态。因此,任何创建新状态对象的活动,都只能成为节点在一段时间内的负担,而不像现在这样变成永久负担。
失活状态,故名思义,就不是“状态”的一部分;想要处理区块或创建区块的节点无需存储失活状态。不过,失活状态不是被完全删除了!在所有类型的状态过期提案中,都预设了某种方法可以“复活”已经失活的状态。
一般原则是,激活状态的使用与当前相同,而失活状态则需通过上述无状态客户端的机制来使用。复活一个过期状态对象的事务需要提供一个证据,来证明该对象是失活状态的一部分。为了能够生成这样的证据,用户自己需要存储和维护至少一部分失活状态。
**
**
何时过期
决定过期条件的设计也有很多种。最常见的几种是:
直接租金:逐块逐块收取“租金”,直接以每个账户的余额来支付;状态对象的余额降到了零,该账户就过期了。
剩余存活时间值:每个状态对象都存储一个”剩余存活时间“值,这个值可以通过支付费用来增加
触达即刷新:每个状态对象都存储一个”剩余存活时间“值,并且每逢读取或写入该账户都会增加该值
所有状态对象定期过期:也就是ReGenesis提案
我自己越来越喜欢”触达即刷新“方案,因为它避免了应用需要创造复杂的经济模型来让用户承担状态租金;以及它保证了激活状态的规模有一个清晰的上限。让大量状态按照规律的时间间隔过期的方案也有同样的好处,但也有一些有趣的权衡:关键好处是,过期方案更简单,但关键不足是,跨过一个过期时点后,你再激活自己的状态对象时,需要多少见证数据会跟你触达状态对象的时间点有关。
**
**
账户层面的过期vs.存储槽层面的过期
状态过期的逻辑既可以运营到账户层面,也可以运用到单个存储槽层面。当前,我强烈偏向于在存储槽层面实现状态过期方案。因为很多合约账户的存储槽数量是不受限制的,任意用户都能加入合约并增加合约名下的存储槽的数量。不管使用什么样的账户层过期方案,想要实际限制状态的规模,租金的数量都必须与合约内存储槽的数量成比例。结果是,用户还是能够仅支付一次性的费用就给合约及其用户施加永久的持续性成本。
要解决这个问题,合约要么加入复杂的内部逻辑,将存储操的租金“转嫁”给用户,要么重新设计自己合约的模式,转向使用CREATE2操作码创建新的合约并使用这些合约来充当存储槽。不管是哪种办法,最后都会变成等价于存储槽层面的过期方案。因此,我个人认为,我们应该仅在合约存储槽层面实现状态过期方案。
但是,存储槽层面的过期方案也有自己的缺点:每个存储槽都要增加一个元数据,指明它何时过期,这也意味着“复活冲突问题”不仅会影响账户,也会影响存储槽。
原文链接:
https://hackmd.io/@HWeNw8hNRimMm2m2GH56Cw/state_size_management
作者:VitalikButerin
翻译:阿剑
你可能还喜欢:
干货|以太坊无状态客户端初探
引介|ReGenesis:重启以太坊以降低节点的负担
观点|以“状态”视角理解以太坊及其未来
免责声明:作为区块链信息平台,本站所发布文章仅代表作者个人观点,与链闻ChainNews立场无关。文章内的信息、意见等均仅供参考,并非作为或被视为实际投资建议。
本文来源于非小号媒体平台:
VitalikButerin
现已在非小号资讯平台发布38篇作品,
非小号开放平台欢迎币圈作者入驻
入驻指南:
/apply_guide/
本文网址:
/news/9688831.html
免责声明:
1.资讯内容不构成投资建议,投资者应独立决策并自行承担风险
2.本文版权归属原作所有,仅代表作者本人观点,不代表非小号的观点或立场
上一篇:
盘点零知识证明代表性项目:如何影响和塑造区块链生态系统?
郑重声明: 本文版权归原作者所有, 转载文章仅为传播更多信息之目的, 如作者信息标记有误, 请第一时间联系我们修改或删除, 多谢。