以太坊:以太坊Medalla测试网“崩溃”事件始末

译者注：

请运行Prysm客户端的用户尽快升级到Alpha.23版本：

https://github.com/prysmaticlabs/prysm/releases

本期是wnie2计划之外的更新，将针对周末Eth2Medalla测试网发生的插曲进行回顾和分析。

我们在差不多两周前启动了Medalla，也就是8月4日，这是一个大型的、公开的多客户端测试网，运行Eth2主网规范。关于Medalla测试网的介绍，可以参阅上期。

测试网平稳运行了10天，即使验证者参与率比我们预期中要低(70%-80%的验证者保持长期在线)。但这无伤大雅，测试网完全能应付。

然而周五的傍晚，我在控制板中目睹了验证者参与率突然断崖式下降。在几分钟之内，活跃验证者从22000降低到5000左右，网络中约80%的验证者都消失了。

因此，本文将对此事件进行回顾，包括其后果和下一步的措施。

究竟发生了什么？

数据：以太坊鲸鱼过去一周增持8.7万亿枚SHIB，价值约1.28亿美元:金色财经报道，在过去一周里，以太坊上的顶级SHIB鲸鱼已经增持了价值约1.28亿美元的Shiba Inu（SHIB），这使得其成为以太坊鲸鱼持仓榜上排名第一的非ETH资产。

WhaleStats数据显示，自2月1日以来，排名前100的以太坊投资者又增持了大量SHIB，持仓价值已从约5.99亿美元跃升至约7.29亿美元，SHIB数量新增8749145591250枚。这占到他们投资组合的18.5%，排名第二，仅次于以太坊，其次是稳定币USDT（17.42%）和USDC（14.21%）。

因此，SHIB现在是这些钱包除以太坊以外持有最多的加密资产（以美元等值计）。目前，它也是以太坊上顶级鲸鱼交易最多的代币。（U.Today）[2023/2/7 11:51:53]

我们发现，网络中每个运行Prysm客户端的验证者都突然消失了。由于Prysm是使用度最高的客户端，其后果严重性可想而知。

Prysmatic团队在此次事件中开放了一个文档报告，并且持续在其中更新事件细节以及团队响应。以下是一些重点内容以及我的注释。

以太坊鲸鱼增持530亿枚SHIB，价值逾200万美元:12月24日消息，据WhaleStats监测，一名以太坊鲸鱼已经增持了530亿枚Shiba Inu代币，价值2,008,890美元。此外，大型Shiba Inu持有者的平均SHIB余额上升了8%。（U.Today）[2021/12/24 8:02:01]

事件起因是时钟同步(clocksync)出现问题。Prysm客户端的配置使用了Cloudflare的Roughtime来计算时间。(在我看来)其起因还不是非常明确，但很显然Roughtime将时间推移到了未来的四小时，并且持续了一个多小时。Prysm客户端验证者们突然发现他们的时间快了四个小时，并且继续为尚不存在的区块链生成区块和证明。

就其本身而言，还不足以造成灾难性的后果。即使有许多区块丢失，并且面临大量来自未来的证明，剩下的客户端仍然能够在原链上进行建设。渐渐地，随着Prysm节点的时钟调整回来，他们开始回到网络中，并且验证者参与率也开始回升。网络似乎在恢复正常。

但几小时之后，情形又急转直下。

数据：以太坊上总锁仓量为1005.8亿美元:金色财经报道，数据显示，当前以太坊上总锁仓量为1005.8亿美元，净锁仓量766.1亿美元。以太坊上锁仓资产排名前五分别为Maker（157亿美元）、Curve（151亿美元）、Aave V2(147亿美元)、Compound（120亿美元）、Uniswap V2（65亿美元）。[2021/10/24 6:09:41]

在初始时间发生的四小时之后，又发生了两件事。首先，所有Prysm客户端在未来生成的证明都开始具备有效性。其次，重新加入网络的Prysm节点又开始消失了，原因是为了防止他们生成任何相悖的证明，罚没保护机制被触发了。

这两件事同时发生，让网络陷入了混乱。剩下的客户端仍在努力地处理他们所接收到的信息，信标链变成了不停分支的丛林。(Prysmatic团队的Raul告诉我，Prysm首次修复中的一个bug使得情况恶化)

在一段时间之内，网络中的信息仍处于可控范围内。但在接下来的24小时左右，要导航愈加复杂混乱的分叉，所需的内存和CPU变得难以负担。我看到一个Lighthouse客户端使用了30GB内存(约为通常情况下的100倍)，对于Teku客户端来说，即使使用12GB的Java内存堆并最大化处理器，也遇到了麻烦。

分析 | 币安研究报告：去中心化金融服务已发展成以太坊上的主要应用之一:据币安研究院研究报告显示，去中心化金融（DeFi）服务已经发展成为以太坊上的主要应用之一，大多数DeFi协议都是在以太坊上构建的，截至6月5日，以以太坊为基础的DeFi应用程序的抵押品总价值超过5亿美元（超过150万以太）。比特币的闪电网络（Lightning Network）解决方案可以被视为在比特币区块链上运行的DeFi应用程序。截至2019年6月5日，闪电网络上的承载价值约为800万美元。总体而言，加密借贷服务领域仍处于初期阶段。[2019/6/10]

请注意，这一切都发生在周末。感谢所有奋战在一线的客户团队们，为了使节点能够应对混乱的网络，他们需要不停地优化内存和效率。

到目前为止，网络正在逐渐恢复。用户报告不尽相同，但是Prysm和Lighthouse的新版本刚好能够找到正确的链头并继续构建信标链。?Eth2Stats当前显示链头或附近的Lighthouse、Prysm和Teku节点的一些节点。我们会继续优化Teku，减少其在同步时所需的资源。

突发 | 慢雾区发布以太坊代币“假充值”漏洞攻击预警:慢雾区发布以太坊代币“假充值”漏洞攻击预警，称相关交易所、中心化钱包、代币合约需要特别警惕，尽快自查以太坊相关代币的充值是否存在异常。此次受影响的主要是以太坊上基于ERC20、ERC721、ERC223等标准发行的代币，已经发现有交易所及中心化钱包遭受此攻击。这次攻击事件的披露前后相关时间线大致如下：2018/6/28 USDT “假充值”漏洞攻击事件披露；2018/7/1 开始分析知名公链是否存在类似问题；2018/7/7 捕获并确认以太坊相关代币“假充值”漏洞攻击事件；2018/7/8 分析此次影响可能会大于 USDT “假充值”漏洞攻击事件，并迅速通知相关客户及慢雾区伙伴；2018/7/9 发出第一次预警。计划：2018/7/11 不出意外，细节报告会正式公开。[2018/7/9]

没有发生共识失败

有一点需要明确的是，客户端之间没有发生共识失败，也就是说网络恢复时，所有客户端都能就链头状态达成共识，也就意味着信标链不会从根本上失败，也不需要进行任何硬分叉。

经验

我们将会花更多时间对这个插曲进行全面反思和总结，以下是我个人的一些陋见。

时间同步的重要性

高度依赖第三方时间服务对于网络来说是一个致命点。碰巧的是，ConsenSysTX/RX研究团队的AlexVlasov之前就撰文详尽阐释了时间同步及其在以太坊2.0网络中的重要性。他的工作在飞速进展当中，或许这也是一次让大家关注到这个方面的契机。此处是他的相关文章和ethresear.ch贴文。

客户端多样性的意义

理想情况是我们会有四个及以上独立客户端，每个客户端节点所占比例不超过网络的30%。如此一来，即使有一个客户端出现了问题，而影响都不足以引起我们的注意。

就算我们无法达到这种理想情况，但是降低单个客户端的极高使用率也能使得网络更加强健。假设这次只有50%的验证者下线而非80%，网络也会更容易恢复。这是因为当客户端出现问题时，会影响网络的区块产生、证明打包、广播效率、点对点通信以及同步，而这些因素也会对剩余的验证者产生连带效应。

备用方案的有效性

一些质押者能够切换签名密钥到其他客户端的热备份节点。这无疑使非常棒的安全网络，虽然需要当心避免被罚没：新验证者可能对于既有验证者的投票历史一无所知，因此可能做出相悖的投票。

在将来，一旦我们完成了新的API，应该可以实现在不同的信标节点之间切换验证者客户端的能力，而不仅仅是密钥。例如，一个Prysm验证者能够轻易地脱离Prysm信标节点，并且重新连接到Teku信标节点。这能够解决上面提到的罚没问题。

质押者的责任感

目前参与Eth2并不是“一劳永逸”的事。质押者们需要保持一定注意力，游走于论坛之间，为开发者提供反馈并且能够在短时内更新客户端。我非常支持大家运行自己的个人验证者，但前提是对自己应承担的责任有所意识。

欲速则不达

为什么总是在周五傍晚出岔子？

即使发生在这个时间，Prysmatic团队做出的响应令人惊叹。详情请参阅该团队的事件报告。我以下的表述并非意在给Prysmatic团队带来不良影响，他们的工作的确非常出色，而是为Teku团队在面临相似处境的时候提供经验。

当有这么多用户失去资产的时候(即使只是测试币)，并且网络处于高压状态下，自然而然会想要做出迅速的反应，但是有时可能欲速则不达。

这次事件中有两件事是可以避免的。首先，在初始修复版本Alpha.21中有一个缺陷，导致要求用户在17小时后进行回滚。

据Prysmatic团队Raul的说法，此缺陷是造成随后出现网络混乱的原因。其次，团队在处理情况时无意中删除了其1024个验证者的防罚没记录数据库，导致大部分验证者被罚没。

任何一个客户端都可能会发生类似情况。所以即使处于高压状态下，无论是开发者还是用户，我们所有人都要沉稳应对，不能一味追求速度。因此当我们在尝试恢复网络时，遵循了慢工出细活的方式。

暴露问题以绝后患

最后，这次插曲其实是有必要的。如果测试网中什么都没测试出来，那它有何意义？一直处于顺滑运行的状态显然是不现实的。

这次是一场了不起的考验！这也许是网络所能遭受的最严重的一类冲击，就算让我们自己来设计，可能也设计不出这样的测试。让测试网遭受这种程度的冲击正是我们强化客户端所需的必备条件。

上周TheBlock在文章中引用了我的陈述：

在邮件中，PegaSys工程师BenEdgington写道Medalla“是首个具备主网规模和配置的测试网”。

“这是首次大规模试验，而之前只是屏幕上的规范，或是玩具网络。点对点网络中有许多方面需要进行测试和优化。到目前为止，一切都在正常运行中，但是在我们能确保无误之前，还需要更多的时间，更广的规模以及更大的网络压力”。

说实话，还真是盼啥来啥。

下一步是什么？

目前，所有客户端团队都在致力于强化客户端，使其能够应对极端的网络情况。问题不大，我们应该在接下来的几天内就能使Medalla恢复到正常状态，可能会对所有验证者的余额产生影响，也会有一些验证者面临罚没。

如果在这之后，即使网络能正常运行，但验证者参与率还是无法回升，那么我们可能会考虑从头开始，重新部署存款合约(重新创世或许也是一个不错的选择)。但这只是现阶段的一个备选方案。

Medalla万岁！

原文链接：https://hackmd.io/@benjaminion/wnie2_200817

来源：What'sNewinEth2?

作者：BenEdgington

郑重声明：本文版权归原作者所有，转载文章仅为传播更多信息之目的，如作者信息标记有误，请第一时间联系我们修改或删除，多谢。

比特币价格数字艺术:8.18币侠晚间：比特币小时级别调整，尽快布局多单。

1900/1/1 0:00:00

比特在在昨日一波冲高后价格来到12450附近区域,直到现在略有回调。站在更小的级别的角度来看多空转换,MA5、MA10日线朝下空头排列打开下跌趋势.

CoinwLIF:阿祖论币：空头持续施压，这次会不会是一场浩劫

1900/1/1 0:00:00

今天周四,各位朋友早上好！阿祖谨代表币达人分析团队,给各位朋友送来清晨的问候和祝福,愿工作顺利,生活美满幸福.

以太坊交易所Bithumb:【活动】“BG Learning 第一期-MANTRA DAO(OM)” 发奖公告

1900/1/1 0:00:00

尊敬的BithumbGlobal用户：BithumbGlobal已对BGLearning第一期-MANTRADAO活动奖励进行统计和发放,请前往活动页面查看.

莱特币TCOIN:趋势论币：不管结果如何？比特币这个位置必须看一波中线多单

1900/1/1 0:00:00

比特币在本周一疯狂拉升突破12000美元关口后,最高到达12450美元附近。但是好景不长,周二就开始一路阴跌,并且晚间跳水直接跌破12000美元的关口,今日周三日间继续释放空头力量延续下跌,打到.

金星链

以太坊:以太坊Medalla测试网“崩溃”事件始末

金星链