阶段式同步重构自Go-Ethereum的完全同步模式,以实现更好的性能。
阶段式同步需要进行大量读写操作。虽然我们的目标是能够在机械硬盘上同步节点,但是我们仍建议使用固态硬盘。
顾名思义,阶段式同步需要依次执行10个阶段。
阶段式同步是如何运作的
Turbo-Geth客户端会向每个对等节点了解该节点的HEAD区块,然后依次执行每个阶段、寻找本地HEAD区块和对等节点的HEAD区块之间缺失的区块。
第一个阶段会设置本地HEAD区块。
各阶段会按顺序执行。在每个阶段执行期间,只有节点本地的状态达到目标状态,该阶段才会结束。
也就是说,在理想情况下,每个阶段只需执行一次,即可完成初始同步。
最后一阶段结束后,整个同步流程会重新开始,寻找新的区块头下载。
数据:以太坊域名服务在空投ENS后完全稀释市值达到54亿美元:11月9日消息,CoinGecko数据显示,以太坊域名服务(ENS)治理代币ENS的完全稀释市值已经达到54亿美元。“完全稀释(fully diluted)”是指如果ENS代币的总供应量处于流通状态的市值。ENS代币的最大供应量为100000000枚,目前只有十分之一在流通。截至发稿时行情显示,ENS现报46.09美元,24小时上涨155.7%。(Decrypt)[2021/11/10 6:42:31]
如果你在两个阶段之间重启应用,应用会从第一阶段开始重启。
如果你在某个阶段执行期间重启应用,应用会从当前阶段开始重启,以完成该阶段。
每个阶段需要耗时多久?
通过下方的饼状图,我们可以看出每个阶段的耗时占比。虽然这些数据并不精确,但是足以作为参考。
CRV总市值接近900亿美元已超过以太坊:据CoinGecko数据显示,CRV当前价格为29美元,而CRV代币总供应量为30.3亿枚,初始发行数量为13亿枚。据此计算,当前Curve市值为870亿美元。释放速率为每天200万CRV代币(约6000万美元)。据悉,当前以太坊总市值为478亿美元,Curve总市值目前已经超过以太坊。[2020/8/14]
重组/回退
如果区块链发生重组,我们需要“回退”部分同步数据。
回退指的是从最后一个阶段倒退回第一个阶段。但是,需要注意的一点是,我们执行完回退之后才会更新交易池,因此我们知道新的nonce。
回退的阶段顺序如下例所示。
state.unwindOrder=*Stage{
??//Unwindingoftxpool(reinjectingtransactionsintothepoolneedstohappenafterunwindingexecution)
动态 | BKCM首席执行官:CFTC将以太坊认定为商品有助于机构入场:加密投资公司BKCM首席执行官Brian Kelly称其看好美国商品期货交易委员会(CFTC)将以太坊和智能合约确定为大宗商品。Kelly表示,这样的分类将为机构投资者铺平道路:“CFTC认定以太坊是一种大宗商品,对加密领域而言是一个重磅利好。这让监管变得清晰。CFTC现在表示,‘如果你在这些智能合约平台上购买比特币,它们就是大宗商品。这为机构入场打开了大门。”Kelly解释说,他与机构的对话一直围绕着比特币和加密作为一种资产最终被禁止的可能性。不过,CFTC将以太坊列为大宗商品的决定,目前缓解了这种担忧。此前消息,刚于7月接任CFTC主席的Heath Tarbert表示,ETH是一种商品,因此属于CFTC的管辖范围。他还预计,CFTC将在不久的将来允许ETH期货在美国市场交易。(CryptoGlobe)[2019/10/13]
??stages,stages,stages,stages,stages,stages,stages,stages,stages,stages,
动态 | 以太坊未确认交易41405笔:据Etherscan.io数据显示,以太坊未确认交易41405笔。以太坊全网算力为163.76 TH/s,当前挖矿难度2040.78 TH,交易处理能力13.2 TPS。[2019/6/11]
?}
通过?ETL?进行预处理
在将数据插入数据库之前,一些阶段会使用我们的ETL框架根据键值对数据进行排序。
这样就可以极大减少数据库写入放大的情况。
因此,当我们生成索引或者说哈希值化状态时,我们会执行一个多步骤流程。
将处理过的数据写入位于数据目录的几个临时文件中;
然后使用一个堆栈把临时文件中的数据插入到数据库中,并且使按照能够最小化数据库写入放大现象的顺序插入数据。
这种优化有时会将写入速度提高几个数量级。
声音 | 以太坊基金会研究员:以太坊股权证明将于6月30日完成:据coindesk消息,在以太坊开发商之间的每两周一次的电话会议中,以太坊基金会研究员Justin Drake说,以太坊第一阶段过渡到股权证明网络的代码规范是“正常”的,将于6月30日完成。以太坊一直在进行重大升级,称为以太坊2.0,这将彻底改变170亿美元网络创建数据块和验证交易的方式。[2019/5/3]
各阶段
每个阶段都包含两个函数,分别是向前推进阶段的ExecFunc?和向后回退阶段的?UnwindFunc。
从理论上来说,部分阶段可以离线工作,但是当前版本并未实现这一功能。
阶段1:下载区块头
在这一阶段,我们会下载本地HEAD区块和对等节点的HEAD区块之间的所有区块头。
这一阶段是CPU密集型的,适合使用多核处理器,因为要验证区块头的工作量证明。
由于区块链重组,大多数回退都是在这一阶段开始的。
这一阶段会推动本地HEAD的指针。
阶段2:区块哈希值
从区块头中抽取出一个从区块哈希值映射成区块号的索引表,以支持更快速的查找功能,并让同步过程对机械硬盘更为友好。
阶段3:下载区块体
在这一阶段,我们会将上一阶段已下载区块头的区块体也下载下来。
这一阶段需要保持良好的联网连接。绝大多数数据都在这一阶段下载。
阶段4:复原发送者
这一阶段会复原出并存储每个已下载区块中的每笔交易的发送者。
这一阶段同样是CPU密集型的,适合使用多核处理器。
这一阶段不需要联网。
阶段5:执行区块
在这一阶段,我们会执行之前下载的所有区块中的每一笔交易。
需要注意的一点是,在执行区块的过程中,我们不会验证根哈希,甚至不会创建默克尔树。
这一阶段是单线程的,无需联网,需占用大量磁盘空间。如果区块执行失败,可以回退该阶段。
阶段6:计算状态根
这一阶段会构建默克尔树,并验证当前状态的根哈希。
这一阶段也会构建中间哈希值,并将它们存储到数据库中。
如果之前没有存储任何中间哈希值,这一阶段会构建出完整的默克尔树及其根哈希。
如果数据库中没有中间哈希值,这一阶段就会利用区块的历史记录来弄清楚哪些哈希值已经过时,哪些哈希值是最新的,然后使用最新的哈希值来构建部分默克尔树,只重构过时的哈希值。
如果根哈希无法匹配,就会向后回退一个区块。
这一阶段不需要联网。
阶段7:生成哈希值化状态
在执行期间,Turbo-Geth使用无格式状态存储。
无格式状态:在标准状态中,账户和存储项的地址是?keccak256(address)?,但是在一般状态中,二者的地址就是?address?。
尽管如此,为了确保一些API能够正常运作并与其它客户端保持兼容,我们也会生成哈希值化状态。
如果哈希值化状态不是空值,我们会查看历史记录变更集,并且只更新已更改的项。
这个阶段不需要联网。
阶段8、9、10?:生成索引
同步期间会生成3个索引。
这3个索引可能会被禁用,因为所有API都不使用它们。
这一阶段不需要联网。
交易查询索引
该索引表由从交易哈希值到区块号的映射构成。
账户历史索引
该索引存储了从账户地址到区块列表的映射。
存储历史索引
该索引存储了从存储项地址到区块列表的映射。
阶段11:交易池
在这一阶段,我们会启动交易池或更新其状态。例如,如果我们已下载的区块中包含了某些交易,就把这些交易从交易池中移除。
在回退时,我们会将被回退的区块中的交易重新添加到交易池中。
这个阶段不需要联网。
原文链接:
https://github.com/ledgerwatch/turbo-geth/tree/master/eth/stagedsync
作者:?AlexSharov
翻译&校对:闵敏?&?阿剑
郑重声明: 本文版权归原作者所有, 转载文章仅为传播更多信息之目的, 如作者信息标记有误, 请第一时间联系我们修改或删除, 多谢。