TER:NNS 20461提案是如何通过不增加物理设备优化IC内存系统性能

?

InternetComputer上运行的所有开放网络服务、DeFi、Dapp、NFT等泛平台都是通过Canisters组成,Canisters的自主服务和多元化可组合特性推动非凡的网络效应,基于这种特性是开发者可以在IC上重新构想任何去中心化应用。自5月IC主网上线至今已有数W个Canisters被创建托管,在这数W个Canisters中的许多Canisters组成了完整的Web3.0Dapp。

?

随着IC链上Canisters和用户的快速增长,IC子网的性能需求也在逐渐增长:最近内存密集型Canisters的增长表明IC的内存系统在重负载下存在性能瓶颈。这篇博文描述了NNS20461提案的性能是如何优化IC的内存系统内存的详细信息)。

Connext宣布Amarok升级已上线,允许开发者构建跨链应用:2月3日消息,跨链互操作性协议Connext宣布其Amarok升级已上线,允许开发人员构建跨链应用程序,此举可以改善链上用户体验。升级还允许去中心化金融交易,例如流动性提供以解决流动性碎片化问题。据悉,此次升级在于改善与去中心化应用程序交互时的用户体验。

此前报道,1月31日,跨链互操作性协议Connext宣布其Amarok升级已完成主网测试,已在以太坊、Polygon、Arbitrum、Optimism、Gnosis链和BNB上软启动,为了鼓励用户为协议提供更多的流行性,Connext将对接下来三个月内每条链上提供流动资金量排名前30%的地址奖励Galxe NFT。[2023/2/3 11:44:48]

曼哈顿牙科诊所Upper East Dental Innovations接受比特币等加密支付:金色财经报道,位于纽约曼哈顿的高端牙科诊所Upper East Dental Innovations现已接受比特币、以太坊、狗狗币作为付款方式。它声称是第一家在纽约向加密货币“敞开大门”的牙科诊所,创始人Sharde Harvey DDS博士表示:“我可以看到加密货币的未来,因为它更快、更高效、更具成本效益并且实际上更安全。”[2022/3/24 14:14:25]

?NNS20461提案详情:https://dashboard.internetcomputer.org/proposal/20461

提案功能升级后的优化结果:

在9月14日NNS20461提案被受理之后,提案中的优化功能逐步部署到所有InternetComputer子网中,图1-3显示了升级时优化对重负载子网的影响,你可以看到以下两个主要改进;

1、增加和更稳定的区块终结:断断续续的终结率从每秒0.5个区块恢复到1个区块的预期水平。

2、改进消息执行时间:执行消息的平均时间提高了约3倍,最大值提高了约10倍。

Solana官方发布Mainnet-Beta 1.6.25版本 修复验证器逻辑漏洞:9月15日消息,Solana官方发布Mainnet-Beta 1.6.25版本。该版本更新包括修复验证器wait_for_supermajority逻辑中的active-stake u64溢出。Solana Status 建议尽快更新至该版本。

此前消息,公链 Solana 的主网 Beta 版自北京时间昨夜 19:52 开始超过12个小时出现不稳定状况,Solana Status 称,Solana 验证人社区选择协同重启网络,快照高度为 slot 96542804。[2021/9/15 23:26:03]

?图?1.?优化推出前后的区块终结率。红线之后是优化升级后的区块终结率。

声音 | Enneking:加密货币最终会在金融系统中起到非常重要的作用:据bitcoinexchangeguide报道,Digital Capital Management的创始人Enneking称,六年前,当我第一次听说比特币和加密货币时,我不相信它会活下来。一年左右后,生存不是问题。现在我觉得加密货币和比特币已经存在,并且它们最终会在金融系统中起到非常重要的作用。比特币已经暴跌83.4%,可能已经接近底部,但市场上还没有足够的资金流入。[2018/12/17]

?图2.优化推出前后的消息执行平均时间。

Coinness分析:BTC多空势力逐渐均衡 多方处于有利价位:据Coinness文章分析,今日BTC日线再次回踩10日均线,进一步确定了多方力量的放缓姿态。同时在今日下午16时BTC小时线上出现了激烈的多空博弈,随后17时再出现一根十字星K线,证明多空双方分歧较大,正在选择方向的博弈中。目前看多方耗费了较多的能量,但并没有实质性突破,只是勉强守住了失地。BTC 4小时线当前形成了一个坡度较缓的上升通道,由于通道下沿(约$9000)与上沿(约$9600)间距较大,而BTC正处于中间价位,周末大概率会在该通道内波动。BTC短期小时线接近布林带上轨,依然有可能再次回踩$8900一线,如果跌破BTC将首先回落至$8300附近,但如果BTC价格能持续收于$9300之上,将有望再次对200日均线($9894)发起冲击。[2018/4/28]

?图3.优化推出前后的最长消息执行持续时间。

Canisters正交持久化:

Canisters可以接收和执行两种类型的消息:查询调用和更新调用,查询调用只是执行一个读取当前Canisters的状态操作而不更改该Canisters的函数的调用,并且查询调用在Wasm内存中执行的所有修改都会被丢弃。而更新调用消息允许更改Canisters的状态并保留更改,并且更新调用消息的执行会自动保留所有内存更改,并使用它们可用于后续更新消息和查询消息,这个概念被称为正交持久化。

任何正交持久化的实现都必须解决两个问题:

如何将持久内存映射到Wasm内存中;如何跟踪Wasm内存中的所有修改,以便以后可以持久保存。IC当前正交持久化的实现使用页面保护来解决这两个问题,当消息开始执行时,我们将Wasm内存的整个地址范围划分为4KiB块,称为页面。最初使用操作系统的页面保护标志将所有页面标记为不可访问,这意味着第一次内存访问会触发页面错误、暂停执行并调用我们的信号处理程序。然后信号处理程序从持久内存中获取相应的页面并将该页面标记为只读之后,对该页面的后续读取访问将会成功,无需信号处理程序的任何帮助。然而第一次写入访问将触发另一个页面错误,并允许信号处理程序记住该页面已修改,并将该页面标记为可读和可写,这意味着对该页面的所有后续访问都将成功,无需调用信号处理程序。

页面保护详情:https://www.gnu.org/software/libc/manual/html_node/Memory-Protection.html

调用信号处理程序和更改页面保护标志是昂贵的操作,读取和写入大块内存的消息会导致此类操作的风暴,从而降低整个系统的吸能。这是在目前在重负载下观察到的性能瓶颈。请注意,信号处理程序是在InternetComputer推出之前编写的,其主要优先事项正确性而不是性能。

Canisters并发查询执行:

Canisters是按照顺序一个接一个执行更新消息,相比之下,查询消息可以相互并发运行并更新消息,对并发执行的支持使得内存实现更具有挑战性,例如:一个Canisters正在H区块高度执行更新消息,同时仍然有一个长时间运行的查询消息,该查询消息更早在区块高度H-K处开始。这意味着同一个Canisters可以同时激活多个版本的内存。

这个问题的一个简单解决方案是在每个更新消息后复制整个内存,这个过程会漫长,并且会使用大量的存储空间,因此当前IC的内存实现采用不同的路线:该路线将修改的内存页面保存在名为PageDelta持久树数据结构中,该结构基于FastMergeableIntegerMaps。每隔一定时间,每N轮都会有一个检查点时间,在克隆文件以保留其先前版本后,将修改的页面提交到检查点文件,在克隆文件以保留其先前版本后,将修改的页面提交到检查点文件中,图4显示了Wasm内存是如何PageDelta和检查点文件构建的。

图?4.a)?检查点文件存储最后一个检查点的?Wasm?内存。b)?自上次检查点以来修改的页面存储在称为?PageDelta?的持久数据结构中。c)Wasm?内存是由信号处理程序通过复制检查点文件页面和修改页面来构建的。

PageDelta详情:https://en.wikipedia.org/wiki/Persistent_data_structure

优化1:内存映射检查点文件

第一个优化是将内存映射到检查点文件页,这通过在同时运行的多个消息之间共享页来减少内存使用,这种优化还通过避免读取访问时的页复制来提高性能。因为信号处理程序调用次数与之前保持一致,经过内存映射检查点优化后信号风暴问题仍然存在。

优化2:查询中的页面跟踪

查询修改所有内存页在执行后都会被丢弃,这意味着信号处理程序不必跟踪查询的修改页面,但是信号处理程序的没有实现区分更新消息和查询消息,我们为查询引入了快速路径,在第一次访问时将页面标记为可读和可写,这种简易的优化使查询速度平均提高了1.5到2倍。

优化3:分摊预取页面

最有影响力的优化背后的想法很简单:如果我们想减少页面错误的数量,那么我们需要为每个信号处理程序调用做更多的事情。新的信号处理程序不是一次获取一个页面,而是尝试推测性的获取更多页面,此处需要适当的平衡,因为预获取太多页面可能会降低仅访问少数页面的小消息性能。优化计算紧接在当前页面之前的访问页面的最大连续范围,它使用范围大小为做预取更多页面的的提示,通过这种方式,预取的成本由以前访问的页面分摊,因此优化将内存密集型消息中的页面错误数量减少了一个轻量级。

总结:最初的信号处理程序是在InternetComputer之前编写的,重点是正确性而不是性能,该区域需要针对性能进行优化也就不足为奇了,然而InternetComputer的快速增长需要比预期更早的进行优化,这些优化不仅消除了一个不需要增加物理设备的性能瓶颈,也为未来更多部署在ICDapp和增长用户做出承载准备。

?

郑重声明: 本文版权归原作者所有, 转载文章仅为传播更多信息之目的, 如作者信息标记有误, 请第一时间联系我们修改或删除, 多谢。

金星链

[0:15ms0-1:400ms