CRO:Scroll联合创始人：如何从0到1构建zkEVM

演讲分成四个部分，第一部分张烨介绍了开发背景以及我们为什么首先需要zkEVM以及为什么它在最近两年间变得如此受欢迎，第二部分通过一个完整的流程，讲解如何从头开始构建zkEVM包括算术化和证明系统，第三部分通过一些有趣的研究问题来谈论了Scroll 在构建 zkEVM时遇到的问题，最后介绍了一些其他使用zkEVM的应用。

传统的Layer 1 区块链会有一些节点通过P2P网络共同维护。他们在收到用户的交易时，会在EVM的虚拟机内执行，读取调用合约和存储，并依照交易更新全局的状态树。

这样的架构的优势在于去中心化和安全性，缺陷就是在L1上的交易手续费昂贵，并且交易确认缓慢。

ZK-Rollup的架构中，L2 网络只需将数据和验证数据正确性的证明上传至 L1，其中证明通过零知识证明电路计算而来。

在早期的ZK-Rollup中，电路是针对特定应用而设计，用户需要将交易发送给不同的证明者，然后不同应用的ZK-Rollup再将自己的数据和证明提交至L1。这样带来的问题是，丧失了原先 L1 合约的可组合性。

Scroll 所要做的是原生的zkEVM方案，是一种通用型的ZK-Rollup。这样不仅对用户而言更友好，对于开发者而言也可以获得在L1上的开发体验。当然这背后的开发难度非常之大，并且现在的证明生成的代价也非常高。

幸运的是，零知识证明的效率在过去两年里已经大幅提高了，这也是为什么在最近两年zkEVM变得如此受欢迎。至少有四个原因让它变得可行，第一是多项式承诺的出现，在原先Groth16证明系统下，约束的规模非常之庞大，而多项式承诺可以支持更高阶的约束，缩小证明规模；第二是查找表和自定义门的出现，可以支持更灵活的设计，使证明更加高效；第三是硬件加速方面的突破，通过GPU，FPGA和ASIC可以将证明时间缩短1-2个数量级，第四是在递归证明下，可以将多个证明压缩成一个证明，使得证明变得更小更易于验证。所以结合这四个因素，零知识证明的生成效率要比两年前高出三个数量级，这也是 Scoll 的起源。

跨链流动性聚合器Router Protocol已集成Scroll测试网:6月27日消息，跨链流动性聚合器Router Protocol已集成Layer2解决方案Scroll测试网，支持开发人员构建IDApp，以扩展到Scroll，同时Scroll内的项目也可以通过Router Protocol访问多个区块链网络。[2023/6/27 22:01:55]

根据Justin Drake的定义，zkEVM可以分为三类，第一类是语言级别的兼容，主要原因是EVM不是为ZK而设计，有很多对ZK不友好的操作码，因此会造成大量的额外开销。因此像Starkware和zkSync选择在语言层面将Solidity或者Yul编译到ZK友好的编译器中。

第二类是 Scroll 在做的字节码层面的兼容，是直接证明EVM的字节码处理正确与否，直接继承了以太坊的执行环境。在这里可做的一些取舍是，使用和EVM不一样的状态根，例如使用ZK友好的数据结构。Hermez 和 Consensys 也在做类似的事情。

第三类是共识层面的兼容，这里的取舍在于不仅需要保持 EVM 不变，还包括储存结构等实现以太坊完全兼容，代价是需要更长的证明时间。而Scroll 正在和以太坊基金会的 PSE 团队合作构建，来实现以太坊的ZK化

第二部分，张烨向大家展示了如何从零开始建立ZKVM。

首先，在ZKP的前端部分，你需要通过数学的算术化来表示你的计算，最常用的就是线性的R1CS，以及Plonkish 和 AIR。通过算术化得到约束后，在ZKP的后端你需要运行证明算法，来证明计算正确性，这里列举了最常用的多项式交互式谕示证明 (Polynomial IOP) 和多项式承诺方案 (PCS)。

在这里我们需要证明 zkEVM，Scroll 使用的是Plonkish，Plonk IOP，以及KZG的组合。

为了理解我们为什么使用这三者的方案。我们首先从最简单的 R1CS 开始，R1CS中的约束，是线性组合乘以线性组合等于线性结合。你可以加上任何变量的线性组合而没有额外的开销，但是在每个约束中阶数最大是2。因此对于阶数较高的运算，需要的约束就越多。

某开发者推出类似于比特币铭文的以太坊铭文协议Ethscriptions:6月19日消息，Genius.com联合创始人兼前首席执行官Tom Lehman于上周六推出了名为Ethscriptions的协议，该协议类似于比特币铭文，可将金融和任意数据写入以太坊区块链主链，用户可以刻录任何类型的文件，只要文件大小不超过96KB。然而，根据其创建者的说法，它目前只允许使用图像，但未来会有所改变。

根据Lehman的说法，这些铭文利用了以太坊calldata，指的是在对智能合约的调用中提供的数据；该协议比使用合约存储更便宜，更去中心化，并可保证所有有效内容的全球唯一性。Lehman表示，在不到18小时的时间内已有近3万个Ethscriptions被创建。[2023/6/19 21:46:34]

而在 Plonkish 中，你需要将所有的变量填入表格，包括输入，输出以及中间变量的见证。在此之上，你可以定义不同的约束。在 Plonkish 中有三种类型的约束可以使用。

第一种约束是自定义门（Custom Gate），你可以定义不同单元格之间的多项式约束关系，例如 va3 * vb3 * vc3 - vb4 =0。相比R1CS来说，阶数可以更高，因为你可以定义任何一个变量的约束，并且可以定义一些非常不一样的约束。

第二种约束是 Permuation，即等价性校验 (equality checks)。可以用来检查不同单元格的等价性，常用于关联电路中的不同门，比如证明上一个门的输出等于下一个门的输入。

最后一种约束是查找表 (Lookup Table)。我们可以将查找表理解成变量之间存在一个关系，该关系可以表示成一个表。例如我们想要证明 vc7 在 0-15 范围内，在R1CS中你首先需要把这个数值分解为4位二进制，然后证明每位在0-1的范围内，这将需要四个约束。而在 Plonkish中，你可以将所有可能的范围列在同一列，只需要证明vc7属于该列即可，这对范围证明非常高效，在zkEVM中，查找表对于证明内存读写非常有用。

小结一下，Plonkish 同时支持自定义门，等价性校验和查找表，可以非常灵活的满足不同的电路需要。简单对比下STARK，STARK中每一行是一个约束，约束需要表示行与行之间的状态转换，但 Plonkish 中的自定义约束灵活性显然更高。

Secret Network已为SushiSwap WSCRT/WETH LP池添加1万枚WSCRT:3月17日，隐私公链Secret Network官方发推称，已经为SushiSwap上WSCRT/WETH LP池添加了1万枚WSCRT。用户可以同时获得SUSHI和SCRT代币。注：WSCRT为Secret原生代币SCRT的合成ERC20版本Wrapped Secret（wSCRT）。此前3月12日消息，隐私公链Secret Network宣布在SushiSwap上推出WSCRT/WETH LP温泉奖励计划。[2021/3/17 18:51:45]

现在的问题是在zkEVM中，我们如何选择前端。对于zkEVM主要有四个挑战。第一个挑战是EVM的字段是256位，这意味着需要高效得对变量进行范围约束；第二个挑战是EVM有很多ZK不友好的操作码，因此需要非常大规模的约束来证明这些操作码，例如Keccak-256；第三个挑战是内存读写问题，你需要一些有效的映射来证明你所读取的和之前所写入的是一致的；第四个挑战是EVM的执行踪迹是动态变化的，因此我们需要自定义门来适配不同的执行踪迹。出于上述的考虑，我们选择了 Plonkish。

接下来，我们看zkEVM的完整流程，基于初始的全局状态树，一笔新的交易进来后，EVM会读取存储和调用的合约的字节码，根据交易生成相应的执行踪迹例如PUSH, PUSH, STORE, CALLVALUE，然后逐步执行更新全局状态，得到交易后的全局状态树。而zkEVM是将初始的全局状态树，交易本身，以及交易后的全局状态树作为输入，根据EVM的规范，来证明执行踪迹的执行正确性。

深入EVM电路细节，每一步执行踪迹都有对应的电路约束。具体来说，每一步的电路约束包含 Step Context，Case Switch，Opcode Specific Witness。Step Context 包含执行踪迹对应的codehash，剩余gas和计数器；Case Switch 包含所有的操作码，所有的错误情况，以及该步的相应操作；Opcode Specific Witness 包含了操作码所需的额外见证，例如运算数等。

以简单的加法为例，需要确保加法的操作码的控制变量sADD设置为1，其他操作码控制变量均为零。在 Step Context 中，通过设置 gas' - gas - 3 = 0 来约束消耗的 gas 等于 3，同理约束计数器，栈指针在该步后累加1；在 Case Switch 中，通过操作码控制变量和为1来约束该步为加法操作；在 Opcode Specific Witness 中，对运算数的实际加法进行约束。

以太坊JavaScript团队发布EthereumJS虚拟机v5版本:11月26日，以太坊官方博客发文宣布，JavaScript团队已正式发布EthereumJS VM v5版本。[2020/11/27 22:19:12]

此外还需要额外的电路约束，来保证运算数从内存读取的正确性。这里我们首先需要构建一个查找表来证明运算数属于内存。并通过内存电路(RAM Circuit)来验证内存表的正确性。

同样的方法可以适用于zk不友好的哈希函数，构建哈希函数的查找表，将执行踪迹中的哈希输入和输出映射到查找表，利用额外的哈希电路 (Hash Circuit) 来验证哈希查找表的正确性。

现在我们来看zkEVM的电路架构，核心的EVM电路用于约束执行踪迹每一步的正确性，在一些EVM电路约束难度较大的地方，我们通过查找表来映射，包括Fixed Table, Keccak Table, RAM Table, Bytecode, Transaction, Block Context，然后利用单独的电路来约束这些查找表，例如 Keccak 电路用于约束 Keccak 表。

小结一下，zkEVM的完整工作流如下图所示。

因为在L1上直接验证上述的EVM电路，内存电路，存储电路等，开销巨大，Scroll 的证明系统采用了两层架构。

第一层负责直接证明EVM本身，需要大量的计算来生成证明。因此第一层证明系统要求支持自定义门和查找表，对硬件加速友好，在低峰值内存下并行生成计算，且验证电路规模小，可以快速验证。有前景的可选方案包括Plonky2，Starky，eSTARK，它们前端基本上都使用 Plonk，但后端可能使用了FRI，并且都满足上述的四个特性。另一类可选的方案包括Zcash所开发的Halo2，以及KZG版本的Halo2。

还有一些新的证明系统也有很有前景，例如最近移除了 FFT 的 HyperPlonk，而NOVA证明系统可以做到更小的递归证明。但它们在研究中只支持R1CS，如果他们未来可以支持 Plonkish 并且应用于实践，将非常实用高效。

Pickle质押奖励已上线本周将分发35000枚SCRV:流动性挖矿项目Pickle?Finance官方发推表示，Pickle质押奖励已上线，35000枚SCRV(不是CRV)将在本周分发给Pickle质押者。[2020/10/8]

第二层证明系统用于证明第一层证明的正确性，需要可以在EVM中高效进行验证，理想情况下，最好也是硬件加速友好并且支持transparent或者universal setup。有前景的可选方案包括Groth16和列数较少的Plonkish证明系统。Groth16仍然是目前研究中证明效率极高的代表，而Plonkish证明系统在列数较少的情况下，也可以达到较高的证明效率。

在Scroll，我们在两层证明系统中我们都采用了Halo2-KZG证明系统。因为Halo2-KZG可以支持自定义门和查找表，在GPU硬件加速下性能良好，且验证电路规模小，可以快速验证。区别在于我们在第一层证明系统中我们使用了Poseidon哈希，进一步提高证明效率，而第二层证明系统因为直接在以太坊上验证，仍然使用了 Keccak 哈希。Scroll 也在探索多层证明系统的可能性，来进一步聚合第二层证明系统生成的聚合证明。

当前实现下，Scroll 的第一层证明系统EVM电路有 116 列，2496 个自定义门，50 个查找表，最高阶数为9，1M Gas下需要2^18行；而第二层证明系统的聚合电路仅有 23 列，1个自定义门，7 个查找表，最高阶数为 5 ，为了聚合EVM电路，内存电路，存储电路，需要2^25行。

Scroll 在 GPU 硬件加速方面也做了非常多的研究和优化工作，对于EVM电路，优化后的GPU证明者仅需30s，相较CPU证明者提升了9倍的效率；而对于聚合电路，优化后的GPU证明者仅需149s，相较CPU提升了15倍的效率。在当前的优化条件下， 1M Gas 第一层证明系统大约需要 2 分钟，第二层证明系统大约需要 3 分钟。

第三部分，张烨谈论了一些Scroll 在构建 zkEVM 过程中有趣的研究问题，从前端的算术化电路到证明者的实现。

首先是电路中的随机性，因为 EVM 字段是256位，我们需要将其拆分成 32 个 8 位的字段，从而更高效得进行范围证明。随后我们使用随机线性组合(Random Linear Combination, RLC)的方法，利用随机数将32个字段编码成1个，只需要验证该字段就可以验证原始的256位字段。但是问题在于随机数的生成需要在拆分字段之后，才能确保不被篡改。因此 Scroll 和 PSE 团队提出了多阶段证明者的方案，来确保在字段拆分之后，再利用随机数生成RLC，该方案被封装在了 Challenge API 中。RLC在zkEVM中有许多应用场景，不仅可以压缩EVM字段成一个字段，也可以加密不定长的输入，或是优化查找表的布局，但仍然有许多开放性的问题需要解决。

电路方面第二个有趣的研究问题是电路布局。Scroll 前端之所以采用 Plonkish，是因为EVM的执行踪迹是动态变化的，需要能支持不同的约束，变化的等价性检验，而R1CS的标准化门需要更大的电路规模来实现。但Scroll 目前使用了 2000 多个自定义门来满足动态变化的执行踪迹，也在探索如何进一步优化电路布局，包括将 Opcode 拆分成 Micro Opcode，或是复用相同表格内的单元格。

电路方面第三个有趣的研究问题是动态规模。因为不同的操作码的电路规模不同，但为了满足动态变化的执行踪迹，每一步的操作码都需要满足最大的电路规模，例如Keccak哈希，因此我们实际上付出了额外的开销。假设我们可以使zkEVM动态适应动态变化的执行踪迹，这将节省不必要的开销。

在证明者方面，Scroll 在 GPU 加速上已经对MSM和NTT进行了大量的优化，但现在的瓶颈转移到了见证生成和复制数据这块。因为假设MSM和NTT占据了80%的证明时间，即使硬件加速可以将这部分效率提升若干个数量级，但原先见证生成和复制数据20%的证明时间将变成新的瓶颈所在。证明者的另一个问题是需要大量的内存，因此也需要探索更便宜更去中心化的硬件方案。

同时Scroll 也在探索硬件加速和证明算法方面，来提升证明者的效率。目前主要有两个大方向，或是切换至更小的域，例如使用64位的Goldilocks域，32位的梅森数（Mersenne Prime）等，或是坚持基于椭圆曲线（EC）的新证明系统，例如SuperNova。当然也有其他的一些别的可能路径，欢迎有想法的朋友直接联系Scroll。

在构建zkEVM时，安全性是至关重要的。PSE 和 Scroll 共同构建的zkEVM有大约3万4千行代码，从软件工程角度，这些复杂的代码库在很长一段时间内是不可能没有漏洞的。Scroll 目前在通过大量的审计，包括业内最顶尖的审计公司，来审核 zkEVM 的代码库。

第四部分探讨了其他一些使用了zkEVM的应用。

在zkRollup的架构中，我们通过在L1的智能合约，来验证在 L2 上的n笔交易是有效的。

如果我们直接验证L1的区块，那么L1的节点就不需要重复执行交易，只需要验证每一个区块证明的有效性。这样的架构方案称为 Enshrine Blockchain。目前在以太坊上直接实现难度非常之大，因为需要验证整个以太坊区块，其中会包括验证大量签名，随之带来更长的证明时间和更低的安全性。当然也已经有一些其他公链在通过递归证明，使用单个证明，来验证整个区块链，例如Mina。

因为zkEVM可以证明状态转换，它也可以被白帽所利用，来证明自己知道某些智能合约的漏洞，寻求项目方的赏金。

最后一个用例是，是通过零知识证明来证明对历史数据的声明，作为预言机来使用，目前Axiom正在做这方面的产品。最近的ETHBeijing 黑客松上，GasLockR团队正是利用了这一特性，证明了历史的Gas开销。

最后，Scroll 正在构建zkRollup的以太坊通用扩容解决方案，使用了非常先进的算术化电路和证明系统，并且通过硬件加速构建快速的验证器，证明递归。目前Alpha测试网已经上线，并稳定运行了很长时间。

当然仍然有一些有趣的问题需要解决，包括协议设计和机制设计，零知识工程和实际效率，欢迎大家加入Scroll一起构建！

来源：panewslab

原文：Ye Zhang

编译：F.F

PANews

媒体专栏

金色财经善欧巴

Chainlink预言机

白话区块链

金色早8点

Odaily星球日报

欧科云链

深潮TechFlow

BTCStudy

MarsBit

Arcane Labs

郑重声明：本文版权归原作者所有，转载文章仅为传播更多信息之目的，如作者信息标记有误，请第一时间联系我们修改或删除，多谢。

金星链

CRO:Scroll联合创始人：如何从0到1构建zkEVM

金星链