DATA:以太坊 Input Data 解析

前段时间,Poly Network 被盗事件的一个小插曲,一地址向黑客地址转账在 input data 中告知其 USDT 已被冻结,不要使用 USDT,黑客知晓后向该地址转账 13.37 ETH。

事后很多人便通过 input Data 在区块链上“聊天”向黑客“索要”虚拟货币,那么我们经常在区块链浏览器中看到的 input Data 到底是什么?知道创宇区块链安全实验室 为您解答。

在以太坊协议中,当交易(transaction)为合约创建时,input data 是账户初始化程序的 EVM 代码;

而当交易(transaction)为消息调用时,input data 是合约函数调用数据。正常情况下简单的消息调用如调用转账函数时需要填写你要转账的地址 _to 和你要转账的数量 _amount,这些基本信息都包含在 input data 里面。我们通过一个调用合约的转账交易具体分析,来理解消息调用时 input data 的结构。

解析形式:

Bernstein:以太坊链上活动升温,上海升级将是下一个重要催化剂:2月6日消息,Bernstein在周一的一份研究报告中表示,以太坊最近见证了更健康的链上活动,由Yuga Labs推出的小游戏导致用户对NFT的兴趣有所提高。

报告称,以太坊区块链的每日费用自年初以来已经翻了一番多,从大约200万美元增至400万至600万美元,而ETH上涨了约35%。

Bernstein指出,以太坊通胀已经持续了两周多的负增长,预计随着链上活动和需求的增加,将出现进一步的通缩。以太坊的下一个重要催化剂仍然是将于3月中旬进行的上海升级,届时将启用质押以太坊的提现。(CoinDesk)[2023/2/6 11:50:08]

原始形式:

我们将原始的 input data 分为三个部分进行分析:

0xa9059cbb:函数标识符

000000000000000000000000345d8e3a1f62ee6b1d483890976fd66168e390f2: 第一个参数为 address 即你要转账的地址,并补位到 32 字节即 64 个 16 进制字符

0000000000000000000000000000000000000000000054b7d8ed70650b290000: 第二个参数为 value 即你要转账的数量,并补位到 32 字节即 64 个 16 进制字符

数据:以太坊链上NFT销售总额突破300亿美元:金色财经消息,据cryptoslam数据显示,以太坊链上NFT销售总额已突破300亿美元,截至目前为30,013,252,119美元,交易总量为15,700,577笔。当前Ronin区块链NFT销售总额为4,093,005,021美元,交易总量为17,871,105笔,排名第二;Solana位列第三,链上NFT销售总额为2,667,490,282美元,交易总量为14,210,483笔。[2022/10/21 16:33:56]

?通过对比分析我们可以发现 input data 的基本结构为函数标识符+参数

函数标识符

这里的函数标识符即为函数选择器,根据官方文档可知函数选择器是某个函数签名的 Keccak(SHA-3)哈希的前 4 字节(高位在左的大端序)。

我们可以通过代码

bytess4(keccake256("transfer(adddress,uint256)"))或者在线工具获取这种函数签名。下图可以看出加密结果的前四个字节 (a9059cbb) 跟 input data 中函数标识符一致。

这里之所以要将函数签名截断到四个字节是考虑到 Gas 成本问题。

在一笔交易中0字节需要支付 4 gas,而非0字节需要 68 gas 也就是 0 字节的 17 倍。在 SHA-3 加密中生成的 32 字节随机字符串更倾向于多的非 0 字节,所以大概成本是32x68=2176 gas,而截断成本大概为 4x68=272 gas,可见截断到四个字节能够节省约 8 倍的 gas 费。

BC Tech Group联合创始人:看好比特币和以太坊等数字资产:OSL和BC Technology Group的联合创始人兼董事总经理Dave Chapman表示,他的公司非常看好央行数字货币和稳定币,根据查普曼的说法,CBDC将在未来十年内普及,此外,他还看好比特币和以太坊等“传统数字资产”。(U.today)[2021/6/7 23:18:51]

而函数标识符的作用是指定调用哪一个函数,在同一个合约中两个不同函数的 SHA-3 签名的前 4 字节相同的概率是十分小的,所以截断到四个字节实际不会影响函数调用。

参 数

在 evm 执行字节码的约定中,静态类型左补齐零至 64 长度,而动态类型则是右补齐零至 64 长度。归纳下常见的静态类型:uint,bool,Address,bytes, 动态数组类型:bytes,string,address[],bytes32[].....我们通过 pyethereum的ABI编码函数 来研究不同数据类型的编码方式。静态类型先导入 encode_abi 函数

import rlp ?from ethereum.abi import encode_abi

我们以函数 transfer(address,uint 256) 为例

> encode_abi(["address", "uint256"],[345d8e3a1f62ee6b1d483890976fd66168e390f2,1]).hex()000000000000000000000000345d8e3a1f62ee6b1d483890976fd66168e390f20000000000000000000000000000000000000000000000000000000000000001

孙宇晨:欢迎以太坊上的项目迁移到波场以告别拥堵:2月19日,针对此前币安暂停以太坊和基于以太坊的代币取款(随后恢复),孙宇晨发微博称,欢迎以太坊上的项目迁移到波场上来,告别拥堵,把握牛市。[2021/2/20 17:31:59]

对于小于 32 字节的定长数组会被自动填充到 32 字节:

> encode_abi(["int8"],[[1, 2, 3]).hex()// 自动填充 0000000000000000000000000000000000000000000000000000000000000000100000000000000000000000000000000000000000000000000000000000000020000000000000000000000000000000000000000000000000000000000000003

动态类型动态类型编码要稍微复杂一些,需要先计算偏移量进行占位处理,我们通过一个简单的例子来具体说明。

> encode_abi( ?["uint256[]", "uint256[]", "uint256[]"], ?[[0xa1, 0xa2, 0xa3], [0xb1, 0xb2, 0xb3], [0xc1, 0xc2, 0xc3]]).hex()// 参数 1 的偏移量:32*3=96 十六进制 0x600000000000000000000000000000000000000000000000000000000000000060// 参数2的偏移量=参数 1 偏移量+参数 1 数据部分长度=96+32*4=224 十六进制0xE000000000000000000000000000000000000000000000000000000000000000e0// 参数3的偏移量=参数 2 偏移量+参数 2 数据部分长度=224+32*4=352 十六进制0x1600000000000000000000000000000000000000000000000000000000000000160// 偏移量 0x60 位置开始传入参数 1 的数据0000000000000000000000000000000000000000000000000000000000000003//元素个数00000000000000000000000000000000000000000000000000000000000000a1//第一个数组元素00000000000000000000000000000000000000000000000000000000000000a2//第二个数组元素00000000000000000000000000000000000000000000000000000000000000a3//第三个数组元素// 0xe0位置。参数 2 的数据000000000000000000000000000000000000000000000000000000000000000300000000000000000000000000000000000000000000000000000000000000b100000000000000000000000000000000000000000000000000000000000000b200000000000000000000000000000000000000000000000000000000000000b3//0x160 位置。参数 3 的数据000000000000000000000000000000000000000000000000000000000000000300000000000000000000000000000000000000000000000000000000000000c100000000000000000000000000000000000000000000000000000000000000c200000000000000000000000000000000000000000000000000000000000000c3

金色晨讯 | 怀俄明州通过认定加密货币为货币的法案 以太坊开发者决定推迟ProgPow升级:1.怀俄明州通过认定加密货币为货币的法案。

2.ADA首席执行官:ADA不受POS v3数字货币漏洞影响。

3.以太坊开发者决定推迟ProgPow升级。

4.Grin全职开发者完成本轮筹款计划既定目标。

5.毕马威:加密资产具有颠覆性潜力 但必须机构化。

6.马来西亚证券委员会修订其“认可市场指南” 引入加密货币交易平台法规。

7.雄安发布《垃圾处理过渡设施项目招标公告》 用区块链进行项目资金管理。

8.马来西亚数字资产交易市场将与股权众筹(ECF)、P2P融资合并。

9.刘强东新年公开信:通过区块链等科技提升用户体验和升级商业模式。[2019/2/2]

短地址攻击经过前面的分析当静态类型如 address 长度不足 32 字节时 EVM 会根据规则将长度补齐到 32 字节,如果当转账的地址以00结尾,如0x641988625108585185752230bde001b3ebd0fc00,转账时将地址后面的两个零去掉,EVM 依然会认为 address_to是 32 位的,所以它会从_value的高位取 0 来补充,amount的位数会多两位也就是会乘以256。攻击过程如下:

将恶意转账地址最后一个字节的 0 去掉函数标识符:a9059cbb转账地址:000000000000000000000000641988625108585185752230bde001b3ebd0fc转账金额:00000000000000000000000000000000000000000000000000000000000000001由于 EVM 的补位规则,解析结果为:0xa9059cbb000000000000000000000000641988625108585185752230bde001b3ebd0fc0000000000000000000000000000000000000000000000000000000000000000100我们分解后发现,转账金额已经多了两位也就是多了一个字节,即为原来转账的 256倍函数标识符:a9059cbb转账地址:000000000000000000000000641988625108585185752230bde001b3ebd0fc00转账金额:00000000000000000000000000000000000000000000000000000000000000100

如何在 input data 附着信息

在以太坊中直接进行转账交易的 input data 字段默认是没有内容的,但是我们可以通过设置钱包实现文章开头的“聊天功能”。我们以 MetaMask 钱包为例展示如何通过转账在 input data 字段附着一些额外的信息。

1、首先我们需要打开钱包高级选项的显示十六进制数据开关

2、在转账时将你要附着的信息通过十六进制编码后填入下方十六进制数据中,记得在开头加上 0x 然后进行转账

3、转账成功后在 etherscan 中就能够看到附着信息

总结

我们能够通过交易中的 input data 将一些信息永久存储在区块链中,可以通过此项技术在食品药品监管部门的产品防伪溯源、财税部门的电子票据打假验真、学术成果存证等方面实现应用落地。

郑重声明: 本文版权归原作者所有, 转载文章仅为传播更多信息之目的, 如作者信息标记有误, 请第一时间联系我们修改或删除, 多谢。

金星链

BNBDAS:时代观察 | 分布式身份实现方法与欧洲监管格局

尽管技术发展和标准对于实现新的数字身份框架非常重要,但法律和法规问题也同样重要。文/欧盟区块链瞭望台和论坛编译/Meagreeee、柳叶惊鸿 对于一个运行中的社会经济来说,没有什么比身份更重要了.

[0:15ms0-1:15ms