前言
前段时间,PolyNetwork被盗事件的一个小插曲,一地址向黑客地址转账在inputdata中告知其USDT已被冻结,不要使用USDT,黑客知晓后向该地址转账13.37ETH。
事后很多人便通过inputData在区块链上“聊天”向黑客“索要”虚拟货币,那么我们经常在区块链浏览器中看到的inputData到底是什么?知道创宇区块链安全实验室为您解答。
Inputdata
在以太坊协议中,当交易为合约创建时,inputdata是账户初始化程序的EVM代码;
而当交易为消息调用时,inputdata是合约函数调用数据。
正常情况下简单的消息调用如调用转账函数时需要填写你要转账的地址_to和你要转账的数量_amount,这些基本信息都包含在inputdata里面。
我们通过一个调用合约的转账交易具体分析,来理解消息调用时inputdata的结构。
解析形式:
原始形式:
Mirror宣布支持以太坊Layer2协议zkSync:金色财经报道,去中心化Web3内容发布平台Mirror宣布支持以太坊Layer2协议zkSync。[2023/7/26 15:59:00]
我们将原始的inputdata分为三个部分进行分析:
0xa9059cbb:函数标识符
000000000000000000000000345d8e3a1f62ee6b1d483890976fd66168e390f2:第一个参数为address即你要转账的地址,并补位到32字节即64个16进制字符
0000000000000000000000000000000000000000000054b7d8ed70650b290000:第二个参数为value即你要转账的数量,并补位到32字节即64个16进制字符
通过对比分析我们可以发现inputdata的基本结构为函数标识符+参数。
函数标识符
这里的函数标识符即为函数选择器,根据官方文档可知函数选择器是某个函数签名的Keccak哈希的前4字节。
我们可以通过代码bytess4(keccake256("transfer(adddress,uint256)"))或者在线工具获取这种函数签名。
下图可以看出加密结果的前四个字节(a9059cbb)跟inputdata中函数标识符一致。
Aptos链上SUCKR项目疑似rug pull,相关代币暴跌99.99%:金色财经报道,据区块链安全审计公司Beosin旗下Beosin EagleEye安全风险监控、 预警与阻断平台监测显示,Aptos链上的SUCKR项目疑似rug pull,账户地址0x7600ee2b357ff993bd00a303a00f57a4c3db44263a1e8be7862ef1266bcecff3调用mint_SUCKR(admin特权函数)函数铸造大量SUCKR代币兑换为USDT,导致SUCKR代币24h价格暴跌99.99%。[2023/3/10 12:54:24]
这里之所以要将函数签名截断到四个字节是考虑到Gas成本问题。
在一笔交易中0字节需要支付4gas,而非0字节需要68gas也就是0字节的17倍。
在SHA-3加密中生成的32字节随机字符串更倾向于多的非0字节,所以大概成本是32x68=2176gas,而截断成本大概为4x68=272gas,可见截断到四个字节能够节省约8倍的gas费。
而函数标识符的作用是指定调用哪一个函数,在同一个合约中两个不同函数的SHA-3签名的前4字节相同的概率是十分小的,所以截断到四个字节实际不会影响函数调用。
参数
在evm执行字节码的约定中,静态类型左补齐零至64长度,而动态类型则是右补齐零至64长度。
Circle CEO发推称“应撕开一些不透明资产的伪装”:11月12日消息,Circle(USDC发行方)首席执行官Jeremy Allaire发推称:“问一个简单的问题。行业内还有哪些离岸、不受监管、不透明、未经审计的公司或加密资产?是时候撕开创可贴了,让我们开始吧。”[2022/11/12 12:52:57]
归纳下常见的静态类型:uint,bool,Address,bytes,动态数组类型:bytes,string,address,bytes32.....
我们通过pyethereum的ABI编码函数来研究不同数据类型的编码方式。
静态类型
先导入encode_abi函数
importrlpfromethereum.abiimportencode_abi
我们以函数transfer(address,uint256)为例
>encode_abi(,
).hex()
000000000000000000000000345d8e3a1f62ee6b1d483890976fd66168e390f2
0000000000000000000000000000000000000000000000000000000000000001
对于小于32字节的定长数组会被自动填充到32字节:
>encode_abi("],).hex()
//自动填充0
持有32枚以上ETH的地址数量达19个月高点:金色财经报道,Glassnode数据显示,持有32枚以上ETH的地址数量达到120,992的19个月高点。[2022/9/13 13:25:23]
0000000000000000000000000000000000000000000000000000000000000001
0000000000000000000000000000000000000000000000000000000000000002
0000000000000000000000000000000000000000000000000000000000000003
动态类型
动态类型编码要稍微复杂一些,需要先计算偏移量进行占位处理,我们通过一个简单的例子来具体说明。
>encode_abi(","uint256","uint256"],
,,]
).hex()
//参数1的偏移量:32*3=96十六进制0x600000000000000000000000000000000000000000000000000000000000000060
//参数2的偏移量=参数1偏移量+参数1数据部分长度=96+32*4=224十六进制0xE000000000000000000000000000000000000000000000000000000000000000e0
数据:2020年以来稳定币最高增发逾30倍,比特币总市值最高增长9.4倍:7月27日消息,区块链数据与技术服务提供商OKLink和量化对冲基金Lucida发布链上数据对二级市场投资的价值的联合报告,称在2021年5月比特币触及历史高点后,巨鲸(1000至1万枚比特币地址)整体处于减持状态。
此外稳定币总发行量由2020年1月1日的520亿美元增长至2022年3月20日的最高点1635亿美元,涨幅为31.3倍;比特币总市值由2020年1月1日的1304亿美元增长至2021年11月10日的最高点1.22万亿美元,增长率为9.4倍。[2022/7/27 2:41:31]
//参数3的偏移量=参数2偏移量+参数2数据部分长度=224+32*4=352十六进制0x1600000000000000000000000000000000000000000000000000000000000000160
//偏移量0x60位置开始传入参数1的数据
0000000000000000000000000000000000000000000000000000000000000003//元素个
00000000000000000000000000000000000000000000000000000000000000a1//第一个数组元素
00000000000000000000000000000000000000000000000000000000000000a2//第二个数组元素
00000000000000000000000000000000000000000000000000000000000000a3//第三个数组元素
//0xe0位置。参数2的数据
0000000000000000000000000000000000000000000000000000000000000003
00000000000000000000000000000000000000000000000000000000000000b1
00000000000000000000000000000000000000000000000000000000000000b2
00000000000000000000000000000000000000000000000000000000000000b3
//0x160位置。参数3的数据
0000000000000000000000000000000000000000000000000000000000000003
00000000000000000000000000000000000000000000000000000000000000c1
00000000000000000000000000000000000000000000000000000000000000c2
00000000000000000000000000000000000000000000000000000000000000c3
短地址攻击
经过前面的分析当静态类型如address长度不足32字节时EVM会根据规则将长度补齐到32字节,如果当转账的地址以00结尾,如0x641988625108585185752230bde001b3ebd0fc00,转账时将地址后面的两个零去掉,EVM依然会认为address_to是32位的,所以它会从_value的高位取0来补充,amount的位数会多两位也就是会乘以256。
攻击过程如下:
将恶意转账地址最后一个字节的0去掉
函数标识符:a9059cbb
转账地址:
000000000000000000000000641988625108585185752230bde001b3ebd0fc
转账金额:
00000000000000000000000000000000000000000000000000000000000000001
由于EVM的补位规则,解析结果为:0xa9059cbb000000000000000000000000641988625108585185752230bde001b3ebd0fc0000000000000000000000000000000000000000000000000000000000000000100
我们分解后发现,转账金额已经多了两位也就是多了一个字节,即为原来转账的256倍
函数标识符:a9059cbb
转账地址:
000000000000000000000000641988625108585185752230bde001b3ebd0fc00
转账金额:
00000000000000000000000000000000000000000000000000000000000000100
如何在inputdata附着信息
在以太坊中直接进行转账交易的inputdata字段默认是没有内容的,但是我们可以通过设置钱包实现文章开头的“聊天功能”。
我们以MetaMask钱包为例展示如何通过转账在inputdata字段附着一些额外的信息。
1、首先我们需要打开钱包高级选项的显示十六进制数据开关
2、在转账时将你要附着的信息通过十六进制编码后填入下方十六进制数据中,记得在开头加上0x然后进行转账
3、转账成功后在etherscan中就能够看到附着信息
总结
我们能够通过交易中的inputdata将一些信息永久存储在区块链中,可以通过此项技术在食品药品监管部门的产品防伪溯源、财税部门的电子票据打假验真、学术成果存证等方面实现应用落地。
郑重声明: 本文版权归原作者所有, 转载文章仅为传播更多信息之目的, 如作者信息标记有误, 请第一时间联系我们修改或删除, 多谢。