前言
近期ChatGPT爆火,其对传统文字工作的效率提高及总结能力让使用者惊艳。紧随其后CodeGPT这样基于GPT的插件出现,也充分体现了其对代码编写效率的提高。而最新GPT-4的发布,是否可以应用到对区块链、Solidity智能合约的审计中呢?
基于这样的疑问,我们进行了多种可行性测试。
测试环境及测试方法
测试使用的对比模型对象:GPT-3.5(Web),GPT-3.5-turbo-0301,GPT-4(Web)。
代码片段使用Prompt:HelpmediscovervulnerabilitiesinthisSoliditysmartcontract.
漏洞代码片段的检测对比
在此部分,我们分三次测试,使用历史上常见的漏洞代码作为测试一和测试二的用例,来验证其对基础漏洞的检测能力,测试三中使用中等难度的漏洞代码作为测试用例。
测试一
用例:《智能合约安全审计入门篇——Phishingwithtx.origin》
漏洞代码:
冉小波:算法交易诞生的流动性挖矿推动整个DeFi进入火爆阶段:9月4日消息,NULS联合发起人冉小波在做客《HyperPay焦点》栏目时提及:DeFi大热,资金都倾向于玩DeFi,反而应该是其他公链的一个挑战。所以公链也需要一些结合DeFi的一些创新的玩法了,不然大部分的资金和流量可能都会流转到一些毫无实际意义项目的流动性挖矿中。这一点相信其他的公链团队应该也感触颇深。DeFi的分支有很多,各家公链也都有在做一些探索,总的来看,推动整个DeFi进入火爆阶段的是算法交易诞生的流动性挖矿。近期大热的项目基本上都是一些新的项目,通过流动性挖矿来进行筹码的分配,以非常高的收益率来进行高通胀的Token分配,从而吸引大量的资金短时间内快速加入。[2020/9/4]
对GPT进行提问:
GPT-3.5(Web)answer
GPT-3.5-turbo-0301answer
动态 | 新华网:炒币、挖矿再度火爆,警惕披着区块链马甲的金融重出江湖:新华网发文《新华视点:“炒币”“挖矿”再度火爆,警惕披着区块链“马甲”的金融“重出江湖”》。文章指出,一些不法分子打着区块链旗号推广宣传虚拟货币、资金盘,将区块链技术等同于虚拟货币,甚至出现“防范代币发行融资风险政策已过时”等言论,有的用“链”“挖矿”“IMO”“STO”等花样翻新的名目,披着区块链的“马甲”开展非法金融活动。目前,上海、北京、广东等多地金融监管部门相继出台措施,对虚拟货币交易场所进行摸排整治。国家互联网金融安全技术专家委员会区块链研究室主任毛洪亮告诉记者,近期、资金盘等不法活动利用区块链概念和发行虚拟货币进行包装,本身与区块链技术无关,涉及资金多,危害严重。[2019/12/4]
GPT-4(Web)answer
可以看到结果:3个测试版本都发现了关键的tx.origin相关问题。
INT chain主链全球公测,答题送20万INT糖果火爆进行中:为庆祝INT chain主链进行全球公测,连续多场赠送糖果活动正在进行中,用户进入INT官方社群即可进行参与。INT chain是一个基于物联网区块链的项目,目标是要做一条可以中继不同的物联网的公链,形成边缘计算网络,有效流通资源,加快物联网普及进度。大幅降低物联网区块链应用的开发难度,致力于使物联网区块链内化成如同 TCP/IP 一样的物联网基础架构。INT将围绕工业制造、无人驾驶、物联网+区块链避开交通堵塞、公共技术设施和智能城市等应用场景发力。[2018/5/10]
测试二
用例:《智能合约安全审计入门篇——溢出漏洞》
漏洞代码:
对?GPT?进行提问:
GPT-3.5(Web)answer
GPT-3.5-turbo-0301answer
AMD季报亮眼 GPU随区块链火爆而热销:美国半导体公司AMD季度财报非常亮眼,业界的焦点从芯片销售转移到了区块链技术提供商的身份上面。区块链的应用范围已经不仅限于虚拟货币,随时有望爆发。市面上发行流通的虚拟货币大多都需要“挖矿”,即虚拟货币矿工利用运行速度极快的GPU解决区块链中复杂的数学难题,然后获得新的数字货币作为奖励。作为供应商,GPU价格上涨势必将让AMD和英伟达获得巨大的收益。分析师预计,随着全球越来越多的公司计划进军比特币市场或者区块链,GPU销售将有望进一步增长。[2018/2/2]
GPT-4(Web)answer
可以看到GPT-3.5(Web)、GPT-3.5-turbo-0301都发现了关键的Overflow漏洞,出乎意料的是GPT-4(Web)居然没有相关提示。
测试三
用例:《空手套白狼——Popsicle被黑分析》
孙宇晨发微博分析以太坊云养猫火爆原因:Tron创始人孙宇晨发布微博分析以太坊云养猫火的原因,他认为:“1.猫的基因是真随机数,血统高贵花费的努力与时间能够被精准度量。2.数据去中心化,机制透明催生了公正市场。3.线上撸猫比线下省力,宅男女喜欢。4.数据透明,容易炫耀与比较。5.线上撸猫交易透明标准化易于交割,带有投资属性。6.交易智能合约7*24小时营业。”[2017/12/6]
漏洞代码:
对GPT进行提问:
GPT-3.5(Web)answer
GPT-3.5-turbo-0301answer
GPT-4(Web)answer
对比结果,我们可以看到3个版本都未发现关键的漏洞点。
代码片段的检测总结
可以看到GPT模型对简单的漏洞代码块的检测能力还是不错的,但是对稍微复杂一点的漏洞代码暂时还无法检测,并且在测试中可以看到GPT-4(Web)的整体上下文可读性很高,输出格式清晰、舒服,但是其对代码的审计能力暂时没有远超GPT-3.5(Web)、GPT-3.5-turbo-0301,甚至在部分测试中由于Transformer输出存在一定的不确定性反而导致GPT-4(Web)遗漏了一些关键问题。
对比已知漏洞的全量合约检测
为了更加契合普通项目方在合约审计中的简单操作需求,这里我们提高些难度,针对代码量大的合约进行全量导入上下文,让GPT-4模型进行审计。
用例:《千万美元被盗——DeFi平台MonoXFinance被黑分析》
整份合约分批输入,在对话最后提出检测漏洞请求
这里使用Prompt:
Hereisasoliditysmartcontract?
Contractcode
Theaboveisthecompletecode,helpmediscovervulnerabilitiesinthissmartcontract.
可以看到,GPT-4虽然在OpenAI公布的信息中其单次输入字符总数已经是当前最高,但还是会由于文本超长导致在最后提问时GPT会上下文缺失而只识别到部分内容,所以这样对大型合约而言就无法进行完整的上下文审计。
拆封整份合约,分批输入分批检测
这里使用Prompt:
对话1:
Helpmediscovervulnerabilitiesinthissoliditysmartcontract.
分段内容1
对话2:
Helpmediscovervulnerabilitiesinthissoliditysmartcontract.
分段内容2
对话3:
Helpmediscovervulnerabilitiesinthissoliditysmartcontract.
分段内容3
总结
GPT当前是否适合合约分析
优点
GPT对合约代码中基础的简单的漏洞具备部分检测能力,并且在检测出漏洞后会以很高的可读性来解释漏洞问题,这样的特性比较适合为初级合约审计工作者前期训练提供快速指导和简单答疑。
存在的问题
a.每次生成内容波动
GPT对每次对话的输出存在一定的波动,可以通过API接口参数进行调整,但是依旧不是恒定的输出,虽然这样的波动性对语言对话来说是好的方式,大大提高了对话给人的真实感。但是这对代码分析类的工作来说是一个不好的问题。因为为了覆盖AI可能告知我的多种漏洞回答,我需要多次请求同一问题并进行对比筛选,这无形中又提高了工作量,违背了AI辅助人类提高效率的基准目标。
例如这里再次运行"漏洞代码片段的检测对比测试二:
可以看到其输出结果比之前测试又多了一些额外内容。
b.?漏洞分析能力依旧有很大的提高空间
对稍微复杂的漏洞进行检测即会发现当前的训练模型不能正确的分析并找到相关关键漏洞点。
GPT辅助合约审计的可行性和潜力分析
虽然当前来看GPT对合约漏洞的分析及挖掘能力还处于相对较弱的状态,但它对普通漏洞小代码块的分析并生成报告文本的能力依旧让使用者兴奋,在可预见的未来几年伴随这GPT及其他AI模型的训练开发,相信对大型复杂合约的更快速,更智能,更全面的辅助审计一定会实现。当科技发展可指数级提高人工的效率时就会发生质变,我们非常期待AI对区块链安全的助力,我们会持续关注新AI产品对区块链安全的影响。最后可见的将来我们必将与AI在一定程度上进行融合,愿AI和区块链与你同在。
郑重声明: 本文版权归原作者所有, 转载文章仅为传播更多信息之目的, 如作者信息标记有误, 请第一时间联系我们修改或删除, 多谢。