ASH:科普:哈希函数的过去、现在与未来

编者按:本文来自

以太坊爱好者

,作者:RaulJordan,翻译&校对:闵敏&阿剑,Odaily星球日报经授权转载。

哈希值和哈希函数的概念是初次入门区块链的人常听到的两个关键词,而且似乎对安全性来说特别关键。对于像比特币和以太坊这样由成千上万的节点通过P2P方法组成的去中心化网络来说,“免信任性”和验证效率无疑是关键。也就是说,这些系统需要找到方法把信息编码成紧凑的形式,同时让参与者能够安全快速地进行验证。

比特币和以太坊网络所处理的主要内容叫做“区块”,指的是由交易、时间戳和其他重要元数据所组成的数据结构。比特币和以太坊网络的安全性的关键一环是:它能将表达网络全局状态的大块信息压缩成一个简短的消息。在有需要之时,我们可以高效地验证这个消息的真实性。这个过程就是用哈希函数来完成的,而得到的结果就是哈希值。

-即使只更改输入中的一个字符,最后得出的哈希值也会完全不同-

密码学哈希广泛应用于口令存储和文件验证系统。简单来说,密码学哈希函数是一种确定性的算法,不论输入什么值,都能得到一个固定长度的字符串。也就是说,同一个输入值始终对应同一个输出值。

国务院:推进科普与区块链技术深度融合:为贯彻落实党中央、国务院关于科普和科学素质建设的重要部署,依据《中华人民共和国科学技术进步法》、《中华人民共和国科学技术普及法》制定《全民科学素质行动规划纲要(2021-2035年)》,其中要求实施智慧科普建设工程。推进科普与区块链等技术深度融合,强化需求感知、用户分层、情景应用理念,推动传播方式、组织动员、运营服务等创新升级,加强“科普中国”建设,强化科普信息落地应用,与智慧教育、智慧城市、智慧社区等深度融合。(新华社)[2021/7/10 0:40:52]

对哈希函数来说,重要的不仅是确定性:即使只更改输入中的一个比特位,也会导致最终得到的哈希值截然不同。

哈希算法有一个无可回避的问题叫碰撞可能性。因为哈希值是固定长度的字符串,同一个哈希有可能对应多个输入。碰撞会造成很严重的后果。如果有人能够按需要发起碰撞攻击,他就可以用恰当的哈希值将恶意文件或数据伪装成合法的、能够通过验证的文件。好的哈希函数的设计目标是让攻击者极难找到方法来找出对应同一个哈希的不同输入。

哈希计算的效率不应过高,以免让攻击者可以更简单地人为计算出碰撞。哈希算法必须能够抵御“原像攻击”。也就是说,对于特定哈希值,攻击者很难通过确定性计算步骤倒推出输入值。

IMF今日发布的加密货币科普视频实为两年前旧闻,且存在诸多疏漏:国际货币基金组织IMF今日在推特上发布了一条关于加密货币的科普视频,这段时长两分钟的视频最初发布于2018年6月。该视频称加密货币是“货币进化的下一步”,但没有特别提到DLT、区块链,甚至是代币名称等术语。BTC、XRP和ETH只出现在说明加密交易的图形中。尽管这段视频到目前为止已经获得了超过13.7万的点击量和2900个赞,但来自加密社区的许多反应都是批评的,他们指出了信息中的漏洞和似乎具有误导性的措辞。

Reddit用户nanooverbtc称:“他们犯了很多错误,比如把私钥称为密码。”该视频也没有讨论挖矿或加密货币供应。Kraken策略师Pierre Rochard等知名人士表示:“可证明的稀缺性是比特币有趣的原因,你忘了提这一点。”(Cointelegraph)[2020/8/24]

假设s=hash(x),倒推x应该是近乎不可能的。

总的来说,“好的”哈希算法需要具备以下3个特性:

更改输入中的一个比特位会产生雪崩效应,导致最后得出的哈希值截然不同

出现哈希碰撞的概率非常低

TRON数字钱包科普资料《波场钱包的现在过去与未来》已上线:据最新消息显示,由TokenPocket联合波场TRON官方,以及 TokenPocket 社区志愿者共同撰写的《波场钱包的现在过去与未来》已正式上线。《波场钱包的现在过去与未来》又称为波场钱包小白书,详细介绍了当前TRON钱包与TRON生态密切结合的实例,是目前市面上最为详细的TRON数字钱包科普资料。波场钱包作为波场公链生态中极为重要的入口,是波场生态的重要构成要素。波场钱包从一开始只提供权限管理、转账收款、节点投票等基础功能,到如今不仅可以为用户提供法币交易、闪兑和去中心化交易所等方便快捷的交易服务,还能让用户直接在钱包上体验波场上DApp,挖矿、DeFi、Staking等资产增值服务。详情见原文链接。[2020/8/20]

在无需牺牲抗碰撞性的前提下计算效率过得去

破解哈希算法

哈希算法的初始标准之一是MD5哈希。MD5哈希广泛应用于文件完整性验证,以及在网络应用数据库中存储经过哈希计算的账号口令。MD5的功能非常简单,因为它会将每个输入转换成一个固定的128位字符串输出,并通过多轮简单的单向操作来计算确定性输出。由于输出值长度较短,操作又较为简单,MD5很容易被破解,一种常见的攻击方法叫生日攻击。

人大附中物理老师李永乐科普拜占庭将军问题和区块链:5月14日,人大附中物理老师、科普视频网红李永乐在其公众号发布视频《拜占庭将军问题是什么?区块链如何防范恶意节点?》。李永乐老师在视频中对拜占庭将军问题和区块链进行了讲解,他表示,拜占庭将军问题本质上指的是,在分布式计算机网络中,如果存在故障和恶意节点,是否能够保持正常节点的网络一致性问题。在近40年的时间里,人们提出了许多方案解决这一问题,称为拜占庭容错法。例如兰波特自己提出了口头协议、书面协议法,后来有人提出了实用拜占庭容错PBFT算法,在2008年,中本聪发明比特币后,人们又设想了通过区块链的方法解决这一问题。区块链通过算力证明来保持账本的一致性,也就是必须计算数学题,才能得到记账的权力,其他人对这个记账结果进行验证,如果是对的,就认可你的结果。与拜占庭问题比起来,就增加了叛徒的成本。[2020/5/14]

“生日攻击”是啥玩意?

你有没有听说过这样一个事实?如果你将23个人放到一个房间里,其中两个人生日相同的概率为50%。如果将70个人放到一个房间里,其中两个人生日相同的概率高达99.9%。这就是我们所说的鸽笼原理,即,将100只鸽子装进99个鸽笼,必然有两只鸽子分享同一个鸽笼。也就是说,固定长度的输出意味着所有输入输出组合中一定存在碰撞。

科普时报:区块链与云计算长期发展目标不谋而合:据《科普时报》今日报道,区块链与云计算两项技术的结合,从宏观上来说,一方面,利用云计算已有的基础服务设施或根据实际需求做相应改变,实现开发应用流程加速,满足未来区块链生态系统中初创企业、学术机构、开源机构、联盟和金融等机构对区块链应用的需求。另一方面,对于云计算来说,“可信、可靠、可控制”被认为是云计算发展必须要翻越的“三座山”,而区块链技术以去中心化、匿名性,以及数据不可篡改为主要特征,与云计算长期发展目标不谋而合。[2018/5/4]

-笼子不够时,鸽子就会凑对-

事实上,MD5的抗碰撞性太差,以至于一台家用2.4GHz奔腾处理器都能在几秒内计算出哈希碰撞。此外,由于MD5在互联网早期阶段得到了广泛应用,网络上有大量MD5原像遭到泄漏,通过谷歌搜索它们的哈希值就能找到。

哈希算法的多样性发展

源起:SHA1和SHA2

NSA是哈希算法标准的先驱。安全哈希算法是最早提出的标准,将输出值的长度固定在160位。遗憾的是,SHA1只是在MD5的基础上增加了输出值长度、单向操作的次数和复杂度,但是并没有作出能够抵御更强大机器攻击的根本性改进。

我们如何才能做得更好?

SHA3兴起

在2006年,美国国家标准技术研究所举办了一场竞赛,旨在找到一个本质上不同于SHA2的替代标准。因此,SHA3应运而生,它是KECCAK哈希算法的一种方案。

虽然SHA3在名称上与SHA1和SHA2一脉相承,但是在本质上差异很大,因为它采用了一种名为海绵结构的机制。该机制使用随机排列来吸收并输出数据,同时为将来用于哈希算法的输入值提供随机性。

-KECCAK256海绵结构是如何进行输入操作的-

SHA3的内部状态相较于输出值拥有更多信息,突破了以往算法的局限性。NIST于2015年正式认可了SHA3标准。

哈希计算和工作量证明

就整合进区块链协议的哈希算法而言,比较早的比特币选择了SHA256,而以太坊采用了改进后的SHA3作为工作量证明算法。对于采用工作量证明的区块链来说,选择哈希函数的一大重要标准是哈希运算效率。

使用一类名为专用集成电路的硬件,我们可以大幅提高比特币SHA256算法的哈希运算的效率。有很多文章已经阐述了矿池是如何利用ASIC的,以及ASIC是如何让协议趋向于计算中心化的。也就是说,工作量证明会激励计算效率较高的机器聚集成矿池,从而形成较大的哈希算力。

以太坊选择的是改进后的SHA3算法。此外,以太坊的工作量证明算法Dagger-Hashimoto被设计成了内存密集型模式,计算硬件需要加大内存才能提高计算效率。

为什么比特币采用双重SHA256?

有趣的是,比特币协议需要重复运行两遍SHA256算法。请注意,这不是为了抵御生日攻击,毕竟在hash(x)=hash(y)的情况下,hash(hash(x))=hash(hash(y))。双重SHA256旨在抵御长度扩展攻击。

从本质上来说,所谓的长度扩展攻击,指的是如果恶意攻击者知道了某个哈希输入的长度,就可以在哈希值上添加一个秘密的字符串、哈希函数从其内部状态的一个特定部分开始计算。作为SHA2算法家族的一员,SHA256也存在这一缺陷。因此,比特币采取执行两遍哈希计算的方式来解决这一缺陷。

Ethereum2.0和BLAKE

SHA3并非哈希算法竞赛取得的唯一突破。虽然最终胜出的是SHA3,但是BLAKE算法紧随其后,位居第二。对于以太坊2.0的分片实现来说,更高效的哈希算法可以说是一项功能性要求,研究团队对此非常重视。BLAKE2b哈希算法是BLAKE算法的高度升级版本。与KECCAK256相比,BLAKE2b哈希算法在保持高度安全性的同时,在提升效率方面也进行了深入探索。

使用一台现代CPU计算BLAKE2b的速度比计算KECCAK快了3倍。

哈希算法的前景展望

这么看来,无论我们做了什么,无非就是增加内部哈希操作的复杂度,或者增加哈希输出值的长度,让攻击者的计算机无法足够快地有效计算出碰撞。

我们依靠单向操作的原像模糊性来保护网络的安全性。也就是说,哈希算法的安全性目标是在有无限多可能的冲突的情况下,让找出哈希碰撞的难度尽可能高。

如果量子计算时代到来,哈希算法依然安全吗?

就目前来看,答案是肯定的,哈希算法将经受时间的考验,抵御量子计算。量子计算能够解决的是那些严格按照某些小技巧或RSA加密理论打造底层结构的数学问题。另一方面,哈希算法的内部构造没那么形式化。

量子计算机确实能够提高哈希等非结构化问题的计算速度,但它们最终还是会像如今的计算机一样采取暴力破解手段。

无论我们为协议选择了哪种算法,我们显然都在迈向计算高效化的未来。为此,我们必须慎重选择最合适的工具,使之经受住时间的检验。

参考文献

:

https:\u002F\u002Fbitcoin.stackexchange.com\u002F

:

https:\u002F\u002Fen.wikibooks.org\u002F

:

https:\u002F\u002Flearncryptography.com\u002F

:

https:\u002F\u002Fgithub.com\u002Fzcash\u002Fzcash\u002Fissues\u002F2233

:

https:\u002F\u002Fcrypto.stackexchange.com\u002F

:

https:\u002F\u002Fen.wikipedia.org\u002F

:

https:\u002F\u002Fkeccak.team\u002F

:

https:\u002F\u002Fen.wikipedia.org\u002F

:

https:\u002F\u002Fcrypto.stackexchange.com\u002F

郑重声明: 本文版权归原作者所有, 转载文章仅为传播更多信息之目的, 如作者信息标记有误, 请第一时间联系我们修改或删除, 多谢。

金星链

[0:31ms0-0:742ms