密码学为何称之为密码学?密码和密钥究竟有何区别?隐私保护方案中,密钥的角色是否可以被替代?密钥在使用过程中存在哪些风险?
这里,我们将以密码学中的密码为起点,展开一系列对密码学算法核心组件的技术剖析。密码和密钥在密码学算法中有着至关重要的地位,了解密码和密钥的作用,有助于理解基于密码学的隐私保护方案是否具备有效性。密码和密钥对于用户而言,则是最终达成隐私数据『始于人、利于人、忠于人』隐私保护效果的无上法器。
密码学的英文为Cryptography,源自希腊语“κρυπτ??秘密”和“γρ?φειν书写”。最初,其研究主要集中在『如何在攻击者存在的环境中隐秘地传输信息』,是一个关于信息编码的学科,由于其最重要研究目标之一是保密,实现敏感信息的秘密编码,所以被称之为密码学。
密码学中的密码,和我们日常生活中登录各类信息化系统所使用的密码是两个不同的概念。前者包含了信息加密编码、密文解密解码、数据完整性验证等一系列信息变换过程。而后者更多地是指代密码学信息变换过程中所使用的便于用户记忆的一类密钥,为了以示区别,在下文中称之为用户口令。
OKEx冷钱包密码掌管人分别位于中国和美国,并备份在中美两个银行的保险柜:据OKEx官网,OKEx比特币冷钱包是在完全离线的电脑上生成10000个私钥和对应的地址,在对私钥进行AES加密后删除原始私钥。AES密码由公司的两个分属异地的人掌握,OKEx 的两位密码掌握人,一位在OKEx办公室,一位在美国西部某城市,两个人不得乘坐同一辆交通工具。加密后的私钥和明文地址会生成二维码加密文档,并在异地银行保险柜备份,OKEx有两份备份,一份在OKEx办公室附近的银行保险柜,一份在美国东部某城市一家银行的保险柜内。[2020/10/19]
在密码学中,密钥的作用与现实生活中的钥匙很相似,只有掌握密钥的用户,才能解密对应的隐私数据,或进行数字签名等相关敏感操作。
为什么密钥能够有这么神奇的作用,一切要从柯克霍夫原则谈起。
柯克霍夫原则
柯克霍夫原则是现代密码学算法设计基本原则之一,最早由荷兰密码学家Auguste Kerckhoffs在1883的论文La Cryptographie Militaire(军用密码学)中提出。
刘昌用:比特币白皮书是密码货币问题导向的,而非理想导向:密码经济倡导者刘昌用博士在直播分享中表示,中本聪认为,第三方信用货币存在两个大的问题,中介增加成本排斥小额交易,并且交易可逆不适合信息商品。这是中本聪撰写比特币白皮书时想解决的问题,解决法币通胀的问题是后来衍生出来的。对于这两个问题,物理现金可以解决,基于密码学而非信用构建的电子现金也可以发挥物理现金的作用。昌用认为,比特币的白皮书是密码货币问题导向的,而非经济学专业思维和语言导向,非理想导向。不要把中本聪神圣化。(巴比特)[2020/7/30]
其核心思想是『密码学算法的安全性,不应该建立在算法设计保密的基础上』。即便算法设计是公开的,只要实际使用的密钥没有被攻击者获知,密码学算法产生的密文信息就不应该被轻易破解。
被誉为“信息论之父”的美国数学家、电子工程师、密码学家Claude Elwood Shannon后来将这一原则进一步扩展,应用到任意信息安全相关的系统,由此也奠定了密钥在现代密码学中的核心地位。
声音 | 中国法学会副研究员:《中华人民共和国密码法(草案)》公开征求意见,或有利于促进区块链等加密技术的商用:据财经网报道,中国人大网公布《中华人民共和国密码法(草案)》,公开征求社会公众意见,征求意见截止日期为2019年9月2日。 中国法学会法治研究所副研究员刘金瑞表示,《中华人民共和国密码法(草案)》的推出既有利于规范区块链等新型技术的应用,也有利于促进区块链等加密技术的商用,当然有些具体问题有待进一步深入研究。 据草案第12条明确规定:“任何组织或者个人不得窃取他人的加密信息,不得非法侵入他人的密码保障系统,不得利用密码从事危害国家安全、社会公共利益、他人合法权益的活动或者其他违法犯罪活动。”此外草案还对核心密码、普通密码与商用密码实行分类管理,为贯彻落实职能转变和“放管服”改革要求,规范和促进商用密码产业发展,草案第三章规定了商用密码的主要制度。[2019/7/5]
密钥具体如何使用呢?这里有必要回顾第3论中提到的,密码学算法设计所基于的计算不对称性,以及与之相关的一个重要概念——单向陷门函数。
声音 | Block.one:探索无密码的未来:据 IMEOS 报道,Block.one 刚刚发布新文章《无密码未来:构建更安全和适用的认证系统》,表达对现代认证系统的未来的看法和一个理论解决方案 - “通行证” 取代密钥或密码。 文章主要讨论困扰现有认证系统的问题,以及现代尝试超越密码所伴随的问题。并做一个理论上的提议,一种如“通行证”的新模式,如机票或图书馆卡,以安全和适用的方式解决这些问题。[2019/4/17]
一个单向陷门函数可以抽象为y = f(x, key),其中,x为敏感的隐私数据输入,y为经过算法保护的不敏感输出,key就是密钥。实际情形下,根据具体密码学算法设计和实现上的差异,密钥key可以有不同的表现形式,也可以表现为多个秘密参数。
如果以上函数是一个密码学安全的单向陷门函数,在不知道密钥key的前提下,很难从输出y通过逆函数反推出输入x,由此避免了隐私数据的泄露。
现场 | 密码学专家杨光:实现高TPS需要解决两个问题 可验证计算是有效途径:金色财经现场报道,全球区块链开发者大会 GBDC 2018于香港正式召开。密码学专家杨光表示,今年“双十一”淘宝运算的峰值256000笔, 区块链如果要达到10000万TPS,实现比淘宝4倍的TPS是需要具备诸多条件的。理想条件下带宽无限、传输没有延迟,可以非常快的达成共识。而这种即使如此如果实现百万TPS,还有解决两个问题:一是单个节点的处理能力、二是区块链数据增长较快。密码学专家杨光介绍了可验证计算的方式以解决实现TPS的问题,着重介绍非交互是的可验证计算。[2018/12/16]
由此可见,密钥就是密码学信息变换过程中的最高机密。谁掌握了密钥,谁就掌握了隐私数据的访问权。
人类可用的密钥
一般而言,再精密的隐私保护方案,最终都需要服务于人类用户。由于密码学隐私保护方案的安全性很大程度上取决于密钥的长度和复杂性,这也为人类用户在使用密钥时带来了不小挑战。
目前业界主流推荐的密码学安全强度是256位,即密钥的信息熵至少等价为256比特的随机数。如果我们用常见的字母数字来设定用户所用的密钥,该密钥的长度至少为256/log2(26*2+10) ~= 43个随机字符。
考虑到用户通常为了便于记忆而拼接字典中的单词来构成密钥,此时为了满足密钥信息熵的随机性要求,实际可能需要使用长度更长的密钥。
相比之下,现有系统对用户口令的长度一般要求在6~20字符之间,对于部分应用4~6位数字用户口令也不少见。所以,这些用户口令的随机性和长度都不足以达到256位安全强度。
如果一个隐私保护方案所使用的密钥只源自用户口令,是无法满足隐私数据的安全性要求的。
然而,普通人类并不具备计算机一般强大的计算和记忆能力,难以记忆和处理过长的密钥。此时,需要借助技术手段来提高人类可用密钥的信息熵,常见的解决方案有以下三类:
三类解决方案中,平台全权托管的用户体验最好,同时也伴随着最大的隐私风险。混合托管和本地全权托管,在用户体验上差异不大,混合托管相关的隐私风险更低。
需要注意的是,这里存在一个固有的设计取舍,隐私数据的自主权与数据服务的完备性不可兼得。
平台全权托管方案中,用户隐私数据的实际控制权在平台手中,由此平台可以提供诸如用户口令重设、数据恢复等关键数据服务。
然而,在其他托管方案中,用户隐私数据的实际控制权在用户手中,一旦用户遗失密钥或用户口令,则平台无法解密对应的数据,也无法提供口令重设等相关密钥服务。
对于企业而言,具体方案的选择,需要结合用户使用习惯和行业监管要求,建议在平台全权托管和混合托管之间做选择。对于高敏感性隐私数据,酌情选择混合托管,并需要配合密钥恢复方案使用。
密钥相关的风险
隐私数据的自主权往往是隐私保护方案强调的重点,但是为了切切实实地获得控制权,仅仅是安全地使用单个安全密钥,就可能会给用户体验方面带来显著负担,而且还需要防范其他密钥相关的泄露风险。
这些风险可以大致分为以下两类:
内在风险
这类风险与隐私保护方案的内在设计和实现有关。由于绝大部分密码学算法和协议不是信息论安全,也就说,同一个密钥使用的次数越多,理论上被破解的概率越大。
对应的常见风险分析手段是,考虑对应密码学算法和协议在选择明文攻击(Chosen-plaintext Attack, CPA)和选择密文攻击(Chosen-ciphertext Attack, CCA)下,是否依旧安全。
这两类攻击都允许攻击者获得一定数量的隐私数据明文和密文对,由此分析破解所使用的密钥。
在现实生活中,攻击者非常有可能获得这样的能力,截获明文和密文对,甚至主动注入数据,生成破解分析所需的明文和密文对,这类风险是真实存在的。
外在风险
这类风险虽然与隐私保护方案的内在设计和实现无关,但却实实在在地对方案的实际效果产生巨大威胁。
比较典型的攻击有社会工程学,具体指通过性手段,如钓鱼网站、短信等,诱导用户直接给出密钥,或者通过下载安装病木马,间接盗取密钥。
无论是哪一类风险,如果用户只有一个密钥,一旦被盗,所有的账户都有被盗的风险,后果不堪设想。
处理好这些风险的必要条件,就是产生并使用多个随机密钥,但这也为隐私保护方案的可用性带来了更大的挑战。
无论隐私保护方案设计安全性多高,如果由于用户体验差,用户难以接受,或者以不安全的变通方式使用,其真实有效性都会大打折扣。这也是学术方案向业务方案转化最常见的阻碍之一。
除了探索更优的方案设计,适当的用户教育也是非常必要的推广手段。
总体而言,同时处理好密钥使用过程的安全性和可用性,是落实隐私保护的重要前提。
正是:隐私数据控制难自主,访问密钥在手任我行!
密钥是任何基于密码学技术方案的最高机密,如何保障其安全性,并让作为隐私数据属主的人类用户方便地记忆和使用,是将隐私控制权回归属主的关键。
郑重声明: 本文版权归原作者所有, 转载文章仅为传播更多信息之目的, 如作者信息标记有误, 请第一时间联系我们修改或删除, 多谢。