区块链:金色观察|PaddleDTX:分布式机器学习解决方案

PaddleDTX 是一个基于分布式存储的分布式机器学习技术解决方案。可以解决海量私有数据需要的安全存储和交换难题,可恶意帮助各方突破数据孤岛,实现数据价值最大化。

PaddleDTX的计算层是一个由三种节点组成的网络:Requester、Executor和DataOwner。训练样本和预测数据集存储在由 DataOwner 和Storage节点组成的去中心化存储网络中。这种去中心化的存储网络和计算层由底层区块链网络支持。

金色相对论 | 李慧:区块链技术能有效杜绝捐赠流程中的低效及腐败现象:在本期金色相对论中,火币区块链研究院副院长李慧发言指出:在这场战疫行动中,用到区块链技术,能降低无序带来的混乱,带来高效协同。用区块链技术改造疫情预警系统,可实现及时的多区多医院的多点位数据同步及交换,数据在链上进行跨医院、跨机构的交叉验证,确保上报的传染病数据的真实性,为一线医疗工作者提供疫情动态感知,真正起到预警作用。通过区块链系统可以帮助公益组织建立公开可信的公益平台,实时公布善款物资的捐赠方、受赠方及管理情况,在公众的监督及检阅下确保物资实现专项专用,能有效杜绝流程中的低效及腐败现象。[2020/2/13]

Requester 是有预测需求的一方,Executor 是 DataOwner 授权获得样本数据访问许可的一方,用于可能的模型训练和结果预测。多个 Executor 节点组成一个 SMPC(安全多方计算)网络。Requester 节点将任务发布到区块链网络,Executor 节点授权后执行任务。Executor节点通过DataOwner获取样本数据,后者为数据的信任背书。

金色晨讯 | 欧洲央行:Libra等数字货币风险巨大 监管门槛要高:1.美联储布拉德:在加密货币监管上反是不可商榷的一部分。

2.欧洲央行:Libra等数字货币风险巨大,监管门槛要高。

3.Facebook区块链主管Marcus:Libra是一个“在现有货币基础上运行的更好的支付网络和系统”,不会威胁国家的货币主权。

4.V神:以太坊2.0“0阶段”所有事情基本已敲定,已实现客户端互相通信。

5.Libra创始人被邀请回答有关货币范围和设计的关键问题,结果将纳入10月提交给G7财长的报告。

6.巴西证券交易委员会:加密投资平台需要获得市政当局批准。

7.BM :EOSVM 即将到来,将为每个人CPU带宽带来极大的提升。[2019/9/17]

SMPC 网络是支持并行运行的多个分布式学习过程的框架。未来将支持垂直联邦学习和水平联邦学习算法。

分析 | 金色盘面:FGI恐慌指数 13:金色盘面综合分析:FGI恐慌指数9月9日显示为13,是近5个月来新低,逼近了2月低点,市场在极度恐慌状态,但是我们也看到当恐慌中跌至20以下,一般会形成市场中期底部,2018年2月6日恐慌值8,BTC见底6140美元后引发了大幅反弹90%,4月2日恐慌值11,前一日见底6404美元,之后反弹51%。所以这里不排除恐慌过后的疯狂,请投资者理性看待市场震荡,做好风险控制。[2018/9/10]

一个DataOwner节点处理自己的私有数据,在这个过程中使用了加密、分段和复制相关的算法,最后将加密的分片分发到多个Storage节点。Storage 节点通过回答 DataOwner 产生的挑战来证明它诚实地持有数据片段。通过这些机制,可以在不侵犯任何数据隐私的情况下安全地维护存储资源。

分析 | 金色盘面:FGI恐慌指数下降至19:金色盘面综合分析:FGI恐慌指数由21下降至19,虽然昨日下午超跌币普涨,却未能让投资者重拾对市场的信心,市场仍处于极度恐慌。[2018/8/18]

训练任务和预测任务将通过区块链网络广播到 Executor 节点。然后所涉及的 Executor 节点将执行这些任务。DataOwner节点和Storage节点在监控文件和节点健康状态时,以及副本持有证明的challenge-answer-verify过程中,通过区块链网络交换信息。

目前,XuperChain 是 PaddleDTX 支持的唯一区块链框架。

PaddleDTX 的开源版本支持垂直联邦学习(VFL)算法,包括两方线性回归、两方逻辑回归和三方 DNN(深度神经网络)。DNN的实现依赖于PaddleFL框架,PaddleFL 提供的所有神经网络模型都可以在 PaddleDTX 中使用。未来更多算法会开源,包括多方 VFL 和多方 HFL(水平联邦学习)算法。

训练和预测步骤如下所示:

样品准备

FL 任务需要指定将用于计算或预测的示例文件,这些文件存储在去中心化存储系统(XuperDB)中。在执行任务之前,执行者(通常是数据所有者)需要从 XuperDB 中获取自己的示例文件。

样品对齐

VFL 训练和预测任务都需要样本对齐过程。即使用所有参与者的 ID 列表查找样本交叉点。训练和预测是在相交的样本上进行的。该项目实施了 PSI(Private Set Intersection)来进行样本对齐,而不会泄露任何参与者的 ID。

训练过程

模型训练是一个迭代过程,它依赖于两个奇偶校验样本的协同计算。参与者需要在许多训练时期交换中间参数,以便为每一方获得适当的局部模型。

为确保每个参与者数据的机密性,Paillier 密码系统用于参数加密和解密。Paillier 是一种加法同态算法,它使我们能够直接对密文进行加法或标量乘法。

预测过程

预测任务需要模型,因此需要在预测任务开始前完成相关的训练任务。模型单独存储在参与者的本地存储中。参与者使用自己的模型计算局部预测结果,然后收集所有部分预测结果以推导出最终结果。

对于线性回归,可以在收集所有部分结果后执行去标准化过程。这个过程只有有标签的一方才能完成。所以所有的部分结果都会被发送给有标签的一方,它会推导出最终结果并将其作为文件存储在 XuperDB 中供请求者使用。

郑重声明: 本文版权归原作者所有, 转载文章仅为传播更多信息之目的, 如作者信息标记有误, 请第一时间联系我们修改或删除, 多谢。

金星链

[0:15ms0-1:86ms