DAT:微众银行区块链开源数据治理通用组件 释放数据价值

随着信息化、数字化、智能化的进程加速,特别是后疫情时代,数据在全球经济运转中的价值日益凸显。今年三月底,数据更是被作为一种新型的生产要素写入中央文件,与土地、劳动力、资本、技术等经典生产要素并列。

数据最终的价值来源于治理。只有经过采集、清洗、分析和处理后的数据,才能在流通中更顺畅地使用,其价值才能得到更充分地挖掘。同时,随着区块链技术的蓬勃发展,区块链渐趋规模化应用,链上数据总量呈指数级增长,其中蕴藏的巨大价值,也需要通过高效、规范的数据治理,才能得到充分彰显。

微众银行区块链在多年技术研究和应用实践的基础上,积极分析、总结行业需求,研发了一套数据治理通用组件解决区块链数据治理的技术难题,多维提升开发、运营、运维效率。

目前,WeBankBlockchain-Data已在金融、公益、农牧产品溯源、司法存证、零售等多个行业落地和使用,历经多个内外部生产环境项目的打磨,不断以“轻量化、模块化、通用化”的设计哲学进化,具备处理海量数据、高可用、可审计等能力。

为助力全行业伙伴提升区块链数据治理的效率,实现数据从要素到资源的转化,我们秉持一贯开源开放的理念,将WeBankBlockchain-Data面向社区和公众完全开源,诚邀各行业伙伴携手共建区块链数据治理体系,为数据价值的全面释放提供有效路径。

数据治理通用组件解决什么问题?

在区块链底层和区块链应用之间,横亘着一条区块链技术、业务和产品的鸿沟,存在着区块链数据扩容难度大、链上数据难以查询和分析、典型场景缺乏通用化产品或组件支持等多种挑战。

微众银行已搭建包括区块链等前沿技术的风控体系:随着区块链、人工智能、大数据和云计算等关键核心技术的底层算法研究和应用方面的优势不断释放,微众银行正运用多种举措提升服务能力,为小微企业注入更多金融活水。微众银行目前已搭建了包括人工智能、区块链、云计算、大数据等前沿技术在内的风控体系,应用于客户身份认证、智能客户服务等环节。(中国证券报)[2020/6/18]

社区也经常会有朋友问到:

区块链节点服务器的磁盘快满了,该怎么办?

如何批量查询智能合约里的数据?

我想查询某个账号发过的所有交易怎么查?

微众银行区块链对账方案是怎么做的,有没有通用的解决方案?

……

为什么强大的区块链还有这些问题呢?

首先,随着区块链数据的“爆炸式”增长,链上已经积累了亿计的交易、几T的数据,节点服务器逐渐无法满足交易数据的存储需求,单纯对节点存储空间进行扩容不仅开发成本高、硬件成本高,而且在数据扩容过程中因技术要求较高,易引发系统性风险,且不能一劳永逸地解决问题。另一方面,大量交易冷数据不仅浪费空间,而且会影响区块链节点出块和执行交易的性能。

其次,区块链由于特定的链式存储结构,链上数据只能通过智能合约接口的方式获取和调用,不仅执行效率低下,且随着链上数据的增加,其查询和计算性能逐级衰减,无法满足大数据分析和复杂查询的诉求,比如需要检索已经部署在链上的所有合约。基于特定场景的数据导出解决方案,由于智能合约存在较大差异,需要针对智能合约做特定开发,成本很高,不能复用。

声音 | 微众银行副行长:微众银行将基于区块链技术发展供应链金融:据每经网报道,微众银行副行长兼首席信息官马智涛接受《每日经济新闻》记者采访时表示,供应链金融解决了小微企业融资难问题,微众银行将基于区块链技术发展供应链金融,一是该行自己发展核心企业,二是与城市商业银行开展“银银合作”,由微众银行提供基层技术。[2019/3/1]

最后,基于区块链的可信数据缺乏通用的产品和可复用的组件,部分场景之间存在类似的需求,比如业务对账、区块链浏览器、业务分析、监管审计等。不同项目之间存在着大量重复的开发,费时费力,同时区块链应用的开发者完成工作目标需要经历陡峭的学习曲线,还可能在开发、测试中引入各类风险。

WeBankBlockchain-Data从底层数据存储层、智能合约数据解析层和应用层等多个层次入手,提供区块链数据挖掘、裁剪、扩容、可信存储、抽取、分析、审计、对账、监管等数据治理方面的关键能力,满足数据治理全流程开发场景的需求,如下图所示:

区块链数据经过区块链共识节点的多方共识,一旦生成就不会被修改。

在运维层,区块链的历史区块数据可被数据仓库组件完整或部分导出到本地。作为可信存储镜像,导出的数据仅在本地有效,被修改不会影响链上共识。我们建议使用方建立管理方法,限制对本地数据的修改。

在应用数据层,数据导出组件支持导出源数据、初步解析和基于合约解析的多维数据。所有参与者均可部署自己的导出服务,作为本地查询或分析的可信数据源。

动态 | 南洋理工与微众银行合作利用区块链等满足用户金融服务需求:据澎湃新闻消息,1月31日,新加坡南洋理工大学与微众银行共同创办的新加坡金融科技联合研究中心正式成立,研究中心将以微众银行金融服务场景的经验积累为基础,结合新加坡南洋理工大学在数据挖掘、行为金融学、机器学习、物联网、区块链等多学科研究的专业知识,利用深层科技了解并满足用户在金融服务中的多样化、个性化需求。[2019/2/1]

在业务层,业务对账组件支持机构内外部对链上链下业务数据进行对账。

数据治理通用组件包含哪些子组件?

目前,WeBankBlockchain-Data由数据仓库组件(?src="https://img.jinse.com/4426052_image3.png"?>

数据导出组件?src="https://img.jinse.com/4426053_image3.png"?>

数据对账组件?src="https://img.jinse.com/4426054_image3.png"?>

数据治理通用组件能怎么用??

企业级区块链应用存在多元化角色参与,诸如业务角色、运营人员、开发角色、运维角色等。针对区块链数据,每一个特定的角色都有着不同的数据治理诉求。WeBankBlockchain-Data分别从区块链底层节点数据维护、应用数据处理和业务数据应用三个维度,抽象、设计了对应的组件来满足不同角色的对数据治理的需求。

声音 | 微众银行张开翔:区块链可成为机构间创新互联的基础设施:今日,在上海举办的2018上海区块链国际周山、万向区块链实验室技术开放日上,微众银行区块链首席架构师张开翔进行了以“区块链技术在金融领域的应用实践”为主题的演讲。他表示,区块链可成为机构之间创新互联的基础设施。区块链技术有五方面的作用:1.跨机构和人,打破机构间或自然人界限的分布;2.分布式事务,通过共识算法在交易发生时就达成一致性确定性,多家机构实时参与到交易的验证和确认中;3.博弈和信任,在验证过程中强调抗欺诈,对交易者和记账者作恶;4.冗余和可用,计算和存储冗余,无差别计算和存储,而不是由某一个集中模块计算或有限分片计算;5.标准化系统,接入一个链上的成员采用一致的软件、接口、治理方式、运维方式、可极大的降低成本提升效率。[2018/9/10]

场景1:节点数据维护

数据仓库组件Data-Stash是一款针对区块链节点数据处理的轻量化、高安全、高可用组件,主要面向运维人员和开发人员。

数据备份:Data-Stash可以通过Binlog协议对区块链节点数据进行准实时全量备份,区块链节点可以根据实际情况进行冷热数据裁剪和分离,在确保数据安全可信的基础上,解决节点扩容问题,降低开发和硬件成本。在解决节点扩容问题的同时,可以使得节点“轻装上阵”,不仅能够减少节点空间的开销,而且能够有效提升节点执行交易的性能。

数据同步:对于加入区块链网络的新节点,可以通过Data-Stash,在FiscoSync工具的配合下,快速同步区块链网络的数据,确保节点以最快的速度参与到区块链网络的“工作”中,降低新节点因等待数据同步而造成的时间浪费。

声音 | 微众银行行长:科技创新是赖以获取竞争优势的重要手段:8月5日,在在人民日报社举行的首届中国普惠金融创新发展峰会上,微众银行行长李南青在介绍普惠金融实践时提到:科技创新是赖以获取竞争优势的重要手段。微众银行采取开源技术,按分布式架构搭建技术平台,建成拥有知识产权的,可支撑亿量级客户、高并发交易的核心系统,极大地降低了账户运维成本,使服务和让利于普罗大众成为可能。与此同时,全面推进ABCD(人工智能AI、区块链Blockchain、云计算CloudComputing、大数据BigData)科技发展战略,致力其研发、应用领先。[2018/8/5]

场景2:应用数据处理

数据导出组件Data-Export提供了导出的区块链标准数据、自动基于智能合约代码智能分析而生成的定制数据,存储到MySQL和ElasticSearch等存储介质中,主要面向开发人员。

复杂查询与分析:现有区块链对查询功能不太友好,且链上计算非常宝贵,Data-Export支持将链上存储的区块链数据导出到链下的分布式存储系统中。开发者可以基于已导出的区块链系统基础数据,智能合约部署合约账户、事件和函数等数据,进行二次开发,定制复杂查询和数据分析的逻辑,快速实现业务需求。例如,开发者可对交易明细根据业务逻辑进行统计和关联查询分析,开发各类反和审计监管报表等等。

区块链数据可视化:Data-Export会自动生成Grafana的配置文件,无需开发,即可实现区块链数据可视化。区块链数据可视化不仅能够作为区块链数据大盘、数据查看、运营分析的工具,同时也可以运用在应用开发、调试、测试阶段,以可见即可得的方式提升研发体验和效率。此外,Data-Export还提供了RestfulAPI供外部系统集成。运维人员可以通过Grafana实时监控业务系统的状态,业务人员可以在集成后的业务后台系统上获得该业务的实时进展。

区块链中间件平台WeBASE的数据导出子系统已经整合了Data-Export,同时,Data-Export也可以独立与区块链底层集成,以灵活地支持业务需求,迄今已在数十个生产系统中稳定、安全运行。

如今,Data-Export作为区块链数据治理的关键组件,以开源形式发布,由社区伙伴通力完善,以适应更多的使用场景、打造更多的功能。

场景3:业务数据应用

在业务层,数据对账是区块链交易系统中最常见的场景之一。基于数个区块链DAPP应用的开发和实践经验,我们封装和开发了数据对账组件Data-Reconcile,提供基于区块链智能合约账本的通用化数据对账解决方案,并提供了一套可动态延展的对账框架,支持定制化开发,主要面向开发人员,为业务人员提供服务。

企业内部对账:Data-Reconcile支持企业内部系统之间的对账,例如区块链链上数据与链下业务系统之间的对账。开发人员可以利用Data-Reconcile快速进行二次开发,将业务系统数据和链上数据进行核算比对,保证了企业内部业务系统数据的可靠和运行安全。

企业间对账:Data-Reconcile可以帮助开发者快速构建跨机构间的对账应用系统。例如,在结算时,A企业定期将自身业务系统交易数据导出为对账文件,发送至与文件存储中心。B企业可借助Data-Reconcile定期拉取A企业对账文件,配合Data-Export,与企业内部的链上数据进行对账处理。Data-Reconcile在保证对账结果可信的同时提升了对账的效率,可实现准实时对账。

综上所述,WeBankBlockchain-Data是一套稳定、高效、安全的立体化区块链数据治理解决方案,旨在通过提供一系列相互独立、可插拔、可灵活组装的组件,应对和处理区块链海量数据的问题,为用户带来更加便捷、简单、低成本和轻量化的用户体验,从而推动区块链数据治理的发展。

开源地址

github代码库地址:

Data-Stash数据仓库组件

https://github.com/WeBankBlockchain/Data-Stash

Data-Export数据导出组件

https://github.com/WeBankBlockchain/Data-Export

Data-Reconcile数据对账组件

https://github.com/WeBankBlockchain/Data-Reconcile

gitee代码库地址:

Data-Stash数据仓库组件

https://gitee.com/WeBankBlockchain/Data-Stash

Data-Export数据导出组件

https://gitee.com/WeBankBlockchain/Data-Export

Data-Reconcile数据对账组件

https://gitee.com/WeBankBlockchain/Data-Reconcile

文档地址:

Data-Stash数据仓库组件

https://data-doc.readthedocs.io/zh_CN/latest/docs/WeBankBlockchain-Data-Stash/index.html

Data-Export数据导出组件

https://data-doc.readthedocs.io/zh_CN/latest/docs/WeBankBlockchain-Data-Export/index.html

Data-Reconcile数据对账组件

https://data-doc.readthedocs.io/zh_CN/latest/docs/WeBankBlockchain-Data-Reconcile/index.html

欢迎参与WeBankBlockchain的社区建设:

如项目对您有帮助,欢迎点亮我们的小星星(点击项目左上方Star按钮)。

欢迎提交代码(Pullrequests)。

提问和提交BUG。

如果发现代码存在安全漏洞,可通过https://security.webank.com/上报。

郑重声明: 本文版权归原作者所有, 转载文章仅为传播更多信息之目的, 如作者信息标记有误, 请第一时间联系我们修改或删除, 多谢。

金星链

UNISAL:Salesforce将以280亿美元收购Slack

在最近几年最著名的技术收购之一中,Salesforce将以约277亿美元的价格收购Slack。这是Salesforce迄今为止最大的一笔收购,也是Slack的一臂之力,Slack面临着来自Mic.

[0:0ms0-1:29ms