CIR:隐私计算百科丨关于“数据”的行业黑话, 你了解多少?

隐私计算是当下数据安全领域的热门赛道,无数企业纷纷涌入,抢跑占道。

相对国外而言,我国企业布局起步较晚,但整体发展迅速。

2016年,我国开始出现垂直的隐私计算厂商,近年来,随着行业客户在应用层实践的逐步加深,除了垂直的隐私计算厂商外,各类技术企业纷纷入局,数据运营、算力加速等需求正在不断涌现。

百舸争流、千帆竞发的市场格局初显。

就目前发展现状看来,政策与技术正在共同促进隐私计算发展。据Gartner报告预测,到2024年,由隐私计算驱动的数据保护和合规技术支出将在全球突破150亿美元以上,即达到千亿人民币以上。

「论道隐私计算」作为一家专注于区块链隐私计算赛道入门科普的垂直媒体,同时也是针对隐私计算兴趣者开放的纯天然、低门槛入口,我们通过研读隐私计算行业报告,汇总并分类了隐私计算行业内晦涩难懂的名词,编写了「隐私计算词典百科」板块,将以最简单的语句结合举例说明,让大家对于隐私计算的行业“黑话”快速上手。

此篇,我们围绕“数据”一词进行展开——“数据”是否等同于信息?人们经常挂在嘴边的“大数据”是什么?“数据交易所”里交易的又是什么?以下请Enjoy。

数据与大数据

数据是事实的体现,也是通过观察、实验和计算所得出的结果,用以表示客观事物的未加工的原始素材。数字、文字、图像以及声音等都可以是数据的表现形式。

数据:铭文活动减缓推动比特币链上交易费用较5月下降96%以上:金色财经报道,据区块链分析公司Glassnode数据显示,自5月以来比特币铭文活动一直在逐渐减少,比特币内存池中的未确认交易开始大规模清空,链上交易费用也开始下滑。自从5月份BRC-20热度达到顶峰以来,比特币的交易费用(以美元计)已经下降了96%以上,目前的平均费用为1.33美元,中位数费用降低到0.16美元。虽然交易活动在减少,但BTC的转手量开始有显著的上升。BTC的交易量已从FTX的最低点上升了75%,目前每日结算总额达到42亿美元。[2023/7/14 10:54:52]

随着云技术、分布式计算和存储等技术的发展,目前我们已经步入了大数据时代。近几年来所产生的数据量之和相当于我们人类发展历史上所有的数据量之和,据国际机构IDC预测,数据每年都在以50%速度在增长。

数据正在快速的增长,而大量的数据已经无法通过人工在合理时间内达到截取、管理、处理、并整理成为人类所能解读的信息。

因此,大数据可以简单理解为大量的数据,除了大量化,大数据还具有多样化、快速化、价值密度低的特性。大量的、不同来源、不同形式的数据通过现有的技术进行整合、分析,成为了互联网发展的重要生产要素。

数据要素

当前,数字经济已经成为了全球经济发展的重要推动力,快速增长的数据量逐渐实现了量变到质变的转换,产生了全新的价值。

金融时报:Genesis欠债权人超过30亿美元:1月12日消息,据《金融时报》援引知情人士报道,加密货币经纪商 Genesis 欠债权人超过 30 亿美元,促使其所母公司 Digital Currency Group(DCG)考虑出售部分风险投资组合中的资产以筹集资金。DCG 考虑出售的风险投资资产中包括至少 35 个国家的 200 个与加密货币相关的项目,例如交易所、银行和托管机构,价值约 5 亿美元。

Genesis 已聘请投资银行 Moelis 帮助探索各种选择,但迄今为止有关外部资金的谈判未能实现。Genesis 的债务包括欠 Gemini 客户的 9 亿美元、欠荷兰交易所 Bitvavo 的 2.8 亿欧元,以及欠加密储蓄公司 Donut 客户的钱。据知情人士透露,另一组 Genesis 债权人由 Proskauer Rose 的律师代理。[2023/1/12 11:08:42]

2020年4月9日,中共中央、国务院发布《国务院关于构建更加完善的要素市场化配置体制机制的意见》,其中明确提出了土地、劳动力、资本、技术、数据这五个生产要素。

简单来说,数据要素已经成为了数字经济下的新型生产要素,能够作为生产力并产生经济效益,这也意味着,数据将对经济的总体发展起到关键作用。因此数据要素既是来自个人衣食住行、医疗、社交等行为活动,也是来自平台公司、政府和商业机构提供服务后的统计与收集。

Circle CEO:Circle仍将长期致力于成为上市公司:12月5日消息,Circle CEO Jeremy Allaire发推称,Circle仍然长期致力于成为一家上市公司。Circle在2022年第三季度实现盈利,总收入和储备利息收入为2.74亿美元,净收入为4300万美元。Circle在第三季度结束时拥有近4亿美元的无限制现金。

据此前报道,USDC主要发行方Circle Internet Financial与特殊目的收购公司(SPAC)Concord Acquisition Corp宣布,相互终止其最初于2021年7月公布并于2022年2月修订的拟议业务合并计划。终止拟议的业务合并已获得Concord和Circle董事会的批准。[2022/12/5 21:24:02]

数据要素市场

在数据成为和土地、劳动力、资本、技术并列的五大生产要素之一后,加快培育数据要素市场成为了数字经济发展的下一步目标。通过数据要素在交换或流通中形成市场,让数据要素价格由市场定、流动随需求走,配置高效公平,促进数据要素高效合规流通使用。

数据作为互联网时代的重要资产,也是推动数字化发展的最佳手段,然而只有对其进行分析、流通以及确权等操作后才能更好的量化,数据要素释放出有效的价值,为市场提供新的动力。

数据产权

产权的产生,实际上是一个成本收益权衡的过程。

Valor宣布将在法兰克福证券交易所推出比特币碳中和ETP:金色财经报道,金融科技公司Valor宣布将在法兰克福证券交易所推出其新的比特币碳中和交易所交易产品(ETP)。这些ETP的交易于9月23日开始。(PR Newswire)[2022/9/23 7:16:43]

而在数字经济时代下,数据产权可定义为:数据主体对基于数据处理行为而产生的数据所享有的权益,包括数据的所有权、占有权、使用权、收益权、处置权等。

不同于资产产权具有的唯一性和排他性,数据产权因数据的可复制性或而不具有排他性,因此数据产权的利益主体不限定为自然人,还包括法人、非法人组织、政府或国家。同时,数据产权界定是数据要素有效配置的基础,对激活数据要素市场、促进数字经济发展具有重要的意义。

数据失真

数据失真是指原始真实数据经过计算机或者人为原因的改变,造成数据结果与真实数据发生偏差的现象。

数据失真的背后有技术原因,比如数据统计方法不科学、数据采集标准不合理等;同样也不排除人为造假的因素。在生活中最常见的是统计数据失真,数据失真将会带来巨大的损失和影响,随着社会经济发展越来越依赖数据,因此防止数据失真将成为数据经济发展的重要议题。

数据密态

2022年,数据领域将告别数据明文,即将进入“数据密态”的新时代。

XAnge为旗下新基金募集2.2亿欧元,将重点投资DeFi和Web3等领域:7月7日消息,欧洲风投机构XAnge宣布为旗下新基金募集2.2亿欧元,该基金将重点投资数字健康、DeFi、Web3、开发工具、生物资源和生物制造等领域,预计每笔投资规模在30万至1000万欧元之间。

此前,XAnge曾投资过开放银行平台Deposit Solutions和硬件钱包Ledger。据悉该风投正在推出一个名为Digital Ownership Fund的Web3专用基金,计划筹集8000万欧元。[2022/7/7 1:57:44]

数据与其他资产明显不同的是,很容易被拷贝复制。数据流通对于产业信息化进程、数字化转型是必不可少的,但明文数据流通又有显著危害。

面对数据要素发展和数据安全保护的双诉求,数据密态无疑是当前最好的选择。一方面,运营者要想“确保其收集的个人信息安全”,最简单有效的就是保证其数据明文不被其他方获得;另一方面,如果要保持数据价值,匿名化后的数据也需要进行密态化处理。

数据挖掘

在信息化时代下,很多领域每天通常需要处理数以万计的数据交易,这是一种庞大的信息数据处理工程,而怎样在如此庞大数据当中筛选,并且提取及分类真正有价值的数据,成为了主要问题。

而数据挖掘技术则很好地解决了此类问题,因此数据挖掘对于大数据时代而言具有重要的意义。

数据挖掘又常被称为数据库中的知识发现。主要特点是对海量数据进行抽取、转换以及分析等处理,并从中归纳出有建设性的模式或规律辅助决策,其主要经过数据清洗、数据集成、数据转换、数据挖掘、模式评估和知识表示六个步骤。

数据清洗

数据清洗指对数据进行重审和校验的过程,目的在于删除重复信息、纠正存在的错误,提供数据的一致性。

数据清洗顾名思义就是“洗掉脏东西”,指发现并纠正数据文件中可识别的错误的最后一道程序,包括检查数据一致性,处理无效值和缺失值等。

数据清洗技术是提高数据质量的有效方法。数据清洗主要应用于3个领域,即数据仓库领域、数据挖掘领域以及数据质量管理领域。

数据聚类

聚类分析的目的是根据在数据中发现的描述对象及其关系的信息,将数据对象分组。

目的是,组内的对象相互之间是相关的,而不同组中的对象是不相关的。组内相关性越大,组间差距越大,说明聚类效果越好。

数据聚类是对于静态数据分析的一门技术,在许多领域受到广泛应用,包括机器学习,数据挖掘,模式识别,生物信息和图像分析。

数据群岛

谈论数据群岛之前,我们先了解一下数据孤岛。

从数据应用伊始,“数据孤岛”问题一直阻碍着数据运用效能的进一步提升。因此在构想教育数据蓝图的同时,首先需要破除数据的“门户之见”。

何谓数据孤岛?数据孤岛是指不同的数据掌握在不同的政府部门或企业手中,而每个数据系统均各成体系,以各自不同的方式存储在不同的服务器上,导致在功能上互不关联,在信息上互不交换的处境。

因此想破除数据孤岛就需要在数据层面进行集成,建立一个庞大的、完整的、连通的数据仓库。一套完整的数据仓库包含模型语言、优化的数据结构、查询语言及撰写报表的程序以及交易机制。

数据群岛旨在形成数据间关系网,在打破数据孤岛的同时,也形成了独立的数据生态。

数据分类分级

一组数据在遭到篡改、破坏、泄露或者非法使用后必然会对数据拥有者造成不同程度影响,因此可以根据由轻到重的不同影响将数据分为不同级别,方便数据管理时进行不同等级的区别管理。

数据分级本质上是根据数据敏感程度进行分类,因此,我们在数据安全治理或数据资产管理领域,都是将数据的分类和分级放在一起做,统称为数据分类分级。

数据可视化

数据可视化是利用计算机图形学和图像处理技术,将枯燥乏味的数据图形化,以达成清晰有效传达与沟通信息的目的,并进行延伸的交互处理理论、方法和技术。

数据可视化的基本思想是将数据库中的单一数据作为单个图形元素,大量数据集则可以构成数据图像,同时将数据的各个属性以多为数据形式表示,从而能对数据进行更深入的观察与分析。

但数据可视化并不意味着要让图形看上去绚丽多彩而显得华而不实,只要能直观有效地传达信息即可。而如何平衡设计与功能,设计出更直观的数据可视化图形则是另一门学问。例如,目前正在飞速发展的VR技术就是以数据可视化为解决方案的。

数据资产化

属于个人或企业的数字化财产被称为数据资产。

例如,人们日常拍摄的照片、视频,编辑的聊天文字,购物消费产生的信息等都属于人们的个人数据资产。

而对于企业拥有或控制、并且预计将为企业带来经济利益的数据资源,例如设计图纸、合同订单、以及任何涉及到使用文件作为载体的各类业务,都属于企业的数据资产。但需要注意的是,一般来说,企业的数据资产包含有实物纸质文件和电子文件,但数据资产是以数字化形式存在,因此需要将纸质文件转化为数字化形式,才能真正地形成企业的数据资产。

一般来说,数据资产化的范围只包含企业数据资产,通过将其拥有的数据转化为可以交易的资产,例如房产、股票等,这样的过程则称为数据资产化。

数据交易

数据交易近似于“买卖行为”,主要是指数据拥有者和数据使用者达成协议,进行合规的数据资产自由交易。

大数据环境下,企业可以接触到的数据大致可分为用户个人的信息数据、企业采集的数据集合和衍生数据三大类。但目前各大数据交易所交易的对象主要是商业市场数据,都暂未涉及个人信息相关数据。

而对于商业市场数据,也可分为两类数据交易产品:一类是数据集市型交易,主要交易粗加工的企业原始数据,很多交易所或交易中心在发展初期都是以这种交易模式为基本发展思路。

另一类是数据加工服务型交易,数据交易双方不直接交易原始数据,而是将其拥有的数据资源通过特定逻辑和算法进行分类整合、深度加工、匿名处理等处理,通过自己开放数据平台等模式提供数据产品或数据服务,而这一类也是更加成熟的交易形式。

数据交易所

数据交易所形成了一个数商体系,包含有数据交易主体、数据合规咨询、质量评估、资产评估、交付等多领域,并且会设立数据交易制度。

在这里,数据可以进行确权,进行数据价格发现与定价,有明确的监管和规则,给数商入场,给交易方建立互信。它还提供有线上数字化数据交易系统,保障数据交易全时挂牌、全域交易、全程可溯。

目前,各地数据交易所交易的标的不是原始数据,而是通过清洗、分析、建模、可视化等方式对原始数据经过深度分析处理、整合加工而形成的数据产品和服务。

简而言之,数据交易机构不是简单地将买方和卖方进行撮合,而是根据不同用户需求,围绕大数据基础资源进行清洗、分析、建模、可视化等操作,形成定制化的数据产品,然后再提供给需求方。

来源:金色财经

郑重声明: 本文版权归原作者所有, 转载文章仅为传播更多信息之目的, 如作者信息标记有误, 请第一时间联系我们修改或删除, 多谢。

金星链

火必交易所TET:万字长文剖析 FTX 营销之路

FTX是一个虚拟货币交易所,平均日交易量达100亿美元,日注册用户超过600万。2019年FTX开局不利仅收入720万美元,但是仅仅用了36个月,公司的估值便增长了4000%,飙升到320亿美元.

[0:0ms0-1:31ms