第七期大讲堂回顾 | 蓝晏翔:数据交易市场的重要基础设施——隐私计算
4月23日,由深圳数据经济研究院发起主办的前海数据经济大讲堂第七期在线上成功举办。深圳数据经济研究院的官方视频平台及新浪、凤凰等媒体平台进行了全网直播,受到政府、业界、学界的多方瞩目。本次大讲堂围绕数据交易这一主题,探讨作为新的生产要素,数据被称为数字经济时代的“石油”,价值巨大不容忽视。数据交易升温背后的底层逻辑是什么?挖掘这一宝贵资源需要做好哪些准备?对“数商”新业态有怎样的启发?
演讲实录节选:
早在“十三五”期间,通过数字经济提速中国经济发展,已上升至国家战略高度。“十四五”规划提出,加快数字化发展,建立数据资源产权、交易流通、跨境传输和安全保护等基础制度和标准规范,推动数据资源开发利用。数字经济已成为稳定经济增长的关键动力,2020年,中国数字经济规模达到39.2万亿元,占GDP比重达38.6%。总体上,我国数字经济创新创业活跃,数字技术蓬勃发展,数字经济与实体经济的融合日益深化,新技术、新产品、新业态、新模式不断涌现。
数据要素市场备受重视
数字经济时代下,推动信息流动,数据流通成为共识。2020年4月,数据作为生产要素正式被写入《关于构建更加完善的要素市场化配置体制机制的意见》。这标志着,数据要素成为数字经济时代的基础性资源、战略性资源和重要生产力。
紧接着,国家和地方政府相继推出一系列政策支持数据要素市场培育的探索。在2021年5月国家统计局发布的《数字经济及其核心产业统计分类(2021)》指出,数据资源是数字经济发展中的关键生产要素。
数据要素流通难题
然而,数据本身的特点导致其交易和发挥价值过程中面临着一系列挑战,包括数据的非竞争性和可复制性不利于数据流通和交易,数据的时效性使其无法有效应用市场化机制等。
同时,由于现有数据交易平台的数据权属不清,数据交易技术机制不成熟以及隐私与安全的考虑导致数据不流通,数据价值发挥受阻。因此,需从多个维度推动数据资产化以及数据交易,而从技术层面,需首要解决隐私安全计算问题。
数据交易破局之道——隐私计算
今年1月份国务院办公厅印发的《要素市场化配置综合改革试点总体方案》中特别提到,要建立数据要素流通规则,探索“原始数据不出域、数据可用不可见”的交易范式,以“数据可用不可见”的形式保障数据安全的隐私计算将成为数据交易的破局之道。
隐私计算,是指在保护数据本身不对外泄露的前提下实现数据分析计算的技术集合。隐私计算技术是人工智能、密码学、区块链、数据科学及计算芯片等领域的交叉融合,能够实现数据处于加密状态或者非透明状态下的计算,以达到各参与方隐私保护的目的。隐私计算以现代密码学为核心,协同计算机体系结构、计算复杂性理论、信息论、统计学、抽象代数、数论等理论共同发展。
现如今,隐私计算已在金融、政务、医疗等场景,尤其是关键基础设施行业开展了探索和实验,应用前景广阔。以金融领域为例,隐私计算在信贷风险评估、供应链金融、保险业、精准营销、多头借贷中均能发挥重要作用。依托隐私计算技术,探索实现“数据可用不可见,数据不动价值动”的数据流通交易新范式,成为数据融合创新的新途径、新方向。
隐私计算的概念虽是近些年才被提出,但其涵盖的技术理论研究已有一定的历史。目前,隐私计算主要的技术路线有,基于密码学协议的安全多方计算(SMPC);不移动数据移动模型的联邦学习(FL);基于硬件的可信执行环境(TEE)。
一、安全多方计算(Secure Muliti-Party Computation,SMPC)最早是由图灵奖获得者、中国科学院院士姚期智于1982年正式提出,解决一组互不信任的参与方各自持有秘密数据,协同计算一个既定函数的问题,安全多方计算在保证参与方获得正确计算结果的同时,无法获得计算结果之外的任何信息。
二、联邦学习(Federated Learning,FL)在2016年由Google最先提出,最先被用于解决安卓手机终端用户在本地更新模型的问题,其设计目标是在保障大数据交换时的信息安全、保护终端数据和个人数据隐私、保证合法合规的前提下,在多参与方或多计算结点之间开展高效率的机器学习。联邦学习可使用的机器学习算法不局限于神经网络,还包括随机森林等重要算法。
三、可信执行环境(Trusted Execution Environment,TEE)这是一种基于硬件可信执行环境实现数据应用保护的技术。核心思想是构建一个独立于操作系统而存在的可信的、隔离的机密空间,数据计算仅在该安全环境内进行,通过可信硬件来保障其安全。
IDEA研究院 AISS——SPU可信计算解决方案
基于对隐私计算的持续探索和研究,IDEA研究院 AISS 自行研制了一款拥有完全自主知识产权的,可提供安全可信计算环境的新型协处理器SPU —— Nereus,兼具安全可信,高性能和普适性。总体上,该SPU可信计算解决方案具备独立的计算和存储单元,可支持多方数据和算法的高性能可信计算,实现各方数据和算法的“可用不可见”。同时,SPU提供了一种全新的软硬件架构,能够实现对于多方可信计算的全方位、全流程保护。
具体而言,SPU具备以下特点:
一、硬件级安全保障
SPU通过硬件级的加密和隔离手段来保障安全。一方面,SPU提供硬件级的加解密芯片以及完全独立的计算和存储单元;另一方面,SPU通过高速PCle接口与外界传输加密数据,为高性能可信计算提供硬件级别的安全保障。
二、监管可介入
SPU提供了完备的存证和审计机制,可监管每次计算的参与方、算法、数据及操作日志。
三、高性能计算
基于灵活可配置的系统架构以及创新的安全容器技术,SPU可轻松满足有大规模、高性能要求的隐私计算需求。
四、算法普适
SPU可支持包括深度学习,统计算法,决策树等任意算法,具有图灵完备性,可降低使用成本,提升开发效率。
五、自主可控
SPU具备完全独立自主的知识产权,是一款自主可控、安全可靠的产品。
直播回顾:第七期前海数据经济大讲堂