【摘要】8月系列重磅会议与政策文件密集发布,国家数据局明确将可信数据空间定位为数据要素流通的核心基础设施。其正从前沿概念加速落地,成为支撑全国一体化数据市场与人工智能发展的国家级新基建。
引言
8月的盛夏,热浪不仅席卷着大地,更涌动在中国的数字经济领域。从北京到贵阳,两场以“可信数据空间”为核心议题的高规格会议接连召开,国家数据局领导与业界顶尖专家频频发声,字里行间透露出强烈的政策信号。紧随其后,《可信数据空间创新发展报告(2025)》的发布,更是为这一新兴领域的发展现状与未来路径给出了清晰的描绘。
这一切并非偶然。当数据成为第五大生产要素,如何让其安全、高效、合规地“流动”起来,便成了数字经济发展的核心命题。长期以来,数据因其敏感性、权属复杂性,面临着“不愿共享、不敢共享、不能共享”的困境。而人工智能大模型的崛起,对高质量、大规模、多样化的训练数据提出了近乎贪婪的需求,进一步加剧了数据供给的结构性矛盾。
在这样的时代背景下,**可信数据空间(Trusted Data Space, TDS)**作为一种全新的解决方案浮出水面。它不是一个孤立的技术,而是一个集技术、规则、生态于一体的复杂系统,旨在构建一个多方参与、权益清晰、安全可控的数据流通利用环境。
这篇文章将带您深入探寻8月以来的一系列动向,层层剖析可信数据空间如何从一个略显晦涩的技术术语,一步步被推上“国家级新型基础设施”的战略高地。我们将一起解读政策背后的深意,洞察产业实践的亮点,并探讨其技术内核与生态逻辑,最终勾勒出它在中国数字经济版图中的未来坐标。
🚀 一、风向标已立:京黔两地会议定调新范式
政策的春风,往往最先在顶层会议上吹起。8月下旬,北京的“2025可信数据空间推进大会”与贵阳的“AI可信数据空间大会”,如同两座灯塔,照亮了可信数据空间的前行道路。国家数据局的密集发声,为整个行业的发展定了调、划了重点。
1.1 北京推进大会:筑牢“可信”之基
在北京召开的推进大会,主题是“可信筑基,数据赋能”。这个主题本身就点明了核心,“可信”是基石,“赋能”是目标。
国家数据局领导在会上明确指出,可信数据空间是**“数据要素流通基础设施”**。这个定义至关重要,它将可信数据空间从一个应用层面的“工具”,提升到了支撑整个数据要素市场的“底座”高度。其核心作用,在于培育全国统一的数据大市场,为各行各业的数字化转型提供坚实支撑。
中国工程院院士沈昌祥的观点则从安全角度提供了佐证。他强调,数据要素的共享共用,必须建立在安全可信的基础之上。没有安全,一切都是空中楼阁。因此,必须依托自主可信的计算技术,构建起一套完整的安全保障体系,才能真正打破数据孤岛,让数据在可信的环境中自由流动。
这次大会传递出的信号非常清晰,国家层面正在全力推动构建一个以“可信”为核心的数据流通新秩序,而可信数据空间,就是承载这个新秩序的关键载体。
1.2 贵阳AI大会:破解“数据+AI”协同难题
如果说北京大会是定战略、筑根基,那么几天后在贵阳举办的AI可信数据空间大会,则更加聚焦于应用场景的“尖刀班”——人工智能。
当前,AI大模型的发展一日千里,但其背后最大的制约因素之一,就是高质量训练数据的匮乏。华为公司董事陶景文在会上的比喻生动而深刻,“没有数据,发展人工智能就是无源之水、无本之木”。他一针见血地指出,数据流动的最大障碍,源于信任的缺失。数据持有方担心数据泄露、隐私侵犯、价值受损,从而不敢将数据拿出来。
可信数据空间,恰恰是为解决这个信任难题而生。它通过技术和制度的双重保障,实现了“数据可用不可见、使用可控可计量”,让数据提供方在确保自身权益和安全的前提下,放心地将数据投入流通,为AI模型提供源源不断的“养料”。
会上,贵州省大数据发展管理局与华为云联合发布的《AI可信数据空间白皮书》,更是将这种协同发展的理念落到了实处,系统性地探索了AI与数据空间融合的技术路径与制度框架。
1.3 核心共识:从“不敢、不愿、不能”到“可信、可用、可控”
综合京黔两地会议的观点,我们可以清晰地看到,从国家主管部门到产业领军者,再到学术界的权威专家,已经形成了一个高度统一的核心共识。
问题共识:数据流通的核心障碍是信任问题,具体表现为数据持有方的“不敢、不愿、不能”。
方案共识:可信数据空间是破解信任难题、实现数据“可用不可见”的中国方案。
价值共识:其核心价值在于激活数据要素潜能,既能支撑传统产业的数字化转型,又能为AI等前沿科技的发展提供关键动能。
这个共识的形成,标志着可信数据空间的发展已经度过了概念普及阶段,正式进入了以政策引导、产业实践、场景落地为核心的规模化发展新时期。
🗺️ 二、蓝图初展:《创新发展报告》勾勒实践全景
如果说高层会议是吹响了号角,那么国家数据局在8月底发布的《可信数据空间创新发展报告(2025)》(以下简称《报告》),则是一幅详尽的作战地图。《报告》系统梳理了我国首批试点项目的实践成果,用翔实的数据和案例,勾勒出了可信数据空间发展的现实图景,并提炼出四大核心亮点。
2.1 亮点一:为AI注入高质量“数据燃料”
《报告》将“为AI提供高质量‘数据燃料’”放在了四大亮点的首位,足见其重要性。随着大模型参数规模的指数级增长,其对数据的需求也呈爆炸式增长。然而,公开网络上的数据质量良莠不齐,且已基本被“喂”完,高质量的行业数据、私域数据则深藏在各个机构的“保险柜”里。
可信数据空间通过构建一个安全域,让这些沉睡的数据得以“出柜”。例如,在金融领域,多家银行可以通过数据空间,在不暴露各自客户隐私数据的前提下,联合进行信贷风控模型的训练,极大提升了模型的精准度和覆盖范围。在医疗领域,多家医院的临床数据可以汇入可信数据空间,用于新药研发和精准诊疗模型的开发,而无需担心患者隐私泄露。
《报告》指出,可信数据空间正在成为连接高质量数据源和AI模型训练需求的关键桥梁,有效破解了AI产业发展的“数据瓶颈”。
2.2 亮点二:服务国家战略与民生福祉
可信数据空间并非空中楼阁,其最终价值体现在对实体经济和国计民生的服务能力上。《报告》用一组数据清晰地展示了其广泛的应用渗透。
覆盖领域广:试点项目已广泛赋能金融、医疗、交通、能源、制造、政务等十大关键领域。
行业渗透深:覆盖了国民经济32个行业大类,显示出其通用性和普适性。
应用场景多:已探索和拓展了超过900个应用场景,从宏观的产业链协同到微观的个人便捷服务,无所不包。
例如,在智慧交通领域,交通管理部门、地图服务商、网约车平台可以通过数据空间共享实时路况、车辆轨迹等数据,进行城市交通流量的智能调度,有效缓解拥堵。在政务服务领域,“一网通办”的背后,正是多个政府部门通过数据空间实现的数据安全共享,减少了市民重复提交材料的烦恼。这些实践,有力地服务了国家重大战略,也实实在在地改善了民生。
2.3 亮点三:构建互信协作的产业新生态
一个新事物的成功,离不开一个繁荣的生态。《报告》揭示,可信数据空间正在催生一个全新的、以互信协作为基础的产业生态。
这个生态的核心特征是引入了可信的第三方机构,如数据空间运营方、技术服务方、安全审计方等,它们共同构建起一个中立、公正的流通环境,改变了以往数据交易“点对点”谈判的低效和不信任模式。
《报告》数据显示,首批试点项目已经带动了近7万家市场主体参与其中。这些主体构成了完整的产业链条,形成了一个协同网络。
这个生态的形成,意味着可信数据空间不再是少数巨头的“独角戏”,而是成千上万家企业共同参与的“大合唱”,其发展动力和创新活力得到了极大增强。
2.4 亮点四:探索“四位一体”的流通规则框架
技术解决了“能不能”的问题,而规则则要解决“该不该”和“怎么办”的问题。《报告》总结,各试点项目在实践中,都在积极探索构建一套行之有效的规则框架。
这个框架被概括为**“四位一体”**,虽然不同材料的表述略有侧重,但其核心内涵是一致的,即一个多维度、动态完善的治理体系。
安全保障体系:这是底线。涵盖了从技术层面的数据加密、脱敏、隐私计算,到管理层面的安全审计、应急响应、风险评估等全方位的安全措施。
合规机制设计:这是红线。确保所有数据流通活动都严格遵守《网络安全法》《数据安全法》《个人信息保护法》等法律法规,明确数据分类分级、出境安全评估等合规流程。
生态合作模式:这是动力源。设计清晰的参与方权责利机制,包括数据定价、收益分配、知识产权保护等,激励更多主体参与生态共建。
价值评估体系:这是度量衡。建立科学的数据资产质量评估和价值评估模型,解决数据“价值模糊、定价困难”的问题,让数据要素的价值可以被公允地衡量和交易。
这套规则框架的探索,为未来全国范围内可信数据空间的互联互通和规模化运营,奠定了坚实的制度基础。
🏛️ 三、战略升维:《行动计划》奠定“国家级基建”地位
如果说会议和报告是“点”和“线”,那么2024年11月国家数据局正式印发的《可信数据空间发展行动计划(2024—2028年)》(以下简称《行动计划》),则是将这些点和线连接起来,绘就了一幅宏大的“面”。这份文件,是国家层面首次针对可信数据空间进行系统性、前瞻性布局的纲领性文件,其分量不言而喻。
3.1 顶层设计的里程碑:首次系统性布局
《行动计划》的发布,标志着可信数据空间的战略地位实现了空前提升。文件开宗明义,给出了权威定义。
可信数据空间是基于共识规则,联接多方主体,实现数据资源共享共用的数据流通利用基础设施。
这个定义中有两个关键词。
“基于共识规则”,强调了其治理属性,它不是一个纯技术系统,而是一个社会技术系统。
“数据流通利用基础设施”,再次强化了其“基建”定位,并明确其核心功能是“流通利用”。
更重要的是,《行动计划》将其视为**“支撑构建全国一体化数据市场的重要载体”**。这意味着,在国家数据要素战略的顶层设计中,可信数据空间被赋予了承上启下的核心枢纽角色。它将成为连接各地数据资源、打通各行业数据壁垒、形成全国统一数据要素大循环的关键一环。
3.2 宏伟目标与清晰路径:“100+”空间的五年之约
《行动计划》没有停留在宏观定性,而是给出了明确的量化发展目标,为未来五年的发展规划了清晰的路线图。
总体目标:到2028年,基本建成广泛互联、资源集聚、生态繁荣、价值共创、治理有序的可信数据空间网络。
具体目标:
数量上:建成100个以上形态多样、应用广泛的可信数据空间。
效能上:数据开发开放和流通使用水平显著提升。
生态上:初步形成与我国经济社会发展相适应的数据生态体系。
这个“100+”的目标,意味着未来几年,可信数据空间的建设将从“盆景”走向“森林”,在全国范围内掀起一场建设热潮。
3.3 “三大行动”与“五类空间”:分类施策,精准发力
为了实现上述目标,《行动计划》设计了周密的实施路径,部署了“三大行动”,并对“五类空间”的建设提出了差异化的发展要求,体现了分类施策、精准发力的科学方法论。
三大核心行动
能力建设行动:聚焦于“强内功”。包括攻关一批核心关键技术,如高性能隐私计算、跨域协同联邦学习等;研制一批关键共性标准,解决互联互通的“普通话”问题;建设一批公共服务平台,降低中小企业参与门槛。
培育推广行动:聚焦于“拓应用”。鼓励在重点行业和区域开展先行先试,打造一批可复制、可推广的标杆案例,通过示范效应带动全面发展。
筑基保障行动:聚焦于“优环境”。包括强化数据安全保障能力,完善相关法律法规和政策体系,以及积极拓展国际交流合作,参与全球数据治理规则的制定。
五类重点空间
《行动计划》根据应用场景和主体类型的不同,将可信数据空间划分为五类,并指明了各自的发展方向。
这种分类推进的策略,使得宏大的国家计划能够精准地落到具体的产业和场景中,具有极强的可操作性。
3.4 地方实践的探索:从上海到温州的多样化模式
国家顶层设计出台的同时,地方的探索早已先行一步。上海、江苏、温州、南昌等地,结合自身的产业特色和发展需求,积极探索了多元化的建设模式,为《行动计划》的全面铺开积累了宝贵经验。
上海模式:依托国际金融中心的地位,聚焦金融、航运等领域,推动数据要素的高价值应用,并积极探索数据跨境流动的规则对接。
江苏模式:发挥制造业大省的优势,重点建设工业数据空间,推动工业互联网平台的数据共享,赋能“智改数转”。
温州模式:结合民营经济发达的特点,探索服务中小企业的普惠式数据空间,降低其数字化转型成本。
这些地方实践,如同一个个充满活力的“试验田”,不仅验证了可信数据空间的可行性,也为不同区域如何因地制宜地推进建设,提供了生动的范本。
💡 四、技术与生态的深层逻辑:从“连接”到“共创”
要深刻理解可信数据空间为何能被提升至国家级基建的高度,我们必须潜入水面之下,探究其技术内核与生态逻辑。它不仅仅是简单的“数据连接”,更是要构建一个能够激发“价值共创”的复杂生态系统。
4.1 技术内核:解构可信数据空间的核心组件
可信数据空间并非单一技术,而是一个由多种技术有机组合而成的技术栈。北京大学教授黄罡等学者提出的“数联网”和数据空间理念,正是对其技术愿景的深刻描绘,即通过统一的数字对象架构,实现私域数据的广域复用。其核心技术组件通常包括以下几个层面。
4.1.1 身份认证与访问控制
这是数据空间的第一道门。所有参与方,无论是人、机构还是设备,都必须拥有一个唯一的、可信的数字身份。通过这套体系,可以对每一次数据访问请求进行严格的身份验证和权限检查,确保只有合法的用户在授权范围内访问数据,这是实现“可控”的基础。
4.1.2 数据安全与隐私计算
这是实现“可用不可见”的核心技术保障。它不是指单一技术,而是一个技术工具箱。
多方安全计算(MPC):允许多个参与方在不暴露各自原始数据的情况下,协同完成计算任务。
联邦学习(FL):一种分布式机器学习技术,各方数据不出本地,只交换模型参数,即可联合训练出一个全局模型。
可信执行环境(TEE):基于硬件的安全技术,在处理器中创建一个隔离的“安全区”,数据在其中进行计算,即使是操作系统也无法窥探。
同态加密(HE):允许在加密状态下对数据进行计算,得到加密的计算结果,解密后与明文计算结果一致。
这些技术的组合应用,构成了数据空间坚实的安全内核。
4.1.3 互操作协议与标准
如果每个数据空间都用自己的一套语言和规则,那么全国“100+”个数据空间建成后,依然是一个个新的“数据孤岛”。因此,统一的互操作协议和数据标准至关重要。这包括统一的数据描述模型、API接口规范、数据交换协议等,确保不同技术架构、不同运营主体的数据空间之间可以顺畅地“对话”和“协作”,真正形成一张“网”。
4.1.4 价值计量与清结算
数据作为要素,其流通必然伴随着价值的转移。数据空间需要一套精准、透明的价值计量和清结算机制。这通常会借助区块链等技术,将每一次数据的使用、调用、计算等行为都记录在不可篡改的分布式账本上,为后续的价值分配、收益清算提供可信的依据,解决“糊涂账”的问题。
下面是一个简化的可信数据空间技术架构示意图。
4.2 生态构建:超越技术的商业与治理模式
仅仅有先进的技术是远远不够的。一个成功的可信数据空间,更是一个成功的商业与治理生态。
4.2.1 参与方角色与权责利
生态的稳定运行,依赖于对各参与方角色的清晰界定和权责利的合理分配。数据提供方、数据使用方、技术服务方、空间运营方、监管方,各方诉求不同,必须通过精巧的制度设计,形成一个多方共赢的格局。例如,如何保障数据提供方的最终收益权,如何激励应用开发方创造更高价值的应用,如何确保运营方的中立性和盈利能力,这些都是需要持续探索的治理难题。
4.2.2 商业模式的创新探索
可信数据空间的商业模式也在不断创新,早已超越了简单的“按次调用”收费。
订阅制:用户按年或按月支付费用,获得一定范围内的数据访问和计算服务。
收益分成:基于数据开发出的应用或模型所产生的收益,在数据提供方、应用开发方、平台方之间按约定比例分成。
数据信托/基金:将数据作为一种资产进行信托管理,由专业机构运营,参与者分享收益。
这些商业模式的探索,旨在让数据价值的实现路径更加多元和可持续。
4.2.3 治理体系的构建挑战
长远来看,可信数据空间面临的最大挑战可能来自于治理。如何处理数据流通中的纠纷?如何认定数据侵权责任?如何平衡数据利用与个人隐私保护的边界?这些问题不仅需要技术和商业层面的创新,更需要法律、伦理、社会规范层面的不断完善。构建一个敏捷、包容、有效的治理体系,将是可信数据空间能否行稳致远的关键。
总结
回顾8月以来的密集动态,一条清晰的脉络已经浮现。在国家顶层设计的强力推动下,在人工智能等产业需求的迫切牵引下,可信数据空间正以前所未有的速度,从一个前沿的技术理念,演进为支撑整个数字经济运行的“国家级新型基础设施”。
它不再仅仅是解决数据共享难题的“术”,更是重塑数据要素市场格局、构建数字时代信任体系的“道”。从京黔两地会议的高瞻远瞩,到《创新发展报告》的实践总结,再到《行动计划》的宏伟擘画,我们看到的是一个国家在数据要素这一全新生产要素领域的战略决心与行动魄力。
当然,前路依然充满挑战。核心技术仍需攻关,商业模式有待成熟,治理规则尚在探索,生态系统更要精心培育。但方向已经明确,共识已经凝聚。正如国家数据局副局长陈荣辉所言,可信数据空间将助力构建一个繁荣活跃的全国一体化数据市场。
未来,随着“100+”可信数据空间的陆续建成和互联互通,一张覆盖全国、连接百业、赋能万象的“数据之网”将徐徐展开。这张网,将为中国数字经济的高质量发展注入持续澎湃的动力,成为数字中国建设最为坚实的基石之一。
📢💻 【省心锐评】
可信数据空间,本质上是用技术和规则重构商业信任。它不是万能药,却是数据要素市场化配置从“口号”走向“现实”的必经之路,是数字经济的“新高速公路网”。
评论