构建个人数据开发利用的多层次基础设施
PeopleData的数据层(Data Layer)是一个多层次的架构设计,旨在解决个人数据开发利用中的"安全、开放和隐私"三重利益之间的不可能三角困境。
负责个人数据的原始生成和采集,是整个数据价值链的起点。
实现个人数据资产的保护、治理和管理,确保数据主权。
构建自治、动态、虚拟和分布式的个人数据合作组织,实现数据价值的释放。
基于底层基础设施,构建多样化的场景应用,实现数据价值的多元化开发利用。
PeopleData数据层结构示意图
DL1层是PeopleData架构的核心层,负责实现个人数据资产的保护、治理和管理,确保数据主权。
确保不同系统、平台之间的数据互通和协作。
对数据全生命周期的处理过程进行监控和可视化。
建立数据处理和使用的信任机制。
实现数据的资产化管理和价值评估。
建立数据治理的规则和机制。
互操作性是确保数据提供者、数据消费者和数据生产者之间有效协作的关键,需要遵守共同的标准和协议。
数据模型需要满足几个维度的考量:
按照分类分级标准可以划分为17大类,22个小类,以及1-5安全级别。参考《信息安全技术 个人信息安全规范》 GB/T35273-2020
主要考虑机器可读、自动化处理和数据资产管理,满足W3C VCs的标准,可验证的数据格式。例如:JSON-LD。
个人数据格式还有待标准化。
按照交收参与者分类:
按照隐私和安全分类:
数据在整个生存周期内(从产生、传播到消亡)的演变信息和演变处理内容的记录。数据溯源也称为"数据族系"、"数据系谱"。ProVOC 模型(provenance vocabulary model)定义了一种简便数据溯源描述模型。
数据溯源参考模型
数据血缘属于数据治理中的一个概念,是在数据溯源的过程中找到相关数据之间的联系,了解数据是怎么来的,经过了哪些过程和阶段。
血缘分析是保证数据融合的一个手段,通过血缘分析实现数据融合处理的可追溯。数据血缘跟踪、记录、展示了数据来自何处,以及在数据流转过程中应用了哪些转换操作,它有助于追溯数据来源及处理过程。
DL2层负责构建自治、动态、虚拟和分布式的个人数据合作组织,实现数据价值的释放和资本形成。
确保个人数据在开发利用过程中的隐私安全。
保障数据在存储、传输和处理过程中的安全性。
构建数据价值评估、交易和分配的经济模型。
DL2层需要解决的一个特别重要的问题是:可信的数据、可信的算法、可负担的算力。
对于交易双方而言,产生价值依赖于"数据、算法和算力"的综合作用,缺一不可。这其中有大量的技术以及法律、制度、标准和规范等。
具体实现可能有多种形态。参考架构仅提出一些原则和一个示范性实施实例,并不具体指定和要求。
一笔业务的步骤描述如下:
深入了解PeopleData参考架构的其他组件和实现方案。