《6G数据面架构研究》

发布于:2024-04-18 ⋅ 阅读:(14) ⋅ 点赞:(0)


一、数据服务的定义

  • 狭义定义: 数据为应用提供符合需要的数据操作(增删改查)和数据视图的各种能力
  • 广义定义: 在符合数据隐私保护的前提下,数据的全生命周期管理,包括数据采集、传输、存储、处理(计算、训练等)、能力开放、交易、销毁等。
  • 数据服务基于数据分发和发布框架,将数据及数据分析处理方法包装为一种服务产品,来满足应用跨域跨实体的实时数据需求
  • 6G数据服务支持端到端的数据采集、传输、存储和共享,解决如何将数据方便、高效、安全地提供给网络内部功能和网络外部应用

二、6G数据服务驱动力及面临的挑战

6G数据服务的业务驱动

  • 1.价值体现

      网络内生的感知和智能为6G网络带来了新的能力和服务,同时也带来了全新的数据流量,包括海量的感知数据和AI数据。这些数据蕴含巨大的价值,需要高效的数据管控机制实现数据变现。
       ① 以5G为代表的现有通信网络作为数据传输的通道,其PDU会话机制无法满足6G新业务对分布式泛在数据的随路计算要求
      ② 现有数据驱动的技术框架只关注特定网络域数据,且多在网络管理层面为网络运营提供自动化运维功能,无法形成统一的数据管控架构 (理解为:现有框架无法很好地整合不同来源的数据,或者说不能有效地处理各种不同类型的数据)
      因此在深入分析5G用户面与现有数据驱动的技术架构的基础上,为6G网络引入数据面架构,借助数据编排和数据承载等实现灵活的数据服务

  • 2.法律法规要求

      从技术层面对数据隐私的保护,数据主体能够自主决定是否将个人数据变现、共享或提供给AI模型进行训练
      然而,目前的 NWDAF 数据服务架构只有基础的网络功能(NF)间的认证功能,而无法支撑提供对数据的接入控制、溯源、审计等可信服务,尤其是满足 PIPL/GDPR 等法律法规对数据的 E2E 的可信服务要求。

  • 3.数据变现

      6G 时代,将会增加感知、AI 模型等数据,数据作为6G网络的核心资产,将驱动网络智能,催生数据分享和变现。
      区别于传统网络作为数据传输的“管道”,6G网络将通过构建架构级的数据服务框架,在严格遵守数据法规的前提下,实现对数据访问的可控和合理使用,及价值变现

  • 4.流量模型变化驱动随路数据处理

      6G网络新技术、新业务、新需求等对数据的管控和处理提出了新的需求。现有基于云化AI架构的数据管控和处理,包括网络数据分析功能(NWDAF),对数据的处理,都是先汇聚到云,再进行预处理、存储、分析等操作,最后把分析结果返回。由于通信感知和网络AI的引入,未来6G网络流量模型将发生变化,有70%的流量将终结在网络边缘,现有这种集中到云端的方式就不再适用。需要把在云端集中数据处理的方式打散到网络中,数据在其数据管道的各节点转发的同时,进行预处理、汇聚、分析等处理,这种由于分布式算力和数据带来的边处理边转发的模式,我们称之为随路处理的数据承载,数据流量边缘化驱动了数据处理也分布化,从而有效支撑网络AI、通感一体化等 (理解为:直接在边缘节点进行一系列处理)

    在这里插入图片描述

6G数据服务的技术驱动

  • 1.DOICT 融合技术驱动数据服务智能化和自动化

      数据技术 DT、运营技术 OT、信息技术 IT 和通信技术 CT(DOICT)的全融合将共同驱动网络变革和能力升级
      随着计算和存储成本的降低,以及大量低时延业务和局域应用的出现,计算和存储、以及依赖于两者的智能算法趋向于在靠近数据源的网络边缘部署,从而形成了以数据为中心的网络架构
      移动通信网络的基本功能也将开始从信息传递的管道数据管控的平台转变

  • 2.分布式技术使能数据服务能力多样化

    区别一:

    • 5G网络的数据是点对点单域通信的 (存疑)
    • 6G网络的数据是融合多网络的跨域跨系统通信

    区别二:

    • 5G网络基于业务为中心的架构设计,造成数据孤岛(数据无法有效整合和共享),使得数据质量和使用效率不高
    • 6G网络中的数据呈现分布式特征,来自不同设备的数据可能最终会汇聚到一个设备进行计算,驱动 6G 网络
      在设计时需要支持任意拓扑传输

    区别三:

    • 5G中很多数据是一次性使用的,几乎不会被存储再使用,例如终端上报的测量信息等
    • 6G网络支持数据的存储和共享,数据可以被内生AI用于优化网络性能,也可以用于多应用程序共享访问

    综上,6G数据具有跨域共享,分布式,复杂拓扑传输、网内存储的特点

    为解决数据的存储和搜索问题:

    在这里插入图片描述

    针对分布式数据安全管理:采用区块链技术;见白皮书P11

6G数据服务的网络内在驱动

  5G网络围绕业务为中心设计,数据伴随各类业务与应用形成数据孤岛,难以进行有效协同实现数据价值最大化。
  不同于5G网络作为数据承载和传输平台仅负责建立安全会话通道,6G网络需要实现基于云边协同的数据实时智能处理,在传输过程中同时执行数据处理,为智能和自动化决策算法提供可信高质量数据,进而使得网络架构原生支持数据服务

6G数据面面临的挑战

  • 1.6G新的数据类型对现有用户面带来挑战

    5G通信网络是基于会话构建的,其用户面用于承载会话数据。由于无法满足6G数据承载所需要的“随路计算”和“任意拓扑”支持,5G用户面无法承载6G网络新的数据类型。
    在这里插入图片描述

    • 5G用户面的会话连接实现两个通信设备之间的信息交互,具体是由协议数据单元(ProtocolDataUnit,PDU)会话提供用户终端设备和网络之间端到端的用户面连接。而6G数据面传输则由数据采集、预处理、转发、存储和分析等功能组成
    • 用户面传输是针对人与人或人与机器之间的通信连接,而数据面处理的数据是由机器/算法生产和消费的
    • 5G 用户面会话只实现数据包传输,而 6G 数据面传输网络则需要实现随路计算,在数据管道中,数据被转换和优化以达到数据分析和智能应用所需状态
    • 在数据转发行为上,会话的数据包基于目标地址进行转发。而数据管道中,数据包则基于数据服务和数据管道标识进行转发
    • 基于5G用户面会话的数据转发属于TCP/IP层,而数据面的数据转发则属于应用层
    • 基于会话的拓扑是点对点的连接,而6G数据面则需要支持任意拓扑结构(如数据分发和数据聚合需要的树形结构)
        此外,如果沿用现有用户面承载所有6G网络数据,数据的起始和终结只能在PDU会话的两端,即用户设备(UserEquipment,UE)或用户面功能(UserPlaneFunctions,UPF),无法满足对感知数据、AI数据、网络行为和状态数据的分布式管控。因此,6G网络需要引入独立的数据面
  • 2.数据服务需求多样性及敏捷相应

      现有的数据服务架构普遍缺乏编排和感知各域数据的能力,无法敏捷响应。现有NWDAF收集的数据类型有限,只能实现单域(核心网侧)智能,缺乏感知UE、RAN等各域数据的能力,及对全域数据编排能力,支撑的应用场景和用例有限,当前NWDAF只定义了十几种数据服务类型ID,基本只用于网优和客户体验提升等场景,且需要预定义的方式来支持。在面对新业务和新需求时,需要从新走标准流程,无法实现敏捷响应。
      6G时代,新终端、新技术、新需求等将促进新业务更加繁荣,新应用层出不穷。数据服务需要满足新业务快速上线的需求,以及适应数据分布式,算力分布式的趋势。通过数据管道可编程来应对数据服务应用的多样化,同时,数据编排能够敏捷响应新业务,快速实现TTM(TimeToMarket)。

  • 3.用户数据平滑快速迁移,兼容性挑战

    用户数据网元的融合也带来了诸多问题。为了实现鉴权数据的重用、鉴权同步、被叫域选择等能力,不同代价的不同系统间的用户数据需要进行融合,通过新建或升级部署用户数据网元,再将全网用户的存量数据割接到新的用户数据网元中,存在网络资源浪费、数据割接量巨大、升级时间长等问题。因此,6G网络需要考虑优化用户数据网元存储性能,以支持不同网络间的统一鉴权、认证,向业务平台提供统一的用户视图

  • 4、数据采集中的隐私、融合等问题

    在数据隐私方面,由于6G及未来无线网络将连接海量、多种类的设备,且支持丰富的应用场景,因此网络中的数据数量庞大且种类繁多,此时会涉及大量用户隐私数据

  • 5、云原生对数据采集的影响 (没看明白)

    云原生趋势,对数据采集提出了新的挑战。云原生环境下,网络功能可以随时实例化,传统的硬采集要硬件绑定网元,制定特定的采集方案,对云原生环境,硬采方案力不从心;同时网络架构服务化,使得接口也服务化,进行了加密增加,传统硬采通过抽头从接口采集数据的方式,将拿到的都是加密的数据,无法使用。云原生趋势下,导致硬采成本急剧上升,这样在网络功能中内置软采集的方式将成为必然。

  • 数据的增长速度远超通信容量的增长速率。

    不可能把所有的数据都传到数据中心进行处理。从成本考虑,文献[2]估计10nJ/bit消耗,如果1M zettabytes传输500Km,则需要22trillionKWh的能量。nJ即 1 0 − 9 10^{-9} 109J;zettabytes即ZB(泽它字节或皆字节,1ZB= 1 0 3 10^{3} 103EB= 1 0 6 10^{6} 106PB= 1 0 9 10^{9} 109TB)。预计2032年,每年数据为1M zettabytes。而三峡大坝现在每年(2020年左右)约发电1100亿度电(1度电=1千瓦时),即每年需要约220个三峡来发电才够传输这些数据 10 ∗ 1 0 − 9 J / b i t ∗ 1 ∗ 1 0 6 ∗ 1 0 9 ∗ 1 0 12 ∗ 8 ) / 36 ∗ 1 0 5 = 25 t r i l l i o n K W h 10*10^{-9}J/bit*1*10^{6}*10^{9}*10^{12}*8)/36*10^{5}=25trillionKWh 10109J/bit110610910128/36105=25trillionKWh


三、6G数据服务典型场景

自动化网络运维

6G网络功能将变得愈加复杂,给网络运维管理带来了巨大的挑战。

  • 传统运维:依靠专家经验被动运维,问题定位困难,资源投放不精准,运维效率低。此外,需要大量手动配置和诊断,带来较高的管理开销
  • 6G网络:需要引入智能化手段,实现快速运维,主动运维

用户体验提升

  6G网络将拥有形态各异的终端,例如穿戴设备、嵌入式传感设备等,并支持多种新型业务,例如沉浸式XR、全息通信等,不同的业务对网络时延、抖动、速率等有不同的要求,这要求6G网络能够更懂业务、更懂用户,提升差异化的产品和客户服务能力。因此,面向业务运营需求,6G网络将提供业务级/用户级的数据采集和AI分析能力,例如精准定位、用户画像、满意度,实现精准营销和定制服务,提升服务能力和服务质量

通信感知数据服务

  针对通感一体化情况,网络需要根据感知服务请求,以及基站/UE的授权和实时状态信息选择合适的节点进行感知信号发送和接收。实时状态包括感知节点(如基站或UE)的位置信息、移动速度、通信负载、感知负载、性能参数等。

四、6G数据面架构研究

数据面架构视图

  • 1.6G 移动通信网络数据面概览

    主要由四部分组成:

    • 数据编排器(Data Orchestrator,DO)(和数据控制器(Data Controller, DC)
      DO 支持数据服务请求转译,将数据服务请求转变为对数据承载的构建,并编排构建可编程数据管道,以提供该数据服务。一个数据业务对应一个数据承载,而一个数据承载可以由多个数据管道组成
    • 数据代理(Data Agent,DA)
      DA 可内置于网络功能或独立部署,作为数据管道的节点,执行被编排指派的数据采集、数据预处理、数据存储、数据分析、数据共享等数据服务
    • 可信锚点代理(Trust Anchor Agent,TAA)
      TAA在6G网络中扮演着保护数据机密性、完整性和可靠性的重要角色
    • 数据存储功能(Data Storage Function,DSF)
      在需要大规模数据存储或长期存储时充当 DA 的存储扩展组件在这里插入图片描述
  • 2.6G数据面功能架构

    根据数据服务任务的实时性需求和跨域情况,将数据编排器细分为两类:DO和DC。DO负责粗粒度、非实时的数据编排,DC则负责细粒度的实时的编排任务,DO与DC二者协同实现了数据管道的弹性和可编程性。

    • DO主要具备以下功能:首先,DO是接收数据服务请求的门户,并且将数据服务请求转化为对数据承载的具体配置请求。此外,DO与其他网络服务展开协作,比如移动算力网络服务对算力进行编排,而DO对数据进行编排。基于数据服务请求和DA的服务能力,DO实现了跨域的粗粒度的数据管道编排。同时,DO内置了一个数据安全防护和隐私保护技术库(DataProtectionTechnologyRepository,DPTR),包含差分隐私、同态加密、安全多方计算、零知识证明等技术,提供数据安全隐私保护能力,并按需将数据保护技术(DataProtectionTechnology,DPT)赋能给DA。
    • DC实现了细粒度的数据承载编排,在本地域中依据DA的能力和数据服务请求对数据管道进行组合,实现实时高效的数据管理。其次,DC接收DA的能力报告并实现对DA的注册和撤销功能,通过监测DA的心跳实现对DA的实时监管。此外,DC内置了可信锚点客户端(TrustAnchorClient,TAC),向TAA发起认证、授权、访问控制等安全机制的请求,以及申请对数据访问的溯源和审计服务。
    • DA负责执行DO编排的数据承载中的数据服务,包括数据采集、预处理、转发、存储、分析等。其中数据存储负责少量的、或短期的、或有隐私保护需求数据的本地存储,数据分析与其他数据管道功能解耦,根据分析类型按需进行部署。首先,DA将数据服务能力上报给DC,之后由DO/DC依据服务请求和DA能力选择合适的DA,并实施编排,DO将按需对DA进行DPT更新。服务API(ServiceAPI)是数据服务对外接口,可以由DC依据DA的能力动态分配。数据消费者通过调用服务API实现的数据服务请求。
    • DSF作为DA的存储扩展组件,负责长期的、或大量数据的存储,例如大型日志数据、AI训练模型。
    • TAA 是 6G 可信面在数据面的代理,包含认证、授权、访问控制、审计、溯源等可信功能,并且提供对于区块链等可信技术的支持接口,保护所有数据的机密性、完整性和可靠性。
      在这里插入图片描述
  • 3.数据面与其他面的交互
    • 管理面可以和数据面的DO模块进行交互,对数据面网元进行性能管理、故障管理,对数据服务进行计费等
    • 控制面对数据面的数据源、数据消费者等进行接入管理、移动性管理,对数据服务提供QoS保障,例如,数据消费者的注册、鉴权、认证等可以由控制面进行统一管理,以及可以由控制面进行数据服务请求和传统用户面会话的区分和调配
    • 在传统管理面、控制面、用户面基础上,未来6G将可能引入数据面、可信面和计算面。其中,可信面为网络提供认证、授权、访问控制、隐私保护等安全机制以及可靠运维和管理;计算面包括计算与连接的融合控制、计算数据的传输和计算任务的执行,包括模型训练和推理等。数据面为可信面、计算面以及连接面提供统一的数据服务
    • 数据面与可信面主要的交互模块是TAA和DA。TAA通过可信面的账本锚点为数据提供可信的区块链服务,例如构建6G区块链实例、部署智能合约、读写链上交易等。可信面的执行单元将DPT更新同步到数据面的DA。数据分析服务将数据分析结果传输到可信面,助力网络安全运维和高效管理。DA将模型训练等AI任务交给计算面,并为计算面提供数据安全、隐私保护和模型存储功能。此外,数据面中的数据分析工具通过计算面进行更新。
      在这里插入图片描述
  • 4.DO与DA的运行
    • DO的运行
      DO通过DA上报的数据服务能力和DA间逻辑连接状态等,获取DA逻辑网络的全局信息。然后,DO根据接收的数据服务请求选择合适的DA,编排数据管道,并计算和构建数据转发路径,形成数据承载。DO通过数据转发控制协议(DataForwardingControlProtocol,DFCP) (这是什么协议呢?) 将数据转发信息发送给DA,并且按需更新和删除数据转发信息。最后,DO通过DFCP从DA处采集统计数据
    • DA的运行
      DA可以实现多种数据处理功能,这些功能在DA注册期间作为DA的能力上报给DO/DC,并可及时上报能力更新。DA的内部运行流程如图所示,DO根据应用的具体服务需求和DA的数据功能实施编排。DA根据DO编排策略执行指定的序列处理功能。当某DA被选择为数据源时,会从如网络功能(NetworkFunction,NF)业务逻辑中采集或过滤数据。如果需要多个DA进行功能协作,则在执行完本地DA最后一个功能后经由数据转发功能转入下一个DA,或在本地DA运行完全部功能后通过数据服务API提供给应用。
      在这里插入图片描述
    • DA 的部署模式 (DA有点类似 语义模型管理模块 也符合最初的设想 即作为一个网络功能引入)
      DA在未来6G网络中有三种可行的部署模式:独立式、内置式和混合式。独立式部署即DA在网络中以独立网元或NF形式部署;内置式部署表示在RAN或者NF以及终端设备中内置DA;混合式部署表示既新增独立的DA,同时在RAN、NF或终端设备中部署内置DA。网络运营商可以依据实际网络环境和应用需求选择最佳部署模式。
      在这里插入图片描述
  • 5.数据面转发技术

    区别一:

    • 5G通信中,通信双方建立会话连接,在连接上进行数据传输,通信结束后关闭会话连接。路径上的节点(路由器,交换机)主要负责数据包转发,不会对数据做处理
    • 6G中,数据传输通过一个新概念,叫做数据管道来传输。数据不仅通过管道传输,并在流经的节点(DA)完成采集、去隐私、处理、存储、分析等功能

    区别二:

    • 传统通信会话是点对点建立的 (存疑?点对点通信是一种常见的通信模式,但传统通信网络也支持其他形式的通信,如广播和多播)
    • 6G具有分布式特点,数据管道(数据汇聚和分发)需要支持任意拓扑结构 (存疑??) (比如不同设备的数据可能最终会汇聚到一个设备进行计算?多对一?)

    区别三:

    • 在数据转发行为上,会话的数据包基于目标地址进行转发
    • 数据管道中,数据包则基于数据服务和数据管道标识进行转发

    区别四:

    • 5G 用户面会话的数据转发属于 TCP/IP 层
    • 数据转发则属于应用层

    根据数据报文和数据转发实体(DA)有无状态(有状态的数据转发实体会在处理数据时记录一些额外的信息,这些信息可能包括路由表、转发表、缓存信息等;"无状态"则表示数据转发实体在处理数据时不需要维护额外的状态信息),提出了三种可行的6G数据面数据转发技术方案 (没太看明白)
    在这里插入图片描述
    方案一:当DA有状态、报文无状态时:数据转发控制实体(DO)根据数据业务需求,按DA的功能编排组成数据管道及其拓扑,并将数据转发表项写入相应DA的数据转发表。DA根据表项转发数据到下一跳,直至转发表项结束。同时DA统计转发的数据报文数和字节数,按需上报给DO。数据服务执行结束后删除数据管道,DA删除数据转发表项。

    方案二:当报文有状态、DA无状态时:DO根据业务需求,按DA的能力/功能编排组成数据管道及其拓扑,并将数据转发表项发送给入口DA。入口DA将转发信息作为数据报文头部信息转发至下一跳。转发路径中的DA根据数据报文头部携带的转发信息进行转发,并删除涉及本DA的转发信息。出口DA将报文头部的地址/标识信息删除后递交给上层应用。DA统计转发的数据报文数和字节数,并按需上报给DO。边缘DA在数据服务结束后删除给定数据服务的数据转发表项

    方案三:当报文和转发实体都是无状态时:DO根据业务需求,按DA的能力/功能编排组成数据管道及其拓扑。DO将数据服务对应的数据转发路径进行编码,并将编码发送给入口DA。DA通过解码操作计算出数据报文的下一跳,在完成数据处理后转发至下一节点。出口DA将报文递交给上层应用。DA根据报文中携带的统计数据按需上报给DO。边缘DA在数据服务结束后删除数据管道。

功能定义说明,接口及交互

  • 1.DO功能定义

    • 1)需求转译
        DO接收应用的需求,应用可以是运营商自己的网规网优、网络AI等应用,也可以是第三方的应用服务需求,其基于标准模板填写相应需求,发送给DO。
    • 2)DPTR(DataProtectionTechniqueRepository)
        DPTR数据安全和隐私保护算法库,与DO松耦合,包括差分隐私、同态加密、多方计算、零知识证明等多种算法,可由DO按需推送或更新给DA,作为DA的DPT。DPTR成为公共能力,可以独立演进和优化。
    • 3)编排
        DO将应用的诸如SLA等需求转译为对相应资源和网络配置的需求,并基于DA的上报信息,选择本次数据服务任务需要参与的DA;如果需要用到算法、算力,则与其他NS进行协作,选择相应的AI算法、算力,并由NetworkService进行算法推送。DO对选择的DA进行编排,组成星式、分布式或混合式等逻辑架构,进行协作,并选定其中一个DA,比如星式或混合式中的汇聚各数据的DA,与应用进行直接交互。DO把该DA的地址发给应用,使应用可以调用该DA的API,获得数据或分析结果等。即与每一个具体应用进行交互的DA是由DO在编排阶段动态指定的。
        DO编排DA形成overlay的网络拓扑示例图如下图所示。橙色或红色圆代表DA。
      在这里插入图片描述
        逻辑上,DO接收应用需求,转译完成后,根据需求的不同,结合DA上报的能力,可以编排DA形成不同的overlay的逻辑拓扑,如星式、环式、混合层级式等。
        星式拓扑中,红色的为集中式DA,可收集其他DA的数据,进行汇总等;集中式DA可直接建立与应用的交互。适用于数据汇聚,联邦学习等场景。
        环式拓扑中,不存在汇聚节点,DA间进行数据协作,可以选择一个DA与应用直接交互。
        混合分级式拓扑中,红色的为集中式DA,与应用建立直接交互;数据分级聚合到集中式DA中。
  • 2.DC功能定义

    • 1)DC编排
      如下图所示,为满足实时性、跨域协作等需求,Orchestration功能需要按需部署在DO和DC中,相互级联,协作实现对DA的编排。相对于DO中Orchestration的粗粒度、非实时的编排及管理;DC中的Orchestration提供细粒度、实时的编排和管理,同时对overlay逻辑网络进行动态控制,形成可执行的DA工作链。
      在这里插入图片描述
    • 2)DC对DA的管理
      DC对DA的管理功能,主要用于管理DA向DO的注册及去注册,以及接收DA的标识、位置、元数据、预处理、存储、分析、对外交互、DPT、支持采集的数据类型等能力的上报。DAManagement随DC按域部署。DC将DA能力统计汇总后,上报给DO。当域下DA的数据能力发生动态变化时,可以实时感知。
  • 3.DA功能定义

    • 1)DA的控制器
      DA控制器编排DA内各功能模块形成数据流的示例图如下图所示
      在这里插入图片描述
        假设DO编排DA形成了图中右上角所示的星式的逻辑拓扑。红色或橙色圆代表DA。红色DA为汇聚节点,橙色DA为普通节点。以DA内置于NF为例。图中左下部分为一个内置于NF的DA及其内部功能模块。
        DA从DO接收到对该DA的功能设定。假设该DA为普通节点,比如是一个客户端节点,向汇聚节点汇聚数据。再假设其被设定的功能为将预处理过的数据传给汇聚节点。则DA控制器编排形成如下功能链,实现数据在其间按要求流动:数据采集模块从NF采集数据,发送给预处理模块,预处理模块再直接发送给下一跳DA,即汇聚DA。
        假设该DA为汇聚节点,如图中所示的红色圆DA,则该DA收集其他DA汇聚过来的数据,处理后,再发送给应用。DA控制器编排形成如下功能链,实现数据按需流动:数据收集模块收集从其他DA传过来的数据;发送给预处理模块,进行融合等处理;如果需要,可以进行隐私保护,存储等其他操作;再发送给数据分析模块,进行分析处理,最后,通过serviceAPI将分析结果返回给应用。当然,这里也可以根据设定,直接将预处理过的数据等直接发送给应用
    • 2)DA数据采集
      数据采集从数据源获取数据,支持订阅/通知的方式,也支持请求/响应的方式,数据获取请求中指示数据上报的触发方式,触发条件,上报的周期,数据量等。支持对用户数据、网络数据、AI数据、IoT数据的采集。支持流式数据采集和批数据采集,实时数据与非实时数据采集。
    • 3)DA预处理
      数据预处理指对采集到的原始数据所进行的诸如“清洗、填补、平滑、合并、规格化、和一致性检验”等一系列操作,旨在提高数据质量,为后期分析工作奠定基础。原始数据中,通常会存在脏数据,如数据缺失、数据噪声、数据冗余、数据集不均衡等
    • 4)DA隐私和安全
      数据隐私保护对采集到的数据进行例如诸如k-anonymity(k-匿名化),l-diversity(l-多样化),t-closeness和ε-differential privacy(差分隐私)等技术对数据进行处理,使得恶意攻击者无法从经过脱敏处理的数据中直接获取敏感信息,从而实现对机密及隐私的防护。数据保护技术可以预装在DA中,也可以由DO按需推送,可对DA的每一层级的数据进行安全和隐私保护
    • 5)DA分析
      数据分析功能与DA松耦合,可按需与DA分开部署。支持各类数据分析技术,例如AI/ML、Hive、Spark等。数据分析功能通过API调用DA的数据采集、预处理、存储等各层级的数据服务。所需的AI模型可以预装或由NetworkService推送。
    • 6)DA对外接口
      DA对外的接口,即数据服务最终的对外接口,比如提供可外部访问的URL

数据面协议栈

见白皮书、PPT

五、基于6G数据面架构的典型数据服务示例

基于所提数据服务架构实现网络数据的服务,与NWDAF中针对网络数据的服务不同点在于:NWDAF只能收集CN和OAM的数据,对于需要进行跨域协同的数据服务存在挑战;随着XR、ISAC、DTN等新技术的应用,未来会有更多的数据存在终端及RAN侧,同时基于隐私保护,传输成本等的考虑,可能很多数据会终结在RAN侧,这也对NWDAF的数据管理带来挑战。

针对网络数据的通用流程图如下图所示:在这里插入图片描述

  • 1.各域DA向DO进行注册并上报该DA的数据服务能力;
  • 2.应用或其他网络业务(NetworkService,NS)向DO发送网络数据相关服务请求;
  • 3.DO将需求模板进行转译,映射为对数据的服务需求;为该数据业务分配任务标识(DSID);根据各域下DA上报的数据服务能力,选择相应的DA,并分配各DA数据服务功能;
  • 4.DO将相关功能设置下发给各DA,从而所选DA形成一个overlay的逻辑网络;同时数据安全和隐私保护技术,以及分析工具等如果有更新,也会把相关更新推送给DA;
  • 5.DO把选定的与应用直接交互的DA的地址反馈给应用,以便应用于该DA建立直接交互;
  • 6.各域下DA根据被分配的功能,进行采集、预处理、存储、分析等系列功能的动作衔接,形成数据服务流;域间DA衔接,形成跨域的数据协同架构,同时还可以通过AF(ApplicationFunction)与应用数据进行协同分析;如果处理的过程中,涉及到对用户数据的处理,需要向TrustAnchorAgent进行处理行为记录;
  • 7.与应用直接交互的DA把请求的数据或分析的结果反馈给应用。

参考

《6G数据面结构研究》