1.初始化
SMMUv3驱动的入口函数如下代码所示。
[drivers/iommu/arm/arm-smmu-v3/arm-smmu-v3.c]
static struct platform_driver arm_smmu_driver = {
.driver = {
.name = "arm-smmu-v3",
.of_match_table = arm_smmu_of_match,
.suppress_bind_attrs = true,
},
.probe = arm_smmu_device_probe,
.remove_new = arm_smmu_device_remove,
.shutdown = arm_smmu_device_shutdown,
};
SMMUv3初始化函数的主要工作有:
- 解析设备树中的
"#iommu-cells"
、"dma-coherent"
或"dma-noncoherent"
属性。 - 获取中断号
- 获取硬件信息。读取ID0、ID1、IDR3、IDR5、IIDR等寄存器,判断硬件是否支持下面的特性:
- ID0:是否支持2级表,页表大小端,是否支持PRI、ATS、SEV、MSI,是否支持Hypervisor以及VHE扩展,是否支持HTTU,是否支持STALL模式、是否支持第一阶段和第二阶段地址转换、支持的页表格式、ASID和VMID的位宽。
- ID1:判断是否支持固定的流表基地址、固定的队列基地址以及Relative base pointers,若支持其中一个则返回错误(标准驱动不支持embedded SMMU的设计),是否支持内存属性覆盖,命令队列、事件队列、PRI队列的大小,SID和SSID的位宽(
iommu.max_pasids = 1UL << smmu->ssid_bits
),STRTAB_SPLIT
。 - ID3:是否支持基于范围和层级的TLB Invalidations。
- ID5:outstanding stalls的最大数量,页表大小,输入地址的大小,输出地址的大小
- IIDR:MMU特性。
- 是否支持SVA特性。
- 初始化软件数据结构。
- 初始化命令队列、事件队列、IO页表缺页异常队列(如果支持SVA和STALL特性)和PRIQ队列。
- 根据硬件支持的特性,创建线性表(一次性分配
1 << smmu->sid_bits
个STE,并将STE设置为ABORT)或者2级流表(只分配第一级L1STD内存,第二级STE内存在arm_smmu_probe_device
函数中分配)。 - 将保留内存区域的映射设置为bypass,不映射。
- 复位SMMU控制器。
- 注册SMMU控制器。
SMMUv3定义了arm_smmu_ops
回调函数集合,该函数集合实现了SMMU所以功能,具体意义如下。
[drivers/iommu/arm/arm-smmu-v3/arm-smmu-v3.c]
static struct iommu_ops arm_smmu_ops = {
.identity_domain = &arm_smmu_identity_domain, // 用于恒等映射
.blocked_domain = &arm_smmu_blocked_domain, // 用于阻止iommu地址转换
.capable = arm_smmu_capable, // 获取iommu的能力
.domain_alloc_paging = arm_smmu_domain_alloc_paging, // 分配dma类型的iommu_domain
.domain_alloc_sva = arm_smmu_sva_domain_alloc, // 分配sva类型的iommu_domain
.domain_alloc_user = arm_smmu_domain_alloc_user, // 分配用户空间的iommu_domain,用于iommufd
.probe_device = arm_smmu_probe_device, // 初始化设备
.release_device = arm_smmu_release_device, // 释放设备
.device_group = arm_smmu_device_group, // 创建iommu_group
.of_xlate = arm_smmu_of_xlate, // 地址转换
.get_resv_regions = arm_smmu_get_resv_regions, // 获取保留的内存
.remove_dev_pasid = arm_smmu_remove_dev_pasid, // 移除设备的PASID
.dev_enable_feat = arm_smmu_dev_enable_feature, // 使能设备的某些特性
.dev_disable_feat = arm_smmu_dev_disable_feature, // 关闭设备的某些特性
.page_response = arm_smmu_page_response, // 响应STALL状态
.def_domain_type = arm_smmu_def_domain_type, // 默认的iommu_domain类型
.pgsize_bitmap = -1UL, /* Restricted during device attach */
.owner = THIS_MODULE,
// 默认的iommu_domain类型回调函数集合,主要用于地址映射
.default_domain_ops = &(const struct iommu_domain_ops) {
.attach_dev = arm_smmu_attach_dev, // 关联设备和iommu_domain
.set_dev_pasid = arm_smmu_s1_set_dev_pasid,
.map_pages = arm_smmu_map_pages, // 映射iova和物理地址,大小为一页
.unmap_pages = arm_smmu_unmap_pages, // 解除映射
.flush_iotlb_all = arm_smmu_flush_iotlb_all, // 刷新某个asid或者vmid的所有iotlb
.iotlb_sync = arm_smmu_iotlb_sync, // 刷新某个asid或者vmid的部分iotlb
.iova_to_phys = arm_smmu_iova_to_phys, // 将iova转换成物理地址
.enable_nesting = arm_smmu_enable_nesting, // 使能第二阶段地址转换
.free = arm_smmu_domain_free_paging, // 释放arm_smmu_domain
}
};
static const struct iommu_domain_ops arm_smmu_identity_ops = {
.attach_dev = arm_smmu_attach_dev_identity,
};
static struct iommu_domain arm_smmu_identity_domain = {
.type = IOMMU_DOMAIN_IDENTITY,
.ops = &arm_smmu_identity_ops,
};
static const struct iommu_domain_ops arm_smmu_blocked_ops = {
.attach_dev = arm_smmu_attach_dev_blocked,
};
static struct iommu_domain arm_smmu_blocked_domain = {
.type = IOMMU_DOMAIN_BLOCKED,
.ops = &arm_smmu_blocked_ops,
};
2.设备树
2.1.控制器设备树
下面是RK3588定义的SMMUv3的设备树。#iommu-cells
属性用于指定编码地址的单元数量。
#iommu-cells = <0>
:表示IOMMU控制器只有一个master(client)设备,不需要在#iommu-cells
指定额外信息。#iommu-cells = <1>
:表示IOMMU控制器有多个master设备,需要一个额外的cell提供master设备信息,以便于IOMMU控制器区分master设备。对于SMMU,额外的cell提供StreamID信息。#iommu-cells = <4>
:某些IOMMU控制器允许master设备配置DMA窗口。第一个cell提供master设备信息,第二个cell提供DMA窗口的起始地址,第三个和第四个cell提供DMA窗口的长度。SMMU不支持这种情况。
[arch/arm64/boot/dts/rockchip/rk3588-base.dtsi]
mmu600_pcie: iommu@fc900000 {
compatible = "arm,smmu-v3";
reg = <0x0 0xfc900000 0x0 0x200000>;
interrupts = <GIC_SPI 369 IRQ_TYPE_EDGE_RISING 0>,
<GIC_SPI 371 IRQ_TYPE_EDGE_RISING 0>,
<GIC_SPI 374 IRQ_TYPE_EDGE_RISING 0>,
<GIC_SPI 367 IRQ_TYPE_EDGE_RISING 0>;
/* eventq: 用于处理 SMMU 的事件队列(Event Queue)中的事件。
* gerror: 用于处理 SMMU 的全局错误(Global Error)。
* priq: 用于处理 Page Request Interface(PRI)队列中的事件。
* cmdq-sync: 用于同步命令队列(Command Queue)的执行。
*/
interrupt-names = "eventq", "gerror", "priq", "cmdq-sync";
/* 的 */
#iommu-cells = <1>;
status = "disabled";
};
2.2.master设备设备树
下面是两个SMMU master设备的设备树。第一个PCI Host设备通过iommus
属性引用smmu,StreamID为0x1,外部可能只会接一个PCIe设备,因此只需要一个StreamID。第二个设备为PCIe RC,外部可能会接很多设备,iommus
属性无法描述这种情况,因此需要使用iommu-map
和iommu-map-mask
属性。
iommu-map
:将PCIe设备的Requester ID(BDF)映射成IOMMU特有的数据,对于SMMU,则将Requester ID映射成StreamID。格式为iommu-map = <rid-base iommu iommu-base length>
。rid-base为Requester ID,iommu为引用的IOMMU设备树节点,iommu-base
为StreamID,length为映射的长度。iommu-map-mask
:每个Requester ID映射成StreamID之前,都需要先和iommu-map-mask
与。该属性的作用是将多个Requester ID映射成一个StreamID,比如多Function的PCIe设备,通常位于一个iommu_domain
里面,因此需要屏蔽Function number。
pcie: pcie@20000000 {
compatible = "pci-host-ecam-generic";
reg = <0x20000000 0x100000>;
#address-cells = <3>;
#size-cells = <2>;
device_type = "pci";
bus-range = <0x00 0xff>;
ranges = <0x02000000 0x00 0x40000000 0x40000000 0x00 0x40000000>;
iommus = <&smmu 0x1>; // 引用SMMU,使用streamID 1
dma-coherent;
status = "okay";
};
pci: pci@f {
reg = <0xf 0x1>;
compatible = "vendor,pcie-root-complex";
device_type = "pci";
/*
* The sideband data provided to the IOMMU is the RID with the
* function bits masked out.
*/
iommu-map = <0x0 &iommu 0x0 0x10000>;
iommu-map-mask = <0xfff8>;
};
参考资料
- linux 6.12.35 source code.
- Documentatio/devicetree/bindings/pci/pci-iommu.txt.
- Documentation/devicetree/bindings/iommu/iommu.txt.