1 概述
1.1 题目
1.2 摘要
高像素病理全幻灯片图像 (Whole slide image, WSI) 的计算机辅助诊断算法是一个重要的研究方向。算法的可信度与其准确性以及可解释性息息相关。WSI分类可以制定为多示例学习 (Multi-instance learning, MIL) 问题,其通常是将图像区块嵌入到特征空间并汇聚为特征向量,新近的做法有使用注意力机制CNN训练特征嵌入以及定位关键区块。关键区块的存在对于分类有一定的可解释性。
然而,关于这些区块为什么被选择以及为什么是重要的有些模棱两可,尤其在医学领域并不是那么令人信服。因此,一种基于字典的可解释CNN被提出:
1)确定目标WSI中的一些病理学发现,并提供代表性且分类有用的词典项目辅助解释;
2)基于MIL方案构建字典,从而利用日常诊断而非细粒度注释获得的诊断信息来减少开销。
2 方法
2.1 问题声明
令 D = { S i : i = 1 , 2 , … , N } D=\{S_i:i=1,2,\dots,N\} D={Si:i=1,2,…,N}表示包含多个包的训练集,每个包对于一个图像,包中的实例对应图像中的区块。对于二分类问题,令 S i = { ( x i , j , y i , j ) : j = 1 , 2 , … , M i } S_i=\{(x_{i,j},y_{i,j}):j=1,2,\dots,M_i\} Si={(xi,j,yi,j):j=1,2,…,Mi}表示一个WSI,其中 x i , j x_{i,j} xi,j表示区块, y i , j ∈ { 0 , 1 } y_{i,j}\in\{0,1\} yi,j∈{0,1}是区块标签,通常未知。不同的WSI的大小 M i M_i Mi一般不同,其标签 Y i ∈ { 0 , 1 } Y_i\in\{0,1\} Yi∈{0,1}。
2.2 基于字典的可解释性CNN
图2展示了所提算法的总体框架,包括:
1)可解释特征表示:将区块级特征向量映射到人类可以轻松解释的特征字典;
2)特征整合:整合区块级特征为一个用于分类的特征。
2.2.1 可解释特征表示