SpaGCN

发布于:2025-02-11 ⋅ 阅读:(31) ⋅ 点赞:(0)

SpaGCN: Integrating gene expression, spatial location and histology to identify spatial domains and spatially variable genes by graph convolutional network

假设你在分析脑组织中的某个区域,这个区域可能包含多种细胞类型,如神经元、胶质细胞等。某一个基因(例如,一个神经元标志基因)的表达可能在该区域内较高,但它并不能代表该区域的所有细胞类型的基因表达模式。如果只看这个基因,你可能会忽略其他类型细胞的表达信息,而这些细胞对该区域的功能和特性也有重要贡献。

解决方案:Meta Gene

为了克服这一问题,SpaGCN会创建一个meta gene,它不是单一基因,而是通过将多个相关基因的表达信息结合起来,形成一个新的综合指标。这种meta gene能更全面地捕捉空间域的整体表达特征,反映该区域所有基因表达的综合情况,而不仅仅是某一个基因的表达模式。

总结来说,单一基因不足以代表空间域的表达模式是指在复杂的生物组织或空间域中,仅依靠一个基因的表达信息无法充分反映该区域的基因表达特征和生物学功能。因此,meta gene通过多基因的联合,能够更准确地表示空间域的表达模式。

Introduction

1.知道不同细胞在组织中的位置关系对理解疾病病理学非常重要,因为空间信息帮助了解一个细胞被周围环境影响的基因表达量。

2.目前对于SRT的研究方法可以分成两类。(目前主要进行空间条形编码再测序)

  • 两类 The first category is in situ hybridization or sequencing-based technologies with single-cell resolution, which includes seqFISH2,3, seqFISH+4, MERFISH5,6, STARmap7 and FISSEQ8 that measure the expression level for hundreds to thousands of genes in cells within their tissue context. The second category is in situ capturing-based technologies with spatial barcoding followed by sequencing, which includes spatial transcriptomics (ST)9, SLIDE-seq10, SLIDE-seqV2 (ref. 11), HDST12 and 10x Visium that measure the expression level for thousands of genes in captured locations, referred to as spots

3.做法:识别空间域+SVGs

Result

Overview of SpaGCN and evaluation

  • 构建图去表示所有spot的空间位置信息和组织信息

  • 用图卷积去聚合邻居的基因信息

  • 用聚合的信息去借助无监督的算法进行聚类

  • 检测某个cluster 的丰富的SVGs(单一基因不足以代表空间与的表达模式,使用组合基因做一个元基因)

💡human primary pancreatic cancer

  • 例证合并组织学信息的重要性(224spots16448genes3manually annotated regions)

  • 对比实验:

  • Louvain stLearn BayesSpace都不能够识别出良好的空间域

  • SpaGCN s的参数设置在1和2的时候效果不同 s=1的时候,很好的检测到了非癌症区,s=2的时候检测到了癌症区【应该是用ARI灯指标衡量的】

  • SVGs是什么

    空间变异基因(SVGs)是那些在空间上的位置和环境条件变化时,其表达水平表现出显著差异的基因。换句话说,这些基因在不同的空间区域(例如组织的不同部位或不同的细胞群体)中具有不同的表达模式,可能与特定的生物学功能、细胞类型或组织结构相关。

    举个例子

    假设你正在分析大脑组织的空间基因表达。某些基因在神经元区域中高度表达,而在胶质细胞区域中表达较低,这些基因就是SVGs。它们的空间表达差异帮助你区分不同的细胞类型或区域,进而揭示各个区域的功能和特点。

    在人类原发性胰腺癌数据集中,SPARK 检测到的 SVG 的 P 值(FDR 调整)分布(共 203 个基因)和 SpatialDE 检测到的 SVG 的 q 值分布(共 163 个基因)

    感觉这个就是和计算方差类似 看P值这样 选择不同个数的基因,在范围内的就是SVG不在就不是

    添加图片注释,不超过 140 字(可选)

网站公告

今日签到

点亮在社区的每一天
去签到