作者,Evil Genius
面对社会的不公,如何才能以积极且坦然的心态面对?
今天我们需要准备的内容是空间转录组联合GWAS的数据分析
参考文章

知识积累
展示疾病相关细胞的空间分布对于理解疾病病理学至关重要。
通过整合空间转录组数据与全基因组关联研究的汇总统计数据,将人类复杂性状(包括疾病)相关细胞以空间分辨率进行定位。
结果1、Overview of gsMap
gsMap的核心原理在于评估:位于空间转录组(ST)数据某个spot中高表达基因内部或附近的遗传变异(主要是单核苷酸多态性SNP),是否在遗传关联层面对特定性状表现出富集效应。每个ST切片需包含全转录组基因表达谱及单个spot的空间坐标。此处"spot"在高分辨率ST平台(如Stereo-seq细胞分bin模式)中指单个细胞,在传统ST平台(如10X Visium)中指细胞簇。gsMap包含三个步骤:
首先,gsMap利用spot同质性解决ST数据稀疏性与技术噪声问题。通过图神经网络(GNN)识别每个焦点spot在基因表达模式和空间位置上的同质spot,通过整合这些同质spot信息计算每个spot的基因特异性评分(GSS),该评分代表每个基因在spot中表达水平的相对排名。
其次,gsMap将每个spot的GSS值分配给基因转录区域上下游各50kb窗口内的SNP,并结合表观基因组数据建立的SNP-基因映射关系,为每个spot生成独特的SNP GSS注释。将每个spot视为SNP注释集,gsMap使用分层连锁不平衡评分回归(S-LDSC)评估具有较高GSS的SNP是否在矫正基线注释后,对性状遗传力贡献显著更大比例。富集P值用于衡量spot与性状关联的统计学显著性。
最后,为量化特定空间区域与性状关联的显著性,gsMap采用柯西组合检验聚合该空间区域内所有单个spot的P值。本质上,gsMap可视为一种在细胞分辨率层面将复杂性状与ST数据进行遗传信息整合映射的方法。

结果2、gsMap验证
Stereo-seq的小鼠胚胎数据,"bin50"分辨率。
使用bin50分辨率数据,并纳入110种复杂性状的公开GWAS汇总统计数据。
gsMap是一种通过整合空间转录组(ST)数据与全基因组关联研究(GWAS)汇总统计数据,实现性状相关细胞空间定位的创新方法。该方法通过图神经网络计算基因特异性评分,结合分层连锁不平衡回归分析,能精准识别与复杂性状(如智商、男性型脱发)相关的细胞空间分布模式。在胚胎发育数据验证中,gsMap成功将性状映射至相应器官祖细胞(如智商与外胚层、红细胞指标与内胚层),且错误发现率控制良好。相比传统单细胞分析方法,gsMap首次实现了单细胞分辨率的遗传驱动空间定位,为揭示性状相关细胞的空间组装特征及分子机制提供了新范式。

结果3、将人类复杂性状映射至小鼠脑区
通过gsMap方法将人类复杂性状映射至小鼠脑区,发现:1)皮层与多数性状(如智商、精神分裂症和抑郁症)关联最强,而帕金森病特异性地与黑质/腹侧被盖区(SN/VTA)关联;2)谷氨酸能神经元(Glu-neurons)在脑区-性状关联中贡献最大(中位相关性r=0.73),其中多巴胺能神经元与帕金森病显著相关(r=0.81);3)不同脑区的Glu-neurons呈现性状特异性分布:海马CA区Glu-neurons与认知性状(智商OR=1.5)和精神分裂症(OR=4.5)高度关联,而中脑Glu-neurons与情绪性状(抑郁症OR=6.7)显著相关。

结果4、Trait-associated neurons in mouse hippocampus

结果5、猕猴前额叶皮层(PFC)空间转录组数据

最后来看看代码,我们以visium数据为例
gsmap quick_mode \
--workdir './example_quick_mode/Visium' \
--homolog_file 'gsMap_resource/homologs/mouse_human_homologs.txt' \
--sample_name 'V1_Mouse_Brain_Sagittal_Posterior_Section' \
--gsMap_resource_dir 'gsMap_resource' \
--hdf5_path 'Visium_example_data/ST/V1_Mouse_Brain_Sagittal_Posterior_Section.h5ad' \
--annotation 'domain' \
--data_layer 'count' \
--sumstats_file 'Visium_example_data/GWAS/IQ_NG_2018.sumstats.gz' \
--trait_name 'IQ'

生活很好,有你更好