宏基因组测序实验分析方法

发布于:2023-01-04 ⋅ 阅读:(967) ⋅ 点赞:(0)

宏基因组测序实验分析方法-功能分析基于reads

1 使用ctab法或相应试剂盒提取样本中的总 DNA;

2 DNA样品检测合格后,使用Covaris超声波破碎仪随机打断,再经末端修复、加A尾、加测序接头、纯化、PCR扩增等步骤完成整个文库制备工作;

3 利用 Illumina NovaSeq 高通量测序平台进行宏基因组测序,获得样品中细菌、真菌和病毒等的宏基因组序列;

4 数据质控和去宿主序列:采用KneadData软件对原始数据进行质控(基于Trimmomatic)和去宿主(基于Bowtie2),KneadData前和KneadData后,用FastQC来检测质控合理性和效果。

5 物种注释:使用Kraken2和自建的微生物核酸数据库(筛选NCBI NT核酸数据库和RefSeq全基因组数据库中属于细菌,真菌,古菌,病毒的序列)比对来计算样本中所含有物种的序列数,再用Bracken来对样本中物种的实际丰度进行估计。

6 功能数据库注释:从质控以及去除宿主基因的reads出发,使用HUMAnN2软件(基于DIAMOND),将各个样本的reads比对到数据库(UniRef90),根据UniRef90 ID 和各个数据库的对应关系,得到各个功能数据库的注释信息和相对丰度表。

7 基于物种丰度表和功能丰度表,可以进行丰度聚类分析,PCoA和NMDS降维分析(仅物种),样品聚类分析;当有分组信息时,可以进行LEfSe biomarker挖掘分析以及代谢通路比较分析,挖掘样品之间的物种组成和功能组成差异。

8 抗性基因注释:从去除宿主基因的clean reads出发,使用DIAMOND软件将各个样本的质控以及去除宿主基因的reads与抗生素抗性基因数据库CARD进行比对注释,可以获得抗性基因丰度分布情况。

宏基因组测序实验分析方法功能分析基于组装

1 使用ctab法或相应试剂盒提取样本中的总 DNA;

2 DNA样品检测合格后,使用Covaris超声波破碎仪随机打断,再经末端修复、加A尾、加测序接头、纯化、PCR扩增等步骤完成整个文库制备工作。

3 利用 Illumina NovaSeq 高通量测序平台进行宏基因组测序,获得样品中细菌、真菌和病毒等的宏基因组序列;

4 数据质控和去宿主序列:采用KneadData软件对原始数据进行质控(基于Trimmomatic)和去宿主(基于Bowtie2),KneadData前和KneadData后,会用FastQC来检测质控合理性和效果。

5 功能注释:运用MEGAHIT软件,将所有样本去宿主基因后的clean reads进行组装,得到contigs; 运用prodigal软件,预测contigs中的基因序列; 再用Cd-hit软件,对得到的基因进行去冗余,得到去冗余基因; 使用Salmon软件,对去冗余基因进行定量; 使用eggnog-mapper, DIAMOND软件,对去冗余基因进行各个数据库的注释。统计各个数据库的基因相对丰度表。

6 物种注释:用diamond 将非冗余蛋白比对到NCBI NR蛋白数据库,比对结果再用BASTA软件分析得到非冗余蛋白的物种注释信息;同时使用Kraken2和自建的微生物核酸数据库(筛选NCBI NT核酸数据库和RefSeq全基因组数据库中属于细菌,真菌,古菌,病毒的序列)比对来计算样本中所含有物种的序列数,再用Bracken来对样本中物种的实际丰度进行估计。

7 抗性基因注释:运用DIAMOND软件,将去冗余基因比对到CARD数据库,得到CARD数据库的抗性基因注释信息,根据去冗余基因的丰度信息,统计抗性基因的相对丰度表。

8 基于物种丰度表和功能丰度表,可以进行丰度聚类分析,PCoA和NMDS降维分析(仅物种),样品聚类分析;当有分组信息时,可以进行LEfSe biomarker挖掘分析以及代谢通路比较分析,挖掘样品之间的物种组成和功能组成差异。

 

本文含有隐藏内容,请 开通VIP 后查看

网站公告

今日签到

点亮在社区的每一天
去签到