人工智能与生物信息组学 || 1. 生物多组学基础与数据库 || 1.1 生物多组学基础知识

发布于:2024-06-19 ⋅ 阅读:(146) ⋅ 点赞:(0)

生物多组学基础知识

1. 组学

细胞 -> DNA -> RNA -> 蛋白质的转录过程
https://b23.tv/S4IjPFY

生物信息学p5

组学 (omics) 主要包括:转录组学(transcriptomics)、单细胞组学、蛋白质组学、基因组学、代谢组学、微生物组学等

多组学数据融合研究

1.1 转录组学

转录组是指细胞内转录产物的集合,包括信使 RNA (message RNA, mRNA)、核糖体 RNA、转运 RNA 以及 非编码 RNA (non-coding RNA, ncRNA),对于能被翻译成蛋白质的编码部分和非编码部分的功能及相互关系的研究就是转录组的任务。

转录组学(transcriptome) 的概念是由 Velculescu 等人在1997年首次提出。转录组学是对细胞在某种条件下所有转录产物进行的系统研究,它从一个细胞中的基因组全部信使 RNA (message RNA, mRNA) 水平出发来研究基因表达情况。转录组学的研究作为一种宏观的整体论方法改变了以往选定单个基因或少数几个基金零打碎敲式的研究模式,将基金组学代入了一个全新的高速发展时代。

以 DNA 为模板合成 RNA 的转录过程是基因表达的第一步,也是基金表达调控的关键环节。基因表达是指基因携带的遗传信息转变为可辨别的表型数据的整个过程。与基因组不同的是,转录组的定义包含了对时间和空间的限定。同一个细胞在不同的生长时期冀生长环境下,其基因表达情况是不完全相同的。

人类的基因组仅有1.5%的核酸序列为蛋白质,其余不编码蛋白质的核酸序列大多转录为非编码 RNA,RNA 是负责信息传递及基因调控的重要物质,包括微小 RNA (microRNA, miRNA),长链非编码 RNA (long non-coding RNA, lncRNA) ,以及循环 RNA (circular RNA, circRNA). 细胞内存在上千种特异的 ncRNA,在疾病领域,ncRNA 已经被鉴定为高发癌症中的癌症驱动因此和肿瘤抑制因子。

miRNA 是一种长度 21~25个核苷酸的单链 ncRNA,是基因表达的重要调节剂。miRNA 突变、miRNA 的生物合成、miRNA与其靶向 miRNA 的功能失调可能会导致各种疾病。研究发现,miRNA 的表达改变与癌症的发生发展相关,miRNA具有组织特异性和表达阶段性,一半以上定位在染色体容易发生改变的区域,具有高度的序列保守性跳空着人类大量的基因,参与了如先天性心脏病、帕金森、智力缺陷等疾病的病理生理过程。

lncRNA 是长度大于200个核苷酸的 ncRNA,具有 mRNA 样结构,目前认为 lncRNA可以从三个水平参与基因表达的调控:表观修饰水平调控、转录水平调控、转录后水平调控。

1.2 单细胞组学

细胞作为生命最基本的一个单元概念,是生命活动的基石。单细胞组学使用单细胞转录组等多组学联合分析,全面体现细胞生命进程的变化。相比常规的细胞群体研究,单细胞组学研究可以解释更多细胞类型和亚群的多样性。通过使用转录组的虚技术 (RNA-seq) 测定不同时刻细胞的转录本,有可能弄清复杂的细胞时间和不同生物学过程所需的时间。

1.3 空间组学

空间组学技术是通过量化数十到数百个基因、转录物或蛋白质,空间组学能够在自然组织或者细胞结构的背景下收集有价值的分子、细胞和微环境信息。2020年5月,来自美国的研究人员在 Matrix Biology 发表综述论文,改论文概述了目前可用的空间转录组学和空间蛋白质组学方法,并进一步描述了应用这些方法来提高对细胞外基质呈现为细胞生物学的理解的最近研究。多重空间组学将有助于通过从多个空间尺度获得信息来解释细胞复杂性,有助于理解整体细胞表型/状态,细胞与细胞之间的相互作用,以及这些分子特性如何与各自的组织结构想联系。空间转录组学方法允许在空间中检测 RNA 转录物,这些方法已用于研究各种组织和器官中基因表达的空间分布,包括大脑、心脏、胰腺和皮肤。然而,空间组学技术还需要继续提升和发展,例如,在给予空间图像的蛋白质组学中,每个图像周期的构建库收到条形码、荧光染料或稀有金属等数量的限制;目前的空间组学方法都不能在活体外或者或体内对细胞进行多空间组学研究等。

1.4 时空组学

时空组学是对当前组学研究的最新进展,是一种将不同时刻、不同位置细胞上组学表达的信息整合起来研究的组学。过去人们知道生命是按照遗传信息也就是 DNA 来规划自己生命活动的,而时空组学弥补了这一研究空白。这一组学将有益于人们去研究遗传疾病在病人身上是何时由何种刺激导致基因突变并转录的,时空组学将尝试并跟踪这一变化。2021年时空组学被 Natural Methods 评为2020年度技术。

2. 生物数据资源

美国国立生物技术信息中心(National Center for Biotechnology Information, NCBI)

https://www.ncbi.nlm.nih.gov

高通量基因表达数据库 (gene expression omnibus, GEO)

https://www.ncbi.nlm.nih.gov/geo

待完善


网站公告

今日签到

点亮在社区的每一天
去签到