神器分享 | tappAS:首创全长转录组isoform功能分析,让三代测序优势尽显
2020年,来自弗罗里达大学的研究团队研发了第一个能够综合分析功能性异构体全长转录组(Functional Iso-Transcriptomics, FIT)的软件框架——tappAS,可以高效揭示特定的转录后调控对功能的影响。tappAS对编码和非编码功能结构域、motifs和位点进行异构体解析注释,同时结合新的分析方法,能够全面探究转录突变体和异构体调控的功能。下面,我将详细介绍这个软件强大的功能。
什么是tappAS
tappAS是如何工作的呢?它需要三个输入文件:表达转录文件、实验设计文件、功能注释文件。
tappAS通过传统和新的分析方法,将转录表达水平数据和大量的功能注释整合在一起,形成了一个研究AltTEM(可变转录表达机制)的全面的框架,这个框架分为三个模块:
模块I:实施功能多样性分析(FDA),通过研究来自同一个基因不同异构体之间的特征是否一致,来评估AltTEM的功能调控潜力。
模块II:通过比较差异异构体使用率(DIU,指转录水平)或差异编码序列使用率(DCU,指蛋白水平)与差异基因表达(DE)结果,探究转录和转录后调控在系统中的作用。
模块Ⅲ:包括了研究背景依赖性的注释功能元件使用率的评估方法:编码和非编码元件的差异特征分析(DFI),差异polyA分析(DPA),以及3’ 和5’UTR延长分析(3/5UL)。
功能多样性分析
图1. 功能多样性分析结果
差异转录水平分析
图2 .tappAS中差异基因表达和AltTEM的组合分析
a.从左至右:差分模块结果的交集:DE vs DIU和DIU vs DCU,以及主要的isoform切换 vs 无切换的DIU有和没有最小isoform过滤。柱状图的数字表示每组中的基因数量。
b.总使用率的变化(isoforms间的表达再分配)vs细胞类型之间基因表达倍数的对数转换值。具有主要isoform切换的基因用橙色表示。标签被分配给具有最高使用率变化的基因,也指出它们是否发生了isoform转换。
c.从左至右:在我们系统中(NPC和OPC,每个都包含两个重复---正方形表示重复表达,点表示重复表达),Cntn 1基因在两种情况下的基因、转录、和蛋白水平的表达图,以及转录组注释的tappAS图形表示。虽然基因表达水平没有变化(不是DE),但该基因表现出差异isoform使用。一个uORF内含物的目前两种可选isoforms应该归于一个可选TSS。
d.按DE和DIU显著性水平对基因进行多维基因集富集分析。节点相当于GO terms通过选择最丰富的GO terms集群的代表。饼图区域表示通过富集实验的相对-log10(P值)测量的DE(蓝色)和 DIU(橙色),节点大小表示每个GO term注释的基因数量。
转录和AltTEM调节的功能比较
为了更全面的理解转录和转录后调控,tappAS还包括了一个基于GO的多维基因集富集分析。通过这种方法可以将显著性排序的DE和DIU基因结合,识别两种机制控制的富集功能(如图2d)。总之,tappAS中的差异模块可以在转录组分析中研究差异基因表达与AltTEM之间的关系,同时还说明它们的综合生物学效应。
AltTEM的功能分析
tappAS的功能富集分析揭示了DIU和DCU中某些motifs、信号和结构域的过表达,可以表明可变异构体使用率与不同基因产物的功能之间存在相互作用。但是这些分析并没有指出AltTEM调控对功能产生的影响,为了研究异构体差异使用率如何引起功能特征的变化,研究者应用了tappAS的差异特征包含(DFI)分析。
DFI分析提供了两个新的指标:特征包含比例和变化的幅度。通过这些指标,研究者观察到OPCs中的特征获得比NPCs更频繁,这可以理解为在细胞分化的时候AltTEM促进功能特性的整合。研究者应用了tappAS的co-DFI分析来计算小鼠神经数据中功能特征的协同包含(coordinated inclusion)(结果如图3d)。
差异polyA分析
可变多聚腺苷酸化和UTR长度的差异与 mRNA 稳定性、亚细胞位置、RNA 蛋白质结合和翻译效率的调控有关。为了评估 AltTEM 对这些过程的影响,研究者开发了新的定量指标评估DPA与 3’ 和 5’UTR 延长 (3/5UL) 分析,DPA基因功能富集分析可以表明某些基因大量参与了转录调控和RNA加工(图4d)。tappAS结合UTR、ployA位点、编码区和域工具的功能,能够对转录终止位点的选择性过程相关的功能进行更深入的分析。
讨论
SERVICE
相关服务
表观生物已经完成 tappAS分析模块的搭建,针对全长转录组项目ISO-seq和纳米孔RNA直接测序项目,可以提供本项分析内容。
- - - 推荐阅读 - - -
-
表观学院| 如何用IGV可视化测序结果?看完这个视频你就会了
IGV(IntegrativeGenomicsViewer),即整合基因组浏览器,是综合查看多种组学数据的强大利器。它支持多种数据格式,包括芯片数据、高通量测序数据和基因注释等,比如有参基因组测序结果bam文件。 今
2020-02-19
-
RNA甲基化测序难 如何找到合适的生物公司?
哪里的测序公司好一些?目前北上广深都有生物科技公司,在诸多的生物科技公司中,广州地区的公司相对来说还是比较多的,并且广州地区的公司专业实力也不错,具有专业化的设备。
2020-12-25
-
外泌体提纯提取方式有哪些?色谱法怎么样?
提纯非常考验技术和设备,目前关于外泌体的提纯问题也是科学界一个非常热点的问题,那么它的提纯提取方式主要有哪种呢?
2020-12-05