神器分享 | tappAS:首创全长转录组isoform功能分析,让三代测序优势尽显

2021-04-21

 

2020年,来自弗罗里达大学的研究团队研发了第一个能够综合分析功能性异构体全长转录组(Functional Iso-Transcriptomics, FIT)的软件框架——tappAS,可以高效揭示特定的转录后调控对功能的影响。tappAS对编码和非编码功能结构域、motifs和位点进行异构体解析注释,同时结合新的分析方法,能够全面探究转录突变体和异构体调控的功能。下面,我将详细介绍这个软件强大的功能。

 

什么是tappAS

 

tappAS是如何工作的呢?它需要三个输入文件:表达转录文件、实验设计文件、功能注释文件。

 

 

tappAS通过传统和新的分析方法,将转录表达水平数据和大量的功能注释整合在一起,形成了一个研究AltTEM(可变转录表达机制)的全面的框架,这个框架分为三个模块:

 

 

模块I:实施功能多样性分析(FDA),通过研究来自同一个基因不同异构体之间的特征是否一致,来评估AltTEM的功能调控潜力。

 

模块II:通过比较差异异构体使用率(DIU,指转录水平)或差异编码序列使用率(DCU,指蛋白水平)与差异基因表达(DE)结果,探究转录和转录后调控在系统中的作用。

 

模块Ⅲ:包括了研究背景依赖性的注释功能元件使用率的评估方法:编码和非编码元件的差异特征分析(DFI),差异polyA分析(DPA),以及3’ 和5’UTR延长分析(3/5UL)。

 

 

功能多样性分析

通过分析转录本和蛋白异构体的功能元件注释的变化,可以获知AltTEM的可能性。功能多样性分析对转录组注释中的功能多样性进行分类,并定性评估来自同一基因异构体的标签变化;还可以通过应用位置变化的方法进行细化,该方法可以检测功能编码的细微变化,并分析仅由位置确定的结构类别,如 CDS 和 UTR 长度变化(下图b)。
为了将蛋白质多样性与RNA调控多样性联系起来,功能多样性分析在tappAS中可视化为替代性聚腺苷酸化(APA)、5’UTR 3’UTR和CDS变化(如下图c)。

 

 

图1. 功能多样性分析结果

a&b. 鼠神经数据集的功能多样性分析结果的注释类型存在或缺失ab位置方法。用总条形长度显示Multi-isoform基因注释的百分比,其中亮区和暗区分别指没有或至少一个isoform特征类型变异的百分比。条形上方的数字表示该类别包含的特征基因的总数,同时显示了转录本(红色)和蛋白质/编码(蓝色)的特征。
c.  Dbt基因的转录水平注释的tappAS图形表示,其中检测到 5TR、CDS 和 3’可变聚腺苷酸化,虚线表示变异区域。
d. 位置与缺失/存在的比较接近FDA对PFAM 区域变异的ID-level结果,显示按变异基因总数排名的前 15 个域家族。

 

差异转录水平分析

转录和AltTEM分别通过控制总基因表达及可变异构体的相对水平来调节基因活性。这两个过程可以通过差异基因表达(DE)和差异异构体使用率(DIU)进行计算分析。DE 中的统计显著性经常通过潜在的生物学相关性(即倍数变化)的测量来补充;然而,目前尚无相应的DIU生物影响估计方法。tappAS 模块 II 整合了这两种分析,基于转换事件(switching events)和异构体总使用率变化完善了设置DIU变化的方法。
除了转换之外,为了更精确地估计异构体使用率的变化量,研究者提出了一种新的衡量标准:异构体总使用率变化(total isoform usage change),即基因表达在其转录本上重新分布的量。倍数变化 vs 异构体总使用率变化散点图显示了转录和转录后影响的相对贡献率对基因表达的调控(如下图b)。

 

2 .tappAS中差异基因表达和AltTEM的组合分析

a.从左至右:差分模块结果的交集:DE vs DIU和DIU vs DCU,以及主要的isoform切换 vs 无切换的DIU有和没有最小isoform过滤。柱状图的数字表示每组中的基因数量。

b.总使用率的变化(isoforms间的表达再分配)vs细胞类型之间基因表达倍数的对数转换值。具有主要isoform切换的基因用橙色表示。标签被分配给具有最高使用率变化的基因,也指出它们是否发生了isoform转换。

c.从左至右:在我们系统中(NPC和OPC,每个都包含两个重复---正方形表示重复表达,点表示重复表达),Cntn 1基因在两种情况下的基因、转录、和蛋白水平的表达图,以及转录组注释的tappAS图形表示。虽然基因表达水平没有变化(不是DE),但该基因表现出差异isoform使用。一个uORF内含物的目前两种可选isoforms应该归于一个可选TSS。

d.按DE和DIU显著性水平对基因进行多维基因集富集分析。节点相当于GO terms通过选择最丰富的GO terms集群的代表。饼图区域表示通过富集实验的相对-log10(P值)测量的DE(蓝色)和 DIU(橙色),节点大小表示每个GO term注释的基因数量。

 

 

转录和AltTEM调节的功能比较

 

为了更全面的理解转录和转录后调控,tappAS还包括了一个基于GO的多维基因集富集分析。通过这种方法可以将显著性排序的DE和DIU基因结合,识别两种机制控制的富集功能(如图2d总之,tappAS中的差异模块可以在转录组分析中研究差异基因表达与AltTEM之间的关系,同时还说明它们的综合生物学效应

 

 

AltTEM的功能分析

 

tappAS的功能富集分析揭示了DIU和DCU中某些motifs、信号和结构域的过表达,可以表明可变异构体使用率与不同基因产物的功能之间存在相互作用。但是这些分析并没有指出AltTEM调控对功能产生的影响,为了研究异构体差异使用率如何引起功能特征的变化,研究者应用了tappAS的差异特征包含(DFI)分析。

 

3. DFI分析结果
a.转录组注释特征的分布(%)()vs分析显示的差异包含特征()。特定类别中DFI功能的相对比例过高通过Fisher精确测试评估,并使用Benjamini-Hochberg方法进行多次测试校正。
b.根据有利包含的细胞类型,差异包含特征的分布(%)。通过概率为0.5的二项式检验和Benjamini-Hochberg多重检验校正来计算细胞类型特征分类的富集。
c.内含物特征差异的条形图 (ΔFI),对于DFI结果,各个类别的重要性以星号标记:***p<0.001;**<0.01’*p<0.005.
d.被两个特征标记为DFI基因的数量,排名前15co-DFI关联分析。条形颜色表示在相同条件(co-Inclusion)或相反条件(Mutualexclusion)中共同包含特征的基因数量。

 

DFI分析提供了两个新的指标:特征包含比例和变化的幅度。通过这些指标,研究者观察到OPCs中的特征获得比NPCs更频繁,这可以理解为在细胞分化的时候AltTEM促进功能特性的整合。研究者应用了tappAS的co-DFI分析来计算小鼠神经数据中功能特征的协同包含(coordinated inclusion)(结果如图3d)。

 

 

差异polyA分析

 

可变多聚腺苷酸化和UTR长度的差异与 mRNA 稳定性、亚细胞位置、RNA 蛋白质结合和翻译效率的调控有关。为了评估 AltTEM 对这些过程的影响,研究者开发了新的定量指标评估DPA与 3’ 和 5’UTR 延长 (3/5UL) 分析,DPA基因功能富集分析可以表明某些基因大量参与了转录调控和RNA加工(图4d)。tappAS结合UTR、ployA位点、编码区和域工具的功能,能够对转录终止位点的选择性过程相关的功能进行更深入的分析。

 

4. 差异polyA分析结果
a. 热图显示每种类型细胞的DPA最显著的基因polyA末端使用(DPAU)水平。
b. 小提琴图显示了OPCNPC之间的3’5’UTR长度表达的差异分布。
c. DAP(FDR>0.05)基因的多个注释类别中特征差异内含物的频率。条形颜色表示该功能所在的转录区域
d. GO termsDPA基因的功能富集(Fisher精确检验,通过Benjamini-Hochberg方法进行多次检验校正,FDR<0.05)。点的颜色表示GO term的方面,点的大小表示重要程度。

 

 

讨论

 
以往传统的分析方法,都仅限于剪接基因的功能富集,我们亟需新的算法来评估多功能位点的异构体决定注释以及进行综合的功能分析。
而现今新研发的tappAS实现了这个功能。tappAS中的每种方法都涵盖了AltTEM功能含义分析的不同方面,当同一基因的不同异构体在其序列中包含不同的功能元件时,其表达水平的变化才能具有AltTEM介导的功能影响。功能多样性分析可以帮我们分析基因功能位点的变化,识别哪些功能在转录水平(通过DIU分析)和编码序列水平(DCU分析)受到AltTEM调控。如果用户对非翻译区域感兴趣,可以使用tappAS差异polyA分析(DAPA)和UTR延长/缩短进行研究。
目前其他统计评估异构体表达差异的方法,要么缺少对全长异构体的评估,要么仅限于特定的可变过程(比如APA, 内含子保留或可变TSS);而异构体使用率功能分析要么局限于编码功能,要么需要研究者收集注释,并没有一个检测异构体差异相关功能的完整方法。tappAS软件的设计非常灵活,能够对异构体进行多功能分析,目前已经包含人类、小鼠、果蝇、拟南芥和玉米的预计算注释文件,用户通过IsoAnnotLite功能可以将这些注释文件比对到相同物种的长读长数据或用户自定义的转录组。功能如此强大的tappAS,能让研究者对AltTEM的功能进行更深入的理解,高效指导分子实验验证,还可以让研究者进行跨多物种的研究工作。

 

 

SERVICE

相关服务

表观生物已经完成 tappAS分析模块的搭建,针对全长转录组项目ISO-seq和纳米孔RNA直接测序项目,可以提供本项分析内容。

 

欢迎拨打400-775-0875或
识别二维码咨询微信客服!

 

 

- - - 推荐阅读 - - -