生物信息
TCGA数据挖掘服务—肿瘤相关RNA结合蛋白深度分析
发布时间:2018-07-16 11:17:27 | 浏览次数:

TCGA(The Cancer Genome Atlas),即癌症基因组图谱项目,始于2005年,由美国政府出资,美国国家癌症研究所(National Cancer Institute)和美国人类基因组研究所(National Human Genome Research Institute)共同监督,旨在应用高通量的基因组分析技术,以帮助人们对癌症有个更好的认知,从而提高对于癌症的预防、诊断和治疗能力。目前,利用TCGA数据,进行深度数据挖掘,再设计实验验证而发表的文章越来越多,其中包括癌症亚型、driver mutation、假基因等新型研究领域。

       但是TCGA数据库中只提供数据的下载,后续的分析任务才是更重要的部分。表观生物通过深度TCGA最新的数据,整合7332套RNA-seq数据及临床相关数据,针对18种高发肿瘤,提供1912个[1-3]RNA结合蛋白的深度分析挖掘服务,为研究癌症相关RNA结合蛋白奠定坚实基础和提升研究效率!


表3-1. 涉及肿瘤类型及分析的样本数量

类型

肿瘤样本数量

正常对照数量

THCA(甲状腺癌)

504

59

CHOL(胆管癌)

36

9

UCEC(子宫内膜癌)

180

23

READ(直肠癌)

92

10

HNSC(头颈癌)

518

44

COAD(结肠癌)

287

41

STAD(胃癌)

413

36

LIHC(肝癌)

369

50

KICH(肾嫌色细胞癌)

66

25

PRAD(前列腺癌)

494

51

LUAD(肺腺癌)

513

59

LUSC(肺鳞癌)

498

50

BRCA(乳腺癌)

1092

113

KIRP(肾乳头状细胞癌)

288

32

ESCA(食管癌)

181

13

KIRC(肾透明细胞癌)

530

72

BLCA(膀胱癌)

407

19

GBM(胶质瘤)

153

5


技术应用

1.       快速获取在肿瘤中表达失常及存在拷贝数变异的RNA结合蛋白,为验证肿瘤相关RBP奠定基础;

2.       为相关研究论文的发表提供重要的数据支撑;

3.       可作为申请课题的基础工作,降低前期投入的成本;

4.       为RNA结合蛋白的功能高通量筛选结果提供参照,指导精确锁定肿瘤相关的RNA结合蛋白。


技术优势

      1.       国内首个TCGA数据挖掘服务!

      2.       表观生物承诺,每个癌种的全部相关数据均只出售一次,18组肿瘤的数据,先到先得!


分析内容

1、  差异表达分析

我们通过利用Limma包中的voom算法对每种癌症类型中差异表达的RNA结合蛋白进行鉴定,统计显著的RNA结合蛋白被定义为倍数变化大于或等于2倍,假阳性发现率(FDR)小于0.05。以肝癌为例,我们用上述的方法分析了1912个RNA结合蛋白在369例肿瘤样本与50例癌旁组织样本之间的表达水平,发现540个RNA结合蛋白在癌与癌旁组织之间显著差异表达(见图1)。例如,TPD52L2和HEATR1在肝癌中显著上调(见图2)。


图3-1. 显示在肝癌中显著失调的RNA结合蛋白



图3-2. 箱线图显示了TPD52L2和HEATR1在肝癌中显著上调


2、  拷贝数变化分析

基于已经鉴定的显著失调的RNA结合蛋白,我们进一步探索了拷贝数变化对其变化的影响。 通过整合分析拷贝数变化和表达数据,我们发现一批显著失调的RNA结合蛋白的DNA拷贝数发生了高频的变化。例如,TPD52L2和HEATR1在肝癌中均发生了频繁的扩增,且明显与它们升高的表达显著相关(见图3)。




图3-3. TPD52L2和HEATR1在肝癌中扩增,且表达与拷贝数显著正相关


3、  生存分析

我们也基于临床数据,评估了这些差异表达的RNA结合蛋白与病人生存之间的关联。基于多因素cox回归模型(以年龄和性别作为协变量),我们鉴定了一批RNA结合蛋白与病人生存显著相关。例如,高表达TPD52L2或HEATR1的肝癌病人比那些低表达的病人拥有更短的生存时间(见图4)。



图3-3. TPD52L2和HEATR1的表达与肝癌病人的生存显著相关


参考文献

1. Gerstberger SHafner MTuschl T.  census of human RNA-binding proteinsNat Rev Genet. 2014 Dec;15(12):829-45.

2. Castello AFischer BFrese CK, et al. Comprehensive Identification of RNA-Binding Domains in Human Cells. Mol Cell. 2016 Aug 18;63(4):696-710. 

3. Castello AFischer BEichelbaum K, et al. Insights into RNA biology from an atlas of mammalian mRNA-binding proteins.Cell. 2012 Jun 8;149(6):1393-406.


 
 上一篇:lncRNA/mRNA功能预测
 下一篇:备战2019NSFC| 肿瘤相关lncRNA度分析与功能预测

关注我们

联系我们

邮箱:service@epibiotek.com
电话:020-89855770   400-775-0875
地址:广州市经济技术开发区国际企业孵化器E406

关于我们

       表观生物专注于医学表观遗传与转录调控研究领域,提供尖端的新一代测序技术服务和试剂盒开发,推动以表观遗传组学为基础的精准诊断与精准治疗的转化医学应用,造福人类健康。

版权所有:广州表观生物科技有限公司 粤ICP备16111092号