GPB | 宁波大学/深圳湾实验室团队合作发表增强子RNA鉴定与功能注释平台eRNA-IDO

增强子RNA(enhancer RNA,eRNA)是一种从增强子区域中转录而出的非编码RNA,能够在生命过程中发挥重要的调控作用,如促进增强子和启动子成环、调控RNA聚合酶II的暂停释放等。已有研究报道eRNA与疾病尤其是癌症的发生发展密切相关。然而,关于eRNA的转录位置、与其它生物分子之间的作用关系及其生物学功能仍未阐明。因此,开发一种用于有效鉴定eRNA并对其功能进行注释的生物信息学方法/平台具有重要意义。

近日, 宁波大学廖奇与深圳湾实验室李磊团队 在生物信息学期刊 Genomics , Proteomics & Bioinformatics 发表题为“eRNA-IDO: A One-stop Platform for Identification, Interactome Discovery, and Functional Annotation of Enhancer RNAs”的论文。该论文介绍了他们最新开发的综合性平台—— eRNA-IDO,这是一个集eRNA鉴定、互作组发现和功能注释于一体的一站式平台。eRNA-IDO由两个模块组成: 1)eRNA-ID模块用于从常规RNA-seq或新生RNA-seq(如GRO-seq)鉴定eRNA;2)eRNA-Anno利用大规模测序数据寻找eRNA的潜在调控靶标,并预测其功能。 此外,为了简化用户输入和方便使用,平台预先配置了大量的已有数据,如增强子的标记物数据、互作的HiChIP数据、以及GTEx和TCGA中的eRNA表达谱数据等。
eRNA-IDO现已开 放使用 https://bioinfo.szbl.ac.cn/eRNA_IDO/
eRNA-ID的工作流程如图1左所示。用户需要输入RNA-seq或GRO-seq数据的重头组装转录本(GTF格式),然后选择平台上预设的8种增强子标记物或自定义上传指定增强子区域,平台将会从处在指定增强子区域的转录本中,剔除和已注释基因、黑名单区域、简单重复区域存在重叠的条目,随后对剩余的转录本进行编码潜力预测,获得不存在潜在编码能力的新转录本,作为鉴定的eRNA并输出。
图1. eRNA-Anno的工作流程图
eRNA-Anno的工作流程如图1右所示。用户需要输入eRNA的位置信息或者ID(HeRA和eRic数据库中使用的ID)。eRNA-Anno首先会根据eRNA的位置信息计算其在正常组织(GTEx数据)和癌症组织(TCGA数据)中的表达量,并构建以eRNA与蛋白编码基因的共表达网络。这些蛋白编码基因可能是eRNA的潜在作用对象。此外, eRNA-Anno中收录了11,356套转录因子ChIP-seq数据、518套RNA结合蛋白CLIP-seq数据以及198套HiChIP测序数据,分别用于鉴定结合于eRNA转录区域的转录因子、eRNA结合蛋白以及eRNA转录区域成环的启动子靶标,以构建eRNA为中心的调控网络。 这些调控因子提示了eRNA可能的作用机制。随后,eRNA-Anno通过整合调控网络和共表达网络,获得高可信度的整合网络和调控靶标,并对高可信度网络中的蛋白编码基因进行GO和KEGG富集分析,预测eRNA参与调控的生命过程和通路。
总之,eRNA-IDO是能够提供一个可靠且易用的eRNA鉴定、调控靶标预测和潜在功能探索的一站式平台,对于eRNA在疾病中 作用的研究具有重要意义。

浙江大学医学院附属第一医院张育炜、深圳湾实验室龚力海为本文的共同第一作者,宁波大学廖奇教授、深圳湾实验室李磊研究员为本文的共同通讯作者。eRNA-IDO现已开放,欢迎使用: https://bioinfo.szbl.ac.cn/eRNA_IDO/

原文链接: https://doi.org/10.1093/gpbjnl/qzae059
·END·

THE END