北京基因组所等开发跨物种长非编码 RNA 鉴定软件 LGC

来源: 北京基因组研究所 / 作者: cas / 时间: 2019-02-02
0 3

近日,中国科学院北京基因组研究所在国际生物多样性与健康大数据(Global Biodiversity & Health Big Data,简称 BHBD)联盟框架下,与沙特阿卜杜拉国王科技大学、巴基斯坦真纳大学以及美国梅奥医学院开展科研合作,联合开发了可跨物种使用的长非编码 RNA(long non-coding RNA, lncRNA)鉴定软件 LGC。该成果以 Characterization and identification of long non-coding RNAs based on feature relationship 为题在国际学术期刊 Bioinformatics 在线发表。

测序技术的飞速发展产生了大量转录组数据,而转录组分析中一个重要的研究内容是鉴定新的转录本并且检测其蛋白编码能力。虽然利用蛋白质谱检测、Ribo-seq 等实验方法可以获得蛋白编码证据,但成本高、耗时长且通量低。因此,目前主要依赖软件预测的计算方法鉴定 lncRNA。已有相关软件大多需要高质量的训练集,对于缺乏高质量数据的非模式物种,鉴定其 lncRNA 难度极大,亟需发展支持跨物种使用的 lncRNA 准确鉴定方法与工具。

为解决以上难题,北京基因组所联合多家科研机构,研究了蛋白编码 RNA 与 lncRNA 在多物种中普遍存在的序列特征差异,发现 GC 含量与 ORF(开放读码框)长度的关系在两者间存在显著差异,且这种差异在动植物中广泛存在。基于此,研发了能够跨物种使用的 lncRNA 鉴定方法和软件 LGC。该方法需要物种特异训练集,与同类方法相比,LGC 可实现从植物到哺乳动物的 lncRNA 的准确鉴定,同时具有较为平衡的灵敏度与特异性,为 lncRNA 跨物种鉴定以及功能分析提供重要方法和工具。同时,提供 web server,支持 fasta、gtf、bed 三种格式,实现在线分析计算。Fasta 格式不限定物种,gtf 与 bed 格式目前支持人、小鼠、斑马鱼与果蝇的在线分析。

该项研究得到中科院战略性先导科技专项、国家重点研发计划、中科院 “十三五” 信息化专项等的资助。

声明:本网所有文章(包括图片和音视频资料)系出于传递更多信息之目的,且明确注明来源和作者,不希望被转载的媒体或个人可与我们联系(edit@bio360.net ),我们将立即进行删除处理。所有文章仅代表作者观点,不代表本站立场。

文章评论(0)
使用匿名身份评论
  • 暂无评论,请抢占。