面向世界科技前沿,面向国度严重年夜需求,面向公平易近经济主疆场,率先完成迷信技巧逾越生长,率先建成国度创新人才网job.vhao.net洼地,率先建成国度高程度科技智库,率先扶植国际一流科研机构。

——中国迷信院办院方针

首页 > 科研停顿

遗传发育所开辟高质量基因组组装软件

2019-12-02 遗传与发育生物学研究所
【字体:大年夜

语音播报

  1125日,中国迷信院遗传与发育生物学研究所梁承志研究组开辟的高质量基因组组装软件HERA在《天然-通信》在线发表(Nature Communications,DOI:10.1038/s41467-019-13355-3)。论文标题为Assembly of chromosome-scale contigs by efficiently resolving repetitive sequences with long reads

  高质量基因组序列关于研究一个物种基因组的构造、功能、退化、基因定位和克隆等都相当重要。今朝单分子测序技巧的生长,已使得构建高质量基因组草图愈来愈轻易。但是,这些草图序列依然存在着由于组装序列碎片化而招致的多种缺点,比如不完全的基因序列、分列到染色体上以后的片段漏掉、分列次序缺点和偏向缺点等。这些缺点关于应用这些基因组所做的很多研究会形成不便或误导。

  中国迷信院遗传与发育生物学研究所梁承志组多年来经过过程结合单分子测序和光学图谱及HiC等技巧构建高质量基因组,已完成多个植物基因组的组装。比来在前期任务的基本上开辟了一个应用单分子测序长片段停止基因组复杂区域组装的新办法HERA。在现有软件组装的基本上,HERA可以或许大年夜大年夜改进基因组序列的持续性并增添了组装缺点。经过过程对水稻基因组停止测试发明,HERA将水稻中的绝大年夜部分反复序列包含复杂的长串连反复序列都精确地组装了出来。在玉米、苦荞和人基因组中与已发表版本停止比较,玉米的Contig N501.3 Mb晋升至61.2Mb,人的Contig N508.3 MB晋升至54.4 MB,苦荞基因组Contig N50达到了27.85 Mb。在玉米B73参考基因组中弥补了大年夜量之前没有组装出的序列,校订了多处染色体上序各地位或偏向缺点,并增长了一些之前损掉的多个重要基因。苦荞中全基因组8条染色体共只由20Contig构成,个中一条染色体是一个Contig,展示了应用现有惯例技巧条件构建简直完全的基因组的潜力。HERA跟已有基因组组装软件CANU等异常互补,预期二者的整合将会产生新的软件,大年夜大年夜进步基因组组装的效力。今朝,由于单分子测序价格的降低,组装一个与日本晴质量相当或更好的水稻参考基因组的本钱已降到了3万元以下。结合单分子测序、BioNanoHi-C数据,今朝可以很低的本钱取得绝大年夜多半物种的高质量参考基因组。关于功能基因组研究来讲,高质量基因组序列的获得已不再是一个瓶颈,这预示着后基因组时代在多半物种中的周全到来。

  论文第一作者为梁承志研究组博士生杜会龙,通信作者为梁承志。软件开辟取得基因组分析平台的大年夜力支撑和赞助。该研究取得中科院计谋性先导科技专项(A)“分子模块设计育种创新体系”等的赞助。

  论文链接

  图a: HERA组装基因组跟玉米参考基因组B73 RefGen_v4的比较。全基因组中序列缺口由2523个增添到了76个。图b: 玉米参考基因组中缺掉或多余的序列(上图)经HERA改进后(下图)被精确地弥补或移除。

打印 义务编辑:叶瑞优

扫一扫在手机翻开以后页

© 1996 - 中国迷信院 版权一切 京ICP备05002857号 京公网安备110402500047号

接洽我们 地址:北京市三里河路52号 邮编:100864