合作文章COOPERATION ARTICLE

瘤胃宏基因组组装的4941个基因组简表,用于瘤胃微生物组生物学和酶的发现

来源:admin    发布时间:2020-07-10   阅读数:349

佳作推荐,周五必看,今天也不例外,给大家分享一篇NBT上的佳作,周末休息和学习充电两不误。

瘤胃宏基因组组装的4941个基因组简表,用于瘤胃微生物组生物学和酶的发现图

Compendium of 4,941 rumen metagenomeassembled genomes for rumen microbiome biology and enzyme discovery

瘤胃宏基因组组装的4941个基因组简表,用于瘤胃微生物组生物学和酶的发现

杂志:NBT

作者:Robert D. Stewart

时间:2019.08

影响因子:36.558

研究手段:三代宏基因组(Nanopare)

DOI:10.1038/s41587-019-0202-3


研究背景

瘤胃是一种特殊的胃,含有大量微生物,能够对植物来源的复合多糖进行分解。瘤胃微生物组的基因组编码数千种适于消化植物物质的酶,它们主导反刍动物饮食结构。尽管瘤胃微生物组在反刍动物消化植物物质中非常重要,但大多数是末被培养或不可培养的微生物。


主要工作

①作者使用283只牛进行二、三代混合测序,得到了约6.5TB的reads,组装了4,941个瘤胃微生物的宏基因组组装基因组(MAG)。

②作者提出了一种新的宏基因组学工作流程,该工作流程能够组装至少80%完整的细菌和古细菌基因组。

③作者获得了三个由长reads数据组装而成的contigs,即瘤胃细菌的全染色体组装,其中两个收纳了以前未知的瘤胃物种。

④通过建立的瘤胃基因组集合,文章预测并注释了大量的瘤胃蛋白。


主要结果

1.牛瘤胃微生物组基因组组装

对283头肉牛瘤胃内容物中提取的DNA进行了测序产生了6.5TB以上的Illumina序列数据。采用PhyloPhlAn基于同源蛋白序列构建进化树,并使用GraPhlAn可视化展示。


4941个瘤胃微生物基因组的系统发育树
图1 4941个瘤胃微生物基因组的系统发育树

2.瘤胃微生物组的新微生物基因组

鉴定到4941个基因组,其中144个属于物种级别,1092个为属级,3188个为科级,4084个为目级,4801个为门级,4941个为微生物界。在种水平分类的基因组中,43个为黄瘤胃球菌(Ruminococcus flavefaciens)未培养菌株的基因组,42个为丁二酸纤维杆菌(Fibrobacter succinogenes)未培养菌株的基因组。


瘤胃微生物基因组数据和以前发布的数据进行比较图
图2 将收集到的瘤胃微生物基因组数据和以前发布的数据进行比较

黑线表示蛋白质与最接近匹配的平均百分比(右手y轴),蓝点表示每个RUG与比较数据集中最接近的匹配之间的混合距离(k = 100,000, 衡量两个不同DNA序列之间的差异)。


3.Illumina和nonopare宏基因组装统计数据比较

直方图显示了282 Illumina组装的统计分布,并突出显示了nonopore组装。a:N50值。b:组装的总长度。c:最长重叠群的长度。nonopore组装N50为268kb,比平均Illumina组装(4.7kb)长56倍以上,Illumina组装总长度通常更长(平均600Mb)。相同样品的仅Illumina组装的N50为12.2kb,总长度为247Mb,最长的contig为358kb。


Illumina和nanopore宏基因组组装统计数据的比较图
图3 Illumina和nanopore宏基因组组装统计数据的比较

4.预测碳水化合物代谢蛋白与CAZy数据库的相似度

预测的CAZy与当前CAZy数据库的相似性如图所示。8种碳水化合物活性酶的平均蛋白同源性均不超过60%,说明CAZy不能很好地代表反刍动物微生物基因组编码的碳水化合物酶的多样性。


预测的CAZy与当前CAZy数据库的相似性图
图4 预测的CAZy与当前CAZy数据库的相似性

5. 蛋白质的分类和功能分布

 拟杆菌门(Bacteroidetes)(390万)和厚壁菌门(Firmicutes)(530万)贡献了最多的蛋白质。纤维杆菌的蛋白质组中,碳水化合物代谢所占比例最高(超过6.6%),它们具有纤维附着性和高纤维素分解活性。据预测,这些蛋白质中只有5%多一点是CAZymes,这表明它们在碳水化合物代谢中发挥作用,并适应碳水化合物代谢。在80个含有内聚蛋白的蛋白质中,有79个是由厚壁菌门编码的。

蛋白质的分类和功能分布图
图5 蛋白质的分类和功能分布

总结:本文通过对200多个牛胃样本进行宏基因组二、三代混合测序,得到了4941个宏基因组组装的基因和40多万个碳水化合物代谢相关基因,为研究牛瘤胃微生物组提供了参考基因组。对外部绵羊甲烷的数据进行了分析和瘤胃数据集进行对比用于用于差分分析。本文还提供了一种新的方法标准,包括物种和功能分析的全套流程和相关代码。



分享到: