微生物组学Microbial Genomics

COMMON PROBLEMS常见问题

  • 扩增子测序能满足的测序长度是多少?

    Miseq PE300平台测序长度为600bp,但其测序质量较差,质控需要过滤掉超过100bp质量较差的序列;Hiseq2500 PE250平台测序质量较好,但测序总长度为500bp,去掉12bp的barcode和部分质量较差的序列之后只剩460bp左右。所以保守起见,扩增子片段长度不能超过460bp,否则双端测序结果将无法进行拼接,在引物选择时应引起注意。

  • DGGE技术与高通量测序技术在环境微生物群落多样性研究中有什么区别?

    DGGE等分子指纹图谱技术,在其实验结果中往往只含有数十条条带,只能反映出样品中的优势种群,需要标准菌株,且受到凝胶电泳特性的局限,无法检测到稀有菌群的种类,因此其重复性和分辨率都不甚理想。而高通量测序技术能同时对样品中的优势种群及微量菌进行检测,获得样品中的微生物群落组成,并将其含量进行数字化。

  • 扩增子测序和宏基因组测序的区别?

    扩增子主要分为16S、18S、ITS等测序,关注环境样本中的物种组成,该技术物美价廉,实用性高。宏基因组关注环境样本中的物种组成、功能组成及代谢通路等信息,该技术深入挖掘环境样本功能层面的信息。

  • 是否需要生物学重复,多少个合适?

    为了数据质量、结果产出及顺利投稿,必须注意生物学重复问题。考虑到个体差异,后期组间统计学分析以及偏离样本,自然环境至少3个生物学重复,推荐5个;若是人类的肠道、粪便等样品,由于个体特异性高,建议10个以上的重复。

  • 若关注环境中的真核微生物多样性,18S测序和ITS测序哪个更好?

    ITS测序主要是针对真菌多样性的研究,注释准确度高;18S测序针对的是真核微生物,注释到的范围广,但是就真菌来说精确度相对较低;可根据研究目的合理选择测序方案。

  • 扩增子测序和宏基因组测序的对象主要是环境微生物,请问针对此类样本推荐的DNA提取方法是什么?

    针对环境样本推荐老师采用常规的CTAB法或SDS法;其中人和动物组织样本使用SDS方法,其他样本采用CTAB法。另外,针对一些较难提取的样本或您希望提高样品DNA的提取效果,推荐使用Mobio公司专门的环境样本DNA提取试剂盒。

  • 分类学注释中Unclassified、Unidentified及Others分别表示什么意思?f_Legionellaceae和f_Legionellaceae,g_s_有何区别?

    Unidentified:分类学比对时在设定的置信阈值以下或没有分类信息的reads;Unclassified:在数据库中没有找到对应于该序列的分类信息;Others:注释到多个数据库的reads;此处应注意,物种相对丰度分布图中的Others则包含上述三种注释结果及相对丰度小于1%的物种。g_和s_是数据库中在属和种水平有对应的序列信息,但是没有注释信息,f_Legionellaceae是数据库中在属和种水平没有对应的序列信息。

  • 样品OTUs Venn分析图中每个样品的OTU数为什么和各样品所含OTU数及序列数统计表格中的OTU数不对应?

    不同的样品的序列数不同,为了排除因样本间测序数目不同而引入的误差,所以以序列数最低的样品为标准,对不同样品进行重抽样,使各样品的序列数在同一水平下进行样品间的比较分析。

  • 物种相对丰度热图分析中为什么数据结果的表格中没有负值,而图中的图例有负数?

    直接用相对丰度值进行热图的绘制,常常会由于聚类结果中出现相对丰度值分布不均匀,导致大部分丰度较低的物种呈现相同或相近的颜色,不利于样品及物种间的比较分析,因此我们在绘制之前对数值进行了标准化,即对每一个丰度排在前30的物种单独进行z-Score并取自然对数后绘制热图。

  • Alpha多样性的结果怎么看,各指数之间是否可以进行比较?

    Alpha多样性即样品内部的生物多样性,跟其他样品无关,但不同的样品之间亦可以进行数值上的比较(在序列数目一致的前提下)。Alpha多样性根据OTU table和系统发育树进行计算,通常计算的参数包括 observed species指数(OTUs)、chao1指数、shannon指数、simpson指数以及PD whole tree,其中observed species指数和chao1指数反映样品中群落的丰富度,即简单指群落中物种的数量(OTU数目),而不考虑群落中每个物种的丰度情况,数值越大,说明样品中物种越丰富;shannon指数、simpson指数以及PD whole tree反映群落的多样性,受样品群落中物种丰富度和物种均匀度的影响,shannon、simpson指数以及PD whole tree的值越大,说明样品群落多样性越高。