行业动态INDUSTRY DYNAMIC

扩增子|环境因子关联分析

来源:admin    发布时间:2020-09-18   阅读数:70

继上两篇给大家介绍了扩增子注释四部曲以及OUT君后,今天的主角仍然是扩增子,分享扩增子环境因子关联分析给大家,希望对大家有所帮助。


一、环境因子关联分析

采用监督式多元分析方法,引入样本环境因子信息与菌群丰度进行分析,运用相关性热图分析、CCA/RDA、VPA分析等全面展示环境因子与物种、样本之间的相关关系,研究环境因子对物种和样本的影响。


1、相关性热图分析

相关性热图分析又称 PERMANOVA 分析或 Spearman 相关性分析,对原始变量的分布不作要求,属于非参数统计方法,可用来研究环境因子或其他临床表型数据与微生物菌群之间的相互关系。 通过计算环境因子与物种丰度间的 spearman 相关系数,得到两两之间的相关性和显著性 p 值,并用热图展示。

该分析可以挑选出与某种环境因子或疾病显著相关的物种,要求每个样本组的样本数量不小于 3 个,同时提供环境因子的数据,如 pH 值、温度、重金属含量等。


扩增子|环境因子关联分析


例图说明:

横向代表环境因子信息,竖向代表物种信息,图中蓝色代表正相关,红色代表负相关,颜色越深代表相关性越高,p值为相关性检验结果,图中的*表示 p<0.05,**表示 p<0.01。


2、RDA/CCA分析

RDA或者CCA是基于对应分析发展而来的一种排序方法,将对应分析与多元回归分析相结合,每一步计算均与环境因子进行回归,又称多元直接梯度分析。此分析主要用来反映菌群与环境因子之间关系,可以检测环境因子、样品、菌群三者之间的关系或者两两之间的关系,可得到影响样品分布的重要环境驱动因子。

RDA是基于线性模型,CCA是基于单峰模型。一般我们会选择 CCA 来做直接梯度分析。但是,如果 CCA 排序的效果不太好,就可以考虑换做用 RDA分析。 RDA 或 CCA 选择原则:先用 species-sample做 DCA 分析,看分析结果中 Lengths of gradient 的第一轴的大小,如果大于4.0,就应选CCA;如果在3.0-4.0之间,选RDA 和CCA 均可;如果小于3.0,RDA 的结果要好于 CCA,即选择RDA。

与微生物菌群相关的环境因子太多,但这些环境因子中有很多是自相关,所以进行环境因子分析前可以进行环境因子的筛选,只保留那些对菌群影响较大的环境因子。


扩增子|环境因子关联分析


例图说明:

圆点表示样品名,箭头表示环境因子,蓝色标注表示不同的物种,箭头连线的长度代表某个环境因子与样本和物种间的相关性程度,箭头越长,则相关性越大。箭头连线和排序轴的夹角代表某个环境因子与排序轴的相关性大小,夹角越小,相关性越高;反之越低。环境因子之间的夹角为锐角时表示两个环境因子之间呈正相关关系,钝角时呈负相关关系。


3、VPA分析

VPA 分析即方差分解分析(Variance partitioning canonical correspondence

analysis),重点研究各环境因子对微生物群落分布的解释量,可得到各环境因子对微生物群落分布差异的贡献度。


扩增子|环境因子关联分析

例图说明:

图中每个圆圈代表一个环境因子,圈和圈的重叠部分的百分比代表某两个(或几个)环境因素的交互作用排除其他影响后的解释度,没有重叠部分的百分比代表某一个环境因素排除其他因素影响后对群落物种分布构成差异的解释度,圆圈外为所有环境因素无法解释的比例。


4、Mantel Test分析

Mantel test是对两个矩阵相关关系的检验,通过随机的置换两个矩阵的行和列 n 次并统计z值构成零分布,计算观测到的值在此分布的位置即可得出 p 值。相对于CCA分析,Mantel test 可以更加直观的根据所求 r值和显著性水平p值来判断环境因子和微生物群落分布的相关性。p<0.05,则该环境因子跟微生物群落物种分布间有显著相关性。


扩增子|环境因子关联分析


图例说明:Variable是环境因子信息,r为相关系数,P为显著性检验p值。r值越大,说明该组环境因子与物种丰度信息相关性越大,P<0.05表示统计具有显著性。


5、排序回归分析

线性回归(Linear Regression)是利用数理统计中回归分析,来确定一个或多个自变量和因变量之间关系的一种统计分析方法。环境因子排序回归分析,根据PCA/PCoA/NMDS分析结果,以各样本在某一轴(如PC1轴)上的分值为x轴,以该样品对应的环境因子(如pH、温度等)为y轴做散点图,并进行线性回归(Linear Regression),标注R2,可用于评价二者间的关系。其中R2为决定系数,代表变异被回归直线解释的比例。为使作图效果较好,样品个数应越多越好,建议10个样品以上。


扩增子|环境因子关联分析


图例说明:

纵坐标为环境因子(如pH、温度等),横坐标为排序轴,R2为决定系数,代表变异被回归直线解释的比例,R2越大,表明该环境因子(如pH)对样本在排序轴上差异的解释度越高。

以上就是扩增子环境因子关联分析的详细内容,希望您看完了有所收获。




您可能还喜欢:

干货|扩增子里妥妥的C位——OTU君

干货|扩增子-物种群落分析



分享到: