用户工具

站点工具


flex_meta-storms_fms_算法重新计算β距离矩阵

FMS

FMS算法简介

Flex Meta-Storms(FMS)算法首次实现了微生物组β多样性的“局部对齐”概念。对于感兴趣的微生物(例如生物标志物),FMS在微生物组对之间产生归一化的系统发育距离。因此,FMS可以挖掘社区样本中一小部分微生物产生的潜在关系,以更大的敏感性和灵活性阐明β多样性,从而有助于更深入地了解微生物-宿主相互作用效应。FMS是作为一个独立的软件包开发的。

微生物组与周围的环境有着密切的互作关系。Beta多样性是微生物组研究与应用的关键基础,能够定量评估复杂群落之间的差异。当前,beta多样性主要基于“全局比对”,即利用群落内全部成员计算总体距离(图1A)。然而,当环境特征(如某些疾病)只与一小部分的微生物有关时,这些微小的改变不足以对整体层面的距离产生影响,从而模糊了微生物与疾病之间的关联。

针对以上问题,苏晓泉教授前期提出了微生物组“局部比对”的概念,并应mSystems期刊(SCI IF= 7.324)主编邀请,将此算法概念发表于该期刊的“2021青年科学家特刊”。在此基础上,研究组首次对微生物组局部比对算法FMS进行了具体实现(图1B)。与现有的 “全局比对”算法相比,FMS能够识别出难以感知的细微差异,表现出了更好的敏感性和特异性。因此,FMS算法有助于深入理解微生物组与宿主的相互作用,促进微生物组大数据的深入研究与广泛应用。

FMS官网:https://github.com/qdu-bioinfo/flex-meta-storms

使用方法

a.输入数据格式

FMS需要两个文件来计算微生物组之间的“局部距离”:

微生物丰度表(例如OTU表)。目前,FMS支持Greengenes的OTU(v13-8)。更多参考数据库将很快发布。例如

            OTU_1   OTU_2   OTU_3   ...     OTU_M
Sample_1    0.1     0        0.1    ...     0.2
Sample_2    0.2     0.1      0      ...     0.1
...         ...     ...      ...    ...     ...
Sample_N    0       0.3      0.2    ...     0.3

确切的感兴趣标记

#Markers
OTU_2
OTU_5
...
OTU_x

生物标志物可以由用户以上述格式手动分配(例如从LefSe解析),也可以在以下步骤中通过秩和测试自动选择。

b.精确的生物标志物选择(可选)

FMS提供了一个基于秩和测试的生物标志物选择工具。这种生物标志物选择需要以下格式的微生物丰度表和元数据:

            Group
Sample_1    H
Sample_2    D
...         ...
Sample_N    D
PM_Marker_Test.R -i dataset.abd -m dataset.meta -o Marker

在这里,“dataset.abd”是微生物丰度表,“dataset.meta”是元数据,“Marker”是选定生物标志物的输出目录。在“标记”目录中,“Out.Group.sig.meanTests.xls”文件是组之间有显著差异的选定生物标志物。

c.计算Flex Meta-Storms距离(局部对齐距离)

使用精确的标记,FMS可以使用灵活提取来提取所有相关的社区成员(目标成员),该提取考虑微生物的加权分类和功能关系,然后计算归一化的系统发育距离作为局部对齐距离。

FMS-comp-taxa -T dataset.abd -M Marker/Out.Group.sig.meanTests.xls -o target.dist

输出文件“target.dist”是FMS距离的成对矩阵。“-M”分配生物标志物,这些生物标志物可以由用户手动指定(例如从LefSe等解析),也可以由FMS包中的“PM_Marker_Test.R”选择。

d.在精确标记上计算距离(可选)

FMS也只能在精确的标记上计算距离(没有灵活的目标成员提取)。

FMS-comp-taxa -T dataset.abd -M Marker/Out.Group.sig.meanTests.xls -k -o exact.dist

输出文件“exact.dist”是精确标记上距离的配对矩阵。“-k”是精确标记上距离的开关。“-M”分配生物标志物,这些生物标志物可以由用户手动指定(例如从LefSe等解析),也可以由FMS包中的“PM_Marker_Test.R”选择。

参考路径 /TJPROJ1/META_ASS/soft/flex-meta-storms/example

sh Readme
或键入以下命令来计算Flex Meta-Storms距离:

#Biomarker selection for samples
PM_Marker_Test.R -m dataset.meta -i dataset.abd -o Marker

#Calculate the Flex Meta-Storms distance of the samples
FMS-comp-taxa -T dataset.abd -M ./Marker/Out.Group.sig.meanTests.xls -o target.dist

#Calculate the Meta-Storms distance on exact markers of the samples
FMS-comp-taxa -T dataset.abd -M ./Marker/Out.Group.sig.meanTests.xls -k -o exact.dist

输出描述

我们还提供了示例输出 https://github.com/qdu-bioinfo/flex-meta-storms/tree/master/example/example_output

target.dist:136个样本的常规配对Flex Meta-Storms距离 target.dist.target_marker:136个样本中目标成员的相对丰度 exact.dist:136个样本的精确标记上的正则成对元风暴距离 exact.dist.exact_marker:136个样本中精确标记的相对丰度

参考文献

Mingqian Zhang$, Wenke Zhang$, Yuzhu Chen, Jin Zhao, Shunyao Wu, Xiaoquan Su*, Flex Meta-Storms elucidates the microbiome local beta-diversity under specific phenotypes. Bioinformatics, 2023, DOI: https://doi.org/10.1093/bioinformatics/btad148.

flex_meta-storms_elucidates_the_microbiome_local_beta-diversity_under_specific_phenotypes.pdf

flex_meta-storms_fms_算法重新计算β距离矩阵.txt · 最后更改: 2023/10/09 03:17 由 yuxi