目录

简介

这是一个用于分析微生物组组成数据中平衡的R包。使用了一种前向选择方法来鉴定两组相对丰度或平衡相关的响应类群,以此来寻找特征菌群。

数据准备及分析

selbal安装
library(devtools)
install_url(url="https://github.com/malucalle/selbal/archive/master.zip",INSTALL_opt= "--no-multiarch")
library(selbal)
数据准备(注意:1.请尽量使用绝对丰度;2.避免所提供物种在各样本的分布大多数为0的情况;3.根据R包内置示例数据来看,其样本量都是远大于物种数的,所以提供的数据也应尽量符合这一点,以免影响结果的准确性;4.设置最后一列为分组)
data <- read.table("data.txt", header = T,row.names=1,sep = '\t',stringsAsFactors=T)
x <- data[,1:64]
y <- data[,65]

分析过程
CV.Bal <- selbal.cv(x,y,n.fold = 5, n.iter = 10,covar = NULL, logit.acc = "AUC")
准确性度量分布,红点表示平均精度,分支表示标准误差。
CV.Bal$accuracy.nvar

CV过程中选择的变量的频率(只考虑上一步中定义的最优变量数量的平衡)
CV.Bal$var.barplot

基于全部数据获得的全局平衡
grid.draw(CV.Bal$global.plot)

CV-procedure概要
plot.tab(CV.Bal$cv.tab)

每次cv迭代的测试预测或分类精度(本例中为AUC)(长度等于n.fold*n.iter)
CV.Bal$cv.accuracy; summary(CV.Bal$cv.accuracy)

回归模型的结果
CV.Bal$glm

平衡中的变量的最优可选数量
CV.Bal$opt.nvar
分析脚本
/TJPROJ5/META_ASS/16s/mengyanliang/work/Process_optimization/2022_Q3/Selbal/Selbal.R

更多详情请参考

Rivera-Pinto, J.; Egozcue, J. J.; Pawlowsky-Glahn, V.; Paredes, R.; Noguera-Julian, M.; Calle, M. L.; Lozupone, Catherine (2018). Balances: a New Perspective for Microbiome Analysis. mSystems, 3(4), –. doi:10.1128/mSystems.00053-18

https://htmlpreview.github.io/?https://github.com/malucalle/selbal/blob/master/vignettes/vignette.html