关于单菌的coreSNP分析,会有客户做此类型分析,频次大概一年两到三次,之前整理了一套基于snippy方法进行coreSNP分析,本次介绍了一种新的软件即KSNP4可以实现。
与snippy方法不同的是,KSNP4无需指定参考基因组即可分析。
现整理了相关流程步骤如下:
寻找SNPs并构建进化树。
1. 样本基因组序列准备:
新建seq文件夹,将需要分析的样本基因组序列文件放入其中,参考/TJPROJ1/META_ASS/soft/KSNP4/test/seq
1. 运行命令生成基因组文件inlist:
/TJPROJ1/META_ASS/soft/KSNP4/kSNP4.1/kSNP4.1pkg/MakeKSNP4infile \ -indir /TJPROJ1/META_ASS/soft/KSNP4/test/seq \ -outfile inlist
2. 计算最佳K值:
export PATH=$PATH:/TJPROJ1/META_ASS/soft/KSNP4/kSNP4.1/kSNP4.1pkg /TJPROJ1/META_ASS/soft/KSNP4/kSNP4.1/kSNP4.1pkg/Kchooser4 -in inlist
3. 运行KSNP4流程寻找SNPs并构建进化树:
/TJPROJ1/META_ASS/soft/KSNP4/kSNP4.1/kSNP4.1pkg/kSNP4 \ -in inlist \ -k 17 \ -outdir /TJPROJ1/META_ASS/soft/KSNP4/test/out \ -cachedir /TJPROJ1/META_ASS/soft/KSNP4/test/tmp -ML -NJ -vcf -CPU 30 -core -min_frac 0.5 | tee Run1Log.txt
注: 此处-k 需要输入上一步输出的最佳k值结果,-outdir 输出文件目录,-cachedir 缓存目录,-ML 构建最大似然树,-NJ 邻接法建树,-core 计算核心SNP和核心SNP最小共有祖先树。
完整脚本及测试路径:
/TJPROJ1/META_ASS/soft/KSNP4/test
软件github链接:
https://github.com/kissake/kSNP4