目录

KSNP4 简介

关于单菌的coreSNP分析,会有客户做此类型分析,频次大概一年两到三次,之前整理了一套基于snippy方法进行coreSNP分析,本次介绍了一种新的软件即KSNP4可以实现。

与snippy方法不同的是,KSNP4无需指定参考基因组即可分析。

现整理了相关流程步骤如下:

功能

寻找SNPs并构建进化树。

数据准备

1. 样本基因组序列准备:

新建seq文件夹,将需要分析的样本基因组序列文件放入其中,参考/TJPROJ1/META_ASS/soft/KSNP4/test/seq

流程

1. 运行命令生成基因组文件inlist:

/TJPROJ1/META_ASS/soft/KSNP4/kSNP4.1/kSNP4.1pkg/MakeKSNP4infile \
    -indir /TJPROJ1/META_ASS/soft/KSNP4/test/seq \
    -outfile inlist

2. 计算最佳K值:

export PATH=$PATH:/TJPROJ1/META_ASS/soft/KSNP4/kSNP4.1/kSNP4.1pkg
/TJPROJ1/META_ASS/soft/KSNP4/kSNP4.1/kSNP4.1pkg/Kchooser4 -in inlist

3. 运行KSNP4流程寻找SNPs并构建进化树:

/TJPROJ1/META_ASS/soft/KSNP4/kSNP4.1/kSNP4.1pkg/kSNP4 \
    -in inlist \
    -k 17 \
    -outdir /TJPROJ1/META_ASS/soft/KSNP4/test/out \
    -cachedir /TJPROJ1/META_ASS/soft/KSNP4/test/tmp -ML -NJ -vcf  -CPU 30 -core -min_frac 0.5 | tee Run1Log.txt

注: 此处-k 需要输入上一步输出的最佳k值结果,-outdir 输出文件目录,-cachedir 缓存目录,-ML 构建最大似然树,-NJ 邻接法建树,-core 计算核心SNP和核心SNP最小共有祖先树。

完整脚本及测试路径:

/TJPROJ1/META_ASS/soft/KSNP4/test

软件github链接:

https://github.com/kissake/kSNP4