SURVIVOR是一款用于处理和分析结构变异(Structural Variations, SV)的生物信息学软件工具。它主要用于将来自不同工具或不同样本的SV调用结果进行合并和比较。SV是指相对于参考基因组的大规模基因组重排,如插入、删除、倒位和复杂的重排等。由于不同的SV检测工具常常会产生不同的结果,因此需要一个有效的方法来整合这些结果,SURVIVOR就是为了解决这一问题而开发的。
合并不同结构变异检测的结果。
至少两款结构变异软件的vcf结果文件,如果结果文件不是vcf,则需要使用SURVIVOR软件或者自写的脚本进行转换。
1 示例路径
/TJPROJ10/JK/liuqifei/workjob/05.gexinghua/X101SC24114105-Z01-J001.20241220.zheda.SURVIVOR/sv
2 分析脚本 本分析以delly的结果和breakdancer的结果为例进行合并,具体文件和中间文件在路径中。
#1.转换breakdancer的结果为vcf格式 for i in 01.RawData/*.ctx;do j=$(basename $i .ctx) /TJPROJ6/AFS_RESEQ/Proj/liuqifei/miniconda3/bin/python /TJPROJ10/JK/liuqifei/getfile/breakdancer2vcf.py $i result/${j}.vcf done #2.使用SURVIVOR合并两个软件的SV结果 cd /TJPROJ10/JK/liuqifei/workjob/05.gexinghua/X101SC24114105-Z01-J001.20241220.zheda.SURVIVOR/sv/result for i in `cat ../sample`;do /TJPROJ10/JK/liuqifei/software/SURVIVOR/Debug/SURVIVOR merge \ <(echo -e "/TJPROJ10/JK/liuqifei/workjob/05.gexinghua/X101SC24114105-Z01-J001.20241220.zheda.SURVIVOR/delly/result/$i/${i}.delly.vcf\n${i}.filted.vcf") 1000 2 1 1 0 50 ${i}_merged.vcf &&\ bgzip ${i}_merged.vcf &&\ tabix -p vcf ${i}_merged.vcf.gz done
SURVIVOR merge的几个参数: 第一个参数: 包含VCF文件名和路径的文件。 第二个参数: 断点之间的最大距离(0-1表示以长度的百分比计算,1表示以碱基对数量计算)。 第三个参数: 最少支持的调用者数量。 第四个参数: 是否考虑结构变异的类型(1表示是,其他值表示否)。 第五个参数: 是否考虑结构变异的链方向(1表示是,其他值表示否)。 第六个参数: 已禁用。 第七个参数: 要考虑的结构变异的最小尺寸。 第八个参数: 输出VCF文件名。
*_merged.vcf