======简介======
SURVIVOR是一款用于处理和分析结构变异(Structural Variations, SV)的生物信息学软件工具。它主要用于将来自不同工具或不同样本的SV调用结果进行合并和比较。SV是指相对于参考基因组的大规模基因组重排,如插入、删除、倒位和复杂的重排等。由于不同的SV检测工具常常会产生不同的结果,因此需要一个有效的方法来整合这些结果,SURVIVOR就是为了解决这一问题而开发的。
======功能======
合并不同结构变异检测的结果。
======数据准备======
至少两款结构变异软件的vcf结果文件,如果结果文件不是vcf,则需要使用SURVIVOR软件或者自写的脚本进行转换。
======数据分析======
1 示例路径======
/TJPROJ10/JK/liuqifei/workjob/05.gexinghua/X101SC24114105-Z01-J001.20241220.zheda.SURVIVOR/sv
======
2 分析脚本
本分析以delly的结果和breakdancer的结果为例进行合并,具体文件和中间文件在路径中。
#1.转换breakdancer的结果为vcf格式
for i in 01.RawData/*.ctx;do
j=$(basename $i .ctx)
/TJPROJ6/AFS_RESEQ/Proj/liuqifei/miniconda3/bin/python /TJPROJ10/JK/liuqifei/getfile/breakdancer2vcf.py $i result/${j}.vcf
done
#2.使用SURVIVOR合并两个软件的SV结果
cd /TJPROJ10/JK/liuqifei/workjob/05.gexinghua/X101SC24114105-Z01-J001.20241220.zheda.SURVIVOR/sv/result
for i in `cat ../sample`;do
/TJPROJ10/JK/liuqifei/software/SURVIVOR/Debug/SURVIVOR merge \
<(echo -e "/TJPROJ10/JK/liuqifei/workjob/05.gexinghua/X101SC24114105-Z01-J001.20241220.zheda.SURVIVOR/delly/result/$i/${i}.delly.vcf\n${i}.filted.vcf") 1000 2 1 1 0 50 ${i}_merged.vcf &&\
bgzip ${i}_merged.vcf &&\
tabix -p vcf ${i}_merged.vcf.gz
done
SURVIVOR merge的几个参数:
第一个参数: 包含VCF文件名和路径的文件。
第二个参数: 断点之间的最大距离(0-1表示以长度的百分比计算,1表示以碱基对数量计算)。
第三个参数: 最少支持的调用者数量。
第四个参数: 是否考虑结构变异的类型(1表示是,其他值表示否)。
第五个参数: 是否考虑结构变异的链方向(1表示是,其他值表示否)。
第六个参数: 已禁用。
第七个参数: 要考虑的结构变异的最小尺寸。
第八个参数: 输出VCF文件名。
======交付结果======
*_merged.vcf