单菌框架图SV结果中,客户想要根据SV变异结果位置,找到参考对应gff文件中覆盖的基因名称,找到样本对应gff文件中覆盖的基因名称
写脚本处理SV结果文件,到参考的gff文件中获取覆盖的基因名称,添加到SV结果文件的最后一列,然后再到样本的gff文件中获取覆盖的基因名称,添加到SV结果文件的最后一列。
1. SV结果文件:
06.Comparative_Genomics/SV/SV*/*.SV.xls
2. 参考基因组gff文件:
参考.gff
3. 样本基因组gff文件:
样本.gff
1. 参考gff覆盖基因:
根据SV变异结果位置,找到参考对应gff文件中覆盖的基因名称,添加到SV结果中的最后一列,以逗号分隔输出
perl /TJPROJ5/META_ASS/16s/chenjiawei/script/danjun/gxh/SV-GFF-pipei/pipei.pl *.SV.xls 参考.gff
对生成的文件重命名 mv new-SV.xls *-new.xls
2. 样本gff覆盖基因:
根据SV变异结果位置,找到样本对应gff文件中覆盖的基因名称,添加到SV结果中的最后一列,以逗号分隔输出
perl /TJPROJ5/META_ASS/16s/chenjiawei/script/danjun/gxh/SV-GFF-pipei/pipei2.pl *-new.xls 样本.gff
对生成的文件进行重命名 mv new-SV.xls *-new2.xls