======简介====== 单菌框架图SV结果中,客户想要根据SV变异结果位置,找到参考对应gff文件中覆盖的基因名称,找到样本对应gff文件中覆盖的基因名称 ======功能====== 写脚本处理SV结果文件,到参考的gff文件中获取覆盖的基因名称,添加到SV结果文件的最后一列,然后再到样本的gff文件中获取覆盖的基因名称,添加到SV结果文件的最后一列。 ======数据准备====== **1. SV结果文件:** 06.Comparative_Genomics/SV/SV*/*.SV.xls **2. 参考基因组gff文件:** 参考.gff **3. 样本基因组gff文件:** 样本.gff ======数据分析====== **1. 参考gff覆盖基因:** 根据SV变异结果位置,找到参考对应gff文件中覆盖的基因名称,添加到SV结果中的最后一列,以逗号分隔输出 perl /TJPROJ5/META_ASS/16s/chenjiawei/script/danjun/gxh/SV-GFF-pipei/pipei.pl *.SV.xls 参考.gff 对生成的文件重命名 mv new-SV.xls *-new.xls **2. 样本gff覆盖基因:** 根据SV变异结果位置,找到样本对应gff文件中覆盖的基因名称,添加到SV结果中的最后一列,以逗号分隔输出 perl /TJPROJ5/META_ASS/16s/chenjiawei/script/danjun/gxh/SV-GFF-pipei/pipei2.pl *-new.xls 样本.gff 对生成的文件进行重命名 mv new-SV.xls *-new2.xls