用户工具

站点工具


sv

简介

单菌框架图SV结果中,客户想要根据SV变异结果位置,找到参考对应gff文件中覆盖的基因名称,找到样本对应gff文件中覆盖的基因名称

功能

写脚本处理SV结果文件,到参考的gff文件中获取覆盖的基因名称,添加到SV结果文件的最后一列,然后再到样本的gff文件中获取覆盖的基因名称,添加到SV结果文件的最后一列。

数据准备

1. SV结果文件:

06.Comparative_Genomics/SV/SV*/*.SV.xls

2. 参考基因组gff文件:

参考.gff

3. 样本基因组gff文件:

样本.gff

数据分析

1. 参考gff覆盖基因:

根据SV变异结果位置,找到参考对应gff文件中覆盖的基因名称,添加到SV结果中的最后一列,以逗号分隔输出

perl /TJPROJ5/META_ASS/16s/chenjiawei/script/danjun/gxh/SV-GFF-pipei/pipei.pl *.SV.xls 参考.gff

对生成的文件重命名 mv new-SV.xls *-new.xls

2. 样本gff覆盖基因:

根据SV变异结果位置,找到样本对应gff文件中覆盖的基因名称,添加到SV结果中的最后一列,以逗号分隔输出

perl /TJPROJ5/META_ASS/16s/chenjiawei/script/danjun/gxh/SV-GFF-pipei/pipei2.pl  *-new.xls 样本.gff

对生成的文件进行重命名 mv new-SV.xls *-new2.xls

sv.txt · 最后更改: 2023/04/10 08:32 由 chenjiawei