====== 一、脚本介绍 ====== ParaAT是中科院基因组所张章课题组在2012年开发,2014年更新了2.0版本,是一个perl脚本。 软件特点:ParaAT(并行比对与反向翻译)能够处理大量同源组。ParaAT 的特点是可以并行构建多个蛋白质编码 DNA 比对,因此非常适合高通量时代的大规模数据分析。 软件分析步骤:1.蛋白序列比对 2.根据蛋白比对结果回译成codon对应的核酸比对结果 3.计算kaks值 ====== 二、软件下载 ====== 下载地址:https://ngdc.cncb.ac.cn/tools/paraat wget https://download.cncb.ac.cn/bigd/tools/ParaAT2.0.tar.gz tar -zxvf ParaAT2.0.tar.gz cd ParaAT2.0 ParaAT.pl -h 依赖下载工具: 1.蛋白比对工具:如clustalw2、mafft、muscle等 2.Kaks_Calculator(https://ngdc.cncb.ac.cn/tools/kaks) ====== 三、数据准备 ====== 1.同源基因列表 2.fasta格式的氨基酸序列文件和核苷酸序列文件(两个文件中对应的序列以及同源基因列表中的对应基因ID要完全相同) 3.多线程运行文件 软件使用参数 {{:paraat.png?400|}} ====== 四、流程执行 ====== 分析一:ParaAT计算Ka/Ks ParaAT.pl -h test.homologs -n test.cds -a test.pep -p proc -m muscle -f axt -g -k -o result_dir #proc文件必须与输出位置在同一个目录下,不然会报错 分析二:ParaAT输出paml格式文件用于dN/dS分析 perl ParaAT.pl -h ogroups.new.txt -n all.cds -a all.pep -p proc -m clustalw2 -f paml -g -o result_dir ====== 五、分析结果 ====== 分析结果展示: {{:parat2.png?400|}}