**全球分布图**
1.按照老师要求的配色进行全球分布图的绘制
library(ggplot2)
library(RColorBrewer)
mydata<-read.table("last.txt",header=TRUE,)
visit.x<-mydata$Xlod
visit.y<-mydata$Ylod
Group<-mydata$Group
library(ggplot2)
library(maps)
mp<-NULL #定义一个空的地图
mapworld<-borders("world",colour = "gray50",fill="white")
mp<-ggplot()+mapworld+ylim(-60,90)+
theme_bw()+
theme(panel.grid = element_blank(),
panel.background = element_rect(fill = "AliceBlue"))
mp2<-mp+geom_point(aes(x=visit.x,y=visit.y,color=Group))+
scale_color_manual(values=c("Blue", "Red", "Green","Gold"))+
labs(x="Longitude",y="Latitude")+
scale_size(range=c(1,1))
ggsave("map.pdf",width =11.5,height =6.2)
{{:组会分享:last.png?400|}}{{:组会分享:map.png?400|}}
**gatk4.1**
1.gatk4.1 call snp
示例脚本:/TJPROJ2/Animal/Pipeline/GATK/test/work.sh
-r |--reference 参考基因组,必填;
-f | --fai samtools建立的基因组.fai索引文件,必填;
-i | --bamlist bam文件列表,不提供—gvcflist时,必填;
-g | --gvcflist gvcf文件列表,不提供--bamlist时,必填;
-s | --binlength bin的长度,如果大于该值的染色体按照该值进行切割,不足该值的染色体进行累加,直到长度超过该值,必填;
-w | --workflow 选择变异检测流程类型,gvcf或者nonegvcf;
-n | --thread HaplotypeCaller线程数,默认6,非必填;
-d | --dbsnp dbsnp文件绝对路径,HaplotypeCaller检测变异时使用,非必填;
-o | --out 输出文件路径,默认当前目录,非必填;
-t | --tmp 临时文件路径,默认在当前目录下建立tmp目录,非必填
脚本配置好后,sh 运行配置脚本,脚本生成后,进入00.shell目录,nohup sh gatk_pipline.sh &即可
{{:组会分享:图片1.png?400|}}
**ML树**
1.使用最大似然法ML构建系统发育树
示例脚本:/PUBLIC/software/public/Evolution/RAxML/standard-RAxML-master/raxmlHPC-PTHREADS -s /TJPROJ6/CCX/Project/Population/X101SC22032953-Z01_kunming100RAD_why/04.pts/01.lianshe/tree/rmRef.fa -n she -m GTRGAMMA -p 12345 -x 12345 -# 100 -f ad -T 20
-s fa文件
-x 12345 指定一个 int 数作为随机种子,以启用快速 Bootstrap 算法。
-p 12345 指定一个随机数作为 parsimony inferences 的种子。
-# 100 指定 bootstrap 的次数。
-m GTRGAMMA 指定核苷酸或氨基酸替代模型。 "PROT" 表示氨基酸替代模型,“GTR”表示碱基替代模型; GAMMA 表示使用 GAMMA 模型; X 表示使用最大似然法估计碱基频率。
-n she 输出文件的后缀为 .she 。
-T 20 指定多线程运行的 CPUs 。
RAxML_bestTree.she 最佳得分ML树
RAxML_bipartitions.she 有bootstrap分值支持的最佳得分树,分值在node上。
RAxML_bipartionsBranchLabels.she 有 bootstrap 分值支持的最佳得分树, 分值在branch上
得到的结果文件在https://itol.embl.de/help.cgi上进行美化。
{{:组会分享:图片2.png?400|}}