全球分布图
1.按照老师要求的配色进行全球分布图的绘制
library(ggplot2) library(RColorBrewer) mydata<-read.table("last.txt",header=TRUE,) visit.x<-mydata$Xlod visit.y<-mydata$Ylod Group<-mydata$Group library(ggplot2) library(maps) mp<-NULL #定义一个空的地图 mapworld<-borders("world",colour = "gray50",fill="white") mp<-ggplot()+mapworld+ylim(-60,90)+ theme_bw()+ theme(panel.grid = element_blank(), panel.background = element_rect(fill = "AliceBlue")) mp2<-mp+geom_point(aes(x=visit.x,y=visit.y,color=Group))+ scale_color_manual(values=c("Blue", "Red", "Green","Gold"))+ labs(x="Longitude",y="Latitude")+ scale_size(range=c(1,1)) ggsave("map.pdf",width =11.5,height =6.2)
gatk4.1
1.gatk4.1 call snp 示例脚本:/TJPROJ2/Animal/Pipeline/GATK/test/work.sh -r |--reference 参考基因组,必填; -f | --fai samtools建立的基因组.fai索引文件,必填; -i | --bamlist bam文件列表,不提供—gvcflist时,必填; -g | --gvcflist gvcf文件列表,不提供--bamlist时,必填; -s | --binlength bin的长度,如果大于该值的染色体按照该值进行切割,不足该值的染色体进行累加,直到长度超过该值,必填; -w | --workflow 选择变异检测流程类型,gvcf或者nonegvcf; -n | --thread HaplotypeCaller线程数,默认6,非必填; -d | --dbsnp dbsnp文件绝对路径,HaplotypeCaller检测变异时使用,非必填; -o | --out 输出文件路径,默认当前目录,非必填; -t | --tmp 临时文件路径,默认在当前目录下建立tmp目录,非必填 脚本配置好后,sh 运行配置脚本,脚本生成后,进入00.shell目录,nohup sh gatk_pipline.sh &即可
ML树
1.使用最大似然法ML构建系统发育树 示例脚本:/PUBLIC/software/public/Evolution/RAxML/standard-RAxML-master/raxmlHPC-PTHREADS -s /TJPROJ6/CCX/Project/Population/X101SC22032953-Z01_kunming100RAD_why/04.pts/01.lianshe/tree/rmRef.fa -n she -m GTRGAMMA -p 12345 -x 12345 -# 100 -f ad -T 20 -s fa文件 -x 12345 指定一个 int 数作为随机种子,以启用快速 Bootstrap 算法。 -p 12345 指定一个随机数作为 parsimony inferences 的种子。 -# 100 指定 bootstrap 的次数。 -m GTRGAMMA 指定核苷酸或氨基酸替代模型。 "PROT" 表示氨基酸替代模型,“GTR”表示碱基替代模型; GAMMA 表示使用 GAMMA 模型; X 表示使用最大似然法估计碱基频率。 -n she 输出文件的后缀为 .she 。 -T 20 指定多线程运行的 CPUs 。 RAxML_bestTree.she 最佳得分ML树 RAxML_bipartitions.she 有bootstrap分值支持的最佳得分树,分值在node上。 RAxML_bipartionsBranchLabels.she 有 bootstrap 分值支持的最佳得分树, 分值在branch上 得到的结果文件在https://itol.embl.de/help.cgi上进行美化。