用户工具

站点工具


组会分享:start

全球分布图

1.按照老师要求的配色进行全球分布图的绘制

library(ggplot2)
library(RColorBrewer)
mydata<-read.table("last.txt",header=TRUE,)
visit.x<-mydata$Xlod
visit.y<-mydata$Ylod
Group<-mydata$Group
library(ggplot2)
library(maps)
mp<-NULL #定义一个空的地图
mapworld<-borders("world",colour = "gray50",fill="white")
mp<-ggplot()+mapworld+ylim(-60,90)+
	theme_bw()+
	theme(panel.grid = element_blank(),
	panel.background = element_rect(fill = "AliceBlue"))
mp2<-mp+geom_point(aes(x=visit.x,y=visit.y,color=Group))+
	scale_color_manual(values=c("Blue", "Red", "Green","Gold"))+
	labs(x="Longitude",y="Latitude")+
	scale_size(range=c(1,1))

ggsave("map.pdf",width =11.5,height =6.2)

gatk4.1

1.gatk4.1 call snp
示例脚本:/TJPROJ2/Animal/Pipeline/GATK/test/work.sh
-r |--reference 参考基因组,必填;
-f | --fai samtools建立的基因组.fai索引文件,必填;
-i | --bamlist bam文件列表,不提供—gvcflist时,必填;
-g | --gvcflist gvcf文件列表,不提供--bamlist时,必填;
-s | --binlength bin的长度,如果大于该值的染色体按照该值进行切割,不足该值的染色体进行累加,直到长度超过该值,必填;
-w | --workflow 选择变异检测流程类型,gvcf或者nonegvcf;
-n | --thread HaplotypeCaller线程数,默认6,非必填;
-d | --dbsnp dbsnp文件绝对路径,HaplotypeCaller检测变异时使用,非必填;
-o | --out 输出文件路径,默认当前目录,非必填;
-t | --tmp 临时文件路径,默认在当前目录下建立tmp目录,非必填

脚本配置好后,sh 运行配置脚本,脚本生成后,进入00.shell目录,nohup sh gatk_pipline.sh &即可

ML树

1.使用最大似然法ML构建系统发育树
示例脚本:/PUBLIC/software/public/Evolution/RAxML/standard-RAxML-master/raxmlHPC-PTHREADS -s /TJPROJ6/CCX/Project/Population/X101SC22032953-Z01_kunming100RAD_why/04.pts/01.lianshe/tree/rmRef.fa -n she -m GTRGAMMA -p 12345 -x 12345 -# 100 -f ad -T 20

-s fa文件
-x 12345 指定一个 int 数作为随机种子,以启用快速 Bootstrap 算法。
-p 12345 指定一个随机数作为 parsimony inferences 的种子。
-# 100 指定 bootstrap 的次数。
-m GTRGAMMA 指定核苷酸或氨基酸替代模型。 "PROT" 表示氨基酸替代模型,“GTR”表示碱基替代模型; GAMMA 表示使用 GAMMA 模型; X 表示使用最大似然法估计碱基频率。
-n she 输出文件的后缀为 .she 。
-T 20 指定多线程运行的 CPUs 。

RAxML_bestTree.she 最佳得分ML树

RAxML_bipartitions.she 有bootstrap分值支持的最佳得分树,分值在node上。

RAxML_bipartionsBranchLabels.she 有 bootstrap 分值支持的最佳得分树, 分值在branch上

得到的结果文件在https://itol.embl.de/help.cgi上进行美化。

组会分享/start.txt · 最后更改: 2023/05/05 05:57 由 wanghongyu