======简介====== Tajima’s D是由日本研究员Fumio Tajima创建的群体基因检验统计数据,可以用于区分DNA序列是随机进化还是受到自然选择。大于0代表群体观测杂合度高于预期杂合度,稀有等位基因频率降低(群体收缩或者平衡选择),小于0说明群体观测杂合位点少于预期值,稀有等位基因频率增加(群体扩张或者低频选择) ======功能====== 群体基因检验统计,计算Tajima’D值和Pi值,并可视化 ======数据准备====== 1 群体的vcf文件/ --gzvcf 压缩格式的群体vcf 文件 ======数据分析====== 脚本示例 : /TJPROJ2/RESEQ/share/software/vcftools_v0.1.14_step/bin/vcftools \ --gzvcf goose-dp5-miss0.2-maf0.05.vcf.gz \ --TajimaD 20000 \ --step 10000 \ --out goose library(ggplot2) data<-read.table("all_Tajima.D3",header=T) pdf("all_TajimaD.pdf",width=15,height=15) head(data) #data1<-filter(data,CHROM!="YY") data$CHROM<-factor(data$CHROM,) p <- ggplot(data,aes(x=BIN_START/1000000,y=TajimaD,color=sample))+ facet_wrap(data$sample,ncol=1)+ geom_line(size=0.5) + xlab("Chromosome")+ ylab("TajimaD") #p <- ggplot(data,aes(x=CHROM,y=TajimaD,color=CHROM)) + geom_line(size=0.5) + xlab("Chromosome1 (Mb)")+ ylab("TajimaD") p + theme_bw(base_size = 20) + theme(plot.margin = margin(t = 1, r = 1, b = 2, l = 1, unit = "cm")) dev.off() PI分析同上