Tajima’s D是由日本研究员Fumio Tajima创建的群体基因检验统计数据,可以用于区分DNA序列是随机进化还是受到自然选择。大于0代表群体观测杂合度高于预期杂合度,稀有等位基因频率降低(群体收缩或者平衡选择),小于0说明群体观测杂合位点少于预期值,稀有等位基因频率增加(群体扩张或者低频选择)
群体基因检验统计,计算Tajima’D值和Pi值,并可视化
1 群体的vcf文件/ –gzvcf 压缩格式的群体vcf 文件
脚本示例 : /TJPROJ2/RESEQ/share/software/vcftools_v0.1.14_step/bin/vcftools \
library(ggplot2) data<-read.table("all_Tajima.D3",header=T) pdf("all_TajimaD.pdf",width=15,height=15) head(data) #data1<-filter(data,CHROM!="YY") data$CHROM<-factor(data$CHROM,) p <- ggplot(data,aes(x=BIN_START/1000000,y=TajimaD,color=sample))+ facet_wrap(data$sample,ncol=1)+ geom_line(size=0.5) + xlab("Chromosome")+ ylab("TajimaD") #p <- ggplot(data,aes(x=CHROM,y=TajimaD,color=CHROM)) + geom_line(size=0.5) + xlab("Chromosome1 (Mb)")+ ylab("TajimaD") p + theme_bw(base_size = 20) + theme(plot.margin = margin(t = 1, r = 1, b = 2, l = 1, unit = "cm")) dev.off()
PI分析同上