用户工具

站点工具


tajima_d和pi分析

简介

Tajima’s D是由日本研究员Fumio Tajima创建的群体基因检验统计数据,可以用于区分DNA序列是随机进化还是受到自然选择。大于0代表群体观测杂合度高于预期杂合度,稀有等位基因频率降低(群体收缩或者平衡选择),小于0说明群体观测杂合位点少于预期值,稀有等位基因频率增加(群体扩张或者低频选择)

功能

群体基因检验统计,计算Tajima’D值和Pi值,并可视化

数据准备

1 群体的vcf文件/ –gzvcf 压缩格式的群体vcf 文件

数据分析

脚本示例 : /TJPROJ2/RESEQ/share/software/vcftools_v0.1.14_step/bin/vcftools \

  1. -gzvcf goose-dp5-miss0.2-maf0.05.vcf.gz \
  2. -TajimaD 20000 \
  3. -step 10000 \
  4. -out goose
library(ggplot2)

data<-read.table("all_Tajima.D3",header=T)

pdf("all_TajimaD.pdf",width=15,height=15)
head(data)
#data1<-filter(data,CHROM!="YY")
data$CHROM<-factor(data$CHROM,)
p <- ggplot(data,aes(x=BIN_START/1000000,y=TajimaD,color=sample))+ facet_wrap(data$sample,ncol=1)+ geom_line(size=0.5) + xlab("Chromosome")+ ylab("TajimaD")
#p <- ggplot(data,aes(x=CHROM,y=TajimaD,color=CHROM)) + geom_line(size=0.5) + xlab("Chromosome1 (Mb)")+ ylab("TajimaD")

p + theme_bw(base_size = 20) + theme(plot.margin = margin(t = 1, r = 1, b = 2, l = 1, unit = "cm"))

dev.off()

PI分析同上

tajima_d和pi分析.txt · 最后更改: 2023/07/09 09:23 由 hongxiang