目录

简介

  随着越来越多物种基因组的组装和完善、检测算法的不断升级、测序成本的大福降低,使得目前基因组重测序等技术被广泛地应用于畜禽基因组研究中。传统的GWAS分析都是以鉴定点突变为主,如:SNP、Indel等,但还可以以某片段上的突变数量进行个性化分析,如:当基因组区域受到的选择达到一定程度时,会造成一定数量和一定密度的SNP表现为纯合,进而判定该区域存在连续性纯合片段(runs of homozygosity,ROH),现代化的动物遗传育种对优良畜禽的选择强度空前加大,加上人工授精技术在大多数畜禽物种上的应用,显著的提高了优良种畜的利用强度,畜禽基因组中鉴定ROH频率和分布受许多因素的影响,ROH在染色体内和染色体之间分布受到许多因素的影响,因此在染色体上会出现ROH集中区域(ROH island)。根据每个SNP位点的ROH ratio绘制曼哈顿图。取top 1% 所在的ROH ratio 作为高频SNP的阈值线,根据超过阈值的SNP位点在基因组的分布情况获得ROH island。

功能

检测群体中ROH岛的位置并可视化

数据准备

1 群体的vcf文件/ –gzvcf 压缩格式的群体vcf 文件

数据分析

脚本示例 : /TJPROJ2/RESEQ/share/software/vcftools_v0.1.14_step/bin/vcftools \

  1. -gzvcf goose-dp5-miss0.2-maf0.05.vcf.gz \
  2. -TajimaD 20000 \
  3. -step 10000 \
  4. -out goose
data <- read.table('all_ratio.xls2',header=FALSE)
source("/TJPROJ6/CCX/Share/PopEvolution/select_sweep/00.bin/Fst_plot.r")
#source("/TJNAS01/AFS_RESEQ/Proj/hongxiang/07.PopEvolution/X101SC22125155-Z01-J001_ROH/AFS/1.ROH/cmd7/test/Fst_plot.r")
png("roh4.png",type="cairo-png",height=6000,width=18000,res=1250)
#manhattan(data, colors=brewer.pal(9,"Set1"),  pch=20,dot.cex=0.5, main="",number_chromosomes=39,ylab="% SNP of ROH")
manhattan(data,  colors=brewer.pal(9,"Set1"), pch=20,dot.cex=0.5, main="",number_chromosomes=39,ylab="% SNP of ROH")
abline(h='0.6',lty=5,cex=0.8,col='black')

dev.off()

#pdf("roh4.pdf",height=5,width=15)
#manhattan(data, colors=brewer.pal(9,"Set1"),  pch=20,dot.cex=0.5, main="",number_chromosomes=39,ylab="% SNP of ROH")
#abline(h='0.6',lty=5,cex=0.8,col='black')
#dev.off()

#tiff("roh4.tif",height=6250,width=18750,res=1250)
#manhattan(data, colors=brewer.pal(9,"Set1"),  pch=20,dot.cex=0.5, main="",number_chromosomes=39,ylab="% SNP of ROH")
#abline(h='0.6',lty=5,cex=0.8,col='black')

#dev.off()