2代测序中女性样本Y染色体有mapping

网页 https://www.jianshu.com/p/a806d44e99c5 ,有关于女性检测到Y染色体变异的情况介绍 , 所以女性是有可能存在Y染色体上的reads mapping的,对于其他项目中比如Y染色体基因有表达,Y染色体有甲基化区域的问题同理是可能出现的,具体内容如下:

问题:为什么女性检测出了Y染色体突变?

原因说明(欢迎补充):

1,首先,性染色体上的很多reads比对质量一般较差,并且存在大片段同源区,可能会有许多错误比对到性染色上的reads。咱们目前使用的最新的基于b37的hs37d5参考基因组虽然会将Y染色体同源区标记为N,但是不能完全避免这种类似的问题,所以就算是女性,也可能存在一些低质量的reads比对到Y染色体(参考截图1)。从目前接触到的女性的染色体覆盖情况也可以看到,即使是女性,Y染色体的覆盖也并不是0,如果女性也是用了Y染色体上覆盖的信息进行变异检测,则可能检测到一些突变。

2,目前GATK官方仍然没有对于性染色体的建议,一般的best practice还是整个bam文件作为输入检测的,但是有提到如果有需求的话,对于女性一般的解决办法,是不去检测Y染色体突变,对应男性的一般解决办法,GATK 可以分开检测X,Y染色体,设置倍性为1(参考截图2,截图3,截图4)。

总结及解决办法:

综上,如果我们没有对男女进行区分检测,即女性没有避开Y染色体,则可能会出现女性有Y染色体突变的情况。目前的解决办法,samtools 或者 GATK分染色体,女性不检测Y染色体突变;