关于低质量和高质量的判定,illumina测序平台下机时会对每一个碱基进行质量值的判定,得到带碱基质量值的数据及fastq文件,其中@开头的是id,第二行是序列,第三行是+,第四行是质量值。质量值在此处展示形式为字母或符号,每一个质量值都有与之唯一相对应的ASCII码对应的质量(ASCII码链接:),按照qiime的质控标准,将质量值小于19的判定为低质量,大于等于19判定为高质量。 质控具体分为两步: 1、Tags截取:将Raw Tags从连续低质量值(默认质量阈值为<=19)碱基数达到设定长度(默认长度值为3)的第一个低质量碱基位点截断。 该步是指碱基质量值小于19的连续达到3个时,将其从第一个低质量碱基位点开始截断。 2、Tags长度过滤:Tags经过截取后得到的Tags数据集,进一步过滤掉其中连续高质量碱基长度小于Tags长度75%的Tags。 经过前面的截断后,基于剩下的数据计算其连续碱基质量大于19的碱基的个数占总个数的比值,若比值小于75%,则将其进行过滤。