原始数据中没有5’接头序列

small RNA项目在测序过程中我们测单端50bp,一般来说,动物sRNA的长度区间为18~35nt,植物sRNA的长度区间为18~30nt。我们测50bp是能够测穿的,在5'端我们加的测序需要的序列(index等)长度我们是已知的,在下机数据中已经去掉了,所以5'端不含有接头,因为small的长度在18~35bp,所以测序会有3'端的接头序列在里面。

因此,流程在发现5'端有接头序列时直接丢掉该reads,在发现3'端有接头时对其进行修剪。