ShortStack

ShortStack是一个小RNA基因的全面注释和定量的工具

使用方法如下:

source /TJPROJ6/RNA_SH/personal_dir/fengjie/SOFTWARE/CONDA/conda/bin/activate ShortStack4

ShortStack --genomefile genome.fa --threads 6 --outdir ExampleShortStackRunF1_9cm2_16 --known_miRNAs tae_known_miRNAs.fasta --readfile F1_9cm2_16_remain_uniq.fa

readme如下:

结果文件说明

具体参见https://github.com/MikeAxtell/ShortStack

1.Counts.txt
Locus:sRNA cluster的坐标;
Name:sRNA cluster的名称;
main:所有Read groups的reads总数;

2.Results.txt
Locus: sRNA cluster的坐标;
Name: sRNA cluster的名称;
Chrom: 染色体名称;
Start: 起始位置;
End: 终止位置;
Length: 长度;
Reads: read count个数;
DistinctSequences: 重叠此位点的不同sRNA序列的数目;
FracTop: 与顶端基因组链比对的Reads的分数;
Strand: 链的方向;
MajorRNA: 位点上单个最丰富的RNA序列;
MajorRNAReads: 与此位点比对的主要rna的读取数;
Short: 与位点比对的小于-dicermin的读取数。默认情况下,这些读取长度小于21个核苷酸;
Long: 与位点比对的大于-dicermax的读取数。默认情况下,这些reads的长度大于24个核苷酸;
21: 与位点比对的21个核苷酸读数的数目;
22: 与位点比对的22个核苷酸读数的数目;
23: 与位点比对的23个核苷酸读数的数目;
24: 与位点比对的24个核苷酸读数的数目;
DicerCall: 如果>= 80%的比对读取在-dicermin和-dicermax的边界内,则DicerCall给出最丰富的小RNA大小。如果< 80%的比对读位于——dicermin和——dicermax边界内,DicerCall被设置为'N'。DicerCall为“N”的位点不太可能是与Dicer-Like/Argonaute基因调控系统相关的小rna;
MIRNA: 该位点是否通过了MIRNA位点的所有标准?如果是,则为“Y”。如果不是,则为N。
Known_miRNAs: 以分号分隔的用户提供的与位点比对的已知rna列表。如果没有,则为“NA”。

3.alignment_details.tsv

一个以制表符分隔的文本文件,它提供了关于sRNA比对的详细信息,作为映射类型、读取长度和样本的函数。这可以用于绘制目的和随后的sRNA数据的质量控制。它只在执行比对时产生。

mapping_type
U:唯一映射(不是multimapper)。
P:使用选项——mmap设置的方法放置的Multimapper。
R:随机放置多张牌。
H:非常高的多映射读取(>=50命中)。
N:未映射读取。

4.Results.gff3

gff3格式的sRNA位点。

5.known_miRNAs.gff3

已知sRNA位点

6.strucVis/

MIRNA位点的每个位点的可视化文件。

7.mir.fasta

鉴定后的发夹、成熟miRNA和miRNA*序列

8..fastq(.gz) file(s)

裁剪后的fastq文件。

9..bam file(s)

比对的bam文件

10..bw (bigwig) files

bigwig格式的.bw文件