====ShortStack====
ShortStack是一个小RNA基因的全面注释和定量的工具
使用方法如下:
source /TJPROJ6/RNA_SH/personal_dir/fengjie/SOFTWARE/CONDA/conda/bin/activate ShortStack4
ShortStack --genomefile genome.fa --threads 6 --outdir ExampleShortStackRunF1_9cm2_16 --known_miRNAs tae_known_miRNAs.fasta --readfile F1_9cm2_16_remain_uniq.fa
readme如下:
结果文件说明
具体参见https://github.com/MikeAxtell/ShortStack
1.Counts.txt
Locus:sRNA cluster的坐标;
Name:sRNA cluster的名称;
main:所有Read groups的reads总数;
2.Results.txt
Locus: sRNA cluster的坐标;
Name: sRNA cluster的名称;
Chrom: 染色体名称;
Start: 起始位置;
End: 终止位置;
Length: 长度;
Reads: read count个数;
DistinctSequences: 重叠此位点的不同sRNA序列的数目;
FracTop: 与顶端基因组链比对的Reads的分数;
Strand: 链的方向;
MajorRNA: 位点上单个最丰富的RNA序列;
MajorRNAReads: 与此位点比对的主要rna的读取数;
Short: 与位点比对的小于-dicermin的读取数。默认情况下,这些读取长度小于21个核苷酸;
Long: 与位点比对的大于-dicermax的读取数。默认情况下,这些reads的长度大于24个核苷酸;
21: 与位点比对的21个核苷酸读数的数目;
22: 与位点比对的22个核苷酸读数的数目;
23: 与位点比对的23个核苷酸读数的数目;
24: 与位点比对的24个核苷酸读数的数目;
DicerCall: 如果>= 80%的比对读取在-dicermin和-dicermax的边界内,则DicerCall给出最丰富的小RNA大小。如果< 80%的比对读位于——dicermin和——dicermax边界内,DicerCall被设置为'N'。DicerCall为“N”的位点不太可能是与Dicer-Like/Argonaute基因调控系统相关的小rna;
MIRNA: 该位点是否通过了MIRNA位点的所有标准?如果是,则为“Y”。如果不是,则为N。
Known_miRNAs: 以分号分隔的用户提供的与位点比对的已知rna列表。如果没有,则为“NA”。
3.alignment_details.tsv
一个以制表符分隔的文本文件,它提供了关于sRNA比对的详细信息,作为映射类型、读取长度和样本的函数。这可以用于绘制目的和随后的sRNA数据的质量控制。它只在执行比对时产生。
mapping_type
U:唯一映射(不是multimapper)。
P:使用选项——mmap设置的方法放置的Multimapper。
R:随机放置多张牌。
H:非常高的多映射读取(>=50命中)。
N:未映射读取。
4.Results.gff3
gff3格式的sRNA位点。
5.known_miRNAs.gff3
已知sRNA位点
6.strucVis/
MIRNA位点的每个位点的可视化文件。
7.mir.fasta
鉴定后的发夹、成熟miRNA和miRNA*序列
8..fastq(.gz) file(s)
裁剪后的fastq文件。
9..bam file(s)
比对的bam文件
10..bw (bigwig) files
bigwig格式的.bw文件