RNA-SeQC测试记录

RNA序列是下一代测序技术对RNA的应用,可提供转录组范围的细胞活性表征。测序性能和文库质量的评估对于RNA-seq数据的解释至关重要,但目前尚无解决此问题的工具。我们介绍了RNA-SeQC,该程序提供了数据质量的关键指标。这些指标包括产量,比对和重复率; GC偏倚,rRNA含量,比对区域(外显子,内含子和基因内),覆盖范围的连续性,3'/ 5'偏倚和可检测的转录本数量,等等。该软件可对库构建方案,输入材料和其他实验参数进行多样本评估。该软件的模块化功能可实现管道集成以及对数据质量关键指标(如可比对读取数,重复率和rRNA污染)的常规监控。 RNA-SeQC使研究人员可以就下游分析中样品的加入做出明智的决定。总之,RNA-SeQC提供了对实验设计,过程优化和下游计算分析至关重要的质量控制措施。

测试记录如下:

1、对于项目中比对的bam中,加入样品名

/TJPROJ2/GB/PUBLIC/software/GB_TR/mRNA/miniconda3/envs/SNP/bin/java -Dsamjdk.use_async_io_read_samtools=false -Dsamjdk.use_async_io_write_samtools=true -Dsamjdk.use_async_io_write_tribble=false -Dsamjdk.compression_level=2 -jar /TJPROJ2/GB/PUBLIC/software/GB_TR/mRNA/miniconda3/envs/SNP/share/gatk4-4.1.1.0-0/gatk-package-4.1.1.0-local.jar AddOrReplaceReadGroups -I=/TJPROJ6/RNA_SH/shouhou/202204/RNA_seQC/bam/shC_DDP48H_3.bam -O=/TJPROJ6/RNA_SH/shouhou/202204/RNA_seQC/shC_DDP48H_3_reorder_head.bam -SO=coordinate -LB=LB -PL=illumina -PU=PU -SM=shC_DDP48H_3 --TMP_DIR=/TJPROJ6/RNA_SH/shouhou/202204/RNA_seQC/tmp --VALIDATION_STRINGENCY SILENT

2、计算每个转录的gc

/TJPROJ6/RNA_SH/personal_dir/zhangxin/miniconda/envs/RNA-SeQC_1.1.8/bin/gc.py </TJPROJ6/GB_TR/reference_data/new_pip/Animal/Homo_sapiens/Homo_sapiens_Ensemble_94/Homo_sapiens_Ensemble_94_transcript.fa>  <gc.txt>

3、使用软件进行QC

/TJPROJ6/RNA_SH/personal_dir/zhangxin/miniconda/envs/RNA-SeQC_1.1.8/bin/java -Xms512m -Xmx8g -jar /TJPROJ6/RNA_SH/personal_dir/zhangxin/miniconda/envs/RNA-SeQC_1.1.8/share/rna-seqc-1.1.8-2/RNA-SeQC_v1.1.8.jar -s "TestId|shC_DDP48H_3_reorder_head.bam|TestDesc" -t /TJPROJ6/RNA_SH/shouhou/202204/RNA_seQC/Homo_sapiens_Ensemble_94.gtf -r /TJPROJ6/GB_TR/reference_data/new_pip/Animal/Homo_sapiens/Homo_sapiens_Ensemble_94/Homo_sapiens_Ensemble_94.fa -o ./ -strat gc -gc /TJPROJ6/RNA_SH/personal_dir/yangdan/gexinghua/RNA_seQC/new2/test2/gc.txt

最终结果如下report.zip