======外源标准ERCC样品评估高通量RNA测序技术====== **##欢迎批评指正!!** 项目:P101SC17092074-01-西农60个转录组测序分析技术服务(委托)合同 ===背景=== ERCC (The External RNA Control Consortium)开发的一组序列和浓度已知的外源标准RNA样本,已被用于评估基因芯片和qPCR等技术平台的性能和数据质量及评估RNA-Seq数据的质量。 采用最新的92条序列和浓度已知的商业化ERCC外源标准RNA,将其按照被测样品mRNA量1%的比例(假设InRNA占总RNA量的2%)加入到样品RNA中,然后用Illumina测序平台进行RNA-Seq测序 ===方法=== 1.有参将ercc序列合并到参考基因组中一起mapping+定量,然后用ercc矫正样品readcount,基于矫正后结果差异分析; 2.无参拼接定量完,然后单独定量ercc,在用ercc定量结果来矫正,基于矫正后结果差异分析 ===脚本=== /TJPROJ1/RNA/shouhou/script_dir/other/ercc/ercc_diff.py \\ 备注:有参基于mapping后结果,无参基于trinity拼接后结果,差异分析为有生物学重复;可调参 \\ ===脚本使用=== Python /TJPROJ1/RNA/shouhou/personal_dir/zhangcuijie/script/ercc/ercc_diff.py --sample A1,A2,A3,B1,B2,B3,C1,C2,C3 \ # 样品名 以逗号隔开 --group A1:A2:A3,B1:B2:B3,C1:C2:C3 \ #样本分组,组内用‘:’分隔,组间用‘,’分隔 --groupname A,B,C \ 组名,逗号分隔,顺序对应于—group --readcount /BJPROJ/RNA/noref1708/P101SC17020563-01-B3-4_sangshu_noref_20171024/DIFF_EXP/Diff_analysis.out/merged.readcount #readcount文件,绝对路径 --cleanfq_dir /TJPROJ1/RNA/shouhou/personal_dir/zhangcuijie/script/ercc/clean_data \ #**无参项目必填,有参不填** --ss 0.5 \ #是否链特异性 **无参项目必填,有参不填** --fa /TJPROJ1/RNA/shouhou/personal_dir/zhangcuijie/script/ercc/RSEM.old/ercc/ercc1.seq \ #ercc1.seq 序列文件 --fc 2 为差异分析筛选条件foldchange ,如果不想用该条件,选择填写1 --p 0.05 差异分析筛选条件pval/padj的阈值 --ty padj 对应参数--p,选择是用pval还是padj为筛选标准 --type noref 项目类型 ref or noref --compare 2:1,3:1 组间比较方式,处理:参考; --exclude 排除选项 {'1':'quant','2':''diff} ===脚本使用方法=== sjm_Analysis.sh ===结果文件=== ===有参: 矫正结果: 1.ERCC.readcount.xls 2.normalized.count:矫正结果:如下 {{:售后:mumbh_s2jc_xxjl_x0qb.png?400|}} 矫正结果说明: gene_id gene的id 其余列是各个样本的所对应的基因的readcount值 若分析差异则差异基因list+火山图结果 ===无参: 1.ERCC定量结果 2.矫正结果 3.若分析差异则差异基因list+火山图结果 ===文献=== {{ :售后:ercc_rna_spike-in_control_mixes.pdf |}}