网站https://www.targetscan.org/vert_80/
TargetScan是一款预测miRNA结合位点的软件,对于哺乳动物中miRNA结合位点预测的效果非常好。在预测miRNA靶基因之前,首先需要确定转录本的3’UTR区域,TargetScan数据库通过一种名为3P-seq的测序技术,确定转录本对应的3’UTR区(哺乳动物中的miRNA通过结合转录本序列的3’UTR区,从而发挥转录后调控作用),并且结合该技术的分析结果和NCBI中已有的3’UTR注释,提供一个综合的3’UTR区序列。
流程如下:
/TJPROJ6/RNA_SH/script_dir/small_target/TargetScan-7.2/targetscan_nonmodel.py -h usage: targetscan_nonmodel.py [-h] [--model {human,mouse,fly,worm,fish}] --mature MATURE --utr UTR --outdir OUTDIR Prediction of target genes in non-model species optional arguments: -h, --help show this help message and exit --model {human,mouse,fly,worm,fish} Select close species --mature MATURE mature.fa --utr UTR 3utr.fa --outdir OUTDIR the out dir of result
需要miRNA序列和3’UTR序列,刷出脚本targetscan.sh(后续可优化拆解miRNA序列,加快速度),结果和readme示例见/TJPROJ6/RNA_SH/script_dir/small_target/TargetScan-7.2
预测超级慢,24小时预测90个sRNA(5万多的mRNA),拆成55份投递
MicroRNAs,或miRNAs,转录后抑制蛋白质编码基因的表达。人类基因组编码了超过1000个miRNA基因,它们共同针对绝大多数信使rna (mRNAs)。将所谓的miRNA种子区与mrna进行碱基配对,可以识别出数千个假定的靶点。评估由此产生的mRNA抑制的强度仍然具有挑战性,但对于潜在miRNA靶点的生物学信息排名至关重要。为了解决这些挑战,预测可能会采用热力学、进化、概率或基于序列的特征。我们开发了一个开源软件库miRmap,它第一次全面覆盖了所有四种方法,使用11个预测器特性,其中三个是新的。这使得我们能够利用免疫纯化、转录组学、蛋白质组学和多聚体分离实验的高通量实验数据,以无偏倚的方式检查特征相关性,并比较它们的预测能力。总的来说,目标站点的可访问性似乎是最具预测性的特性。我们的新特征基于PhyloP,评估负选择的意义,是在进化类别中表现最好的预测器。我们将所有的特性结合到一个集成的模型中,使TargetScan的预测能力几乎提高了一倍。(翻译自网站首页)
分析流程如下:
/TJPROJ6/RNA_SH/script_dir/small_target/miRmap-1.1/scripts/mirmap_runs.py -h usage: mirmap_runs.py [-h] [-m MIRNA_SEQS] [-n MIRNA_IDS] [-a MIRNA_FNAME_FASTA] [-b MIRNA_FNAME_TAB] [-t TRANSCRIPT_SEQS] [-i TRANSCRIPT_IDS] [-f TRANSCRIPT_FNAME_FASTA] [-u TRANSCRIPT_FNAME_TAB] [-z] [-c] [-l LIBRARY_PATH] [-e EXE_PATH] [-s ALN_PATH] [-d MOD_PATH] [-o OUTPUT_FNAME] [-w NUM_WORKER] [-g LOGGING_LEVEL] Predict miRNA targets. optional arguments: -h, --help show this help message and exit -m MIRNA_SEQS, --mirna MIRNA_SEQS miRNA sequence -n MIRNA_IDS, --mirna-id MIRNA_IDS miRNA IDs -a MIRNA_FNAME_FASTA, --mirna-fasta MIRNA_FNAME_FASTA miRNA Fasta file -b MIRNA_FNAME_TAB, --mirna-tab MIRNA_FNAME_TAB miRNA tabulated file -t TRANSCRIPT_SEQS, --transcript TRANSCRIPT_SEQS Transcript sequence -i TRANSCRIPT_IDS, --transcript-id TRANSCRIPT_IDS Transcript IDs -f TRANSCRIPT_FNAME_FASTA, --transcript-fasta TRANSCRIPT_FNAME_FASTA Transcript Fasta file -u TRANSCRIPT_FNAME_TAB, --transcript-tab TRANSCRIPT_FNAME_TAB Transcript tabulated file -z, --site-id Add a column with site IDs -c, --combine Combine multiple targets (miRNA-mRNA 1 to 1 relationships)
例如:
/TJPROJ6/RNA_SH/script_dir/small_target/miRmap-1.1/scripts/mirmap_runs.py --mirna-fasta miRNA.fa1 --transcript-fasta 1.fa --output test2.xls
需要miRNA序列和transcript序列,测试结果见/TJPROJ6/RNA_SH/script_dir/small_target/miRmap-1.1/scripts/test/result/miRmap
miRanda 是由著名的 Memorial Sloan-Kettering 癌症研究中心的研究人员开发的,用于预测 miRNA 与其靶基因互作的结合位点。 miRanda 主要强调 miRNA 与靶基因连接位点的进化保守性,亦偏重于以 miRNA 的5′ 端序列搜索靶基因,并采用 RNAFold 计算热力学稳定性。
small流程中使用该软件,参考流程即可
网站https://pictar.mdc-berlin.de/
PicTar是通过一定计算法则来鉴定microRNA的靶目标的。该可搜索的网站可以提供以下物种的关于microRNA靶目标的预测详细信息,包 括:脊椎动物、七个果蝇种类、三个线虫种类和人类的非保守但共表达的microRNA的靶目标(例如:表达在同一组织的microRNA和mRNA)。
该网站为在线网站,且未找到填写序列的位置,只能填写id,即针对数据库有的物种且使用参考基因的id可以与数据库中匹配(这种一般我们拒绝老师就可以了)
网站https://dianalab.e-ce.uth.gr/html/dianauniverse/index.php?r=microT_CDS
分析pipline https://dianalab.e-ce.uth.gr/html/dianauniverse/index.php?r=taverna/index
DIANA-microT是KiriakidouM等基于实验和计算生物学方法开发的miRNA靶基因预测软件。和miRanda预测结果中可能出 现一个miRNA对应多个靶位点或多个miRNA对应一个靶位点而丢掉了miRNA调控单个靶位点不同的是,DIANA-microT考虑了miRNA调 控单个靶位点的情况。
预测算法:
①miRNA和靶基因间的高亲和力,主要通过结合能来衡量。
②影响miRNA和靶基因所形成二聚体茎环结构环部位置和环大小的miRNA相关蛋白可能指导miRNA和靶基因的相互作用。
该网站为在线网站,且未找到填写序列的位置,只能填写id,即针对数据库有的物种且使用参考基因的id可以与数据库中匹配(这种一般我们拒绝老师就可以了)