用户工具

站点工具


gtdb-tk

软件介绍

16S rRNA基因是现有细菌分类系统的基石。这个仅以单基因核酸差异构建的细菌生命之树并非尽善尽美。Nature Biotechnology上面的一篇报道,将单基因分类系统扩展到120个细菌共有单拷贝蛋白质,在大量氨基酸水平差异的基础上构建新的分类系统,命名为基因组分类数据库GTDB (Genome Taxonomy Database),大幅修正了现有的细菌生命之树。

  • 这一分类系统以细菌中普遍存在的120个单拷贝蛋白质(bac120)为基础;
  • 在对多分组类别消歧后,根据相对演化散度标准化和分级,得到基因组分类数据库(GTDB);
  • 涵盖了94759个细菌基因组(截止2024/01/29,更新至402709个基因组),在属、种分辨率水平上描述了99个门(截止2024/01/29,更新至181个门),其中不可培养细菌占14.4%;
  • 58%在NCBI分类系统中已收录基因组的分类地位有变动,例如新系统中变形菌门重新划为6个不重叠的新类群;
  • 一些难以确定分类地位的物种(如不可培养微生物)也被系统的整合了进来。

测试路径

测试路径:/TJPROJ1/META_ASS/script_Advanced_analysis/GTDB-tk/test

目录树

Result-X101SC23063510-Z01-F001/
├── 01.identify    鉴定标记基因
│   ├── gtdbtk.ar53.markers_summary.tsv      古菌标记基因  
│   └── gtdbtk.bac120.markers_summary.tsv    细菌标记基因
├── 02.align
│   ├── gtdbtk.bac120.msa.fasta.gz           细菌标记基因提取的fa序列
│   └── gtdbtk.bac120.user_msa.fasta.gz      细菌标记基因提取的fa序列对齐结果
├── 03.classify
│   └── gtdbtk.bac120.summary.tsv            细菌注释结果
├── 04.infer
│   ├── gtdbtk.rooted.tree                   有根树
│   └── gtdbtk.unrooted.tree                 无根树
└── 05.decorate
    ├── gtdbtk.decorate_iTOL.root.tree       可导入iTOL的有根树
    ├── gtdbtk.decorate_iTOL.unroot.tree     可导入iTOL的无根树
    ├── gtdbtk.decorate.root.tree            使用物种信息装饰后的有根树
    └── gtdbtk.decorate.unroot.tree          使用物种信息装饰后的无根树
gtdb-tk.txt · 最后更改: 2024/10/09 02:07 由 sunhongtao