跳至内容
售后
用户工具
登录
站点工具
搜索
工具
显示页面
修订记录
反向链接
最近更改
媒体管理器
网站地图
登录
>
最近更改
媒体管理器
网站地图
您的足迹:
基于unigene的转移元件分析
编辑本页后请点击“保存”。请参阅
syntax
了解维基语法。只有在您能
改进
该页面的前提下才编辑它。如果您想尝试一些东西,请先到
playground
热身。
媒体文件
======简介====== meta高级分析流程中,基于unigene的转移元件分析所使用的数据库版本过旧,需要及时更新。 已将流程中isfinder数据库更新至2023.01.06版本。 由于此数据库不提供下载,只能使用爬虫爬取数据库网址信息,此处整理补充了isfinder数据库更新方法。 ======功能====== 整理完善了isfinder数据库的更新方法 ======数据库下载流程====== **1. 爬取数据库网址链接:** 第一步用来抓取每个插入序列的注释信息以及对应的网址链接。 <code> /TJPROJ1/META_ASS/script_Advanced_analysis/HUMANn3/software/conda/envs/python3/bin/python ISfiner.step1.py step1 </code> **2. 插入序列网址下载:** 第二步根据下载的所有插入序列的网址链接,对每个网页进行下载,并提取网页中的seq序列信息 <code> /TJPROJ1/META_ASS/script_Advanced_analysis/HUMANn3/software/conda/envs/python3/bin/python ISfiner.step2_new.py step1.IS.ID.list outdir/ </code> <code> rm IS.database.tmp.fa find outdir/ -type f -name 'IS*.seq.fa'|xargs -L 1 -I {} cat {} >> IS.database.tmp.fa </code> <code> /TJPROJ1/META_ASS/script_Advanced_analysis/HUMANn3/software/conda/envs/python3/bin/python check.empty.py IS.database.tmp.fa IS.database.fa > check.list </code> **3. 爬取注释信息:** 第三步,由于第一步爬取的注释信息不符合我们流程需要,需要重构脚本抓取注释。 <code> /TJPROJ1/META_ASS/script_Advanced_analysis/HUMANn3/software/conda/envs/python3/bin/python ISinfo.py list ./ </code> 这样我们就得到了数据库网址最新的插入序列以及注释信息。 完整脚本路径: <code> /TJPROJ1/META_ASS/script_Advanced_analysis/MGEs-unigene/database/isfinder/method </code>
保存
预览
取消
编辑摘要
当您选择开始编辑本页,即寓示你同意将你贡献的内容按下列许可协议发布:
CC Attribution-Share Alike 4.0 International
基于unigene的转移元件分析.txt
· 最后更改: 2023/07/08 09:18 由
chenjiawei
页面工具
显示页面
修订记录
反向链接
回到顶部