MPB:华大孙海汐等-从细菌基因组中预测活性前噬菌体工具Prophage Hunter的使用流程和常见问题...

为进一步提高《微生物组实验手册》稿件质量,本项目新增大众评审环节。文章在通过同行评审后,采用公众号推送方式分享全文,任何人均可在线提交修改意见。公众号格式显示略有问题,建议电脑端点击文末阅读原文下载PDF审稿。在线文档(https://kdocs.cn/l/cL8RRqHIL)大众评审页面登记姓名、单位和行号索引的修改建议。修改意见的征集截止时间为推文发布后的72小时,文章将会结合有建设性的修改意见进一步修改后获得DOI在线发表,同时根据贡献程度列为审稿人或致谢。感谢广大同行提出宝贵意见。

从细菌基因组中预测活性前噬菌体工具Prophage Hunter的使用流程和常见问题

The Usage Process and Common Problems of Prophage Hunter, a Tool to Capture Active Phage from the Bacterial Genome

孙海汐1, 2, #, *,李敏1, 2, 3, #,宋文琛1, 2, #,肖敏凤1, 2, 3, *

1.深圳华大生命科学研究院,深圳;2.深圳市未知病原体应急检测重点实验室,深圳;3.中国科学院大学华大教育中心,深圳

*通讯作者邮箱: xiaominfeng@genomics.cn; sunhaixi@cngb.org

#共同第一作者/同等贡献

摘要:识别具有活性的前噬菌体,对于研究噬菌体和细菌的协同进化、噬菌体的生理生化以及工程化设计噬菌体等多种用途至关重要。这里,我们介绍了Prophage Hunter,该工具旨在从细菌的全基因组序列中寻找具有活性的前噬菌体。结合序列相似性的匹配及基于遗传特征的机器学习分类模型,我们开发了一种新颖的评分系统,该系统在验证数据集上预测活性前噬菌体中表现出比当前工具更高的准确性。该工具也可以选择跳过序列相似性匹配,这样有更多可能发现新颖的前噬菌体。Prophage Hunter提供一站式网站服务,包括从细菌基因组中提取前噬菌体基因组、评估前噬菌体的活性、鉴定系统发育相关的噬菌体、注释噬菌体蛋白的功能及可视化前噬菌体基因组位置信息等。Prophage Hunter可在https://pro-hunter.genomics.cn/免费使用。

关键词:前噬菌体,细菌,机器学习,注释,一站式分析

仪器设备

1.个人电脑:安装主流浏览器 (Chrome/Safari) 即可

实验步骤

1.准备输入数据:细菌基因组序列,可包含一条或多条序列 (FASTA格式,图1)。

图1. FASTA格式序列

2.在浏览器中输入https://pro-hunter.bgi.com/,进入网站主页 (图2)。

图2. Prophage Hunter网站主页

3.在网页的导航栏上单击"Start Hunting (开始狩猎)"按钮启动Prophage hunter程序 (图3)。

图3. 单击红色框中的Start Hunting (开始狩猎) 按钮以启动程序

4.在主页上,单击"Browse (浏览)"将一个或多个核苷酸序列以FASTA文件格式上传到网站 (图4a)。默认情况下,Prophage Hunter使用相似性搜索策略来标识初始前噬菌体区域。也可以通过勾选"Skip similarity matching (跳过相似性匹配)"框 (图4b),用户可以跳过此过程以识别新型噬菌体。本示例以地衣芽孢杆菌Bacillus licheniformis DSM 13 (Accession Num.:NC_006322.1) 为输入。

图4. 单击"Browse (浏览)"上传FASTA文件

5.可选择输入电子邮箱地址以接收指向分析报告的超链接 (图5)。请注意,此超链接将在一周后过期。若不输入,则需在提交序列后跳转的分析页面等待分析完成,或自行将提交序列后跳转的分析页面链接复制保存,以便查看结果(详见步骤7、8)。

图5. 输入电子邮件地址以接收分析报告

6.勾选以加入"Join User Experience Improvement Program (用户体验改善计划)" (图6a)。有关更多详细信息,请单击"Join User Experience Improvement Program (用户体验改善计划)" (图6b)。

图6a. 勾选加入用户体验改善计划

图6b. 用户体验改善计划具体信息

7.点击"START HUNTING (开始狩猎)"按钮开始分析。

图7. 开始分析

8.分析完成需要等待5-15分钟,分析完成后点击蓝色区域链接即可到达结果页面 (图8)。

图8. 等待分析完成

结果

1.在结果页面的顶部是一个基因组浏览器,显示了每个预测的前噬菌体区域 (图9a)。活性前噬菌体区域(Category 为Active)和模糊区域(Category 为Ambiguous,即难以判断活性的前噬菌体区域)分别以天蓝色和灰色着色 (图9b)。若提交文件中含有多个序列,用户可以通过单击左上方的下拉菜单切换到基因组的其他染色体或Scaffold序列 (图9c)。

图9. 基因组浏览器显示预测的前噬菌体区域的基因座和活性类别

2.在结果页面底部的表格显示了每个预测的前噬菌体基因组区域的详细信息 (图10a):

- Candidate ID (候选ID):预测的前噬菌体基因组区域的ID;

- Sequence ID (序列ID):输入文件中显示的细菌基因组序列ID;

- Start (开始):预测的前噬菌体基因组区域的开始位置;

- End (结束):预测的前噬菌体基因组区域的结束位置;

- Length (长度):预测的前噬菌体基因组区域的长度;

- Category (类别):预测的前噬菌体基因组活性类别,Active表示预测为具有活性(Score > 0.8),Ambiguous表示该预测区域活性难以判断 (0.5 < Score < 0.8);

- Score (分数):预测的前噬菌体基因组活性分数,分数越高,支持预测区域的活性证据越强;

- Closest phage (最近源的噬菌体):与现有噬菌体库相比,预测的前噬菌体区域最近源的噬菌体," N/A"表示未在噬菌体库中找到近源噬菌体;

- Gene number (基因数目):预测的前噬菌体区域内基因的数目。

图10. 每个预测的前噬菌体区域详细信息。

用户可以单击相应的按钮以下载对应预测的前噬菌体区域的基因组DNA序列、CDS序列或蛋白质序列 (图10b) 或所有分析结果 (图10c)。用户还可以单击最接近的噬菌体的分类名称以查看详细信息 (图10d)。

3.在结果页面顶部的基因组浏览器或下方的表格中单击预测的前噬菌体区域,可以查看预测的前噬菌体区域每个基因的注释情况 (图11a) 和与该区域同源的前5个最接近的噬菌体 (图11b)。本示例为点击表格中 Candidate 22 。

    图11a. 预测的前噬菌体中基因在数据库中 (NCBI NR、Pfam和InterPro) 的注释情况

图11b. 与预测区域同源的前5个最接近的噬菌体

致谢

本项目由国家重点研发计划项目 (2020YFA0908700)、深圳市孔雀团队项目(KQTD2015033117210153)支持。

参考文献

1.Song, W., Sun, H. X., Zhang, C., Cheng, L., Peng, Y., Deng, Z., Wang, D., Wang, Y., Hu, M., Liu, W., Yang, H., Shen, Y., Li, J., You, L. and Xiao, M. (2019). Prophage Hunter: an integrative hunting tool for active prophages. Nucleic Acids Res  47(W1):W74-W80.

猜你喜欢

10000+:菌群分析  宝宝与猫狗  梅毒狂想曲  提DNA发Nature  Cell专刊  肠道指挥大脑

系列教程: 微生物组入门  Biostar  微生物组   宏基因组

专业技能: 学术图表  高分文章  生信宝典  不可或缺的人

一文读懂: 宏基因组  寄生虫益处  进化树

必备技能: 提问  搜索   Endnote

文献阅读  热心肠  SemanticScholar  Geenmedical

扩增子分析: 图表解读  分析流程  统计绘图

16S功能预测    PICRUSt   FAPROTAX   Bugbase  Tax4Fun

在线工具: 16S预测培养基  生信绘图

科研经验: 云笔记   云协作  公众号

编程模板:  Shell   R  Perl

生物科普:   肠道细菌  人体上的生命  生命大跃进   细胞暗战  人体奥秘  

写在后面

为鼓励读者交流、快速解决科研困难,我们建立了“宏基因组”专业讨论群,目前己有国内外5000+ 一线科研人员加入。参与讨论,获得专业解答,欢迎分享此文至朋友圈,并扫码加主编好友带你入群,务必备注“姓名-单位-研究方向-职称/年级”。PI请明示身份,另有海内外微生物相关PI群供大佬合作交流。技术问题寻求帮助,首先阅读 《如何优雅的提问》学习解决问题思路,仍未解决群内讨论,问题不私聊,帮助同行。

学习16S扩增子、宏基因组科研思路和分析实战,关注“宏基因组”

点击阅读原文下载PDF审稿,或浏览器直接访问下载链接:http://210.75.224.110/github/MicrobiomeProtocol/04Review/210226/2003952HaixiSun970936/Protocol2003952.pdf

刘永鑫Adam
关注 关注
  • 2
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
噬菌体预测软件
weifanbio的博客
11-19 1811
噬菌体 噬菌体(bacteriophage, phage)是感染细菌、真菌、藻类 、放线菌或螺旋体等微生物的病毒的总称,因部分能引起宿主菌的裂解,故称为噬菌体。本世纪初在葡萄球菌和志贺菌首先发现。作为病毒的一种,噬菌体具有病毒的一些特性:个体微小;不具有完整细胞结构;只含有单一核酸。可视为一种“捕食”细菌的生物。噬菌体基因组含有许多个基因,但所有已知的噬菌体都是细菌细胞利用细菌的核糖体、蛋白质合成时所需的各种因子、各种氨基酸和能量产生系统来实现其自身的生长和增殖。一旦离开了宿主细胞,噬菌体既不能生长,也
mpb-feedstock:mpb的conda-smithy存储库
02-26
aarch64_mpimpich linux_aarch64_mpinompi linux_ppc64le_mpimpich linux_ppc64le_mpinompi osx_64_mpimpich osx_64_mpinompi当发行信息姓名资料下载版本平台类安装mpb 从conda-forge频道安装mpb可以通过使用以下...
国科大生命科学学院华大专项-孙海汐导师课题组专访:去伪存真的过程一定不是一帆风顺的...
悟道西方
04-02 1014
本文转自国科大生命科学学院华大专项公众号一项项科研成果的成功发布离不开课题组成员们的智慧和辛劳,更离不开课题组导师的悉心指导。我们将对华大学院优秀的课题组导师与成员们进行专访,来一同了解优秀课题组是怎样炼成的。本期我们有幸采访到了华大生命科学研究院超级细胞研究所孙海汐老师和他的课题组成员们,专访将以一问一答的形式呈现。孙海汐华大生命科学研究院超级细胞所 博导研究方向:...
PhiSpy:在细菌基因组识别噬菌体
刘永鑫的博客——宏基因组公众号
08-14 4654
PhiSpy:在细菌基因组识别噬菌体PhiSpy: a novel algorithm for finding prophages in bacterial genomes that ...
孙海汐组专访:去伪存真的过程一定不是一帆风顺的
刘永鑫的博客——宏基因组公众号
03-30 210
一项项科研成果的成功发布离不开课题组成员们的智慧和辛劳,更离不开课题组导师的悉心指导。我们将对华大学院优秀的课题组导师与成员们进行专访,来一同了解优秀课题组是怎样炼成的。本期我们有幸采访到了华大生命科学研究院超级细胞研究所孙海汐老师和他的课题组成员们,专访将以一问一答的形式呈现。孙海汐华大生命科学研究院超级细胞所 博导研究方向:生物信息学,目重点关注多组学技术、单细...
MPB:南农韦组-根际细菌便利和竞争互作类型和强度的研究方法
刘永鑫的博客——宏基因组公众号
02-04 2303
为进一步提高《微生物组实验手册》稿件质量,本项目新增大众评审环节。文章在通过同行评审后,采用公众号推送方式分享全文,任何人均可在线提交修改意见。公众号格式显示略有问题,建议电脑端点击文末阅...
MPB:微生物所东秀珠组-​​基于16S rRNA基因和基因组序列对细菌物种的初步鉴定...
热门推荐
刘永鑫的博客——宏基因组公众号
03-02 1万+
为进一步提高《微生物组实验手册》稿件质量,本项目新增大众评审环节。文章在通过同行评审后,采用公众号推送方式分享全文,任何人均可在线提交修改意见。公众号格式显示略有问题,建议电脑端点击文末阅...
MPB:南农韦组-​​根际细菌产铁载体能力的高通量检测
刘永鑫的博客——宏基因组公众号
02-18 6612
为进一步提高《微生物组实验手册》稿件质量,本项目新增大众评审环节。文章在通过同行评审后,采用公众号推送方式分享全文,任何人均可在线提交修改意见。公众号格式显示略有问题,建议电脑端点击文末阅...
MPB农冯固组-​利用13C-DNA-SIP法示踪根际和菌丝际活性解磷细菌
刘永鑫的博客——宏基因组公众号
02-13 3066
为进一步提高《微生物组实验手册》稿件质量,本项目新增大众评审环节。文章在通过同行评审后,采用公众号推送方式分享全文,任何人均可在线提交修改意见。公众号格式显示略有问题,建议电脑端点击文末阅...
MPB:微生物所蔡磊组-​​基于二代测序的真菌基因组组装和注释
刘永鑫的博客——宏基因组公众号
01-08 7407
为进一步提高《微生物组实验手册》稿件质量,本项目新增大众评审环节。文章在通过同行评审后,采用公众号推送方式分享全文,任何人均可在线提交修改意见。公众号格式显示略有问题,建议电脑端点击文末...
MPB2-guolu2004-0531 OK.zip
06-03
MPB2-guolu2004-0531 OK.zipMPB2-guolu2004-0531 OK.zipMPB2-guolu2004-0531 OK.zip
mpb-demo.zip_DEMO_mpb_mtb_mtb-255
07-13
Example document for using MTB from MIT
Python库 | mpb_lib-0.1.21-py3-none-any.whl
04-23
资源分类:Python库 所属语言:Python 使用提:需要解压 资源全名:mpb_lib-0.1.21-py3-none-any.whl 资源来源:官方 安装方法:https://lanzao.blog.csdn.net/article/details/101784059
强化学习——学习笔记3
qq_52302919的博客
05-29 1409
先上图:在上述流程所说的Q表即为下表:假设我们在玩一个小游戏,该游戏有上下左右不同的动作,同时也会有不同的状态,比如游戏结束等。Q表也可以称为状态-价值函数QsaQ(s,a)Qsa:这个表格的每一行代表每个 state上述例子的游戏结束等,每一列代表每个 action上述例子的上下左右,表格的数值就是在各个 state 下采取各个 action 时能够获得的最大的未来期望奖励。
强化学习——学习笔记
qq_52302919的博客
05-27 1459
强化学习问题通常可以建模为一个马尔可夫决策过程,包括以下几个要素:1、状态集合 (State Set):S;2、动作集合 (Action Set):A;Ps′∣saPs′∣sa,描述在状态s下执行动作a后转移到状态s′s^′s′的概率;Rsas′Rsas′,描述在状态s 下执行动作a并转移到状态s′后获得的奖励。πa∣sπ (a∣s)πa∣s,描述智能体在状态s下选择动作a 的概率。
pytorch学习笔记5
最新发布
drarad的博客
06-02 864
向钩子(forward hook)在模块的向传播开始时触发,向后钩子(forward pre-hook)在向传播之触发,反向钩子(backward hook)在反向传播过程触发。总结来说,钩子提供了一种在 PyTorch 模型的执行过程插入自定义代码的方法,使得用户可以灵活地调试、监控和扩展模型的功能。作用: 这是一个内部的 C 语言指针,指向张量在底层库(通常是 C++ 实现的 PyTorch 核心)的具体数据结构。这些钩子可以在张量的梯度计算之或之后执行自定义的操作。
AI开发初体验:昇腾加持,OrangePi AIpro 开发板
上周的博客
05-27 1370
因为工作需要,以及个人兴趣,本人经常购买开发板进行调试、学习,但具备AI计算的开发板,本人尚未体验过,究其原因,是因为自觉知识储备可能无法胜任AI的开发工作。然而,在体验了OrangePi AIpro 开发板之后,却大大改变了我的看法——AI时代,真的已经来临!OrangePi AIpro 开发板是香橙派联合华为精心打造的高性能 AI 开发板,其内置华为昇腾 AI 处理器,作为国产AI 芯片翘楚,实乃开发板的一大亮点!
AI Agent:人类工作范式的颠覆者还是人机协作新范式?
Baihai_IDP的博客
05-29 674
生成式 AI 只是人工智能发展的开端,未来可能会出现更先进的 AI 智能体系统(AI Agent),我们应当重视 Andrew Ng(译者注:Andrew Ng 是斯坦福大学计算机科学系和电气工程系的客座教授,曾任斯坦福人工智能实验室主任。作者相信人工智能的未来必将呈现出更智能、更自主的 AI Agent 形态。但是 AI Agent 强调的是综合智能,包括但不限于决策制定、环境交互和跨领域的知识应用,这样的智能系统能够适应更复杂的任务需求,并在与人的交流合作展现出更强的灵活性和实用性。
解释下评价参数模型和广义加性模型的统计量有:平均绝对误差(MAB),相对百分误差(MPB),均方根误差(RMSE),确定系数(R方)。模型检验使用留一交叉检验法(leave-one-out、cross-validation) ,检验结果通过MAB、MPB和RMSE来比较。
06-10
评价参数模型和广义加性模型的统计量主要有以下几个: 1. 平均绝对误差(MAB):是预测值与真实值之间差的绝对值的平均值,用来衡量模型的预测误差大小。MAB越小,说明模型的预测误差越小,预测效果越好。 2. 相对百分误差(MPB):是预测值与真实值之间差的绝对值与真实值之间的比值的平均值,用来衡量模型的预测误差相对大小。MPB越小,说明模型的预测误差相对较小,预测效果越好。 3. 均方根误差(RMSE):是预测值与真实值之间差的平方的平均值的平方根,用来衡量模型的预测误差大小。RMSE越小,说明模型的预测误差越小,预测效果越好。 4. 确定系数(R方):是预测值与真实值之间的相关系数的平方,用来衡量模型的拟合优度。R方越接近1,说明模型的拟合效果越好。 留一交叉检验法是一种常用的模型检验方法,它通过将数据集的一个观测值作为测试集,剩余的观测值作为训练集,来评估模型的预测性能。具体地,对于每个观测值,模型都会被训练并预测其对应的响应变量,接着通过计算MAB、MPB、RMSE等统计量来评估模型的预测精度。最终,将所有的测试集上的预测精度指标进行平均,得到模型的整体预测性能评估结果。 在比较不同模型的预测效果时,通常可以通过比较MAB、MPB、RMSE等指标来选择最优模型。一般而言,预测效果好的模型应该具有较小的MAB、MPB和RMSE值,以及较高的R方值。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
写文章

热门文章

  • R语言常用函数:交集intersect、并集union、找不同setdiff、判断相同setequal 123682
  • Windows10远程桌面Ubuntu16.04 92103
  • QIIME 2教程. 01简介和安装 Introduction & Install(2020.11) 83894
  • R语言:生成正态分布数据生成--rnorm,dnorm,pnorm,qnorm 80510
  • Canoco5绘制漂亮的DCA或CCA图 79086

分类专栏

  • 宏基因组分析 18篇
  • R语言绘图包 22篇
  • 扩增子分析 36篇
  • 作者解读 4篇
  • software 51篇
  • shell 19篇
  • R 44篇
  • papers 191篇
  • 扩增子 90篇
  • 宏基因组 76篇
  • 经验 26篇
  • 科普 21篇
  • 新闻 50篇

最新评论

  • 微生物群落基于KEGG预测功能的丰度分布图绘制

    无机语文: 功能预测

  • MPB:南农韦中组-根际细菌便利和竞争互作类型和强度的研究方法

    T_9996: 生物量具体怎么计算呢?

  • 国家自然科学基金优秀青年海外项目答辩汇报PPT模板(双色系可供选择)

    方象: 刘老师,您申报过基金委的项目嘛?

  • gg.gap:ggplot阶截断坐标轴的优秀完美解决方案

    XIX_arbez: add.legend存在bug,请问如何解决?

  • Adv. Intell. Syst. | 青岛大学发表基于深度学习和宿主信息嵌入的微生物组多标签疾病检测研究...

    RR519: GMHI数据库里的宿主变量是怎么处理的?比如BMI的缺失,年龄的异常值?

最新文章

  • NC | 四川大学华西二院王少璞等构建婴幼儿肠道菌群参考基因组集
  • MPB:西农焦硕等-微生物生物地理学研究方法
  • 你想要的宏基因组-微生物组知识全在这(2024.6)
2024
06月 5篇
05月 79篇
04月 79篇
03月 75篇
02月 61篇
01月 79篇
2023年876篇
2022年564篇
2021年629篇
2020年655篇
2019年613篇
2018年447篇
2017年137篇

目录

目录

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43元 前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值

聚圣源生产骨灰盒公司起名洛奇英雄传美服哈尔滨生活知道网风水起名韩起名字大全男孩测试起名的吉凶昆明婴儿起名安全责任王者荣耀起名神器下载我的老师作文600字孟起名字男孩梦的翅膀受了伤燕赵晚报电子版新生儿起名字检测姓素的孩子起什么名字起名网站哪个靠谱宁姓取名起名贝起名公司起名八字免费商标起名查询徐志摩《陌上花开》公司起名网周易免费取名打分从零开始竞选总统我起好名字汉正街中心商城梦见虫子高雅大气四字成语公司起名未受信任的企业级开发者怎么解决工藤有希子天若有情电视剧淀粉肠小王子日销售额涨超10倍罗斯否认插足凯特王妃婚姻让美丽中国“从细节出发”清明节放假3天调休1天男孩疑遭霸凌 家长讨说法被踢出群国产伟哥去年销售近13亿网友建议重庆地铁不准乘客携带菜筐雅江山火三名扑火人员牺牲系谣言代拍被何赛飞拿着魔杖追着打月嫂回应掌掴婴儿是在赶虫子山西高速一大巴发生事故 已致13死高中生被打伤下体休学 邯郸通报李梦为奥运任务婉拒WNBA邀请19岁小伙救下5人后溺亡 多方发声王树国3次鞠躬告别西交大师生单亲妈妈陷入热恋 14岁儿子报警315晚会后胖东来又人满为患了倪萍分享减重40斤方法王楚钦登顶三项第一今日春分两大学生合买彩票中奖一人不认账张家界的山上“长”满了韩国人?周杰伦一审败诉网易房客欠租失踪 房东直发愁男子持台球杆殴打2名女店员被抓男子被猫抓伤后确诊“猫抓病”“重生之我在北大当嫡校长”槽头肉企业被曝光前生意红火男孩8年未见母亲被告知被遗忘恒大被罚41.75亿到底怎么缴网友洛杉矶偶遇贾玲杨倩无缘巴黎奥运张立群任西安交通大学校长黑马情侣提车了西双版纳热带植物园回应蜉蝣大爆发妈妈回应孩子在校撞护栏坠楼考生莫言也上北大硕士复试名单了韩国首次吊销离岗医生执照奥巴马现身唐宁街 黑色着装引猜测沈阳一轿车冲入人行道致3死2伤阿根廷将发行1万与2万面值的纸币外国人感慨凌晨的中国很安全男子被流浪猫绊倒 投喂者赔24万手机成瘾是影响睡眠质量重要因素春分“立蛋”成功率更高?胖东来员工每周单休无小长假“开封王婆”爆火:促成四五十对专家建议不必谈骨泥色变浙江一高校内汽车冲撞行人 多人受伤许家印被限制高消费

聚圣源 XML地图 TXT地图 虚拟主机 SEO 网站制作 网站优化