🔥 Prokka 注释原核生物基因组

相关实验：基因注释 prokka

最新修订时间：2023-05-24

合作专家 | 张冰心博士

农业昆虫害虫防治中国农业大学

审核专家 | 聂壹峰博士

纳米生物医学中国科学院大学

简介

原核生物全基因组组装测序已有了较为成熟的方法体系，但是在组装好的基因组注释上还没有较为快捷简便的方法。

Prokka: rapid prokaryotic genome annotation，快速的原核基因组注释，是一个适用于原核生物基因组的快速高效的自动注释工具，以 FASTA 格式的预组装基因组 DNA 序列为输入文件，能够对原核基因组和宏基因组进行快速高效的功能注释，在基因组序列上识别和标记所有相关特征。

用途

原核生物，如细菌的基因组注释，即识别和标记基因组序列上所有相关特征，例如包括预测编码区域及其假定产物以及非编码 RNA，信号肽等。

材料与仪器

组装好之后的细菌基因组 fasta 文件，例如：<filename>.fa

步骤

1. 在 Linux 环境下依赖安装：conda install prokka

2. 激活环境下的软件：conda activate /path/prokka

3. 查看参数：prokka -h

4. 运行：

prokka [options] <filename.fasta>

5. 查看结果：

.gff 基因注释文件

.gbk Genebank 格式注释的文件

.fna 输入核苷酸序列文件

.faa 翻译 CDS（编码区）的氨基酸序列

.ffn 所有转录本注释的核苷酸序列

.sqn 用于提交的可编辑格式的序列

.fsa 用于提交的核苷酸序列

.tbl 用于提交的特征表格文件

.err 存疑或错误报告

.log 运行日志

.txt 注释的各种类型序列统计信息

.tsv 所有注释基因特征列表

注意事项

1. 软件前加上原始路径：

2. 使用前先激活 conda 环境：conda activate path/prokka

3.ftype 默认的是 CDS，使用 addgenes 或 addgmma 参数会区别编码基因或 RNA

来源：丁香实验