如何在 NCBI 查找指定物种及近源物种的基因组信息
南京集思慧远生物
一个合适的参考基因组对于生物信息学的分析至关重要,参考基因组的选择原则一般是同一物种、组装完成度高并且为最新版本,退而求其次也可以选择近源物种的基因组。
那么如何知道 NCBI 数据库是否发布了自己关注的物种基因组,又如何去查找某个物种的基因组信息呢?若没有该物种的基因组信息,又如何查找近源物种的信息呢?在我们与客户的沟通中,发现小可爱们总会有这样的困扰,那究竟该如何在 NCBI 上查找指定物种及近源物种的基因组信息呢,接下来小编就以拟南芥(Arabidopsis thaliana)为例,给大家来一次实战演练,快快拿起小本本记笔记啦!!!
1. 输入物种名称,选择 Genome(基因组),点击搜索:
2. 搜索之后就能得知该物种是否已有基因组信息、基因组组装情况以及注释情况等内容:
那有小可爱就要问啦:“有些时候关注的物种还没有参考基因组发布,怎么办” 这个时候就需要该物种的近源物种信息,或者已有关注的物种信息但还想知道该物种的近源物种信息。
小编还是以拟南芥(Arabidopsis thaliana)为例,在 NCBI 上查找已知物种的近源物种信息。
1. 此时只需输入物种名称的第一个单词 Arabidopsis(双名法中的属,此处为拟南芥属),选择 Taxonomy(分类),点击搜索:
2. 点击属名 “Arabidopsis”:
3. 现在就可以得知所查找物种的近源物种基因组信息了,结果中包含了已有的各个近源物种的基因组、蛋白和注释等信息:
此处结果页面可以分为两个部分:
第一部分是可选选项,在相应选项前选中,点击 Display 即可在第二部分中显示出所选选项的信息,以颜色来对应。
本例勾选了 “Genome” 和 “Protein” 两个选项,则在第二部分不同物种名称之后显示了基因组和蛋白的统计数量;
第二部分是搜索的属分类水平下不同的物种链接,以及显示第一部分的勾选统计信息。
本例第二部分则是拟南芥属的不同物种的链接以及各自的基因组和蛋白数量信息。
4. 点击物种名称链接即可进一步了解各个近源物种的详细信息:
此处页面右侧即为物种的详细基因组统计信息,与上一级页面的第一部分相对应,点击第二列的数字部分即可进入相对应的信息页面。
通过以上的操作我们就可以清楚的知道自己所关注的物种是否有已经发布的基因组以及其具体的基因组信息啦,这样将更加方便地进行科学研究中的实验设计以及分析。大家可以按照步骤实操一下,轻松学会,找到合适的参考基因组,搞定生信分析中重要一步。同学们如果在操作过程中遇到问题以及有其它想要学习了解的内容,都可以留言告诉我们。