人有美图秀秀我有生物秀秀

丁香园2016-05-25

2308

学生物，自然就离不开各种生物软件，掌握这些软件的使用是基础。使用过程中，难免会遇到各式各样的问题，如何针对不同软件的特点，择优选用以事半功倍解决问题？鉴于此，特整理此帖，希望对新手有用。

Q1：怎么查找序列保守区？

A1：很多人查找序列保守区，一般通过序列多重比对后，肉眼判断序列保守区，但此法难免太主观，不具重复性，且选择的保守区无法受统计上的显著性检验。其实，实现这一目的，可以使用DnaSP--> 「Analysis」 -->「Conserved DNA region」...

【注】设计简并引物，用此法，简单易用，强烈推荐...

Q2：多个 FASTA 格式保存的单条序列如何批量快速合并为一个文件？

A2：一条条添加，费时费劲，且容易出错。解决的办法有两个：一是可以通过 DNAMAN 的「多重序列比对」后导出功能，即：添加序列所在的目录，或全选相关文件，进行多重比对，导出 Clustal aln 文件，然后再转换为 FASTA；二是使用我们 2012 年新开发的序列火枪手套件的「Seq Merger.exe」即可快速实现合并。

Q3：如何解决 Clustalx 多重比对（.Aln_格式）后转为 MEGA 格式时提示出错的问题？

A3：检查所转换 MEGA 的 .meg_文件最后几行内容是否有号，全部删减之即可。因为 Clustalx 多重比对后，程序会自动添加一致序列。

Q4：为什么 DNAMAN 软件的很多功能菜单都显示无法使用？

A4：DNAMAN 软件的精华在于通道（Channel）的应用，遇到功能菜单呈灰度无法使用时，不妨将序列载入通道后再试试...

Q5：如何让多重比对美观显示又不占篇幅？

A5：推荐使用 Web Logo（http://weblogo.berkeley.edu/logo.cgi）或 Sequence Logo 之类的在线工具处理。其实这类工具还有一个妙用－可用于设计简并引物，简并序列一目了然，如下图的第 7 个碱其位点，G/A=R。

Q6：如何在多重比对序列的上方显示对应的蛋白质二级结构？

A6：使用 ESPript（http://espript.ibcp.fr/ESPript/cgi-bin/ESPript.cgi）对多重比对序列着色的同时，上传预测的蛋白质结构文件.pdb_即可，效果如下图所示，详见《马铃薯 Y 病毒 pipo 基因的分子变异及结构特征分析》一文。具体操作方法可以参考《ESpript 美化多重比对序列图解 (By Raindy)》。

Q7：如何批量将核苷酸序列翻译为蛋白质序列？

A7：推荐使用 MEGA 中的 Alignment Explorer，先将待翻译的序列以 FASTA 格式保存，鼠标右键「打开方式」选择用 MEGA 打开，在 MEGA 界面点击「Translated Protein Sequence」即可 (下图箭头指示位置)，最后在「Data」菜单导出序列保存：

Q8：如何快速批量下载指定的序列？

A8：通常办法是借助一些生物软件的检索功能，诸如：Bioedit、Geneious、MacVector 等。其实，NCBI 自带的 Batch Entrez 只需简单三步即可轻松完成这一任务，具体见《如何批量下载指定的序列》。

Q9：如何快速进行基因的选择压力检测及检验？

A9：提及基因选择压力的检测，Phylogenetic Analysis by Maximum Likelihood (PAML) 可能是第一反应的分析工具，但 PAML 的操作令不少初学者望而却步，快速完成基因的选择压力分析，推荐使用一个在线服务器 Adaptive Evolution Server，提交序列后，先选择一个最适的进化模型，再选择一个压力检测方法即可，如：病毒群体的可以选用 IEFL 法。具体操作方法详见《基因的选择压力检测及检测图解教程（By Raindy）》一文。

【注】Adaptive Evolution Server 中 GARD 法是目前流行用于检测重组的方法，非常不错，推荐使用。

Q10：如何对多重比对序列进行排序？

A10：由于序列比对矩阵分值的不同，Clustalx 比对后的序列顺序会发生变化，解决比对后序列重新排序的问题，可以使用两个软件：（1）MEGA5 中的子程序 Alignment Explorer，点击下图中的红色箭头即可实现序列升/降排序；（2）直接用 MAFFT 软件比对，在输出格式选项设置输出序列顺序即可，详见《MAFFT 多重序列比对图解教程（By Raindy）》。

Q11：如何解决 Word 2007/2010 中打开带 EndNote X6/7 的文件响应缓慢甚至假死问题？

A11：由于 Word 中某一项拼写和语法检查功能与 EndNote 冲突，依次打开在 Word 中点击"文件"-「选项」-「校对」-「在 Word 文档中更正拼写和语法时」标签，取消选中「键入时标记语法错误」即可。

Q12：如何快速判断测序得到的序列方向并批量删除载体序列？

A12：将测序得到的序列（大于 800bp 的需先拼接）和参考序列文件均以 FASTA 格式合并在一个文件内，先在 MEGA 多重比对，根据比对结果判断目的序列的方向。如果与参考序列差异较大的序列，则可能为需要调整的序列，选定这些序列外，依次在「Data」-「Reverse complement」反向互补后，重新比对后，然后删除参考序列以外的两端序列，最后导出为 FASTA 的文件即可。

Q13：如何使用 MEGA 批量进行系统发育分析？

A13：图形化界面（GUI）的 MEGA 每次处理一个批次的数据，不同批次数据需要做相似或相同系统发育分析时，可以用 MEGA 6.0 Compute Core (CC) 进行批量分析，将不同批次的数据（每个建树序列/行）保存在一个文本文件中，通过命令行进行： M6CC.exe -a Model.mao -d seqpath.txt -o Modelresults，MEGA 6-CC 官网下载地址：http://www.megasoftware.net/megaccusage.php，详见教程：MEGA6 Compute core 图解教程 (By Raindy)

Q14：如何快速批量重命名序列名称？

A14：可以用「借来还去法」实现：将 FASTA 格式的序列排序后，复制粘贴入 Excel 文档中，并手动添加第一列，进行编号后，再对第二列排序，实现序列名称和序列内容分离。批量替换序列名称后，重新以第一列排序，最后删除手动添加的第一列。

本文作者系生物信息学老师高芳銮