丁香实验_LOGO
登录
提问
提问
我要登录
|免费注册
丁香通
点赞
收藏
wx-share
分享

人有美图秀秀 我有生物秀秀

丁香园

1327
学生物,自然就离不开各种生物软件,掌握这些软件的使用是基础。使用过程中,难免会遇到各式各样的问题,如何针对不同软件的特点,择优选用以事半功倍解决问题?鉴于此,特整理此帖,希望对新手有用。

Q1:怎么查找序列保守区?

A1:很多人查找序列保守区,一般通过序列多重比对后,肉眼判断序列保守区,但此法难免太主观,不具重复性,且选择的保守区无法受统计上的显著性检验。其实,实现这一目的,可以使用DnaSP--> 「Analysis」 -->「Conserved DNA region」...


【注】设计简并引物,用此法,简单易用 ,强烈推荐...

Q2:多个 FASTA 格式保存的单条序列如何批量快速合并为一个文件?

A2:一条条添加,费时费劲,且容易出错。解决的办法有两个:一是可以通过 DNAMAN 的「多重序列比对」后导出功能,即:添加序列所在的目录,或全选相关文件,进行多重比对,导出 Clustal aln 文件,然后再转换为 FASTA;二是使用我们 2012 年新开发的序列火枪手套件的「Seq Merger.exe」 即可快速实现合并。


Q3:如何解决 Clustalx 多重比对(.Aln_格式)后转为 MEGA 格式时提示出错的问题?

A3:检查所转换 MEGA 的 .meg_文件最后几行内容是否有号,全部删减之即可。因为 Clustalx 多重比对后,程序会自动添加一致序列。


Q4:为什么 DNAMAN 软件的很多功能菜单都显示无法使用?

A4:DNAMAN 软件的精华在于通道(Channel)的应用,遇到功能菜单呈灰度无法使用时,不妨将序列载入通道后再试试...

Q5:如何让多重比对美观显示又不占篇幅?

A5:推荐使用 Web Logo(http://weblogo.berkeley.edu/logo.cgi)或 Sequence Logo 之类的在线工具处理。其实这类工具还有一个妙用-可用于设计简并引物,简并序列一目了然,如下图的第 7 个碱其位点,G/A=R。


Q6:如何在多重比对序列的上方显示对应的蛋白质二级结构?

A6:使用 ESPript(http://espript.ibcp.fr/ESPript/cgi-bin/ESPript.cgi)对多重比对序列着色的同时,上传预测的蛋白质结构文件.pdb_即可,效果如下图所示,详见《马铃薯 Y 病毒 pipo 基因的分子变异及结构特征分析》一文。具体操作方法可以参考《ESpript 美化多重比对序列图解 (By Raindy)》。


Q7:如何批量将核苷酸序列翻译为蛋白质序列?

A7:推荐使用 MEGA 中的 Alignment Explorer,先将待翻译的序列以 FASTA 格式保存,鼠标右键「打开方式」选择用 MEGA 打开,在 MEGA 界面点击「Translated Protein Sequence」即可 (下图箭头指示位置),最后在「Data」菜单导出序列保存:


Q8:如何快速批量下载指定的序列?

A8:通常办法是借助一些生物软件的检索功能,诸如:Bioedit、Geneious、MacVector 等。其实,NCBI 自带的 Batch Entrez 只需简单三步即可轻松完成这一任务,具体见《如何批量下载指定的序列》。

Q9:如何快速进行基因的选择压力检测及检验?

A9:提及基因选择压力的检测,Phylogenetic Analysis by Maximum Likelihood (PAML) 可能是第一反应的分析工具,但 PAML 的操作令不少初学者望而却步,快速完成基因的选择压力分析,推荐使用一个在线服务器 Adaptive Evolution Server,提交序列后,先选择一个最适的进化模型,再选择一个压力检测方法即可,如:病毒群体的可以选用 IEFL 法。具体操作方法详见《基因的选择压力检测及检测图解教程(By Raindy)》一文。

【注】Adaptive Evolution Server 中 GARD 法是目前流行用于检测重组的方法,非常不错,推荐使用。

Q10:如何对多重比对序列进行排序?

A10:由于序列比对矩阵分值的不同,Clustalx 比对后的序列顺序会发生变化,解决比对后序列重新排序的问题,可以使用两个软件:(1)MEGA5 中的子程序 Alignment Explorer,点击下图中的红色箭头即可实现序列升/降排序;(2)直接用 MAFFT 软件比对,在输出格式选项设置输出序列顺序即可,详见《MAFFT 多重序列比对图解教程(By Raindy)》。


Q11:如何解决 Word 2007/2010 中打开带 EndNote X6/7 的文件响应缓慢甚至假死问题?

A11: 由于 Word 中某一项拼写和语法检查功能与 EndNote 冲突,依次打开在 Word 中点击"文件"-「选项」-「校对」-「在 Word 文档中更正拼写和语法时」标签,取消选中「键入时标记语法错误」即可。


Q12:如何快速判断测序得到的序列方向并批量删除载体序列?

A12:将测序得到的序列(大于 800bp 的需先拼接)和参考序列文件均以 FASTA 格式合并在一个文件内,先在 MEGA 多重比对,根据比对结果判断目的序列的方向。如果与参考序列差异较大的序列,则可能为需要调整的序列,选定这些序列外,依次在「Data」-「Reverse complement」反向互补后,重新比对后,然后删除参考序列以外的两端序列,最后导出为 FASTA 的文件即可。


Q13:如何使用 MEGA 批量进行系统发育分析?

A13:图形化界面(GUI)的 MEGA 每次处理一个批次的数据,不同批次数据需要做相似或相同系统发育分析时,可以用 MEGA 6.0 Compute Core (CC) 进行批量分析,将不同批次的数据(每个建树序列/行)保存在一个文本文件中,通过命令行进行: M6CC.exe -a Model.mao -d seqpath.txt -o Modelresults,MEGA 6-CC 官网下载地址:http://www.megasoftware.net/megaccusage.php,详见教程:MEGA6 Compute core 图解教程 (By Raindy)

Q14:如何快速批量重命名序列名称?

A14:可以用「借来还去法」实现:将 FASTA 格式的序列排序后,复制粘贴入 Excel 文档中,并手动添加第一列,进行编号后,再对第二列排序,实现序列名称和序列内容分离。批量替换序列名称后,重新以第一列排序,最后删除手动添加的第一列。


本文作者系生物信息学老师高芳銮



提问
扫一扫
丁香实验小程序二维码
实验小助手
丁香实验公众号二维码
关注公众号
反馈
TOP
打开小程序