生物信息学所用的方法和技术
互联网
6884
在生物信息学研究中,常用的方法和技术如下。
一、数学统计方法
数学统计在生物信息学中是一种最常用的方法。例如,在分析DNA语言中的语义、分析密码子使用频率、利用马尔科夫模型进行基因识别时都要用到数学统计方法。
二、动态规划方法
动态规划(Dynamic Programming)是一种通用的优化方法,其基本思想是:在状态空间中,根据目标函数,通过递推,求出一条从状态起点到状态终点的最优路径(代价最小的路径)。动态规划在生物信息学研究中用得最多的方面是DNA序列或者蛋白质序列的两两对比排列。
三、模式识别技术
模式识别是在输入样本中寻找特征并识别对象的一种技术。模式识别主要有两种方法,一种是根据统计特征进行识别,另一种是根据对象的结构特征进行识别,而后者常用的方法为句法识别。在基因识别中,对于DNA序列上的功能位点和特征信号的识别都需要用到模式识别。
四、数据库技术
在生物信息学中,数据库技术是最基本的技术。生物分子信息的存储、管理、查询等功能是建立在数据库管理系统之上。目前的分子信息数据库大都采用关系数据库管理系统。
五、人工神经网络技术
人工神经网络是对大脑神经网络的模拟,这种模拟既是在功能上的,也是在结构上,这与传统的串行计算机有着本质的区别。神经网络计算不仅计算速度快,重要的是它更具有智能。从应用来看,神经网络计算在优化和模式识别方面具有非常强的能力。在生物信息学研究中,无论是基因识别还是蛋白质结构预测,神经网络都取得了比其它方法更为准确的结果。
六、分子模型化技术
分子模型化是利用计算机分析分子结构的一种技术。包括显示分子的三维结构,显示分子的理化或电子学特性,将分子小片段组装成更大的分子片段或完整的分子结构。利用分子模型化软件,用户可以通过交互操作平移、旋转和缩放分子的三维结构,从不同的角度观察分子构象和形状。对于DNA分子,我们可以直观地观察双螺旋结构,看到两条链的走向,还可以研究碱基之间的氢键配对。对于蛋白质分子,既可以观察其结构骨架,可以观察其外观形状,也可以研究其活性部位或结合部位的结构。
七、分子力学和量子力学计算
在分子构象优化研究方面必须要用量子力学或分子力学。结构优化工作按理应该用量子力学来完成,但是由于生物大分子体系太复杂,包含几千个原子,超过了目前量子力学方法可以处理的体系范围,所以研究生物大分子的构象,主要还是用基于半经验势函数的分子力学方法,而量子力学则在确定势函数的参数和研究局部性质时起作用。
八、分子动力学模拟
分子动力学模拟是一种重要的统计物理方法,在物理和化学上早有应用。用此方法可以研究蛋白质的构象,对蛋白质进行动力学研究。这是利用计算机进行模拟实验的基础。
九、专家系统
专家系统将有关专家的知识和经验以一定的知识表示形式(如产生式规则、语义网络等)存放在计算中,并在用户需要时,以智能的方式帮助解决问题,提供参考性决策。专家系统是人工智能领域里的一个重要分支,在生物信息学研究中也有着应用,如用于基因识别。
十、Internet技术
目前,分子生物学研究人员进行信息交流特别是生物分子数据的交流,都是通过Internet网实现的。在大多数情况下,你可以从Internet网上查到你所想要的生物分子数据,如原始的序列和结构数据,经过加工处理以后的数据。同时,你也可以将所要处理的数据直接送到相应的网络服务器上,服务器接受你的处理请求,并将处理结果返回给你。
一、数学统计方法
数学统计在生物信息学中是一种最常用的方法。例如,在分析DNA语言中的语义、分析密码子使用频率、利用马尔科夫模型进行基因识别时都要用到数学统计方法。
二、动态规划方法
动态规划(Dynamic Programming)是一种通用的优化方法,其基本思想是:在状态空间中,根据目标函数,通过递推,求出一条从状态起点到状态终点的最优路径(代价最小的路径)。动态规划在生物信息学研究中用得最多的方面是DNA序列或者蛋白质序列的两两对比排列。
三、模式识别技术
模式识别是在输入样本中寻找特征并识别对象的一种技术。模式识别主要有两种方法,一种是根据统计特征进行识别,另一种是根据对象的结构特征进行识别,而后者常用的方法为句法识别。在基因识别中,对于DNA序列上的功能位点和特征信号的识别都需要用到模式识别。
四、数据库技术
在生物信息学中,数据库技术是最基本的技术。生物分子信息的存储、管理、查询等功能是建立在数据库管理系统之上。目前的分子信息数据库大都采用关系数据库管理系统。
五、人工神经网络技术
人工神经网络是对大脑神经网络的模拟,这种模拟既是在功能上的,也是在结构上,这与传统的串行计算机有着本质的区别。神经网络计算不仅计算速度快,重要的是它更具有智能。从应用来看,神经网络计算在优化和模式识别方面具有非常强的能力。在生物信息学研究中,无论是基因识别还是蛋白质结构预测,神经网络都取得了比其它方法更为准确的结果。
六、分子模型化技术
分子模型化是利用计算机分析分子结构的一种技术。包括显示分子的三维结构,显示分子的理化或电子学特性,将分子小片段组装成更大的分子片段或完整的分子结构。利用分子模型化软件,用户可以通过交互操作平移、旋转和缩放分子的三维结构,从不同的角度观察分子构象和形状。对于DNA分子,我们可以直观地观察双螺旋结构,看到两条链的走向,还可以研究碱基之间的氢键配对。对于蛋白质分子,既可以观察其结构骨架,可以观察其外观形状,也可以研究其活性部位或结合部位的结构。
七、分子力学和量子力学计算
在分子构象优化研究方面必须要用量子力学或分子力学。结构优化工作按理应该用量子力学来完成,但是由于生物大分子体系太复杂,包含几千个原子,超过了目前量子力学方法可以处理的体系范围,所以研究生物大分子的构象,主要还是用基于半经验势函数的分子力学方法,而量子力学则在确定势函数的参数和研究局部性质时起作用。
八、分子动力学模拟
分子动力学模拟是一种重要的统计物理方法,在物理和化学上早有应用。用此方法可以研究蛋白质的构象,对蛋白质进行动力学研究。这是利用计算机进行模拟实验的基础。
九、专家系统
专家系统将有关专家的知识和经验以一定的知识表示形式(如产生式规则、语义网络等)存放在计算中,并在用户需要时,以智能的方式帮助解决问题,提供参考性决策。专家系统是人工智能领域里的一个重要分支,在生物信息学研究中也有着应用,如用于基因识别。
十、Internet技术
目前,分子生物学研究人员进行信息交流特别是生物分子数据的交流,都是通过Internet网实现的。在大多数情况下,你可以从Internet网上查到你所想要的生物分子数据,如原始的序列和结构数据,经过加工处理以后的数据。同时,你也可以将所要处理的数据直接送到相应的网络服务器上,服务器接受你的处理请求,并将处理结果返回给你。