蛋白质与蛋白质组分析生物信息学
互联网
5587
蛋白质与蛋白质组分析生物信息学
生物信息学的主要目的之一是理解蛋白质的氨基酸序列和三维结构之间的关系。一旦关系的规律被确定,就能根据氨基酸序列预测蛋白质的空间结构。但是,序列与结构之间的关系并不简单。以序列和结构为基础对蛋白质进行分类已取得一些进展,这些信息对蛋白质结构模型的构建很重要。
预测二级结构的算法中使用了多种计算方法,其中包括神经网络、离散态模型、隐马尔可夫模型、最近邻分类和进化计算。目前大多数二级结构预测的算法都是对一系列由BLAST、FAST和CLUSTALW算法产生的经过比对的序列进行二级结构预测。通过这些比对的序列可以计算出目标序列中每个氨基酸的保守程度。表7-1为互联网上常用的蛋白质结构分析站点。
在20世纪90年代中期,在人类基因组计划研究及功能基因组学的基础上,产生了在整体水平上研究细胞内蛋白质的组成及其活动规律的学科――蛋白质组学。蛋白质组学以蛋白质组为研究对象,是指“一个细胞或一个组织的基因组所表达的全部蛋白质”。
蛋白质组学的主要研究内容包括蛋白质组作图、蛋白质组成成分鉴定、蛋白质组数据库构建、新型蛋白质发掘、蛋白质差异显示、同工型比较及重要生命活动的分子机制和与疾病相关的蛋白质组分析等。
蛋白质组分析中必须使用信息学工具如数据库和分析工具。瑞士生物信息研究所的专家蛋白质分析系统(ExpertProteinAnalysisSystem,TheExPASy)及蛋白质组服务器上列出了一系列数据库和工具。