生物信息学与生物医学数据

互联网2010-12-02

1527

生物信息学与生物医学数据

生物医学数据库的建立既是生物信息学在医学领域的应用，也是生物信息学自身发展所必需的组成成分。在人类基因组计划的推动下，生物学数据急剧爆炸，而要真正读懂这些基因，揭示所有基因编码所代表的信息，必须破译浩如烟海的DNA和蛋白质的序列和结构数据。显然传统的生物学研究模式已经不能适应，我们必须借助于信息技术和信息学手段，构建各种类型的专业数据库，同时必须发展新的分析方法，对这些数据进行存储、管理、加工，进行相应的数据挖掘，从中找出具有明确意义的生物信息，并抽提具有生物学意义的知识。通过对生物信息的查询、搜索、比较、分析，破译隐藏在DNA序列中的遗传语言，我们可以从中获取基因编码、基因调控、核酸和蛋白质结构功能及其相互关系等理性知识．逐步认识生命的起源、进化、遗传和发育的本质，揭示人体生理和病理过程的分子基础，为人类疾病的预测、诊断、预防和治疗提供最合理和有效的途径。

20世纪80年代末各种类型的生物学数据库，尤其是以核酸及蛋白质序列为基础的大型数据库相继建立。1988年，美国国立生物技术信息中心开发了核酸序列数据GenBank，其中储存了世界范围的各种已有的核酸序列的生物信息资源。1994年，欧盟建立了EMBL，其主要任务之一是开发和维护EMBL核酸序列数据库，与GenBank、日本的DNA数据库DDDJ协作，为世界各国的研究工作者提供核酸序列数据资源。它还与瑞土共同维护和发布SWISS―PROT蛋白质序列数据库。21世纪初，随着研究内容的扩展和深入，加速了对功能基因组和结构基因组的研究，并与临床医学和药物治疗学相结合。在原始数据库的基础上，各种专题数据库又如雨后春笋般涌现出来，如TTD治疗靶子数据库、Gene Card疾病数据库、Cancer Net肿瘤数据库、IDP免疫缺陷数据库、在线人类孟德尔遗传数据库(online mendelian inheritance in man，OMIM)等。Nuclear Acid Research从1998年起每年的第一期都发布较好的生物数据库。医学信息数据库，不同于以核酸及蛋白质序列为基础的生物信息数据库，它主要以实验和临床观察为重要资源，包含有大量医学与临床资料和数据，已成为基础医学、临床医学领域实施科学管理和科学研究的重要资源，如Pub Med(Medline)，它已成为基础和临床医学研究不可缺少的工具。横贯细胞、器官、功能及调控的生物医学数据库系统，将是实现未来医学研究的基石。