生物信息学与生物医学数据
互联网
1489
生物信息学与生物医学数据
生物医学
数据库的建立既是生物信息学在医学领域的应用,也是生物信息学自身发展所必需的组成成分。在人类基因组计划的推动下,生物学数据急剧爆炸,而要真正读懂这些基因,揭示所有基因编码所代表的信息,必须破译浩如烟海的DNA和蛋白质的序列和结构数据。显然传统的生物学研究模式已经不能适应,我们必须借助于信息技术和信息学手段,构建各种类型的专业数据库,同时必须发展新的分析方法,对这些数据进行存储、管理、加工,进行相应的数据挖掘,从中找出具有明确意义的生物信息,并抽提具有生物学意义的知识。通过对生物信息的查询、搜索、比较、分析,破译隐藏在DNA序列中的遗传语言,我们可以从中获取基因编码、基因调控、核酸和蛋白质结构功能及其相互关系等理性知识.逐步认识生命的起源、进化、遗传和发育的本质,揭示人体生理和病理过程的分子基础,为人类疾病的预测、诊断、预防和治疗提供最合理和有效的途径。
20世纪80年代末各种类型的生物学数据库,尤其是以核酸及蛋白质序列为基础的大型数据库相继建立。1988年,美国国立生物技术信息中心开发了核酸序列数据GenBank,其中储存了世界范围的各种已有的核酸序列的生物信息资源。1994年,欧盟建立了EMBL,其主要任务之一是开发和维护EMBL核酸序列数据库,与GenBank、日本的DNA数据库DDDJ协作,为世界各国的研究工作者提供核酸序列数据资源。它还与瑞土共同维护和发布SWISS―PROT蛋白质序列数据库。21世纪初,随着研究内容的扩展和深入,加速了对功能基因组和结构基因组的研究,并与临床医学和药物治疗学相结合。在原始数据库的基础上,各种专题数据库又如雨后春笋般涌现出来,如TTD治疗靶子数据库、Gene Card疾病数据库、Cancer Net肿瘤数据库、IDP免疫缺陷数据库、在线人类孟德尔遗传数据库(online mendelian inheritance in man,OMIM)等。Nuclear Acid Research从1998年起每年的第一期都发布较好的生物数据库。医学信息数据库,不同于以核酸及蛋白质序列为基础的生物信息数据库,它主要以实验和临床观察为重要资源,包含有大量医学与临床资料和数据,已成为基础医学、临床医学领域实施科学管理和科学研究的重要资源,如Pub Med(Medline),它已成为基础和临床医学研究不可缺少的工具。横贯细胞、器官、功能及调控的生物医学数据库系统,将是实现未来医学研究的基石。