90年代初期开始实施的人类基因组计划,在经过各国科学家近10年的努力下,已经取得了巨大的成就。不仅完成了十余种模式生物(从大肠杆菌、酿酒酵母到线虫)基因组全序列的测定工作,还有望在2003年提前完成人类所有基因的全序列测定。那么,知道了人类的全部遗传密码即基因组序列,就可以任意控制人的生老病死吗?其实并不是这么简单。基因组学(genomics)虽然在基因活性和疾病的相关性方面为人类提供了有力根据,但实际上大部分疾病并不是因为基因改变所造成。并且,基因的表达方式错综复杂,同样的一个基因在不同条件、不同时期可能会起到完全不同的作用。关于这些方面的问题,基因组学是无法回答的。所以,随着人类基因组计划的逐步完成,科学家们又进一步提出了后基因组计划,蛋白质组(proteome)研究是其中一个很重要的内容。
那么,基因组和蛋白质组到底有什么联系?我们可以这样理解生命,遗传信息从DNA(基因)转变为一种被称作mRNA的中间转载体,然后再合成各式各样的结构蛋白质和功能蛋白质,构成一种有机体,完成生命的功能。基因→ mRNA→蛋白质,三位一体,构成了遗传信息的流程图,这即是传统的中心法则。现在已经证明,一个基因并不只存在一个相应的蛋白质,可能会有几个,甚至几十个。什么情况下会有什么样的蛋白,这不仅决定于基因,还与机体所处的周围环境以及机体本身的生理状态有关。并且,基因也不能直接决定一个功能蛋白。实际上,往往是通过基因的转录、表达产生一个蛋白质前体,在此基础上再进行加工、修饰,才成为一个具生物活性的蛋白质。这样的蛋白质还通过一系列的运输过程,到组织细胞内适当的位置才能发挥正常的生理作用。基因不能完全决定这样的蛋白质后期加工、修饰以及转运定位的全过程。而且,这些过程中的任何一个步骤发生微细的差错即可导致机体的疾病。纽约Rockefeller大学的细胞和分子生物学家Günter Blobel博士就是因其“蛋白质内在的信号分子活性,调节自身的细胞内转运和定位”研究上的卓越成就,获得了1999年诺贝尔医学奖和生理学奖。近些年来人们又发现蛋白质间亦存在类似于mRNA分子内的剪切、拼接,具有自身特有的活动规律。这种自主性不能从其基因编码序列中预测,而只能通过对其最终的功能蛋白进行分析。因此说,基因虽是遗传信息的源头,而功能性蛋白是基因功能的执行体。基因组计划的实现固然为生物有机体全体基因序列的确定、为未来生命科学研究奠定了坚实的基础,但是它并不能提供认识各种生命活动直接的分子基础,其间必须研究生命活动的执行体-蛋白质这一重要环节。蛋白质组学(proteomics)研究即旨在解决这一问题。
蛋白质组(proteome)一词,源于蛋白质(protein)与 基因组(genome)两个词的杂合,意指“一种基因组所表达的全套蛋白质”,即包括一种细胞乃至一种生物所表达的全部蛋白质。蛋白质组的研究不仅能为生命活动规律提供物质基础,也能为众多种疾病机理的阐明及攻克提供理论根据和解决途径。通过对正常个体及病理个体间的蛋白质组比较分析,我们可以找到某些“疾病特异性的蛋白质分子”,它们可成为新药物设计的分子靶点,或者也会为疾病的早期诊断提供分子标志。确实,那些世界范围内销路最好的药物本身是蛋白质或其作用靶点为某种蛋白质分子。因此,蛋白质组学研究不仅是探索生命奥秘的必须工作,也能为人类健康事业带来巨大的利益。
与基因重组、表达、序列分析的快速、自动化程度相比,到最近为止,机体组织细胞内蛋白质的序列分析只是实验室小规模研究项目。随着对生物学、物理、化学及信息学的各种尖端技术的综合应用,蛋白质组研究也正逐步变成高产量、高精确度的分析过程。现今,蛋白质组研究中主要应用的技术包括:双相电泳(2-DE)、新型质谱(MS)技术、数据库设置与检索系统等。为了保证分析过程的精确性和重复性,大规模样品处理机器人也被应用。整个研究过程包括:样品处理、蛋白质的分离、蛋白质丰度分析、蛋白质鉴定等步骤。当前,蛋白质组分析虽然以双相电泳和质谱分析为其技术基础,但离不开各种先进的数据分析和图象分析软件及网络技术的支持。