现在我们通用的“基因”一词,是由“GENE”音译而来的。基因原称遗传因子,这一概念由来已久,例如斯宾塞的“生理单位”,达尔文的“微芽”,魏斯曼的“定子”等都是为了企图说明世代之间性状遗传机理的早期遗传因子的假说。
1865年,奥地利原天主教神父、遗传学家约翰·格雷戈尔·孟德尔(1822―1884年)根据豌豆七对不同性状的杂交实验,总结出遗传因子的概念以及在生殖细胞成熟中同对因子分离、异对因子自由组合两条遗传规律,也就是人们称为的孟德尔因子和孟德尔定律。他发现了遗传基因原理,总结出分离规律和自由组合规律,为遗传学提供了数学基础,创立了孟德尔学派,由此成为“遗传学之父”。
“基因”是丹麦的植物学家和遗传学家威·约翰逊1909年首先提出来用以表达孟德尔的“遗传因子”这一概念的。从1910年到30年代美国人托马斯·亨特·摩尔根(1866―1945年)等通过数百种果蝇性状的杂交实验,结合细胞学的观察,不仅证明了孟德尔定律的正确性,而且还发现了基因连锁和交换显象及其染色体机理,同时还证实了长期存在的一种猜测,即借助于显微镜能看到的在细胞核里呈小棍形状结构的染色体就是基因的所在地。他阐明了基因变异和遗传的染色体机理,总结为基因学说。
但是,当时人们还没有弄清楚基因到底是什么。40年代以来遗传学研究逐步提高到分子水平,40-60年代,经过许多科学家的实验研究,肯定了基因的化学成分主要为DNA,阐明了DNA的双螺旋结构以及双股DNA之间碱基互补配对原则,人们才在以后的研究中,越来越清楚地认识了“基因”及其在遗传中的作用。
基因是具有遗传效应的DNA分子片段,它存在于染色体上,并在染色体上呈线性排列。基因不仅可以通过复制把遗传信息传递给下一代,还可以使遗传信息得到表达,也就是使遗传信息以一定方式反映到蛋白质的分子结构上,从而使后代表现出与亲代相似的性状。
根据遗传学研究,一般都认为一条染色体只含有一条DNA双螺旋;如果染色体已分裂为两个染色单体,那么每一个单体含有一条DNA双螺旋。但是染色体的宽度要比DNA双链大得多,而染色体的长度又比DNA双链短得多。据统计,人的染色体总长不到半毫米,而DNA分子的总长却可达数米,所以在染色体中的DNA双链总是缠绕又缠绕,呈高度地盘曲的状态。
在染色体中高度盘曲着的DNA分子是一条很长的双链,最短的DNA分子中大约也含有4000个核苷酸对,最长的大约含有40亿个。一个DNA分子可以看作是很多区段的集合,这些区段一般不互相重叠,大约各有500-6000个核苷酸对,这样的一个区段就是一个基因。
那么,基因的内部结构是什么样的,科学家又是如何确定它的呢?
实际上,在遗传学发展的早期阶段“基因”仅仅是一个逻辑推理概念,而并非一种已经得到证实了的物质和结构。在本世纪30年代,由于证明了基因是以直线的形式排列在染色体上,因此人们认为基因是染色体上的遗传单位。随着分子遗传学的发展,1953年在沃森和克里克提出DNA的双螺旋结构以后,人们普遍认为基因是DNA的片段,确定了基因化学本质。大多数生物的基因是由DNA组成,而DNA则是染色体的主要化学成分。大多数真核生物细胞内的DNA是由双股多核苷酸单链结合而成。每股DNA链又是由许多个单核苷酸借磷酸二酯键互相连接而成;而两股之间则是依靠两者的碱基成分按互补规律分别配对结合,即腺嘌呤(A)与胸腺嘧啶(T)借两个氢键连接,鸟嘌呤(G)与胞嘧啶(C)借三个氢键连接,形成一条双螺旋梯形结构,故称为DNA双螺旋。本世纪60年代,本茨又提出了基因的内部具有一定的结构,可以区分为突变子、互换子和顺反子三个不同的单位。DNA分子上的一个碱基变化可以引起基因突变,因此可以看成是一个突变子;两个碱基之间可以发生互换,可以看成是一个互换子;一个顺反子是具有特定功能的一段核苷酸序列,作为功能单位的基因应该是顺反子。因此从分子水平来看,基因就是DNA分子上的一个片段,经过转录和转译能合成一条完整的多肽链。可是,通过近来的研究,科学家认为这个结论并不全面,因为有的基因在转录出RNA后,不再翻译成蛋白质。另外,还有一类基因,如操纵基因,它们既没有转录作用,又没有翻译产物,仅仅起着控制和操纵基因活动的作用。特别是近年来,科学家发现DNA分子上有相当一部分片段,只是某些碱基的简单重复。这类不含有遗传信息的碱基片段,在真核细胞生物中数量可以很大,甚至达到50%以上。关于DNA分子中这些重复碱基片段的作用,目前还不十分了解。有人推测可能有调节某些基因活动和稳定染色体结构的作用,其真正的功能尚待研究。由此,目前有遗传学家认为,应把基因看作是DNA分子上具有特定功能的(或具有一定遗传效应的)核苷酸序列。