随着重组DNA技术和核酸的顺序分析技术的发展,对基因的认识又有了新的发展,主要是发现了重叠的基因、断裂的基因和可以移动位置的基因。
重叠基因是在1977年发现的。早在1913年A.H.斯特蒂文特已在果蝇中证明了基因在染色体上作线状排列,20世纪50年代对基因精细结构和顺反位置效应等研究的结果也说明基因在染色体上是一个接着一个排列而并不重叠。但是1977年F.桑格在测定噬菌体ΦX174的DNA的全部核苷酸序列时,却意外地发现基因D中包含着基因E。基因E的第一个密码子从基因D的中央的一个密码子TAT的中间开始,因此两个部分重叠的基因所编码的两个蛋白质非但大小不等,而且氨基酸也不相同。在某些真核生物病毒中也发现有重叠基因。
断裂的基因也是在1977年发现的,它是内部包含一段或几段最后不出现在成熟的mRNA中的片段的基因。这些不出现在成熟的mRNA中的片段称为内含子,出现在成熟的mRNA中的片段则称为外显子。例如下面这一基因,有三个外显子和两个内含子。在几种哺乳动物的核基因、酵母菌的线粒体基因以及某些感染真核生物的病毒中都发现了断裂的基因。内含子的功用以及转录后的加工机制是真核生物分子遗传学的一个吸引人的课题。
功能、类别和数目到目前为止在果蝇中已经发现的基因不下于1000个,在大肠杆菌中已经定位的基因大约也有1000个,由基因决定的性状虽然千差万别,但是许多基因的原初功能却基本相同。
1945年G.W.比德尔通过对脉孢菌的研究,提出了一个基因一种酶假设,认为基因的原初功能都是决定蛋白质的一级结构即编码组成肽链的氨基酸序列。这一假设在20世纪50年代得到充分的验证。
20世纪60年代初F.雅各布和J.莫诺发现了调节基因。把基因区分为结构基因和调节基因是着眼于这些基因所编码的蛋白质的作用:凡是编码酶蛋白、血红蛋白、胶原蛋白或晶体蛋白等蛋白质的基因都称为结构基因;凡是编码阻遏或激活结构基因转录的蛋白质的基因都称为调节基因。但是从基因的原初功能这一角度来看,它们都是编码蛋白质。
一个生物体内的各个基因的作用时间常不相同,有一部分基因在复制前转录,称为早期基因;有一部分基因在复制后转录,称为晚期基因。一个基因发生突变而使几种看来没有关系的性状同时改变,这个基因就称为多效基因。
数目不同生物的基因数目有很大差异,已经确知RNA噬菌体MS2只有3个基因,而哺乳动物的每一细胞中至少有100万个基因。但其中极大部分为重复序列,而非重复的序列中,编码肽链的基因估计不超过10万个。除了单纯的重复基因外,还有一些结构和功能都相似的为数众多的基因,它们往往紧密连锁,构成所谓基因复合体或叫做基因家族。
等位基因位于一对同源染色体的相同位置上控制某一性状的不同形态的基因。不同的等位基因产生例如发色或血型等遗传特征的变化。