遗传密码有64种,但是绝大多数生物倾向于利用这些密码子中的一部分。那些被最频繁利用的称为最佳密码子(optimal codons),那些不被经常利用的称为稀有或利用率低的密码子(rare or low-usage codons)。实际上用做蛋白表达或生产的每种生物(包括大肠杆菌,酵母,哺乳动物细胞,Pichia,植物细胞和昆虫细胞)都表现出某种程度的密码子利用的差异或偏爱。大肠杆菌、酵母、果蝇、灵长类等每种生物都有独特的8个密码子极少被利用。有趣的是,灵长类和酵母有6个同样的利用率低的密码子。大肠杆菌、酵母和果蝇中编码丰度高的蛋白质的基因明显避免低利用率的密码子。因此,重组蛋白的表达可能受密码子利用的影响(尤其在异源表达系统中)的事实并不很奇怪。你的基因利用的密码子可能不是你正在利用的蛋白生产系统进行高水平表达所偏爱的密码子,这种情况是可能的。利用偏爱密码子(preferred codons)并避免利用率低的或稀有的密码子可以合成基因,基因的这种重新设计叫密码子最佳化。
在同源表达系统中,同较低水平表达的基因相比,较高表达的基因可能有很不同的密码子偏爱。通过对密码子利用的归类分析,人们可以真正预测任何基因在酵母中的表达水平。在诸如Zea mays的其他生物中,大量高表达基因强烈偏爱以G或C结尾的密码子。而且,在Dictyostelium中,同低水平表达的基因比较,高表达基因有较大数目的偏爱密码子。
在大肠杆菌中表达哺乳动物基因是不可预测和具有挑战的。例如直到最近才实现了人血红蛋白的过表达。为了达到血红蛋白的好的表达水平,Alpha-球蛋白cDNA不得不用大肠杆菌偏爱的密码子进行重新合成。在异源宿主中实现象血红蛋白这样复杂的蛋白质的过表达可能需要最佳化密码子,这些研究者为此提供了令人信服的资料。成簇的低利用率的密码子抑制了核糖体的运动,这是基因不能以合适水平表达的一个明显机制。核糖体翻译由九个密码子组成的信使(含几个低利用率密码子或全部为低利用率密码子)时的运动速度要比翻译不含低利用率密码子的同样长的信使的速度慢。即使低利用率密码子簇位于3'端,信使最后也会被核糖体”拥挤”而损害,核糖体又回到5'端。3'端低利用率密码子簇的抑制效应可以和全部信使都由低利用率密码子组成的抑制效应一样大。如果低利用率密码子簇位于5'端,其效应是起始核糖体数目的全面减少,导致蛋白合成中信使的低效率。散在分布的稀有密码子对翻译的效应还未很好地研究,但是有证据表明这种情况的确对翻译效率有负面效应。
其他因素也可以影响蛋白表达,包括使mRNA去稳定的序列。重新设计合成基因可以去除或改变这些序列,导致高水平表达。消除稀有密码子、去除任何去稳定序列和利用最佳密码子的基因的重新设计都可能增加蛋白产量,使的蛋白生产更有效和经济。