Il codice genetico è un codice a triplette nel quale ogni codone, cioè l’insieme di tre basi adiacenti di un mRNA, specifica un aminoacido.
Dato che sono possibili 64 parole di codice ed esistono 20 aminoacidi, alcuni aminoacidi sono codificati da più di un codone.
Il codice genetico nell’mRNA viene letto senza interruzioni e in codoni successivi senza sovrapposizioni.
Il codice è universale: gli stessi codoni specificano gli
stessi aminoacidi nella maggior parte dei sistemi. La sintesi proteica inizia
di solito con il codone AUG (metionina) e termina con i seguenti tre codoni,
presenti singolarmente o in combinazione: UAG, UAA, UGA. Questi codoni non
codificano per nessun aminoacido.
Il codice genetico è un codice a triplette: ogni codone composto da tre nucleotidi di un mRNA codifica per un
aminoacido. Però alcuni aminoacidi sono rappresentati da più di un
codone. Il codice è quasi universale, e viene letto senza interruzioni in
codoni successivi senza sovrapposizioni.
La
traduzione dell’mRNA in una catena proteica avviene sui ribosomi.
Gli aminoacidi vengono portati al ribosoma su di una molecola di tRNA. La
sequenza corretta di aminoacidi si ottiene mediante il legame specifico tra il
codone dell’mRNA e l’anticodone complementare del tRNA, nonché mediante
il legame specifico di ogni aminoacido al proprio tRNA.
Nei procarioti e negli eucarioti il codone d’inizio
per l’avvio della traduzione è AUG (metionina). L’allungamento
della catena proteica richiede la formazione del legame peptidico tra l’aminoacido
attaccato al tRNA nel sito A del ribosoma e il polipeptide nascente attaccato
al tRNA nel sito P. Una volta che il legame peptidico si è formato, il
ribosoma si sposta di un codone lungo l’mRNA per preparare il legame al
codone disponibile del prossimo tRNA con il suo aminoacido attaccato.
La traduzione prosegue finché sull’mRNA non viene
raggiunto un codone
di terminazione (UAG, UAA o UGA). Questi codoni vengono riconosciuti
da uno o più fattori di rilascio proteici, e quindi il polipeptide viene
rilasciato dal ribosoma. A questo punto le altre componenti dell’apparato
della sintesi proteica si dissociano.
Negli eucarioti le proteine si trovano libere sia nel citoplasma che in diversi compartimenti cellulari, quali il nucleo, i mitocondri, i cloroplasti e le vescicole secretorie. Le proteine destinate ad entrare nei compartimenti della cellula sono dotate di sequenze aminoacidiche specializzate che indicano al macchinario cellulare la via che dovranno seguire all’interno della cellula.
Ad esempio, le proteine che devono essere secrete hanno
delle sequenze segnale all’estremità
N-terminale che facilitano il loro ingresso nel reticolo endoplasmatico per la
successiva distribuzione nel complesso di Golgi. Le proteine destinate al
nucleo, ai mitocondri o ai cloroplasti, possiedono sequenze specifiche che ne
programmano la localizzazione in questi comparti.
Come si è affermato in precedenza, uno dei tre requisiti
del materiale genetico è che esso deve contenere, in forma stabile, l’informazione
completa per la struttura, la funzione, lo sviluppo e la riproduzione di un
organismo. Tutte queste proprietà richiedono l’azione di proteine
specifiche e l’informazione
per le proteine è codificata nei geni strutturali del
materiale genetico della cellula.
L’espressione di un gene che codifica per una proteina avviene in due tappe principali: trascrizione e traduzione. Nella trascrizione, o sintesi dell’RNA, viene letta la sequenza di coppie di basi del segmento di DNA che costituisce il gene, di modo che l’informazione viene trasferita alla sequenza di basi di una molecola di mRNA a filamento singolo.
Questa sequenza di basi porta l’informazione
specifica per la sequenza di aminoacidi di un polipeptide. La conversione a
livello cellulare dell’informazione contenuta nella sequenza di basi dell’mRNA
è detta traduzione. L’informazione
presente nelle coppie di basi del DNA che specifica la sequenza di aminoacidi di un polipeptide viene detta codice genetico.