Una delle domande più rilevanti che ci si pone in genetica di popolazioni è quanta variabilità genetica esista all'interno delle popolazioni naturali.
La quota di variabilità ereditabile entro popolazioni è importante per svariati motivi: per prima cosa essa determina il potenziale per il cambiamento evolutivo e l’adattamento. Inoltre, la quota di variabilità ci fornisce preziosi indizi circa l’importanza relativa di varie forze evolutive, dato che alcune di queste forze aumentano la variabilità e altre la diminuiscono.
Ancora, le modalità di insorgenza di nuove specie possono dipendere dalla quota di variabilità genetica posseduta entro popolazioni.
Per
tutte queste ragioni, i genetisti di popolazione sono interessati alla stima
della variabilità genetica e alla comprensione delle forze evolutive che la
controllano.
Durante gli anni '40 e '50 i
genetisti di popolazione svilupparono due opposte ipotesi circa la quantità
di variabilità genetica all'interno delle popolazioni naturali. Queste
ipotesi, o modelli di variabilità genetica, sono noti come modello bilanciato
e modello classico.
Il
modello classico emerse principalmente in seguito al lavoro di
genetisti di laboratorio, i quali proposero che la maggior parte delle
popolazioni naturali possiede una scarsa
variabilità genetica. Secondo questo modello, all'interno di ciascuna
popolazione uno degli alleli funziona al meglio, e questo allele viene
fortemente favorito dalla selezione naturale. La conseguenza è che quasi
tutti gli individui di una popolazione sono omozigoti per questo allele
migliore o selvatico. Di tanto in tanto, per
mutazione, si formano dei nuovi alleli, ma quasi tutti sono deleteri e sono
mantenuti ad una frequenza bassa grazie alla selezione. Molto raramente
insorge una mutazione che si rivela migliore dell'allele selvatico: questo
nuovo allele migliora la sopravvivenza e il tasso di riproduzione degli
individui che lo portano, così la frequenza dell'allele tende ad aumentare
col tempo a causa del suo vantaggio selettivo. Ad un certo punto il nuovo
allele raggiungerà un'alta frequenza e diventerà il nuovo allele selvatico.
In questo modo una popolazione evolve, ma ad ogni momento si riscontrerà un
ridotto grado di variabilità genetica all'interno della popolazione.
Il
modello bilanciato, al contrario, predice che non esiste un singolo allele migliore e più
diffuso: il pool genico di una popolazione consta di numerosi
alleli ad ogni locus; pertanto gli individui sono eterozigoti per molti loci e
l’evoluzione avviene tramite spostamenti casuali nelle frequenze alleliche e
nel tipo di alleli. Per giustificare la presenza di questa variabilità, i
fautori del modello bilanciato suggeriscono che la selezione naturale giochi
un ruolo attivo nel mantenere la variabilità genetica all'interno di una
popolazione attraverso una selezione
equilibratrice, ovvero un tipo di selezione che mantiene un equilibrio
tra gli alleli, evitando che ogni singolo allele raggiunga frequenze elevate.
Una forma di selezione equilibratrice è la sovradominanza, dove l’eterozigote possiede una fitness
maggiore di ciascuno degli omozigoti. Il punto di vista bilanciato della
variabilità genetica emerse e si affermò tra quei genetisti di popolazione
che avevano come substrato una formazione storico-naturalistica e un interesse
per le popolazioni selvatiche.
Per molti anni i genetisti di
popolazione non furono in grado di stabilire quanta variabilità esistesse
nell'ambito delle popolazioni naturali: era difficile determinare quale fosse
il modello corretto di variabilità genetica, in quanto non era disponibile
alcuna procedura universalmente valida per stimare la quota di variabilità
genetica in natura. Per scegliere tra il modello classico e quello bilanciato,
i genetisti avevano bisogno di dati sui genotipi e su molti loci di molti
individui appartenenti a più specie.
Fino al 1966 non fu disponibile alcuna tecnica per
ottenere quest’informazione: i naturalisti riconobbero che in natura sia le
piante che gli animali sono frequentemente diversi per quanto riguarda il
fenotipo, ma la base genetica di molti caratteri è troppo complessa da
permettere di assegnare un genotipo specifico ad ogni individuo. Alcune specie
esibiscono caratteri genetici semplici, come il profilo delle macchie colorate
sulle ali nelle farfalle e il colore della conchiglia nelle chiocciole, ma
questi casi isolati erano insufficienti per fornire una stima generale della
variabilità genetica. Metodi indiretti suggerivano che molte popolazioni
possedessero un’elevata variabilità genetica, ma nessuna misura diretta era
disponibile.
Nel 1966 i genetisti di popolazione cominciarono ad
applicare il principio dell'elettroforesi proteica allo studio delle
popolazioni naturali. L'elettroforesi separa le proteine dalle strutture
molecolari diverse, fornendo ai genetisti di popolazione una tecnica in grado
di stabilire velocemente il genotipo di molti individui per molti loci. Questa
metodica è ora utilizzata per esaminare la variabilità genetica in centinaia
di specie animali e vegetali. La quota di variabilità genetica all'interno di
una popolazione si misura di solito mediante due parametri, la proporzione di loci polimorfi
e l’eterozigosità.
Un
locus polimorfo è un qualsiasi locus che presenti più di un
allele nell'ambito di una popolazione: la proporzione di loci polimorfi (P)
viene calcolata stabilendo il numero di loci polimorfi e dividendolo per il
totale dei loci analizzati. Ad esempio, supponiamo di esaminare 33 loci in una
popolazione di raganelle e di trovare che 18 sono polimorfi. La proporzione di
loci polimorfi sarebbe 18/33 = 0,55.
L'eterozigosità
(H) corrisponde alla quota dei loci di un individuo che sono polimorfi:
supponiamo di aver stabilito il genotipo per il locus dell'esterasi di
individui tratti da una popolazione delle nostre raganelle e di aver trovato
che la frequenza degli eterozigoti è 0,09: l’eterozigosità per questo
locus sarebbe allora pari a 0,09. Per ottenere una stima dell'eterozigosità
della popolazione si fa una media di questa eterozigosità con quella
riscontrata a carico di altri loci.
I risultati di questi studi non lasciano adito a dubbi: la maggior parte delle specie possiede un elevato
grado di variabilità a livello proteico e il modello classico risulta chiaramente errato. In realtà, la tecnica
dell'elettroforesi non riesce a mettere in evidenza una notevole quota della
variabilità genetica presente, in quanto si possono osservare solo quelle
varianti genetiche che producono una variazione nella mobilità delle proteine
in un gel. Pertanto, il grado reale di variabilità genetica è ancora più
grande di quello messo in evidenza da questa metodica.
Gli studi sulla variabilità elettroforetica nelle
popolazioni naturali hanno mostrato che il modello classico non era corretto,
in quanto le popolazioni posseggono una forte variabilità genetica. Tuttavia,
questo non provava che il modello bilanciato fosse corretto: il modello
bilanciato prevede che nelle popolazioni naturali esista un’elevata
variabilità genetica, ed è così, ma il modello propone inoltre che quote
notevoli di variabilità genetica vengano mantenute equilibrate dalla
selezione, e questo fatto non era stato dimostrato in modo inequivocabile
dagli studi elettroforetici.
A questo punto, la natura della controversia mutò direzione: in precedenza il punto centrale del contendere era stato quanta variabilità genetica esistesse, ora l’enfasi si spostava sulla natura di cosa mantenesse la grande variabilità osservata.
Una nuova ipotesi sorse a rimpiazzare il modello classico: quest’idea, detta ipotesi neutralista, riconosce la presenza in natura di una elevata variabilità genetica per quel che riguarda le proteine, ma propone che questa variabilità sia neutrale per quel che riguarda la selezione naturale.
Questo non significa che le proteine studiate mediante elettroforesi non abbiano alcuna funzione, ma piuttosto che i diversi genotipi sono equivalenti dal punto di vista fisiologico.
Quindi, la selezione naturale non agisce sugli
alleli neutri, e processi casuali, quali la mutazione e la deriva genetica,
plasmano i modelli di variabilità genetica che osserviamo nelle popolazioni
naturali. L'ipotesi neutralista propone che la variabilità a carico di certi
loci abbia effetto sulla fitness, e
che la selezione naturale elimini la variabilità di questi loci.
È stato difficile discriminare tra il modello bilanciato
e l’ipotesi neutralista. I genetisti di popolazione stanno ancora discutendo
i rispettivi meriti, e non è ancora emerso un chiaro accordo su quale sia il
modello più corretto per la variabilità genetica. In realtà, entrambi
potrebbero essere parzialmente corretti; per alcuni loci la variabilità
genetica potrebbe essere essenzialmente di tipo neutro, mentre per altri
potrebbe fornire la base su cui agisce la selezione naturale.
Per spiegare la quota di
variabilità presente nelle popolazioni naturali, negli anni '40 e '50 vennero
sviluppate due ipotesi. Il modello classico prevedeva che si sarebbe
riscontrata una scarsa variabilità, il modello bilanciato proponeva che nelle
popolazioni naturali fosse mantenuta un’elevata variabilità genetica.
Mediante l’uso dell'elettroforesi proteica i genetisti di popolazione furono
in grado di dimostrare che le popolazioni naturali custodiscono un’elevata
variabilità genetica, smentendo così il modello classico. Tuttavia, è
tuttora fonte di controversia quali siano le forze responsabili del
mantenimento di questa variabilità all'interno delle popolazioni. L'ipotesi
neutralista propone che la variabilità genetica rilevata mediante
elettroforesi sia neutra riguardo la selezione naturale, mentre il modello
bilanciato propone che questa variabilità sia favorita dalla selezione
equilibratrice.
Attualmente le tecniche di genetica molecolare forniscono i mezzi per esaminare la variabilità genetica direttamente sul DNA, stabilendo inequivocabilmente la quota di variabilità genetica presente nelle popolazioni naturali. Una di tali tecniche per rilevare la variabilità genetica utilizza gli enzimi di restrizione.
Si ricorda che gli enzimi di
restrizione producono tagli a doppio filamento sul DNA a livello di sequenze
specifiche: la maggior parte degli enzimi di restrizione riconosce una
sequenza di 4 oppure di 6 basi. Ad esempio, l’enzima di restrizione BamHI
riconosce la sequenza
GGATCC |
CCTAGG |
Ogni qualvolta questa sequenza è presente sul DNA, BamHI
taglia il DNA stesso. I frammenti risultanti possono venire separati con
elettroforesi su gel di agarosio e osservati colorando il DNA o adoperando
sonde per geni specifici.
Supponiamo che due individui differiscano per uno o più nucleotidi in una data sequenza di DNA e che le differenze si verifichino in un sito di riconoscimento per un enzima di restrizione. Uno degli individui possiede una molecola di DNA che contiene il sito di restrizione, ma l’altro individuo no, in quanto la sequenza nucleotidica del DNA è diversa. Se si digerisce il DNA di questi due individui con l’enzima di restrizione e si separano su gel i frammenti risultanti, i due individui producono profili diversi dei frammenti.
Questi profili su gel sono denominati Restriction
Fragment Lenght Polymorphism o RFLP
(polimorfismi nella lunghezza dei frammenti generati mediante digestione con
enzimi di restrizione) e indicano che le sequenze di DNA dei due individui
sono diverse. Gli RFLP vengono ereditati allo stesso modo degli alleli che
codificano per altri caratteri, solo che gli RFLP non producono un fenotipo
visibile macroscopicamente, a occhio nudo. I loro fenotipi consistono invece
nei profili dei frammenti prodotti su di un gel quando il DNA è digerito
dall'enzima di restrizione.
Gli RFLP possono essere usati come marcatori genetici per
la mappatura dei geni; possono inoltre fornire informazioni su come le
sequenze di DNA siano diverse tra individui. Tali differenze comprendono
soltanto una piccola parte del DNA, in modo specifico quei pochi nucleotidi
riconosciuti dall'enzima di restrizione. Tuttavia, assumendo che i siti di
restrizione siano localizzati in maniera casuale sul DNA, il che non
rappresenta un assunto irragionevole, dato che i siti non vengono espressi
come caratteri, la presenza oppure l’assenza dei siti di
restrizione può venir usata per stimare le differenze in sequenza a livello
generale.
Allo scopo di illustrare l’uso degli RFLP per stimare la
variabilità genetica, supponiamo di isolare il DNA da 5 topi selvatici,
tagliare il DNA con l’enzima di restrizione BamHI
e separare i frammenti con elettroforesi su gel di agarosio. Trasferiamo
adesso il DNA su nitrocellulosa con la tecnica Southern
blot e saggiamo con una sonda che riconosca il gene della b-emoglobina.
Si ricordi che ciascun topolino porta due copie del gene per la b-emoglobina, una su ciascuno dei
cromosomi omologhi; pertanto, un topo potrebbe essere +/+ (il sito di
restrizione è presente su entrambi i cromosomi), +/- (il sito di restrizione
è presente su uno dei cromosomi e assente sull'altro) oppure -/- (il sito di
restrizione è assente in entrambi i cromosomi). Dei dieci cromosomi presenti
in questi cinque topolini, 4 posseggono il sito di restrizione e 6 no.
Per calcolare l’eterozigosità attesa nella sequenza
nucleotidica esiste una formula ad hoc
che dà come risultato 0,11. L’uso di quest’equazione assume che ciascun
RFLP sia il risultato di una differenza per un singolo nucleotide.
L'eterozigosità a livello dei nucleotidi è stata
studiata mediante gli enzimi di restrizione in un gran numero di organismi.
Negli organismi eucariotici l'eterozigosità a livello nucleotidico varia tipicamente tra 0,002 e 0,02.
Questo significa che un
individuo è eterozigote (contiene nucleotidi diversi sui due cromosomi
omologhi)
all'incirca in un caso
ogni 50 o 500 nucleotidi. Un altro modo di interpretare l’eterozigosità
a livello dei nucleotidi è quello di pensare che due cromosomi scelti a caso
da una popolazione saranno diversi all'incirca per un nucleotide ogni 50 o
500.
Uno degli svantaggi di utilizzare gli RFLP per esaminare
la variabilità genetica è che questo metodo rivela variabilità soltanto per
un piccolo sottoinsieme dei nucleotidi che compongono un gene. Con l’analisi
RFLP siamo costretti a prendere un piccolo campione di nucleotidi (quelli
riconosciuti dall'enzima di restrizione) e usiamo questo campione per stimare
il livello generale di variabilità.
I metodi di sequenziamento del DNA forniscono un metodo per rilevare tutte le differenze nucleotidiche che esistono in un gruppo di molecole di DNA. Ad esempio Martin Krietman ha sequenziato 11 copie (ottenute da moscerini diversi) di un frammento di 2.659 paia di basi del gene per l’alcool deidrogenasi di Drosofila, trovando differenze nucleotidiche in 43 posizioni all’interno del frammento. Inoltre, soltanto 3 delle 11 copie erano identiche per tutti i nucleotidi analizzati. Pertanto a livello nucleotidico vi erano 8 alleli diversi su 11 copie di questo gene.
Questo suggerisce che le popolazioni conservino a livello delle loro
sequenze di DNA un’immensa quota di variabilità genetica.