CAPITOLUL I 1.1. ACIZII NUCLEICI. STRUCTURĂ CHIMICĂ ŞI ACTIVITATE BIOLOGICĂ Investigarea structurii şi activităţii biologice a acizilor nucleici… [301535]

CAPITOLUL I

1.1. ACIZII NUCLEICI. STRUCTURĂ CHIMICĂ ŞI ACTIVITATE BIOLOGICĂ

Investigarea structurii şi activităţii biologice a acizilor nucleici prezintă o importanţă majoră, [anonimizat].
Aceste molecule poartă informaţia genetică necesară transmiterii caracterelor de la o generaţ[anonimizat] – moleculele de bază în alcătuirea tuturor structurilor celulare şi controlează căile metabolice celulare.
[anonimizat], fiind identificaţi pentru prima dată ca molecule distincte în anul 1869 de către de către Friedrich Miescher. Studierea acizilor nucleici a constituit de-a lungul timpului o parte importantă a cercetărilor din biologie și medicină și formează fundamentul atât pentru studiile de genetică şi genomică cât și pentru biotehnologie și industria farmaceutică.
În natură se diferenţiază două tipuri de acizi nucleici şi anume acidul dezoxiribonucleic ADN şi [anonimizat], care se găsesc în proporţii diferite în celule. Astfel, în celula bacteriei E. coli proporţia ADN este de 1%, iar cea a ARN este de 6%. Aceste molecule reprezintă principalele molecule informaţionale ale celulei.
Acidul dezoxiribonucleic (ADN) [anonimizat], dar şi în mitocondrii şi cloroplaste.
Acizii ribonucleici (ARN) se diferenţiază în funcţie de rolul pe care îl îndeplinesc în celulă. Astfel, acidul ribonucleic mesager (ARNm) transportă informaţia de la ADN la ribosomi şi serveşte ca matriţă pentru sinteza proteinelor. [anonimizat] (ARNr) şi ARN de transfer (ARNt) sunt implicate în sinteza proteinelor. [anonimizat] (Tabel 1.1).
Moleculele ARN citoplasmatic de dimensiuni mici (scRNA – “Small cytoplasmatic RNAs”) intră în alcătuirea particulei de recunoaștere a semnalului (SRP – „signal recognition particle”) și au implicații în procesul de procesare a ARNt.
Moleculele ARN nuclear de dimensiuni mici (snRNA – “Small nuclear RNAs”) sunt implicate în procesul de eliminare a intronilor în timpul prelucrării și maturării moleculelor de ARNm. [anonimizat] (snRNPs – “Ribonucleoprotein particles”).
Moleculele ARN nucleolar de dimensiuni reduse (snoARN- “Small nucleolar RNAs”) [anonimizat].
Moleculele microARN (miRNAs – “Micro RNAs”) [anonimizat], fiind implicate în reglarea expresiei genelor. Aceste molecule au capacitatea de a se lega la ARNm prevenind desfășurarea procesului de sinteză a proteinelor.
Moleculele siARN (siRNA – “Small interfering RNA“) [anonimizat]. Aceste molecule au capacitatea de a [anonimizat] (la fel ca miARN) sinteza anumitor proteine.

Tabel 1.1. Tipurile de ARN și funcțiile îndeplinite

Tipul molecule ARN
Funcția îndeplinită

ARNm – ARN mesager
Translaţie (sinteza proteinelor)

ARNr – ARN ribozomal
Translaţie (sinteza proteinelor), având rol catalitic

ARNt – ARN transfer
Translaţie (sinteza proteinelor)

scARN – ARN citoplasmatic de dimensiuni mici
Procesarea ARNt fiind un component al particulei de recunoastere a semnalului (SRP – “signal recognition particle”)

snARN – ARN nuclear de dimensiuni mici
Procesarea ARNm, fiind implicat în procesul de poliadenilare cu rol catalitic

snoARN- ARN nucleolar de dimensiuni mici
Procesarea/maturarea/metilarea ARNr

miARN – micro ARN
Reglarea translaţiei – inactivarea ARNm

siARN – ARN de interferență de dimensiuni mici
Reglarea translaţiei – degradarea ARNm



1.1.1. ORGANIZAREA MOLECULARĂ A ACIZILOR NUCLEICI

Din punct de vedere structural, atât ADN cât şi ARN sunt polimeri ai nucleotidelor, fiind alcătuite din baze purinice şi pirimidinice legate la monozaharide fosforilate.
Nucleotida ca unitate de bază a acizilor nucleici este o moleculă organică compusă din:
O glucidă, mai exact o monozaharidă, de tipul pentoză;
O bază azotată heterociclică, cu un număr de 6 atomi de tipul pirimidinei sau o variantă a acesteia condensată cu inelul imidazolic numită purină;
un rest de acid fosforic, adică o "grupare fosfat ".

Monozaharidele sau pentozele care intră în structura acizilor nucleici sunt 2-dezoxi-riboză pentru ADN sau riboză, pentru ARN (Fig. 1.1). În cazul moleculei de 2’ – dezoxi-riboză, gruparea -OH din poziţia 2’ este înlocuită de un atom de hidrogen.

Fig. 1.1 Structura monozaharidelor care intră în alcătuirea
acizilor nucleici

Dintre bazele heterociclice azotate ale ADN, două sunt purinice, adenina şi guanina, iar alte două sunt pirimidinice, citozina şi timina. În ARN, uracilul înlocuieşte timina (Fig. 1.2).
Bazele azotate se leagă în poziţia 1 la 2’- dezoxi-riboză în ADN sau la riboză în ARN, pentru a forma nucleozide. Nucleotidele conţin în plus una sau mai multe grupări fosfat legate la atomul de carbon 5’ al nucleozidului.
Polimerizarea nucleotidelor pentru constituirea acizilor nucleici implică formarea legăturilor fosfodiesterice între fosfatul 5’ al unui nucleotid şi hidroxilul 3’ al altui nucleotid.

Fig. 1.2 Structura bazelor azotate care intră în alcătuirea
acizilor nucleici

În urma polimerizării nucleotidelor se formează oligonucleotidele, polimeri care conţin câteva nucleotide sau polinucleotidele mari ca ARN şi ADN, care conţin mii sau milioane de nucleotide.
Fiecare catenă polinucleotidică are o anumită orientare şi anume: extremitatea 5’ a catenei este constituită dintr-o grupare fosfat, iar la cealaltă extremitate – 3’se află o grupare hidroxil. Polinucleotidele sunt întotdeauna sintetizate în direcţia 5’- 3’, un nucleotid liber fiind adăugat la gruparea 3’-OH a unui lanţ în creştere (Fig. 1.3).
Două catene polinucleotidice alcătuiesc macromolecula ADN, în care bazele azotate sunt dispuse spre interiorul macromoleculei. Legăturile spaţiale care se stabilesc între bazele azotate complementare şi anume timină-adenină şi citozină – guanină determină dispunerea în sensuri opuse a celor două catene determinând orientarea antiparalelă („regula Watson Crick”) (Fig 1.4 A).
De o deosebită importanţă pentru procesele care au loc ”in vivo” (replicarea, repararea leziunilor, transcripţia), dar şi pentru dezvoltarea tehnicilor de investigaţie asupra acizilor nucleici este atât legea complementarităţii bazelor, cât şi numărul legăturilor de hidrogen care se stabilesc între bazele azotate – două între adenină şi timină şi trei între guanină şi citozină.

Aranjarea spaţială a celor două catene ale moleculei ADN determină o spirală dublu helicoidală, orientată spre dreapta, având un diametru de 2nm.
Cele două catene, rezultate din alternarea dezoxiribozelor și a grupărilor fosfodiesterice sunt răsucite în jurul axului ca balustrada unei scări, iar perechile de baze azotate reprezintă treptele acesteia. În configuraţia spaţială a moleculei de ADN fiecare spiră a elicei este alcătuită dintr-un fragment de 10,4 perechi de nucleotide, generându-se două şanţuri laterale – unul cu dimensiunea de 12Å şi cele de-al doilea de 24 Å. Cele două şanturi au un rol important în recunoşterea şi fixarea proteinelor cu care interacţionează molecula de ADN în timpul proceselor metrabolice. Această structură clasică, descrisă de Watson şi Crick, corespunde conformaţiei de tip B (Fig 1.4 B).

Fig. 1.4 Structura dublu helix a moleulei ADN şi formarea legăturilor de hidrogen între bazele azotate

Au fost identificate şi alte conformaţii care se diferenţiază prin modificarea pasului elicei, numărul de nucleotide pe fiecare pas şi unghiul de înclinare al bazelor azotate. Acestea sunt considerate izoforme, denumite conformaţii A şi C. Moleculele de ADN pot să treacă dintr-o conformaţie izoformă în alta, cu implicare în reglarea transcripţiei genelor.
În anumite condiţii, în special când are loc metilarea citozinei în regiuni bogate în C-G şi sub acţiunea unor topoizomeraze are loc trecerea într-o altă conformaţie, denumită ADN-Z. În acest caz molecula helicoidală este răsucită spre stânga, adoptând o formă în zig-zag. Această conformație a fost dificil de studiat pentru că este o structură tranzitorie care este uneori indusă de activitatea biologică, rămânând în această formă un timp scurt.
Structura helicoidală este considerată un simbol al lumii vii, fiind asociată cu funcțiile metabolice îndeplinite de către acizii nucleici. Informaţia genetică stocată în ADN şi ARN este transmisă exclusiv prin aranjamentul bazelor azotate din lanţul polinucleotidic.
Acizii nucleici sunt singurele molecule care sunt capabile să-şi direcţioneze propria autoreplicare, adică o catenă de ADN sau ARN poate acţiona ca matriţă pentru sinteza unui lanţ complementar.
În biologia moleculară dimensiunea fragmentelor de ADN poate fi evaluată în unități de masă sau de lungime. În mod convențional, pentru lungimea fragmentelor ADN se foloește termenul de perechi de baze (“base pairs”) cu prescurtarea bp sau kb („kilo base pairs”).

1.1.2. ORGANIZAREA SUPRAMOLECULARĂ A MOLECULEI ADN

În cazul celulelor eucariote dublul helix ADN este supus unui proces de condensare, datorită interacţiunii biochimice cu alte molecule cum ar fi histonele şi proteinele reglatoare. Gradul de condensare este asociat cu etapa din ciclul celular în care se află celula la un moment dat.
Ciclul de viaţă al fiecărei celule este alcătuit din două etape importante şi anume interfaza şi diviziunea celulară. În continuare sunt prezentate cîteva aspecte ale ciclului celular legate de aspectele genetice (Fig.1.5).
Interfaza este alcătuită din faza G1 sau presintetică, faza S sau sintetică şi faza G2 sau postsintetică. În faza G1 cantitatea de ADN corespunde unor cromozomi monocromatidici despiralizaţi, alcătuiţi dintr-o moleculă ADN dublu catenară. În faza S sau sintetică are loc replicarea ADN nuclear printr-un proces semiconservativ, astfel încât cantitatea de ADN este dublată. Deci, la iniţierea sintezei ADN, celula se află în condiţii de diploidie (2n), la sfârşit ajungând în condiţii de tetraploidie (4n).
În faza G2 cantitatea de ADN corespunde unor cromozomi bicromatidici despiralizaţi, fiecare cromatidă fiind alcătuită dintr-o moleculă ADN dublu catenară.

Fig. 1.5. Procesele desfăşurate în cadrul ciclului celular, urmărindu-se comportarea unui singur cromozom

Cea de-a doua etapă a ciclului celular o reprezintă diviziunea celulară sau mitoza (M). La începutul mitozei cromozomii bicromatidici se condensează, fiind vizibili la microscopul optic. În timpul diviziunii celulare are loc împărţirea/segregarea materialului genetic dublat în faza de sinteză (S) în mod egal între cele două celule fiice.
Durata ciclului celular variază în funcţie de tipul celular, specie şi stadiul de dezvoltare. Celulele neproliferative părăsesc ciclul în G1, intrând în faza G0, în care rămân până când primesc un semnal de multiplicare. În general faza S are o durată constantă, pe când durata G1 este variabilă, în limite largi. S-a constatat că timpul necesar parcurgerii perioadei G1 este influenţat de o serie de factori extracelulari, cum ar fi elementele nutritive şi factorii de creştere.
Pentru cele aproximativ 1013 celule care alcătuiesc organismul uman, durata ciclului variază în limite foarte largi. Celulele epiteliale ce delimitează lumenul intestinal se divid foarte rapid (o dată sau de două ori pe parcursul a 24 ore), în timp ce celulele musculare şi neuronii îşi pierd complet capacitatea proliferativă după încheierea procesului de diferenţiere.
De-a lungul ciclului celular moleculele de ADN adoptă diferite niveluri de organizare, astfel încât să poată asigura desfăşurarea în condiţii optime aproceselor de replicare, transcriere sau diviziune celulară.

Primul nivel de organizare supramoleculară a moleculei ADN îl reprezintă filamentul cu nucleozomi, cu un diametru de 10 nm, denumit cromatină.
Nucleozomii sunt structuri sferice, alcătuite din 8 molecule de histone. Histonele sunt proteine bazice, care poartă grupări încărcate pozitiv datorită aminoacizilor lizină şi arginină. Atât arginina cât şi lizina au câte o grupare laterală amino, care poate să atragă protoni, devenind astfel structuri încărcate pozitiv ( ~~ NH2 + H+ → ~~ NH3+). Aceasta încărcare pozitivă a histonelor permite ataşarea la grupările fosfat negative care intră în alcătuirea moleculei ADN. Familiile de histone sunt de tip H1, H2A, H2B, H3 şi H4, fiecare cuprinzând un număr de subfamilii.
Centrul nucleozomului sau miezul proteic îl reprezintă un octamer care cuprinde un tetramer alcătuit din proteinele H3 şi H4 (doi dimeri H3-H4) și doi dimeri H2A-H2B.
În jurul fiecărui miez proteic este înfăşurat un fragment ADN cu o lungime de 147 bp sub forma a două spire. Doi nucleozomi vecini sunt uniți prin intermediul unor fragmente ADN cu lungimea de 20-60 bp, denumite ADN de legătură (ADN linker).
Structura de „mărgele pe sfoară” este menţinută şi de moleculele de histone H1, care formează punţi între doi nucleozomi adiacenţi, fiind localizate în afara nucleozomului, lângă ADN linker şi interacţionând cu subunitatea H2A a miezului nucleozomic (Fig. 1.6). Aspectul de „mărgele înşirate pe sfoară” a fost confirmat şi prin microscopie electronică.

Fig. 1.6. Structura filamentului cu nucleozomi, care generează imaginea de „mărgele pe sfoară” a cromatinei

Legarea histonelor la ADN nu depinde de o anumită secvenţă a nucleotidelor, dar depinde de secvenţa de aminoacizi a histonelor. Acestea se fixează în şanţul mic al moleculei de ADN, contribuind la procesul de împachetare. În anumite etape ale ciclului celular are loc modificarea chimică prin metilare, fosforilare sau acetilare a numeroase situsuri în special ale histonelor H3 şi H4, ceea ce conduce la modificarea interacţiunilor cu molecula de ADN. Astfel se modifică accesul altor proteine, în special a factorilor de transcripţie la molecula de ADN.
Pe lângă histone, cromatina mai conţine o cantitate mică dintr-o gamă largă de proteine non-histonice. Majoritatea acestora este reprezentată de factori de transcripţie, care se atasează în şanţul mare al moleculei de ADN, în special în porţiunile care constituie promotorii.
Histonele sunt unele dintre cele mai bine conservate molecule în cursul evoluţiei datorită rolului foarte important pe care îl au în alcătuirea moleculelor de acizi nucleici. Fiecare familie prezintă o serie de caracteristici generale, dar au fost identificate mai multe tipuri de molecule în cadrul acestora.
Astfel, au fost caracterizate 8 tipuri diferite de histone H1, care depind de tipul celulei, poziţionarea în celulă şi stadiul de diferenţiere. În cazul nucleozomilor care sunt poziţionaţi lângă centromeri histona H3 este înlocuită de CENP-A ("centromere protein A"). Dacă în această regiune histona H3 nu poate fi înlocuită de CENP-A structura şi funcţionarea centromerului se blochează. Histona H2A poate fi înlocuită cu o altă variantă H2A.Z în regiunea care separă eucromatina şi heterocromatina.
De obicei histonele standard sunt încorporate în nucleozomii moleculei ADN nou sintetizată, în timpul fazei de sinteză S a ciclului celular. Mai târziu, unele sunt înlocuite cu alte variante ale histonelor, în funcţie de condiţiile din celule.
Dar, aranjarea ADN sub forma nucleozomilor nu este suficientă pentru a explica o structură atât de compactă care să permită împachetarea în interiorul nucleului. Astfel, pentru ca 46 de molecule de ADN uman, totalizând mai mult de 2m în lungime, să intre într-un nucleu cu un diametru de 10µm este necesară o împachetare mai avansată.

Al doilea nivel de organizare supramoleculară a moleculei ADN este fibra de cromatină, cu un diametru de 30nm, rezultată din spiralizarea sub forma unui solenoid a cromatinei. Fiecare spiră a solenoidului este alcătuită din 6 nucleozomi, fiind stabilizată de histona H1. Astfel, se consideră că unitatea fundamentală de organizare a moleculei ADN în nucleul interfazic este fibra de cromatină, cu diametrul de 30 nm.
Analiza structurală a evidențiat că prin spiralizare se apropie regiuni ale ADN, care sunt amplasate la distanțe mari unele față de celelalte în molecula liniară. Astfel, este asigurată transmiterea corectă a informației genetice, dovedind implicarea modului de împachetare în funcționarea genomului.
Spiralizarea specifică sub forma de solenoid asigură accesul enzimelor care realizează transcripţia, deoarece apare o alternare a zonelor puternic spiralizate cu cele nespiralizate.

Al treilea nivel de organizare rezultă prin plierea fibrei de cromatinăcu diametrul de 30 nm în bucle laterale, numite şi domenii, de lungimi diferite (20 – 100kb), având un diametru de 300nm. Buclele nu au numai un rol structural ci şi funcţional deoarece se consideră că fiecare bucla ar putea fi o unitate de transcripţie.

Al patrulea nivel de organizare îl reprezintă cromatida, care apare la începutul profazei prin condensarea fibrei de cromatină pliată în bucle laterale. În metafază are loc cel mai înalt grad de condensare al fibrei de cromatină, diametrul ajungând la 700 nm (Fig. 1.7).
Cromozomul aflat în metafază este alcătuit din două cromatide surori (ataşate la nivelul centromerului). Fiecare cromatidă a cromozomului conţine deci o singură moleculă de ADN, care a suferit mai multe procese succesive de compactare. Cea de-a doua cromatidă a luat naştere în timpul replicării, care a avut loc în faza S a ciclului celular.
           Se poate spune că molecula de ADN suferă o compactare de aproximativ 10.000 de ori şi astfel poate să încapă în nucleu, care are un diametru de câțiva micrometri. Astfel, este asigurată împărțirea corectă a materialului genetic în timpul procesului de diviziune și totodată se asigură desfășurarea corespunzătoare a tuturor proceselor metabolice: replicare, transcripţie, etc.

Fig. 1.7 Nivelurile de organizare supramoleculară ale moleculei ADN
(dupa http://www.mun.ca/biology/desmid/brian/BIOL2060/BIOL2060-18/18_22.jpg)

(1) reprezentări schematizate ale fiecărui nivel de organizare;
(2) imagini vizualizate la microscop.

1.1.3. ORGANIZAREA SUPRAMOLECULARĂ A MOLECULEI ARN

Structura primară a moleculei de ARN este în general similară cu cea a ADN cu două excepţii: monozaharidul este riboza care posedă o grupare hidroxil în poziţia 2’ şi timina este înlocuită de uracil.
Prezenţa timinei în loc de uracil în molecula ADN influenţează stabilitatea pe termen lung a acestei molecule, deoarece timina este implicată în procesele de reparare a ADN. Gruparea hidroxil de la atomul C2 al ribozei face ca molecula de ARN să fie mult mai labilă comparativ cu cea de ADN. Ca rezultat al acestei labilităţi, ARN poate fi clivat în mononucleotide în soluţie alcalină, fenomen care nu apare în cazul moleculei de ADN. Hidroxilul de la atomul C2 pune la dispoziţie o grupare chimică reactivă, care este implicată în reacţiile catalizate de ARN.
La fel ca ADN, ARN este o macromoleculă polinucleotidică, care poate fi mono (ARNmc) sau dublu catenară (ARNdc), liniară sau circulară. Poate de asemenea să participe la formarea unor molecule hibride ARNmc – ADNmc. Spre deosebire de ADN care se găseşte în celulele vii întotdeauna bicatenar, dublu helix, majoritatea moleculelor ARN sunt monocatenare (cu excepţia particulelor virale), fiind posibilă adoptarea mai multor conformaţii. Diferenţele de dimensiune şi conformaţie permit moleculelor ARN să îndeplinească diferite funcţii în celule.
Structura secundară a ARN se formează prin legarea fragmentelor monocatenare complementare. Astfel, structura ac de păr” („hairpin”) se formează prin cuplarea bazelor azotate aflate la o distanţă de 5 – 10 nucleotide una faţă de cealaltă, iar în cazul structurii sub formă de ”bucla” („loop”) distanţa dintre secvenţele complemenare cuplate poate fi de zeci, sute sau chiar mii de nucleotide (Fig. 1.8).

Fig. 1.8 Structura secundară a moleculei de ARN
a – structura în „ac de păr” („hairpin”);
b- structura sub formă de buclă („loop”).

Aceste împachetări simple concură la formarea unor structuri terţiare mult mai complexe, specifice fiecărui tip de ARN.
În cazul moleculei de ARNt se adoptă o structură tridimensională bine definită, care are o importanţă deosebită în procesul de sinteză a proteinelor (Fig. 1.9).

Fig. 1.9. Modelul structurii moleculare a ARNt

Bucla 1 – situsul pentru fixarea temporară la ribozom, în timpul sintezei proteice;
Bucla 2 – bucla variabilă;
Bucla 3 – situsul pentru ataşarea la codonul de molecula ARNm (tripletul denumit anticodon);
Bucla 4 – situsul de recunoaştere pentru enzimele implicate în formarea complexului aminoacil ~ ARNt ( ARN sintetaze).

Moleculele ARNr au de asemenea structuri tridimensionale localizate, legate între ele cu regiuni mai flexibile.
Se observă adoptarea unei structuri secundare şi terţiare şi la moleculele de ARNm, în particular în zonele situate spre capetele moleculelor.
Prin urmare moleculele de ARN sunt asemănătoare cu proteinele, care au domenii structurate, conectate prin domenii liniare, mai puţin structurate şi flexibile. Domeniile de împachetare ale moleculelor de ARN nu sunt asemănătoare cu cele ale proteinelor (α şi β) dar în unele cazuri au şi capacităţi catalitice. Astfel ARNr catalizează legarea la proteine pentru a da naştere precursorilor ribozomali.

1.2. PROTEINELE. STRUCTURA CHIMICĂ ŞI ACTIVITATEA BIOLOGICĂ

1.2.1. ORGANIZAREA MOLECULARĂ A PROTEINELOR

Proteinele sunt componentele funcţionale cele mai importante ale celulelor, având o structură polipeptidică, alcătuită din 20 de aminoacizi.
Fiecare aminoacid este alcătuit dintr-un atom de carbon, numit carbon α,
cu patru substituienți diferiți și anume: o grupare carboxil (COO-), o grupare amino (NH3+), un atom de hidrogen şi o catenă laterală distinctă (Fig. 1.10).

Proprietăţie chimice, specifice diferitelor catene ale aminoacizilor explică rolul fiecărui aminoacid în structura şi funcţia proteinei.
Catenele laterale ale aminoacizilor pot fi nepolare alifatice (glicină, alanină, valină, leucină, izoleucină şi metionină ), nepolare, aromatice (fenil-alanină, tirozină şi triptofan), polare, neutre (serină, treonină, cisteină, prolină, asparagină şi glutamină), încărcate pozitiv datorită grupărilor bazice (lizină, arginină şi histidină), încărcate negativ datorită grupărilor acid (acid aspartic şi acid glutamic).
Natura catenelor laterale ale aminoacizilor determină atât conformația cât și functiile îndeplinite de proteine. În continuare sunt prezentate câteva caracteristici ale aminoacizilor, cu implicaţii în desfăşurarea proceselor metabolice din celule.
Aminoacizii polari neutri, care formează legături de hidrogen între ei sau cu proteinele ligand / substrat asigură specificitatea interacțiunilor pe când aminoacizii hidrofobi conferă stabilitate şi furnizează forţa necesară procesului. Unii dintre aminoacizii polari neutri funcționează ca agenţi nucleofili în cataliza enzimatică.
Serina și treonina, care au grupări –OH în catenele laterale sunt adesea fosforilate în proteinele ​​care participă la comunicarea celulă-celulă. Această modificare este reversibilă și servește ca un sistem de marcare în transducția semnalului chimic. Datorită grupării hidroxil din catena lor laterală, cei doi aminoacizi pot funcţiona ca agenţi nucleofili în cataliza enzimatică.

Cisteina, care are o grupare –SH în catena laterală, este orientată în interiorul proteinelor hidrofile, în ciuda caracterului sau polar. În condiţii oxidante, gruparea tiol are tendinţa de a forma punţi disulfidice împreună cu alte grupări similare. Aceste legături sunt importante pentru proteinele care sunt secretate din celule, cum ar fi hormonii, anticorpii sau unele enzime. Cisteina poate fi şi un agent nucleofil sau de transfer al electronilor în reacţii catalizate enzimatic, datorită electronilor neparticipanţi ai atomului de sulf care-i conferă reactivitate ridicată şi capacitatea de a exista în diferite stări de oxidare.
Acizii aspartic şi glutamic au câte o grupare corboxil (-COOH) în catena laterală, care tinde să-şi piardă protonul la pH fiziologic, încărcându-se negativ. Astfel, ei tind să interacţioneze electrostatic cu grupări încărcate pozitiv fie ale altor aminoacizi din aceiaşi proteină, fie ale unor proteine ligand / substrat.
Lizina și arginina au grupări care conțin azot în catenele laterale lor laterale (gruparea amino în lizină și guanidină în arginină). Aceste grupări, care tind să accepte un electron au o încărcare pozitivă la pH fiziologic, conferind proteinei un caracter bazic. Datorită caracterului pozitiv au tendintă de a interacţiona electrostatic cu grupări încărcate negativ fie ale altor aminoacizi din aceiaşi proteină, fie ale unor proteine ligand / substrat
Histidina are o grupare imidazol în catena sa laterală, care are şanse egale de a fi protonată, cu o încărcare pozitivă, sau deprotonată neutră în condiţii de ph fiziologic. Această caracteristică îi permite histidinei să participe în catalize enzimatice cu transfer de protoni, în care poate fi donor de protoni, acceptor sau amandouă.
În general, aminoacizii cu grupări încărcate, acide sau bazice sunt hidrofili şi sunt orientaţi spre suprafaţa proteinelor, intrând în contact cu soluţia apoasă care alcătuieşte matrixul compartimentelor celulare (citozol, mitocondrii, cloroplaste etc.). De obicei aminoacizii hidrofobi sunt localizaţi în interiorul proteinelor.
Aminoacizii, indiferent de catenele lor laterale interacţionează între ei, formând lanţurile polipetidice sau polipeptidele. Acestea sunt lanţuri liniare, alcătuite din sute sau mii de aminoacizi, având o extremitate amino ( N – terminală) şi o extremitate carboxil (C- terminală).
În alcătuirea polipeptidelor aminoacizii sunt legaţi între ei prin legături peptidice realizate între gruparea amino a unui aminoacid şi gruparea carboxil a celui de-al doilea aminoacid (Fig. 1.11).
Polipeptidele, cu succesiuni specifice de aminoacizi reprezintă numai primul element al structurii unei proteine. Acestea adoptă de obicei conformaţii tridimensionale distincte, ca rezultat al interacţiunilor dintre aminoacizii care le compun. Deci, conformaţiile proteinelor sunt determinate de secvenţa lor de aminoacizi.

Fig. 1.11 Reacţia de formare a unei legături peptidice prin condensare

R1, R2 – catenele laterale ale aminoacizilor

1.2.2. ORGANIZAREA SUPRAMOLECULARA A PROTEINELOR

Proteinele au o structură supramoleculară organizată pe patru nivele, în funcţie de gradul de condensare şi împachetare.
Structura primară a unei proteine este dată de secvenţa de aminoacizi care intră în alcătuirea lanţului polipeptidic.
Structura secundară este determinată de dispoziţia aminoacizilor în anumite regiuni ale polipeptidului. Pauling şi Corey (1951) au propus două tipuri de structuri secundare, în α helix şi în pachete β (planuri pliate). Aceste două structuri secundare sunt menţinute prin legăturile de hidrogen dintre grupările CO şi NH ale legăturilor peptidice.
Un α helix se formează când o regiune a unui lanţ polipeptidic se răsuceşte în jurul ei însăşi; gruparea CO a unei legături peptidice formează o legătură de hidrogen cu gruparea NH a altei legături peptidice situată cu patru resturi în aval pe lanţul polipeptidic liniar.
În schimb, un pachet β este format când două porţiuni ale unui lanţ polipeptidic se dispun alăturat şi se leagă între ele prin legături de hidrogen. Asemenea pachete β pot fi formate între mai multe lanţuri polipeptidice, care pot fi orientate paralel sau antiparalel unele față de altele.
Structura terţiară este indusă de plierea lanţului polipeptidic ca rezultat al interacţiunii dintre radicalii aminoacizilor care se află în diferite regiuni ale secvenţei primare. În majoritatea proteinelor, combinaţiile în α helix şi pachetele β – conectate prin regiuni flexibile în formă de buclă ale lanţului polipeptidic – se pliază în interiorul unor structuri globulare compacte, numite domenii.
Aceste domenii sunt unităţi de bază ale structurilor terţiare. Proteinele mici cum ar fi ribonucleaza au un singur domeniu, iar proteinele mari conţin mai multe domenii care sunt asociate frecvent cu funcţii distincte. Porţiunile interne ale proteinelor pliate sunt alcătuite din aminoacizi hidrofobi aranjaţi în α helix sau pachete β; aceste structuri secundare sunt prezente în miezul hidrofob al proteinelor, deoarece prin legăturile de hidrogen se neutralizează caracterul polar al grupărilor CO şi NH ale scheletului polipeptidic. Regiunile buclă care conectează aceste elemente ale structurii secundare sunt prezente pe suprafaţa proteinelor pliate, acolo unde componentele polare ale legăturilor peptidice formează legături de hidrogen cu apa sau cu radicalii polari ai aminoacizilor hidrofili.
Interacţinile dintre radicalii aminoacizilor polari, realizate prin legături de hidrogen şi legături ionice la suprafaţa proteinei sunt factori importanţi ai structurii terţiare. În plus, legăturile disulfurice covalente între grupările sulfhidril ale resturilor de cisteină stabilizează structurile pliate ale multor proteine secretate sau ale proteinelor prezente pe suprafaţa celulară.
Cel de-al patrulea nivel al structurii unei proteine – structura cuaternară – este determinată de interacţiunile dintre diferite lanţuri poli-peptidice prezente în proteinele compuse din mai mult decât un polipeptid. De exemplu, hemoglobina este compusă din patru lanţuri polipeptidice menţinute împreună prin aceleaşi tipuri de interacţiuni care determină structura terţiară. Conformaţiile tridimensionale diferite ale proteinelor corespund funcţiilor variate pe care trebuie să le îndeplinească în biologia celulei (Fig. 1.12).

Fig. 1.12 Nivelurile de organizare supramoleculară ale lanţurilor polipeptidice

CAPITOLUL II

GENOMUL ŞI ORGANIZAREA GENICĂ

Noţiunea de genom a fost introdusă pentru prima dată în anul 1920 de către un botanist pe nume Hans Winkler care a fuzionat cuvintele grecești "genesis" şi "soma" pentru a descrie setul complet de gene.
În prezent, o dată cu dezvoltarea geneticii moleculare termenul de genom se referă la totalitatea materialului genetic dintr-o celulă, cuprinzând atât genele cât şi secvenţele necodante. Fiecare genom trebuie să conţină informaţia necesară pentru alcătuirea organismului şi totodată să-i permită creşterea şi dezvoltarea.
Dimensiunea genomului este o noţiune care se referă la cantitatea de ADN conţinută într-o copie a genomului. Ca unitate de măsură se folosesc de obicei picograme (pg), mai rar daltoni (Da). Cel mai adesea se exprimă ca număr de perechi de nucleotide sau perechi de baze (bp). Un picogram de ADN corespunde unui fragment cu lungimea de 978 Mb (Dolezel, 2003).
Cantitatea totală de ADN din genomul haploid este denumită valoarea C. Nu exista o corelaţie între valoarea C şi complexitatea unui organism, fapt denumit în literatura de specialitate paradoxul valorii C.
Până în prezent a fost evaluată dimensiunea genomului şi numărul aproximativ de gene atât la viruşi – cele mai simple entităţi biologice cât şi la organismele complexe – plante, animale sau om (Tabel 2.1).

Tabel 2.1. Dimensiunea genomului şi numărul de gene la diferite organisme

Specia
Perechi de baze
Număr aproximativ de gene

Viruşi
1,7 x 103 – 2,5 x 106
10

Mitocondria umană
16 x 103
37

Bacterii
1,1 x 105 – 10 x 106
1.500- 6.000

Fungi
1,2 x 107 – 3 x 107
4000-1400

Nematozi
2 x 107 – 1 x 108
14000-24000

Insecte
1,3 x 108 – 4,8 x 108
10000

Plante superioare
0,61 x 108 – 2,8 x 109
25000 – 60000

Mamifere
2,4 x 109 – 3,4 x 109
20000

Om
3,2 x 109
20000

Paris japonica
1,5 x 1011
-


S-a confirmat încă o dată că dimensiunea genomului unui organism nu se corelează cu complexitatea sau cu nivelul evolutiv. Deși organisme unicelulare, cum ar fi drojdia de bere sau unele specii de plante au mult mai puțin ADN comparativ cu omul, totuşi există plante care au o cantitate mult mai mare de ADN.
Genomul speciei Arabidopsis thaliana, planta model al cărei genom a fost secvenţializat încă din anul 2000, conţine un număr 1,57 x 108 perechi de baze (bp). Aproximativ 14% din acesta este constituit din transpozoni, iar restul constituie cele 25.498 de gene. Porumbul conţine de 20 de ori mai mult ADN (2,8 x 109 bp), dar numărul de gene este numai de aproximativ 2 ori mai mare, deoarece 60% din genomul porumbului este constituit din transpozoni (The Arabidopsis Genome Initiative, 2000).
În anul 2014 a fost secvenţiat genomul Genlisea tuberosa, o specie de plante carnivore din genul Genlisea, care are cel mai mic genom identificat până în prezent la angiosperme şi anume 0,61×108 bp. Se consideră că de-a lungul evoluţiei genului, genomurile unor specii Genlisea au suferit o reducere drastică a dimensiunii însoţită de o miniaturizare a cromozomilor (Fleischmann și colab., 2014).
Genomul speciei Paris japonica, un hibrid octoploid între patru specii, cu un număr de 40 de cromozomi a fost evaluat în anul 2010 ca fiind cel mai mare genom al unei plante analizate până în prezent, cu o lungime de 1,5 x 1011bp. Este de 50 de ori mai mare decât cel uman, fiind cel mai mare genom al vreunui organism viu cunoscut (Pellicer și colab, 2010)

2.1. ORGANIZAREA GENOMULUI LA VIRUSURI

2.1.1. VIRUSURI BACTERIENE

Virusurile bacteriene sau bacteriofagii au genomuri reprezentate de macromolecule de ADN sau ARN de mărimi variabile. În prezent sunt cunoscute câteva mii de bacteriofagi şi numai bacteria E. coli poate fi infectată de câteva sute de fagi. Astfel fagii care infectează E. coli pot fi împărţiţi în 4 grupe.
Fagii cu genom ADN din seria T, au un singur genom reprezentat de o singură moleculă de ADN de dimensiuni variabile.
După pătrunderea genomului fagic în celula bacteriană are loc reproducerea a aproximativ 100 de fagi care sunt eliberaţi în mediu prin liza celulei gazdă, în numai câteva minute.
Fagii temperaţi cu genom ADN după ce infectează celula gazdă pot determina liza celulei bacteriene, similar celor din seria T, dacă este urmat ciclul litic, sau genomul lor poate fi integrat în cromozomul bacterian. Ei rămân în această postură de provirus sau de bacteriofag temperat un timp nedefinit, fiind replicaţi o dată cu genomul celulei gazdă – ciclul lizogenic.
Dacă este urmat ciclul lizogenic, genomul fagic este integrat în cromozomul bacterian şi sub această formă este replicat o dată cu acesta sute şi mii de generaţii până ce intervin fenomene de afectare a ADN, cum ar fi radiaţiile UV. Din această cauză genomul fagului este eliberat din cromozomul bacterian, se replică independent şi are loc astfel trecerea de la ciclul lizogenic la cel litic. Celula bacteriană este astfel lizată şi aproximativ 200 de fagi noi sunt eliberaţi în mediu.
Caracteristicile genetice ale bacteriofagului  au fost exploatate, astfel că a stat la baza dezvoltării un sistem de clonare a fragmentelor ADN în celule bacteriene.
În cazul fagilor cu genom ADN monocatenar materialul genetic este reprezentat de o macromoleculă de ADN monocatenar circular. După ce materialul genetic viral pătrunde în celula bacteriană are loc rapid sinteza unei catene de ADN complementare, astfel că genomul viral devine bicatenar. Apoi, el are o replicare rapidă, formând aproximativ 20 de copii de ADN circular bicatenar. În acelaşi timp începe procesul de transcripţie a informaţiei genetice virale, se sintetizează ARNm, care împreună cu ribozomii celulari determină sinteza de proteine virale.
Cele 20 de copii bicatenare ale genomului viral servesc ca matriţă pentru sinteza a aproximativ 200 de molecule de ADN monocatenare.
ADN viral monocatenar împreună cu proteinele virale dau naştere particulelor virale active, celula este lizată, iar particulele virale sunt eliberate în mediu.
În cazul fagilor cu genom ARN genomul esten reprezentat de o moleculă de ARN de dimensiuni mici, alcătuită din aproximativ 3500 nucleotide, cuprinzând 3 gene. În acest caz genomul funcţionează în celulele gazdă ca ARNm, conducând direct la sinteza proteinelor.

2.1.2. VIRUSURI ANIMALE

În cazul virusurilor animale genomul este constituit din acidul nucleic viral, care poate fi ADN, în cazul dezoxi-ribovirusurilor, sau ARN, la ribovirusuri, neavând niciodată ambii acizi nucleici. Majoritatea virusurilor animale conţine genom de tip ARN.
Din punctul de vedere al mărimii acidului nucleic, structurii şi secvenţelor de baze azotate virusurile sunt extrem de diverse. Virusurile ADN pot prezenta următoarele structuri (Fig. 2.1).
Diferenţele privitoare la dimensiunea geomului viral sunt considerabile de la o familie la alta, atât în ceea ce priveşte greutatea moleculară, a numărului de nucleotide, cât şi cea a secvenţei bazelor azotate.

Fig. 2.1 Structura genomului la dezoxi-ribovirusurile animale
monocatenare liniare – mc;
monocatenare circulare – mc;
dublu catenare liniare, cu secvenţe terminale repetitive;
dublu catenare – dc, cu extermităţi închise covalent;
dublu catenare, circulare, închise necovalent, cu extremităţi monocatenare (dc- mc);
dublu catenare, circulare, închise covalent şi suprarăsucite.

Numărul de gene cuprins în genom poate fi extrem de restrâns: HIV conţine 9 structuri genice, virusul gripal – 12, dar poate să ajungă până la 240 de gene. Prin urmare şi numărul de proteine va fi diferit (2 – 250 proteine), în funcţie de numărul şi structura genelor.
Structura genomului viral se caracterizează printr-o mare diversitate, atât la virusurile ADN cât şi la cele ARN.

Ribovirusurile, sau virusurile ARN sunt, de asemenea, diverse ca structură, fiind monocatenare sau bicatenare, cu genomul într-un singur fragment sau divizat. Astfel, genomul virusurilor ARN prezintă următoarele structuri (Fig. 2.2.).
Genomul segmentat permite reasortarea materialului genetic între virusuri înrudite, fiind suportul material al variabilităţii unor virusuri (de exemplu virusul gripal).

Fig. 2.2 Structura genomului la ribovirusurile animale

monocatenare – mc liniar, într-un singur segment;
monocatenare – mc diploid, în care două molecule ARN identice sunt legate necovalent (retrovirusuri);
monocatenare – mc divizat, format din 8 molecule liniare inegale;
monocatenar – mc, cu două segmente, unul mare şi altul mic;
monocatenar – mc, cu 3 structuri circulare;
dublu catenar –dc, cu 10 sau 12 segmente separate.

Se poate concluziona că, în cazul virusurilor genomul conţine întreaga informaţie genetică necesară pentru infecţie şi pentru multiplicare. Atât ADN cât şi ARN viral sunt capabili de autoreplicare în absenţa celorlalţi constituienţi virali, excepţie făcând ARN viral, izolat, monocatenar de sens negativ. Celelalte procese, cum ar fi transcripţia genelor şi sinteza proteinelor se desfăşoară cu ajutorul sistemelor enzimatice ale celulei gazdă.

2.2. ORGANIZAREA GENOMULUI LA PROCARIOTE

Celulele procariote nu prezintă nucleu adevărat, astfel că materialul genetic nu este separat de citoplasmă printr-o structură membranară.
Materialul genetic este reprezentat de cromozomul bacterian şi de elementele genetice accesorii – plasmidele.

2.2.1 CROMOZOMUL BACTERIAN. ORGANIZARE MOLECULARĂ

Cromozomul bacterian nu se află amplasat într-un organit separat de restul celulei printr-o biomembrană, ci într-o regiune cu o formă neregulată, denumită nucleoid. Nucleoidul este echivalentul cromatinei din celulele eucariote, fiind alcătuit din 60% ADN și în plus molecule mici de ARN si proteine.
In cele mai multe cazuri cromozomul bacterian este reprezentat de o singură moleculă de ADN dublu catenară, circulară şi super-spiralizată, alcătuită din secvenţe unice de ADN. Proteinele care ajută la menținerea structurii super-spiralizate a acizilor nucleici sunt cunoscute ca proteine asociate cu nucleoidul, fiind diferite de histonele prezente în nucleul eucariot. Acestea nu stau la baza alcătuirii nucleosomilor, ci utilizează alte mecanisme pentru a iniţia condensarea prin formarea unor bucle ADN („DNA looping”).
Cel mai bine studiat până astăzi a fost cromozomul celulei bacteriene E. coli care are o lungime de 4639 kb. Genomul a fost secventializat în totalitate, pentru o gamă largă de tulpini, identificându-se în cazul fiecăreia un număr de 4000-5500 de gene (The Complete E. coli Genome Sequence).
În E. coli, jumătate dintre gene sunt organizate în operoni, fiecare dintre aceştia codificând enzime implicate în anumite căi metabolice, sau proteine care interacţionează pentru a forma o structură complexă, alcătuită din mai multe subunităţi.
Un operon reprezintă o unitate funcțională alcătuită dintr-o înlănțuire de gene structurale, puse sub controlul aceluiași promotor. Genele sunt transcrise împreună într-o moleculă de ARN mesager, care poate sta la baza sintezei unei singure proteine sau poate fi clivată în mai multe molecule ARNm, care fiecare codifică o anumită proteină, cu implicare într-o cale metabolică.
Având în vedere că un operon bacterian este transcris de la un punct de pornire, într-o singură moleculă de ARNm, toate genele care îl alcătuiesc sunt reglate împreună. De aceea ele sunt activate sau represate ca urmare a aceluiaşi factor. Transcripţia operonului este controlată de interacţiunea dintre ARN polimerază şi proteine specifice activatoare sau represoare.
Regiunea de reglare, în cazul unui operon procariot este alcătuită din mai multe elemente:
o secvenţă care leagă proteinele activatoare – situs CAP („catabolite activator protein”);
regiunea operator, care funcţionează ca receptor de semnale şi controlează transcripţia genelor structurale;
regiunea promotor, care este adiacentă regiunii operator, fiind secvenţa care permite ataşarea ARN polimerazei la molecula de ADN, iniţiind transcripţia informaţiei genetice (Fig 2.3).

Fig. 2.3 Structura generală a unui operon din genomul bacterian

Regiunea promotor este alcătuită din două secvenţe: TATAAT localizată pe catena ADN în poziţia -10, în amonte de situs-ul de start pentru sinteza ARNm şi TTGACA, în poziţia -35.
În structura cromozomului bacterian mai sunt prezente secvenţe de inserţie – IS –elemente mobile cu lungimi de 1-2 kb, care pot fi inserate în diferite regiuni ale genomului bacterian. Sunt secvenţe specifice de ADN ce includ o serie de gene structurale, care codifică una sau două enzime necesare pentru transpoziţie, delimitate la extremităţi de regiuni alcătuite din repetiţii directe sau inverse, care condiţionează procesul.

2.2.2 ELEMENTELE GENETICE ACCESORII – PLASMIDELE

Plasmidele reprezintă o informaţie genetică accesorie, extra-cromozomială, ce favorizează existenţa celulei bacteriene în medii neobişnuite. Peste 300 din numărul total al plasmidelor cunoscute au fost identificate la E. coli.
O plasmidă este o moleculă mică de ADN dublu catenară, circular închisă, care are o replicare independentă. Datorită dimensiunilor reduse (1-2% din cromozomul bacterian) aceste structuri mai poartă denumirea de minicromozomi. În unele situații pot să existe și plasmide liniare, dar în cele mai multe situații sunt circulare.
Plasmidele sunt deci entităţi genetice care în condiţii naturale se replică autonom, iar replicarea lor poate fi corelată sau nu cu cea a cromozomului. În plasmide sunt prezente cel puţin trei gene, dar numărul acestora poate să ajungă până la 100. Adesea plasmidele conţin gene care conferă rezistenţă la antibiotice, de exemplu rezistenţă la ampicilină, tetraciclină, kanamicină sau cloramfenicol.
Caracteristicile plasmidelor şi anume dimensiunile reduse, capacitatea de autoreplicare şi prezenţa genelor care conferă rezistenţă la antibiotice le recomandă pentru utilizarea ca vectori de clonare a moleculelor de ADN, în tehnologia ADN recombinat.

2.3. ORGANIZAREA GENOMULUI NUCLEAR LA EUCARIOTE

În celulele eucariote depozitarea informaţiei genetice, reglarea şi controlul activităţilor genetice sunt asigurate de structurile celulare care conţin ADN (nucleul, mitocondriile şi cloroplastele).
Dar, organitul care asigură coordonarea activităților metabolice este nucleul, care conține aproximativ 99,5% din cantitatea de ADN a celulei.
Pe parcursul ciclului celular nucleul își modifică structura, în funcție de caracteristicile fiecarei etape. În acelaşi timp cromatina, alcătuită din molecula dublu catenară de ADN, prezintă diferite grade de condensare.
2.3.1. CLASIFICAREA CROMATINEI ÎN FUNCŢIE DE GRADUL DE CONDENSARE
Eucromatina este puțin condensată, evidenţiată sub forma unor bucle alcătuite de fibra de cromatină (30 nm). Din punct de vedere morfologic este alcătuită din ADN nerepetitiv, în care predomină perechile de baze G-C şi proteinele nehistonice, conținând gene structurale. Din punct de vedere funcțional reprezintă partea activă genetic, cu un grad ridicat de transcripţie.
La drojdii buclele alcătuite din eucromatină sunt situate adesea în apropierea complexelor porilor nucleari, ceea ce sugerează favorizarea deplasării compuşilor de transcripţie spre citozol. Totuşi, în celulele animale produşii de transcripţie par să fie represati în apropierea suprafeţei interne a învelişului nuclear.
Noţiunea de “genă” a fost introdusă prima dată în anul 1909 de către botanistul Wilhelm Johannsen şi provine din limba greacă, de la cuvântul “genos”. După descoperirea ADN ca material genetic şi odată cu dezvoltarea biotehnologiei şi cu secvenţierea genomului uman, noţiunea de “genă” a început să se refere mai ales la înţelesul său din biologia moleculară, adică la segmentele de ADN care sunt transcrise în ARN şi apoi traduse cel puţin parţial în proteine (Fig. 2.4).

Fig. 2.4. Structura unei gene eucariote
Heterocromatina este porţiunea foarte condensată, cu replicare tardivă în faza de sinteză (S) a ciclului celular. Din punct de vedere morfologic conţine mai mult ADN repetitiv, în care predomină perechile de baze A-T şi histonele. Din punct de vedere funcțional reprezintă partea inactivă genetic, fiind implicată în procesul de stabilizare a centromerului și telomerilor. La nivelul heterocromatinei rata recombinarilor este redusă.
În celulele eucariote au fost evidenţiate două tipuri de heterocromatina: constitutivă şi facultativă.
Heterocromatina constitutivă este o cromatină constant condensată în interfază. Ea este genetic inactivă, nu conţine gene structurale şi pe ea nu se face niciodată transcripţie. Heterocromatina constitutivă conţine aşa-numitul ADN repetitiv sau satelit, reprezentat de secvenţe scurte, repetate de un număr mare de ori.
Heterocromatina facultativă este o cromatină condensată temporar. Conţine gene structurale care într-un anumit tip de celule sau într-un anumit stadiu de dezvoltare sunt represate, dar se pot transforma în anumite momente în eucromatină.
      Clasificarea menţionată – eucromatina şi heterocromatina s-a realizat în urma experimentelor de bandare şi examinare la microscop. Dezvoltarea fără precedent a tehnicilor moderne de biologie moleculară, cum ar fi amplificarea ADN, hibridizarea cu sonde moleculare sau chiar secvenţierea a permis clasificarea secvenţelor ADN după structura şi numărul de repetiţii în care apar în genom.
Din punctul de vedere al numărului de repetiţii în genomul celulelor eucariote există mai multe tipuri de secvenţe ADN şi anume: ADN nerepetitiv, ADN moderat repetitiv şi ADN înalt repetitiv.
2.3.2. CLASIFICAREA CROMATINEI ÎN FUNCŢIE DE NUMĂRUL DE REPETIŢII
Analiza secvenţelor ADN care intră în alcătuirea cromatinei a condus la clasificarea acestora în două categorii principale: gene unice sau duplicate şi gene sau secvenţe cu copii multiple.

2.3.2.1. GENE UNICE SAU DUPLICATE. STRUCTURĂ ŞI FUNCŢII

Genele care codifică proteine pot avea o singură copie sau pot să aparţină unor familii de gene. În organismele multicelulare numai 25-50% dintre genele care codifică proteine se găsesc într-o singură copie în genomul haploid.
O a doua categorie de gene sunt genele duplicate, cu secvenţe foarte asemănătoare, dar nu identice, care se află la distanţe de 5 -50 kb una faţă de cealaltă. Un set de gene duplicate care codifică proteine similare, dar cu secvenţe diferite de aminoacizi alcătuiesc o familie de gene, iar proteinele corespunzătoare alcătuiesc o familie de proteine. Unele familii de gene pot să conţină până la câteva sute de membri, dar cele mai comune cuprind până la 30 de tipuri. Exemple de familii de gene sunt cele care codifică proteinele citoscheletului.
Dimensiunile medii ale unei gene dintr-un organism eucariot variază mult, de la mai puţin 1 kb (genele care codifică histone), până la 2300 kb în cazul unei gene care codifică o proteină neuronală sau 2500 kb în cazul genei care codifică distrofina la om (Scherer S., Guide to the Human Genome).
Dimensiunea medie a genelor din organismele vertebrate este de 30 kb, iar în organismul uman 20-50 kb, spre deosebire de bacterii care au gene cu dimensiuni mult mai mici, deoarece conţin numai material codant.
Toate genele sunt alcătuite dintr-o regiune centrală și regiuni laterale sau secvenţe de reglare.

A. REGIUNEA CENTRALĂ SAU CODANTĂ A UNEI GENE
Regiunea centrală poartă numele de „cadru de lectură” sau ORF („open reading frame”). Regiunea centrală a genei este transcrisă integral în ARN mesager precursor prin acţiunea ARN polimerazei II. Această regiune este alcătuită din succesiunea a două tipuri distincte de secvenţe: exoni şi introni, prezente sau nu în versiunea finală a ARNm matur, ce va părăsi nucleul. Pentru descoperirea structurii mozaic a genelor eucariote Richard Roberts şi Philip Sharp au primit premiul Nobel în anul 1993.
Regiunea centrală a genei începe cu situsul de iniţiere al transcrierii, după care urmează o regiune necodantă (transcrisă dar netradusă) cu o lungime de câteva sute de nucleotide denumită 5’UTR („untranslated region”). Această regiune conţine la finalul ei codonul START– AUG, care marchează locul de începere a translaţiei, corespunzând primului aminoacid al lanţului polipeptidic.
După codonul de iniţiere a translaţiei se succed exonii şi intronii care alcătuiesc gena structurală.
Exonii sunt secvenţe transcrise în ARN mesager precursor şi regăsite în molecula ARNm după maturare. Exonii reprezintă regiunile funcţionale din structura genei, care de obicei codifică anumite părţi structurale şi/sau funcţionale distincte ale proteinei, numite domenii. Numărul exonilor variază de la o genă la alta (între 2 şi mai mult de 50) precum şi la diferite organisme.
Intronii sunt secvenţe necodante, transcrise iniţial în ARNm precursor dar secţionate şi eliminate ulterior din ARNm matur, ce va fi alcătuit prin asamblarea exonilor. Numărul intronilor este cu unul mai mic decât cel al exonilor iar lungimea lor este variabilă, neconcordantă cu cea a exonilor, de obicei mult mai mare. Important de precizat este faptul că aproape toţi intronii încep cu dinucleotidele 5' GT şi se termină cu AG 3'. Aceste perechi de nucleotide au rolul unor semnale pentru secţionarea precisă şi corectă a intronilor.
Rolul intronilor nu este încă bine  cunoscut, dar se ştie că numărul şi mărimea lor variază la diferite gene, fiind cel mai adesea mult mai mari în dimensiuni decât exonii pe care îi separă. Până în prezent se cunoaşte că intronii pot să fie implicaţi în procesul de matisare alternativă sau diferenţială în care anumiţi exoni pot fi sau nu incluşi în molecula maturată de ARNm codificată de o anumită genă.
După ultimul exon din regiunea centrală transcrisă a genei există o secvenţă 3' UTR („untranslated region”), necodantă, transcrisă dar netradusă, care începe cu unul dintre codonii stop (TAA, TAG, TGA), responsabili cu oprirea translaţiei sau sintezei proteinei.
La capătul 3’ al secvenţei 3'UTR se găseşte un oligonucleotid având succesiunea bazelor azotate AATAAA, care are rol în stoparea transcrierii şi totodată în poliadenilarea moleculei ARNm (Fig. 2.5). Astfel, la 15-30 nucleotide în aval de acest situs se produce desprinderea moleculei de ARN sintetizate de pe catena matriţă a ADN iar la 10-20 de nucleotide în aval este prezentă o secvenţă CA, la nivelul căreia are loc secţionarea moleculei ARNm, urmată de ataşarea unei oligonucleotide poly A, cu o lungime de 100-250 de nucleotide.
În această regiune 3'UTR sunt prezente şi situsuri care permit legarea anumitor proteine şi molecule miARN implicate în reglarea transcripţiei.

B. REGIUNILE LATERALE SAU SECVENŢELE DE REGLARE ALE UNEI GENE

Regiunea centrală a oricărei gene este flancată de două regiuni laterale, netranscrise, care au rolul de a semnaliza iniţierea transcripţiei de către ARN polimerază şi de a regla intensitatea ei; mutaţiile apărute în aceste regiuni nu modifică structura de aminoacizi a proteinei codificate de genă ci numai nivelul ei de expresie (rata sintezei) (Fig. 2.6).
Regiunea laterală 5' este amplasată în amonte de regiunea centrală a genei, reprezentând locul unde se fixează ARN polimeraza pentru iniţierea transcripţiei. Această regiune poartă numele de promotor şi conţine mai multe elemente (cis-activatoare) cu o secvenţă nucleotidică scurtă şi precis definită. Pe aceste secvenţe se fixează nişte proteine reglatoare (trans-activatoare) denumite factori de transcripţie care au rolul de a regla transcripţia.

Fig. 2.5. Dispunerea regiunilor laterale sau a secvenţelor de reglare ale unei gene eucariote
Promotorul eucariotelor superioare este divizat la rândul lui în regiuni care au structură şi funcţii diferite:
Elementele de bază ale promotorului sunt alcătuite din casetele „TATA box”, „CCAAT box” şi regiunea adiacentă care cuprinde secvenţe reglatoare.
TATA box  (secvenţa TATAAA situată la circa 20-30 bp în amonte de situsul de iniţiere al transcrierii este locul la care ARN polimeraza II se fixează la ADN prin intermediul factorilor de transcripţie. Această secvenţă este prezentă în special la genele cu specificitate de ţesut sau în cazul genelor care se exprimă într-o anumită etapă a ciclului celular. La genele comune (“housekeeping genes”) – funcţionale  în toate ţesuturile, secvenţa TATA este înlocuită de secvenţa GC (sau insule CpG) datorită concentraţiei mari de dinucleotide 5’- CG- 3’. Procesul de formare a complexului transcripţional se va prezenta în capitolul următor.
CAAT box  (secvenţa GGT/CCAAT) este situată în amonte de caseta TATA (la circa 50 -130 bp de situsul de iniţiere a transcrierii) şi fixează alţi factori de transcripţie cum ar fi C/EBP (CCAAT-box/Enhancer Binding Protein).
În regiunea adiacentă mai sunt prezente o serie de elemente care reglează expresia  specifică a anumitor gene fie într-un anumit tip de ţesuturi fie la un anumit stadiu de dezvoltare ontogenetică şi anume elementele de răspuns, activatorii şi inhibitorii,
Elemente de răspuns (RE) care reglează transcripţia unor gene în funcţie de anumite semnale extracelulare ("expresie genică indusă"). Aceste semnale pot fi stimuli externi (molecule nutritive, concentraţia unor ioni, temperatură, şoc) sau semnale de comunicare de la alte celule (hormoni)- care activează anumiţi factori de transcripţie ce se fixează pe elementele de răspuns ale anumitor gene şi determină transcripţia lor temporară;
Activatorii ("enhancers") sunt elemente de reglare pozitivă care măresc nivelul transcripţiei. Funcţia lor nu depinde de localizare (pot fi plasaţi şi în regiunea 3’) sau orientare, fiind determinată mai ales de fixarea unor factori de transcripţie specifici anumitor ţesuturi;
Inhibitorii ("silencers") reduc nivelul transcripţiei şi uneori represează funcţia unor gene.
Acţiunea activatorilor şi inhibitorilor este limitată la o anumită genă de către nişte secvenţe "izolatoare" ("insulators") care blochează răspândirea efectului unor secvenţe care intensifică sau diminuează transcripţia.

Regiunea laterală 3' reprezintă secvenţa netranscrisă, care flanchează
cadrul de citire al genei (ORF) sau zona ei centrală. Această secvenţă nu are un rol structural şi funcţional bine cunoscut, dar se consideră că aici se găsesc secvenţe semnal care afectează procesarea, stabilitatea şi durata de viaţă a ARNm. Totodată se cunoaşte că la unele gene (ex. gena beta-globinei) în această regiune 3' a genei se pot găsi secvenţe reglatoare de tip activator („enhancer”).

2.3.2.2. GENE CU COPII MULTIPLE. STRUCTURA ŞI FUNCŢII

Necesitatea prezenţei unui număr mare de gene identice sau gene cu copii multiple apare în cazul în care molecula ARN transcrisă este direct funcţională (ARNr, ARNt sau snARN), sau proteina codificată este necesară în cantităţi foarte mari în celulă este
S-a demonstrat că o genă unică poate fi matriţă pentru sinteza a 104 molecule ARNm, iar fiecare moleculă ARNm poate fi matriţă pentru sinteza a 105 proteine. Deci o singură genă stă la baza sintezei a 109 molecule de proteine.
Atât la vertebrate cât şi la nevertebrate, genele care codifică ARN ribozomal şi alte tipuri de ARN, cum ar fi cel implicat în procesul de matisare a ARNm apar sub forma unor structuri repetate în tandem. Acestea se diferenţiază de genele duplicate care alcătuiesc familiile de gene deoarece codifică proteine sau molecule de ARN funcţional identice.

ADN ÎNALT REPETITIV
Genele ribosomale se găsesc dispuse în unităţi repetate în tandem localizate în regiunile denumite "organizatori nucleolari", care formează nucleolii în nucleul interfazic (~ 300 copii în genomul uman) Nucleolul se diferențiază de restul nucleului prin densitatea ridicată, datorată unei acumulări de ARN ribozomal, proteine ribozomale și precursori ai ribozomilor.
Genele care codifică ARN ribozomal (ARNr) sunt transcrise cu ajutorul ARN polimerazei I şi codifică trei subunităţi ribosomale 18 S, 5,8 S şi 28 S. Cea de-a patra subunitate ARNr 5S este codificată de gene situate într-o altă regiune a nucleului. Deşi porţiunile transcrise ale genelor ARNr sunt aceleaşi la fiecare individ, regiunile interne transcrise pot să difere (Fig. 2.7).

/
Fig. 2.7. Dispunerea secvenţelor care alcătuiesc unitaţile repetitive care codifică ARN ribosomal
NTS – regiuni netranscrise
ITS – regiuni interne transcrise
ETS – regiuni externe transcrise

Genele ribosomale sunt prezente în copii multiple în genom deoarece în cazul ARN implicat în biogeneza ribosomilor procesul amplificării în cursul translaţiei nu este posibil – aceste molecule de ARN sunt produsul final al transcrierii genelor.
În fiecare celulă şi cu precădere în cele active din punct de vedere metabolic, sinteza proteinelor este accentuată, necesitând un număr mare de ribozomi. Prin urmare sunt necesare cantităţi mari de ARN ribosomal, care să stea la baza formării subunităţilor ribozomale.

ADN MODERAT REPETITIV
Unele dintre secvenţele ADN moderat repetiv codifică anumite proteine, sau ARN, iar altele reprezintă secvenţe necodante, ale căror funcţii sunt mai puţin cunoscute.
Genele pentru ARNt (~ 500 copii în genomul uman) şi alte molecule mici de ARN sunt transcrise cu ajutorul ARN polimarezei III. Se gasesc dispuse în grupe de gene repetate în tandem fiind localizate pe diferiţi cromozomi.
Genele care codifică moleculele ARN de dimensiuni reduse, implicate în procesul de eliminare a intronilor se găsesc într-un număr de ~ 500 copii în genomul uman.
Genele care codifică histone sunt prezente în număr variabil, în funcţie de organism; astfel, la drojdii există doar două copii pentru fiecare tip de histone, la alte specii, de exemplu ariciul de mare se ajunge la un număr de 300-1000 de copii. Caracteristic pentru genele histonice este absenţa intronilor şi a secvenţelor terminale poly(A). S-a emis ipoteza că absenţa acestor structuri ar facilita sinteza şi transportul foarte rapid prin citosol al histonelor.
Un procent foarte mare din ADN genomic este alcătuit din gene sau secvenţe ADN necodante. Astfel se evidenţiază ADN satelit, care are un rol structural și se gaseste în anumite regiuni cromozomiale cum ar fi centromerul, telomerul sau constricțiile secundare, alcătuind heterocromatina constitutivă. Se diferenţiază două tipuri de ADN satelit şi anume:
minisateliţii hipervariabili (sau VNTR de la "variable number of tandem repeats"), alcătuiţi din secvente scurte 10-100 bp, repetate în tandem de 20-50 de ori, dispersate în toţi cromozomii, ocupând anumite regiuni precise, relativ scurte (1-5 kb);
microsateliţii, secvenţe de 1-13 bp (de cele mai multe 2, 3 sau 4 bp), repetate de 10 -100 de ori. Sunt formaţi cel mai adesea din repetiţia unui dinucleotid, dar pot fi și secvențe tri sau tetranucleotidice, cu o structură variabilă, avand o distribuție uniformă în genom. Secvenţa CA este foarte frecventa în genomul uman şi se găseşte la fiecare mie de perechi de baze.
Secventele de mini și micro sateliți pot fi utilizate ca markeri genetici, deoarece sunt specifice fiecarui individ în parte. Se cunoaște că fiecare regiune alcătuită din secvențe scurte repetate se diferențiază din punctul de vedere al numărului de unități repetitive și totodată datorită secvențelor care mărginesc regiunea repetitivă. Pe baza acestor secvențe s-au dezvoltat tehnicile de amprentare, cu utilizare în cartarea genomurilor, analiza cromozomală, evaluarea variabilitații, identificarea speciilor sau a indivizilor și diagnosticul molecular. Se consideră că probabilitatea de a găsi doi indivizi identici, neîrudiți având același profil la nivelul acestor secvenţe este inexistentă.
O altă categorie de secvenţe repetate sunt IRS "interspersed repeated sequences"), alcătuite dintr-un număr mare de copii, răspândite în întregul genom. Acestea sunt cunoscute şi sub numele de secvenţe ADN moderat repetate şi formează 25 – 50% din genom la mamifere şi 45% la om.
Deoarece aceste secvenţe au proprietatea unică de a se deplasa în genom, ele sunt denumite elemente transpozabile mobile, sau transpozoni. Procesul prin care aceste secvenţe sunt copiate şi inserate într-o nouă poziţie în genom poartă numele de transpoziţie.
Dacă transpoziţia apare în celulele germinale, secvenţele transferate în noile poziţii sunt transferate generaţiilor următoare. Astfel, elementele mobile s-au multiplicat şi acumulat în genomul eucariot de-a lungul evoluţiei, constituind acum o parte semnificativă din genomul multor eucariote. Transpozonii nu sunt numai o sursă pentru creşterea cantităţii de ADN din genom, dar constituie un al doilea mecanism care, pe lângă recombinarea meiotică a produs o restructurare a materialului genetic de-a lungul evoluţiei.
Au fost evidenţiate două clase de transpozoni, în funcţie de mecanismul de inserare a secvenţelor ADN.
Clasa I – Retrotranspozoni, sau transpozoni ARN, care acţionează prin copierea unor fragmente ADN şi inserţia lor înapoi în genom, în poziţii multiple (sistemul “copy – paste”). Prima dată are loc copierea secvenţelor retrotranspozonilor în ARN, prin transcripţie, după care are loc un proces de revers-transcripţie prin care molecula de ARN este copiată în ADN, care este inserat înapoi în genom. Retrotranspozonii se comportă similar cu retrovirusurile, conducând la ipoteza posibilei origini evolutive a acestora. Au fost caracterizate trei categorii diferite de retrotranspozoni şi anume:
Retrotranspozonii virali, care codifică revers-transcriptaza şi au secvenţe terminale repetitive cu lungime mare, denumite LTR (“long terminal repeats”).
Retrotranspozonii non-virali, care codifică revers-transcriptaza, dar nu posedă secvenţe terminale repetitive cu lungime mare (LTR), se împart la rândul lor în două categorii:
Secvenţele LINE ("long interspersed repeated sequences") cu lungimeade 6 kb, prezente în circa 900.000 copii, dispersate în genom; Secvenţele LINE sunt probabil implicate în împerecherea corectă a cromozomilor omologi în meioză, ceea ce asigură desfășurarea optimă a acestui proces.
Secvenţele SINE ("short interspersed repeated sequences") sunt secvenţe scurte de 100 – 400 bp, prezente în circa 500.000 de copii (13% din genomul uman), dispersate în cromozomi în 1,6 milioane de situsuri; dintre acestea 1,1 milioane sunt reprezentate de elementele Alu, denumite astfel deoarece conţin un singur situs de recunoaştere pentru enzima de restricţie Alu I. Funcţia lor nu este cunoscută, considerându-se că au o implicare în inițierea replicării în anumite puncte din genom.
Pseudogene, care provin din molecule ARNm maturate (au suferit procesele de eliminare a intronilor şi poliadenilare). Aceste molecule sunt supuse unui proces de revers-transcripţie, după care fragmentul ADN nou sintetizat este inserat înapoi în genom.

Clasa II – Transpozoni ADN, care se diferenţiază de cei din clasa I prin mecanismul lor de transpoziţie, care nu necesită un intermediar ARN. Astfel, transpozonii din clasa II se deplasează printr-un mecanism tăiere-inserare (“cut and paste”), cu ajutorul unei enzime specifice – transpozaza.
Mecanismele de transpoziţie ale diferitelor tipuri de transpozoni sunt descrise amplu în capitolul 3.1.3.2.

2.4. GENOMUL  MITOCONDRIAL
Mitocondriile au dimensiuni destul de mari, astfel că pot fi vizualizate la microscopul optic, iar ADN mitocondrial (ADNmt) poate fi detectat prin microscopie în fluorescenţă.
Studiile comparative au evidenţiat un număr diferit de molecule ADNmt, cu dimensiuni variabile, în mitocondriile diferitelor specii.
De cele mai multe ori genomul mitocondrial al celulelor animale este definit printr-un singur tip de ADN circular, bicatenar format din ~16kb, caracterizat printr-o mare densitate de gene, alcătuite numai din exoni, amplasate pe ambele catene (Fig. 2.8).

Fig. 2.8 Structura genomului mitocondrial al unei celule animale
(După Biochemistry and Molecular Biology, 2005)

La organismele animale ADNmt codifică cele două tipuri de ARNr, care intră în alcătuirea ribozomilor mitocondriali, 22 molecule de ARNt, implicate în procesul de sinteză a proteinelor şi 13 proteine implicate în lanţul de transport al electronilor şi sinteza ATP.
Proteinele sintetizate în mitocondriile celulelor animale sunt identificate ca fiind subunităţi ale unor complexe multimerice necesare în transportul electronilor, sinteza ATP şi inserţia proteinelor în membrana mitocondrială internă sau în spaţiul intermembranar şi sunt sintetizate cu ajutorul ribozomilor mitocondriali. Codul genetic utilizat la sinteza acestor proteine este diferit de cel standard şi poate să difere chiar între specii.
Totuşi, marea majoritate a proteinelor implicate în procesul de respiraţie celulară sunt codificate de ADN nuclear, sintetizate în citosol şi importate în mitocondrii prin procese specializate de transport, care vor fi discutate în capitolele următoare.
Genomul mitocondrial vegetal se diferenţiază de cel animal prin dimensiune şi complexitate. Astfel, în cazul plantei model Arabidopsis thaliana, ADNmt are dimensiuni de 367 kb, iar ADN mitocondrial cu cele mai mari dimensiuni a fost identificat la plante din familia cucurbitaceelor, cu o lungime de aproximativ 2 Mb.
În plus, în cazul celulelor vegetale comparativ cu cele animale, marea majoritate a ADNmt nu codifică proteine. ADNmt vegetal este alcătuit din introni, pseudogene, elemente de ADN mobil, care nu părăsesc mitocondria şi fragmente de ADN străin, provenit de la cloroplaste, ADN nuclear sau viral. Se consideră că aceste fragmente au fost inserate în genomul mitocondrial de-a lungul evoluţiei. Secvenţele duplicate contribuie de asemenea la dimensiunile mari ale ADNmt vegetal.
În mitocondriile celulei vegetale este sintetizat un număr redus de proteine (15-20). Acestea sunt subunităţi componente ale lanţului de transfer al electronilor, sau parte a complexului ATPazic. Restul proteinelor necesare pentru desfăşurarea procesului de respiraţie celulară sunt sintetizate în citozol şi importate în mitocondrii.
O altă caracteristică importantă a moleculelor ADNmt vegetal este aceea că nu conţin un set complet de gene care codifică ARNt, dar conţin un număr de aproximativ 16 gene ARNt, specifice pentru 12-16 aminoacizi. Restul de molecule de ARNt (până la totalul de 20) sunt importate din citozol.
Spre deosebire de celulele animale, în cazul celor vegetale codul genetic utilizat la sinteza proteinelor în mitocondrii este identic cu cel standard.
Trebuie subliniat că atât în cazul celulelor animale cât şi vegetale genomul mitocondrial al zigotului provine exclusiv de la ovul, deci de la mamă. Se poate spune că genele mitocondriale au o transmitere exclusivă pe cale maternă.

2.5. GENOMUL CLOROPLASTIC (ADNcp)

Cloroplastele, de altfel ca toate plastidele au evoluat dintr-o bacterie endosimbiotică fotosintetizatoare ancestrală. Acest eveniment simbiotic care a condus la apariţia cloroplastelor a avut loc mai recent (1,2-1,5 miliarde de ani), comparativ cu cel care a condus la apariţia mitocondriilor (1,5 – 2,2 miliarde de ani). De aceea, în prezent ADNcp prezintă o diversitate mai redusă comparativ cu mitocondriile.
Cloroplastele pot fi întâlnite la toate celulele vegetale, reponsabile cu fotosinteza, astfel că într-o celulă tipică parenchimatică se găsesc în jur de 10-100 cloroplaste.
Similar cu mitocondriile, cloroplastele conţin copii multiple ale genomului cloroplastic (ADNcp) şi ribozomi, care stau la baza sintezei unui număr redus de proteine, pe baza codului genetic standard.
La plantele superioare ADNcp are o lungime de 120-160 Kbp lungime, în funcţie de specie. Studiile iniţiale referitoare la genomul cloroplastic s-au efectuat pe Chlamydomonas reinhardtii, o algă unicelulară cu un ciclu de viaţă scurt, cu un genom mic haploid care este utilizată ca organism model în studiile de fotosinteză. In acest caz a fost identificat un genom circular.
Totuşi, studii recente au arătat ca ADNcp este de fapt alcătuit din concatemeri liniari cu lungime mare, legaţi “cap-coadă”, care suferă o serie de recombinări şi care conduc la nişte structuri aparent circulare, în urma adoptării unor conformaţii specifice (Fig. 2.9).
Studiile asupra ADN cloroplastic au avansat, astfel că în prezent a fost deja determinată secvenţa completă a unui număr mare de ADNcp din plantele superioare.
Numărul mediu de gene se încadrează în intervalul 120 – 135. Astfel, cloroplastele plantei model Arabidopsis thaliana au un genom care cuprinde 76 de gene codante pentru proteine şi 54 de gene care sintetizează ARNr şi ARNt.
Totodată ADNcp codifică subunităţile unei ARN polimeraze asemănătoare cu cea bacteriană, iar multe gene sunt alcătuite din operoni, la fel ca în cazul bacteriilor. Unele gene cloroplastice conţin introni, dar aceştia sunt mai asemănători cu intronii specializaţi găsiţi în unele gene bacteriene şi în genele mitocondriale ale unor fungi şi protozoare, decât cu cei nucleari. Procesul de sinteză a proteinelor cloroplastice se bazează pe codul genetic universal.
Marea majoritate a proteinelor implicate în procesul de fotosinteză sunt codificate de ADN nuclear, sintetizate în citozol şi importate în cloroplastele prin procese specializate de transport, care vor fi discutate în capitolele următoare.
La fel ca în cazul mitocondriilor, genomul cloroplastic provine exclusiv de la ovul, deci transmiterea genelor cloroplastice are o ereditate maternă.
Structura ADNcp, menţionată anterior subliniază înaltul grad de polimorfism, care a permis dezvoltarea unei game largi de markeri moleculari. Este posibilă astfel caracterizarea genetică a unor populaţii, evaluarea diversităţii, stabilirea gradului de înrudire şi totodată analize filogenetice.

Fig. 2.9. Structura ADN cloroplastic şi procesul de replicare ADN, dependent de recombinare (după Biochemistry and Molecular Biology, 2005)

(A) Capătul unui genom monomeric se recombină cu o altă moleculă şi iniţiază replicarea. Dacă se urmează calea (1) este generat un produs concatemeric “cap-coadă”. Are loc apoi secţionarea cu o enzimă de restricţie în două poziţii (situsurile sunt marcate cu ), rezultând genomul cloroplastic; Dacă are loc o recombinare alternativa, din sens opus, este urmată calea (2), rezultând un produs concatemeric “cap-coadă” cu un segment inversat. Gemomul format în cel de-al doilea caz are o lungime mai mare comparativ cu prima variantă.
(B) O structură multigenomică produsă prin replicare dependentă de recombinare.
(C) Forme circulare ale genomului, produse prin recombinare moleculară („flipping”).

CAPITOLUL III

MECANISMELE MOLECULARE
ALE SINTEZEI ŞI PRELUCRĂRII PROTEINELOR

În celulele animale sinteza proteinelor are loc în două compartimente subcelulare, citoplasma şi mitocondriile. În mitocondrii sunt codificate un număr de 10-13 proteine, dar marea majoritate a proteinelor necesare în aceste compartimente sunt sintetizate în citozol şi importate în mitocondrii prin procese specializate de transport. Codul genetic care coordonează sinteza proteinelor în mitocondrii este diferit de cel standard.
În plante, sinteza proteinelor are loc în trei compartimente subcelulare. Citoplasma, plastidele şi mitocondriile conţin sisteme diferite de sinteză a proteinelor. Aproximativ 75% dintre proteinele celulare sunt sintetizate în citoplasmă, unde ARNm este tradus. Într-o celulă activă din punct de vedere fotosintetic (de exemplu celule mezofilice tinere), aproximativ 20% dintre proteine sunt sintetizate în cloroplaste, prin translaţia ARNm transcris după genomul cloroplastic. O proporţie mai mică de proteine (2-5%) sunt sintetizate în mitocondrii, fiind codificate de gene din genomul mitocondrial. În celulele vegetale este respectat codul genetic standard, în toate cele trei compartimente în care au loc sinteze proteice.
În general, mecanismul sintezei proteice este considerat un proces de traducere, translaţie a celor patru litere (A, T, G, C) ale alfabetului acizilor nucleici în alfabetul complet diferit al proteinelor.
Din punct de vedere teoretic secvenţa de aminoacizi dintr-o proteină reprezintă o copie tradusă a secvenţei nucleotidice dintr-un anumit fragment de ADN, între aceste două macromolecule existând o colinearitate.
Acest proces de traducere sau translaţie necesită interacţiunea unui număr mai mare de 100 de macromolecule (ARNm, ARNt, enzime activatoare, factori proteici, ribozomi). Fiecărui aminoacid îi corespunde cel puţin o enzimă activatoare şi cel puţin o moleculă de ARNt.
Sinteza proteică atât la procariote cât şi la eucariote are loc în două etape şi anume:
transcripţia sau transcrierea (transportul informaţiei de la nivelul moleculei ADN la ARNm);
translaţia sau traducerea informaţiei ajunse la nivelul ribozomilor în secvenţe specifice de aminoacizi din lanţul peptidic, care se sintetizează la nivelul respectivilor ribozomi.

În cazul celulelor procariote, atât transcripţia cât şi translaţia au loc în citoplasmă, iar în cazul celulelor eucariote procesele sunt separate în spaţiu, astfel că transcripţia – sinteza ARN se desfăşoară în nucleu, iar translaţia, sau sinteza proteinelor are loc în citoplasmă (Fig. 3.1).

Fig. 3.1. Desfăşurarea proceselor de transcripţie şi translaţie în celula procariotă, respectiv eucariotă
(după http://www.course-notes.org/flashcards/ch_17_from_gene_to_protein)

În ultima perioadă s-a demonstrat că sinteză proteinelor nu se finalizează o dată cu translaţia. După eliberarea lanţului polipeptidic sintetizat la nivelul ribozomilor, pentru a deveni activă, o proteină trebuie să fie supusă unor modificări post-translaţionale de ordin chimic şi conformaţional, în urma cărora devine stabilă şi funcţională. Apoi proteinele sunt orientate spre un organit ţintă cu ajutorul unor secvenţe de localizare. La destinaţie, secvenţele care au avut rolul de a orienta deplasarea proteinei în celulă sunt eliminate, rezultând proteina, în forma funcţională finală (Fig. 3.2).

Fig. 3.2. Procesele care au loc de-a lungul transferului de informaţie, de la genă la proteina funcţional activă

3.1 MECANISMELE MOLECULARE ALE TRANSCRIPȚIEI GENETICE

Transcripţia genetică este un fenomen complex, prin care se asigură transferul informaţiei genetice de la ADN, care serveşte ca matriţă pentru sinteza ARN. Toate tipurile de ARN sunt codificate la nivel de ADN, dar numai ARNm este capabil să transmită mai departe mesajul genetic la proteine.
Transcripţia este mediată de ARN-polimerază, denumită şi ARN-polimerază dependentă de ADN, o enzimă care are capacitatea de a recunoaşte secvențe specifice din molecula de ADN şi de a iniția sinteza unei molecule ARN, pe baza complementarității bazelor azotate.
Spre deosebire de ADN-polimerază, ARN-polimeraza poate realiza sinteza de novo, fără a necesita un primer, ci numai molecula ADN matriţă pe care urmează să o copieze.
În celulele procariote se găsește cel mai adesea o singură ARN-polimerază, iar în celulele eucariote au fost caracterizate trei tipuri, localizate în anumite regiuni ale nucleului, în funcție de produșii finali de sinteză.
În cadrul procesului de transcripţie ARN-polimeraza recunoaşte o secvenţă specifică de nucleotide dintr-o catenă de ADN, denumită promotor, la care se ataşează; apoi, cele doua catene ale ADN se separă printr-un proces de denaturare fiziologică şi începe sinteza unei molecule ARN, în secvenţa căreia sunt prezente ribonucleotide ce stabilesc legături de hidrogen cu ADN, pe baza complementarităţii dintre bazele azotate. Se formează astfel un hibrid ADN-ARN temporar între ADN matriţă şi catena nou sintetizată de ARN. Această catenă ARN este sintetizată întotdeauna în direcţia 5’→3’, catena ADN pe care o copiază fiind orientată în direcţia 3’→ 5’ (Fig. 3.3.).

Fig. 3.3. Desfăşurarea procesului de transcripţie a genelor,
în prezenţa ARN-polimerazei

Astfel, la gruparea OH de la capătul 3’ al catenei ARN în formare sunt adăugaţi ribonucleozid-trifosfaţi, printr-o reacţie de esterificare în urma căreia se eliberează grupări pirofosfat.

/

Teoretic există posibilitatea ca oricare dintre cele două catene ADN care alcătuiesc o genă să fie copiată în câte o moleculă de ARN. Deci, pentru o genă ar exista două molecule de ARN complementare, care ar codifica două proteine diferite. De fapt numai una dintre cele două catene ale genei este transcrisă, deci o genă codifică o singură proteină, promotorul având un rol determinant în acest proces.

3.1.1. MECANISMUL REACŢIEI DE TRANSCRIPŢIE ÎN CELULELE PROCARIOTE
În cazul celulelor procariote materialul genetic este organizat sub forma operonilor, care sunt alcătuiţi din mai multe gene reglate împreună. Pentru transcripţie există o singură ARN-polimerază care este responsabilă pentru sinteza tuturor celor trei specii de ARN (ARNr, ARNm şi ARNt).
Cea mai cunoscută ARN-polimerază, care a stat la baza celor mai complexe studii a fost enzima extrasă şi purificată din celulele bacteriene E. coli. Partea centrală a enzimei are o masă moleculară de 490 kDa şi conţine cinci subunităţi diferite β, β’, αI şi αII şi ω, care alcătuiesc două structuri de bază:
Subunitatea β’, cea mai mare subunitate conţine o parte a centrului activ responsabil pentru sinteza ARN şi totodată structuri pentru interacţiuni nespecifice de secvenţă cu moleculele ADN şi ARN în formare.
Subunitatea β, următoarea subunitate din punctul de vedere al mărimii, conţine restul centrului activ necesar pentru sinteza ARN.
Subunitatea α este prezentă în două copii în fiecare moleculă de ADN polimerază – αI şi αII. Fiecare subunitate conţine două domenii: un domeniu N-terminal, care este implicat în asamblarea enzimei şi un domeniu C-terminal care mediază legarea la promotor.
Subunitatea ω este cea mai mică subunitate care facilitează asamblarea şi stabilizarea ARN polimerazei.
Pentru a se lega la promotor, partea centrală a ARN polimerazei se asociază cu factorul de transcripţie sigma (σ), pentru a forma enzima activă. Factorul σ reduce afinitatea ARN polimerazei pentru secvenţe nespecifice de ADN mărind specificitatea pentru promotor şi permiţând începerea transcripţiei de la situsul corect.
Se poate spune ca enzima activă este alcătuită din 5 subunităţi β'βαI şi αIIωσ, având o masă moleculară de ~450 kDa. În condiţii intracelulare normale, molecula de ARN-polimerază recunoaşte şi se leagă de situsurile de inţiere specifice – promotorii şi transcrie numai una dintre catenele moleculei de ADN.
La procariote regiunea promotor este alcătuită din două secvente: TATAAT localizată pe catena ADN în poziţia -10, în amonte de situs-ul de start pentru sinteza ARNm (+1) şi TTGACA, în poziţia -35. Componenţa regiunii de reglare a genelor în celulele procariote a fost descrisă detaliat în cadrul capitolului 2.2.1.
Legarea ARN-polimerazei la un anumit promotor este determinată de interacţiunea cu proteine de reglare, care afectează abilitatea ei de a recunoaşte situsurile start. Aceste proteine de reglare pot să acţioneze atât ca activatori cât şi ca represori, accesul ARN-polimerazei la regiunea promotor fiind în multe cazuri reglată de interacţiunea lor cu regiunea denumită operator.
Sunt urmate apoi etapele specifice procesului de transcripţie:
Iniţierea transcripţiei
Subunitatea σ se asociază cu partea central a enzimei, având rolul de a menţine enzima într-o conformaţie potrivită pentru a se lega la situsul de inţiere de pe ADN matriţă (la nivelul promotorului).
După ataşarea la ADN matriţă, ARN polimeraza îşi schimbă conformaţia, ceea ce determină separarea celor două catene ADN pe o lungime de aproximativ 13 bp, denumită buclă de transcripţie.
Apoi, nucleozid 5’-trifosfatul de iniţiere formează un complex împreună cu ARN-polimeraza. Acest complex interacţionează cu cel de-al doilea nucleozid 5’- trifosfat formând prima legătură fofodiesterică după următorul mecanism: gruparea OH aflată în poziţia 3’ a primei nucleotide interacţionează cu atomul de fosfor α a celui de-al doilea nucleozid-trifosfat. În urma acestei reacţii se eliberează o moleculă de pirofosfat anorganic (PPi).
Deci, la capătul 5’al moleculei nou sintetizate rămâne o grupare trifosfat, care este specifică oricărei molecule de ARN.
Creşterea şi sinteza catenelor de ARN.
Reacţia continuă după acelaşi mecanism, sinteza realizându-se întotdeauna în direcţia 5’-3’. Se formează tranzitoriu o moleculă hibridă ARN-ADN care nu este stabilă şi de aceea cele două catene se disociază la nivelul buclei de transcripţie.
O dată unite cele două resturi nucleotidice, creşterea catenei are loc rapid, transcripţia făcându-se în direcţia, antiparalelă direcţiei 3’-5’ din catena de ADN matriţă. În cursul creşterii, un segment de ARN nou sintetizat formează un duplex hibrid ARN-ADN complementar, de tranziţie, mult mai puţin stabil decât duplexurile ADN-ADN. De aceea catena de ARN are tendinţa de a se separa de ADN la bifurcaţia de transcripţie.
După sinteza unui fragment cu lungimea de 8-9 nucleotide factorul σ disociază de restul ARN-polimerazei. Subunităţile rămase ale enzimei continuă sinteza, iar factorul σ va putea să participe la iniţierea altor procese de transcripţie. Copierea catenei matriţă de către ARN polimerază are loc până când întâlneşte semnalul de stopare a transcripţiei. Dacă nu ar apărea semnalul de oprire a transcripţiei, acest proces ar continua, până la copierea în totalitate a moleculei ADN. Maturarea sau prelucrarea lanţului ARN are loc în funcţie de tipul celulei în care a avut loc transcripţia şi totodată de tipul de ARN transcris.
Deci, ARN-polimeraza ataşează la capetele 3’–hidroxil ale catenei ARN, unităţi mononucleotidice, sintetizând ARN în direcţia 5’-3’, antiparalelă catenei ADN folosită ca matriţă. Ca în cazul ADN polimerazei, hidroliza enzimatică a pirofosfatului face ca reacţia să decurgă în celulă în sensul sintezei ARN (Fig. 3.4). Secvenţa moleculei ARN nou formată este complementară cu cea a catenei matriţă, cu menţiunea că prezenţa adeninei în ADN va determina introducerea uracilului în catena ARN.

Fig. 3.4. Mecanismul molecular al reacţiei de transcripţie
3.1.2. MECANISMUL MOLECULAR AL REACŢIEI DE TRANSCRIPŢIE ÎN CELULELE EUCARIOTE

Mecanismul de sinteză a unei noi molecule ARN, avînd ca matriţă ADN este identic în celulele eucariote cu cel al procariotelor. La eucariote însă aparatul de transcripţie este mult mai complex şi mai puţin cunoscut decât la procariote. Într-o celulă eucariotă există trei tipuri de ARN-polimeraze nucleare în celulele animale şi cinci în celulele vegetale. Ele ocupă poziţii distincte în spaţiul nuclear şi fiecare tip de enzimă prezintă o structură complexă (Tabel 3.1 )

Tabel 3.1 Caracterizarea şi localizarea ARN-polimerazelor nucleare
Tipul polimerazei
Localizare celulară
Produşi finali

ARN-polimeraza I
nucleol
ARNr 45S, care se maturează în ARNr 28S, 18S şi 5,8 S

ARN-polimeraza II
nucleoplasmă
ARNm, snARN şi miARN

ARN-polimeraza III
Clasa1
nucleoplasmă
ARNr 5S


Clasa 2
nucleoplasmă
ARNt


Clasa 3
nucleoplasmă
alte molecule de ARN de dimensiuni mici nuclar sau citoplasmatic

ARN-polimeraza IV
nucleoplasmă
siRNA în plante

ARN-polimeraza V
nucleoplasmă
Molecule ARN implicate în formarea heterocromatinei în plante, mediate de siRNA


Atât în mitocondrii cât şi în cloroplastele eucariote a fost evidenţiat un mecanism diferit de transcripţie, mediat de o ARN polimerază care face parte din familia enzimelor cu o singură subunitate. Aceste enzime par să provină dintr-o linie evolutivă diferită faţă de ARN polimerazele nucleare, având ca origine virusurile.
În celulele animale ARN-polimeraza I este localizată in nucleol, iar celelalte două se găsesc în nucleoplasmă. Cele trei ADN polimeraze prezente in nucleu sunt alcătuite din mai multe subunităti polipeptidice, având mase moleculare de cel puţin 500 kDa. Fiecare celulă eucariotă conţine între 2×104 şi 2,3 x107 molecule de ARN-polimeraze. Celulele mamiferelor conţin aproximativ 4 x104 molecule de ARN-polimerază I şi aproape acelaşi număr de molecule de ARN-polimerază III. Numărul lor depinde totuşi de rata creşterii şi de gradul de diferenţiere al celulelor respective.
Mecanismul reacţiei de transcripţie este similar celui din celulele procariote, având însă câteva deosebiri esenţiale. La eucariote transcripţia se produce pe ADN legat în nucleozomi. Pentru ca ARN polimeraza să se poată lega la promotori este necesar ca molecula de ADN să sufere nişte modificări de conformaţie. Totodată, în cazul celulelor eucariote se sintetizează precursori ai ARN, care necesită procese de maturare complexe. Există numai câteva specii de ADN mici şi stabile, transcrise de ARN-polimeraza III, care nu suferă procese de maturare.
Spre deosebire de procariote, în celulele eucariote nici unul dintre cele trei tipuri de ARN-polimeraze nu recunosc promotorul în mod direct ci prin intermediul unor factori de transcripţie, iniţiindu-se astfel procesul.
Factorii de transcripţie au aceleaşi funcţii pentru toate tipurile de ARN-polimeraze, numărul lor fiind mai mare în cazul ARN-polimerazei II.
Dacă ARN-polimerazele sunt universale, identice pentru toate celulele şi ţesuturile, factorii de transcripţie sunt specifici pentru anumite ţesuturi. Ei joacă un rol important în diferenţierea celulară şi menţinerea tipurilor de celule.
Pe lângă aceşti factori de transcripţie, implicaţi direct în sinteza ARN există şi proteine care reglează desfăşurarea procesului, în sensul că îl intensifică, atenuează sau blochează. Acestea sunt proteine reglatoare, care similar cu factorii de transcripţie au capacitatea de a se lega la ADN. În această categorie de proteine intră receptorii hormonali steroidici, care transportă hormonii în nucleu şi interacţionează cu secvenţele specifice ADN, iniţiind, accelerând sau blocând transcripţia unor gene.

Factorii de transcripţie care intervin în proces sunt proteine multimerice, denumite TFII A, TFII B, etc. Factorul de transcripţie cu cea mai mare dimensiune este TFII D, alcătuit dintr-o proteină de legare la regiunea TATA – TBP („TATA-box-binding protein”) şi 13 factori asociaţi – TAF.
Procesul de transcripţie parcurge în continuare mai multe etape:
Prima dată proteina TBP („TATA-box-binding protein”) se leagă la regiunea TATA, după care este posibilă şi legarea factorului de transcripţie TFII B. Acest factor de transcripţie este o proteină monomerică, de dimensiuni puţin mai reduse comparativ cu TBP. Domeniul C-terminal al factorului de transcripţie intră în contact atât cu TBP, cât şi cu secvenţa ADN, într-o parte a regiunii TATA, în timp de domeniul N-terminal se extinde spre situsul de transcripţie.
Factorul de transcripţie TFII F formează un complex tetrameric cu ARN-polimeraza, după care se leagă la nivelul situsului start al transcrierii.
La complexul TFII F – ARN-polimerază-ADN se leagă şi alţi factori de transcripţie (TFII E şi TFII H), necesari pentru formarea complexului de preiniţiere a transcrierii. Prima dată se leagă TFII E, un complex tetrameric, care crează situsul de legare pentru TFII H, care este un factor multimeric alcătuit din 10 subunităţi.
Activitatea de helicază a unei subunităţi din TFII H, utilizează energia furnizată de hidroliza ATP pentru a desface dublul helix ADN la nivelul situsului start al transcripţiei. Se permite astfel ARN-polimerazei să formeze un complex deschis în care ADN este disociat, iar catena ADN matriţă (care urmează să fie transcrisă) se leagă la situsul activ al polimerazei.
ARN-polimeraza începe sinteza moleculei ARN, cu ajutorul ribonucleozid-trifosfaţilor prezenţi în mediu.
În continuare are loc elongarea transcriptului, după acelaşi mecanism descris în cazul celulelor procariote.

În rezumat putem spune ca transcripţia urmează următorii paşi importanţi: legarea factorilor de transcripţie şi menţinerea duplexului ADN; menţinerea stării active a genei ţintă sub acţiunea altor factori transcripţionali şi legarea ARN-polimerazei; discocierea moleculei ADN şi activarea ARN-polimerazei cu ajutorul energiei furnizate de hidroliza ATP; iniţierea transcripţiei, a sintezei ARN; elongarea transcriptului.
Procesul de transcripţie este specific fiecărui tip de ARN sintetizat, respectiv ARN-polimerază implicate. In urma reacţiilor de transcripţie se formează precursori ai ARN, care suferă apoi multiple procese de prelucrare, pentru a rezulta forma lor activă. Particularităţile fiecărei clase de ARN plimeraze vor fi prezentate în continuare.

MECANISMUL MOLECULAR DE ACŢIUNE AL ARN-POLIMERAZEI I

ARN-polimeraza I este localizată în nucleol şi catalizează în celulele eucariote sinteza a trei tipuri de ARN ribozomal şi anume ARNr 28S, ARNr 18S şi ARNr 5,8S, care vor intra în alcătuirea ribozomilor.
Studiile cele mai ample cu privire la structura şi modul de acţiune
s-au efectuat asupra ARN-polimerazei din celulele animale. În acest caz enzima transcrie genele care codifică ARNr, amplasate în copii multiple pe anumiţi cromozomi, în regiuni speciale denumite organizatori nucleolari. Cromozomii sunt astfel dispuşi în celulă încât toţi organizatorii nucleolari sunt orientaţi într-o anumită regiune, denumită nucleol.
Deci, nucleolul este alcătuit din bucle mari de ADN care provin de la diferiţi cromosomi, fiecare buclă conţinând o serie de copii multiple ale genelor ARNr. În această regiune genele ARNr sunt transcrise cu o viteză foarte mare de către ARN-polimeraza I.
Deoarece au un aranjament repetitiv şi pentru că trascrierea lor are loc cu o viteză foarte mare, genele ARNr dispuse în serie pot fi uşor evidenţiate prin tehnicile de microscopie electronică. Pe o singură genă efectuează transcripţia, în mod succesiv până la 100 de molecule de ARN-polimeraze I, ARN transcris dispunându-se perpendicular pe molecula de ADN. Astfel, fiecare „unitate de transcripţie” are aspectul unui brad, structură uşor de vizualizat. Tot în nucleol ARNr este imediat împachetat cu proteinele ribozomale pentru a genera precursorii ribozomali.

MECANISMUL MOLECULAR AL TRANSCRIERII ARN RIBOZOMAL (ARNr) DE CĂTRE ARN-polimeraza I
Genele ribozomale din nucleul celulelor eucariote au copii multiple repetate în tandem şi codifică precursori ai ARNr. Astfel, genele care codifică cele trei forme ale ARNr şi anume 18S, 5,8 S şi 28 S sunt toate transcrise ca o singură unitate, rezultând un produs cu o lungime foarte mare. Această moleculă conţine, pe lângă cele trei tipuri ARNr şi regiunile interne şi cele externe transcrise (Fig. 2.7).. După aceea acest produs este împărţit în lanţuri polipeptidice mai scurte, necesare pentru asamblarea ribozomilor
Produsul iniţial de transcripţie reprezintă un precursor ARNr, cu masa 45 S, care se scindează apoi în două molecule cu mase de 32, respectiv 20S. Molecula 32 S se scindează la rândul ei, dând naştere moleculelor ARNr 28 S şi 5,8 S. Molecula 20 S va genera în final, după prelucrare molecula ARNr 18 S. Moleculele de ARNr au o conformaţie complexă, alcatuită din regiuni monocatenare si bicatenare, formate datorită unor secvenţe complementare din structura lor.
Moleculele ARNr 28 S, 5,8 S şi 5 S se vor asocia cu proteine şi vor da naştere precursorilor subunităţii ribozomale mari. ARNr 5 S este transcris de o genă separată, care are şi ea copii multiple, amplasate în afara nuleolului.
Molecula ARNr 18 S se va asocia cu proteine şi va da naştere precursorilor subunităţii ribozomale mici.

B. MECANISMUL DE FORMARE A PRECURSORILOR RIBOZOMALI ÎN CELULELE EUCARIOTE
ARNr reprezintă aproximativ 80-85% din cantitatea totală de ARN celular, intrând în structura ribozomilor. Ribozomii sunt particule nucleoproteice citoplasmatice implicate în sinteza proteinelor, contribuind la transformarea mesajului genetic dintr-o secvenţă de ribonucleotide din ARNm într-o secvenţă de aminoacizi din catena polipeptidică.
Ribozomii din celulele eucariote au o constantă de sedimentare de 80S fiind alcătuiţi dintr-o subunitate mică de 40S şi o subunitate mare de 60S. Ribozomii din organitele celulelor eucariote (mitocondrii şi cloroplaste) sunt de tip procariot, avand o constanta de sedimentare de 70S.
Ribozomii conţin 40-60% ARN, restul fiind reprezentat de proteine bazice ribozomale (75-80 tipuri). In medie, diametrul unei particule ribozomale mature este de 12-23 nm.
Imediat după ce a avut loc sinteza moleculelor ARNr, în nucleol începe procesul de formare a precursorilor ribozomali care se vor deplasa în citoplasmă.
În final, subunitatea ribozomală mică conţine o moleculă de ARNr 18 S care se asociază cu 33 tipuri de proteine ribozomale, iar în cea mare se găsesc trei tipuri de ARNr (28 S; 5,8 S şi 5 S) şi 50 tipuri de proteine ribozomale (Fig. 3.5). Molecula ARNr 5S este sintetizată în afara nucleolului şi este transferată după transcripţie la nivelul situsului de formare a precursorilor ribozomali, în nucleol.

Fig. 3.5. Componenţa şi modul de alcătuire a ribozomilor dintr-o celulă eucariotă
MECANISMUL MOLECULAR DE ACŢIUNE AL ARN-POLIMERAZEI III

ARN-polimeraza III este localizată în nucleoplasmă şi catalizează sinteza moleculele ARN cu dimensiuni reduse.
Celulele eucariote conţin un număr mare de molecule de ARN cu o lungime de 300 de nucleotide, sau chiar mai mici. Acestea sunt sintetizate de ARN-polimeraza III, în exteriorul nucleolului.

A. SINTEZA ARN RIBOZOMAL 5S (ARNr 5S)
În plus faţă de subunităţile ARNr 18 S, 5,8 S şi 28 S, care provin din pre-ARNr, celulele eucariote mai conţin o moleculă mică, cu o lungime de 120 de nucleotide, cunoscută ca 5S ARNr.
Aceasta este transcrisă de pe o genă separată, aflată în altă parte pe cromozom (nu în nucleol), dar care posedă şi ea copii multiple.
Produsul primar de transcripţie al acestei gene este funcţional, ceea ce face ARNr 5S unic între celelalte molecule de ARN din celulele eucariote. Secvenţa care codifică acest tip de ARN este înalt conservată, fiind identică în toate celulele şi totodată în mitocondrii şi cloroplaste.

B. SINTEZA ARN DE TRANSFER (ARNt)
ARNt este implicat în activarea aminoacizilor din citoplasmă şi în transportarea lor la locul de sinteză a proteinelor în ribozomi. El constituie aproximativ 15% din totalul ARN din celulă, comparativ cu ARNr care reprezintă 80-85%. Genele care codifică ARNt sunt prezente în copii multiple pe cromozomi, dar ele nu sunt aşa de înalt repetitive ca ARNr 5S.
Prima dată sunt transcrişi precursori ai ARNt care suferă apoi o serie de modificări: micşorarea lungimii, modificări chimice, care să permită adoptarea structurii lor secundare specifice şi totodată să asigure buna lor funcţionare. Prelucrarea precursorilor ARNt are loc prin modificarea lungimii – scurtare cu 30-40 de nucleotide şi totodată metilarea unui număr mare de baze azotate.
În mod practic s-a constatat că moleculele de ARNt conţin multe baze rare, dintre care cele mai multe sunt formele metilate ale nucleozidelor uzuale. Se consideră că metilarea are loc după transcripţie şi are ca scop:
să împiedice formarea de legături de hidrogen, în anumite puncte, între bazele complementare ale aceleiaşi molecule de ARNt, în aşa fel încât să poată rezulta structura secundară caracteristică.
Să nu permită formarea de legături de hidrogen între bazele complementare din moleculele de ARNt şi ARNm.
Să reducă susceptibilitatea ARNt la atacul hidrolitic al nucleazelor.
Din punctul de vedere al structurii lor primare după prelucrare, există mai multe tipuri diferite de ARNt, cel puţin unul pentru fiecare aminoacid, dar toate au o lungime medie de 75-80 de nucleotide şi prezintă aceiaşi structură secundară.
Secvenţa de nucleotide a diferitelor tipuri de ARNt prezintă regiuni de complementaritate a bazelor azotate, la nivelul cărora se formează regiuni bicatenare, astfel încât macromolecula realizează o structură secundară caracteristică, asemănătoare unei frunze de trifoi. Molecula de ARNt cuprinde patru bucle monocatenare, corespunzătoare celor patru regiuni dublu catenare formate prin împerecherea bazelor azotate complementare. Aceste bucle prezintă o mare importanţă pentru funcţiile ARNt, la nivelul lor fiind localizate o serie de situsuri specifice (Fig 1.9- capitolul 1.1.3.).

C. SINTEZA ALTOR MOLECULE MICI DE ARN
ARN-polimeraza III contribuie şi la transcripţia altor molecule mici de ARN. Acestea sunt de obicei asociate cu proteine specifice şi formează particulele ribonucleoproteice (RNPs). Ele pot funcţiona în nucleu şi atunci poartă numele de particule (snRNP) sau în citoplasmă, purtând denumirea de ribonucleo-proteime citoplasmatice (sc RNPs).
Rolul acestor particule depinde de tipul şi structura lor (Tabelul 3.2)

Tabelul 3.2 Rolul şi localizarea particulelor ribonucleoproteice (RNPs)

Tip
Denumire
Localizare
Funcţie probabilă

snARN
U1, U2, U4, U11, U12
nucleoplasmă
Matisarea pre-ARNm


U7
nucleoplasmă
Procesarea pre-ARNm histonic
Ataşarea capetelor poly A

snARN
U3, U8, U13
nucleol
Procesarea pre-ARNr


microARN

nucleoplasmă
Reglarea genelor

Alte molecule ARN mici
RNaza P

nucleoplasmă, cloroplaste,
mitocondrii
Procesarea pre-ARNt


7SL
citoplasmă
Transportul proteinelor



MECANISMUL MOLECULAR DE ACŢIUNE AL ARN-POLIMERAZEI II

ARN-polimeraza II este localizată în nucleoplasmă şi catalizează în principal sinteza moleculelor ARNm. Într-o celulă există o populaţie de molecule ARNm, a cărei structură depinde de genele care sunt transcrise la acel moment şi poate să difere în funcţie de tipul ţesutului, etapa de dezvoltare ontogenetică sau de condiţiile de mediu.
ARN mesager (ARNm) este numit şi ARN informaţional, deoarece este implicat direct în copierea informaţiei genetice de pe matriţa de ADN şi în translaţia ei în proteine. De aceea, în funcţie de mărimea mesajului genetic, moleculele de ARNm pot avea dimensiuni foarte variate. De asemenea, secvenţa primară de nucleotide este caracteristică fiecărui tip de ARNm, în funcţie de mesajul genetic pe care îl poartă.
ARNm se sintetizează în nucleu, prin transcripţia genelor corespunzătoare, sub forma unor precursori pre-ARNm. Aceaste molecule precursoare, reprezentând transcriptul primar al genelor, cuprind regiuni codificatoare (exoni) precum şi regiuni necodificatoare (introni) şi sunt supuse unor serii de modificări post-transcripţionale care au ca scop ataşarea unor structuri specifice la capetele moleculei de ARN şi totodată eliminarea (excizia) intronilor.
După cum s-a arătat în fig. 2.5, structura zonei centrale a unei gene începe cu o regiune netranscrisă, urmată apoi de o regiune transcrisă, dar netradusă în proteină, care se notează de obicei 5’UTR („ 5’untranslated region”). Această regiune începe cu situsul de start al transcrieii şi se încheie înainte de codonul start al translaţiei.
La extremitatea 3’ a precursorilor ARNm se găseşte o secvenţa notată 3'UTR („ 3’untranslated region”), care începe cu codonul stop al translaţiei.
Aceste regiuni transcrise dar netraduse joacă un rol important în prelucrările post-translaţionale, inclusiv în stabilirea eficienţei cu care ARNm se deplasează din nucleu în citoplasmă, în localizarea subcelulară şi în stabilitatea acestuia. Importanţa funcţională a acestor regiuni este subliniată de faptul că apariţia unor mutaţii conduce la apariţia anumitor afecţiuni.

A. STRUCTURA PRECURSORILOR ARNm
Lungimea medie a regiunii 3'UTR este aproximativ constantă în cadrul diferitelor specii, încadrându-se în intervalul 100-200 de nucleotide, în timp ce lungimea medie a secvenţei 3'UTR este mult mai variabilă, de la 200 de nucleotide la plante până la 800 de nucleotide la om.
Regiunea genomică corespunzătoare secvenţelor UTR („untranslated regions”) ale unei molecule ARNm poate să conţină şi introni, mai frecvent la capătul 5' decât 3'. Compoziţia bazelor azotate în cele două regiuni poate de asemenea să difere. Astfel, conţinutul G+C în secvenţa 5'UTR este mai mare, comparativ cu cel din 3'UTR. S-a evidenţiat şi o corelaţie interesantă între conţinutul de G+C în regiunile 3'UTR sau 5'UTR şi prezenţa acestor baze azotate (G şi C) în cea de-a treia poziţie a codonilor care alcătuiesc secvenţa codificatoare. De asemenea s-a constatat o corelaţie negativă între conţinutul G+C în regiunile 3'UTR sau 5'UTR şi lungimea acestora. Astfel se poate spune că genele localizate în regiunile bogate în G şi C ale cromozomilor au regiuni netradusă cu lungimi mai reduse.
Ţinând cont de structura genelor se poate spune că un precursor al ARNm este alcătuit din mai multe regiuni, înainte de a fi prelucrat.
Regiunea netradusă 5’UTR („5’ untranslated region”), cu rol în controlul translaţional;
Regiunea codificatoare: codonul de iniţiere a translaţiei – AUG, secvenţa de nucleotide alcătuită din exoni şi introni şi o secvenţă stop, reprezentată de unul dintre codonii stop- UAA, UGA sau UAG.
Regiunea netradusă 3’UTR („3’ untranslated region”), cu rol în localizarea celulară, transportul ARNm din nucleu în citoplasmă şi stabilitatea ARNm.

B. MODIFICĂRI POST-TRANSLAŢIONALE ALE PRECURSORI-LOR ARNm
Pentru a ajunge la structura finală a moleculei mature, pre-ARNm trebuie să sufere mai multe modificări şi anume: adăugarea unei grupări 7-metil-guanozina (m7Gppp) la capătul 5’, poliadenilarea la capătul 3’ şi eliminarea intronilor sau matisare (”ARN splicing”). Astfel, molecula ARNm poate fi transferată în citoplasmă, unde îşi va îndeplini funcţia de matriţă pentru sinteza lanţurilor polipeptidice.

B1. MODIFICAREA CAPĂTULUI 5’AL MOLECULEI pre-ARNm
Orice tip de moleculă de ARN începe cu un nucleozid 5’ trifosfatat (A sau G), care constituie punctul de pornire al sintezei ARN.
Imediat după începerea transcrierii, la capătul 5’ al pre-ARNm este ataşată o moleculă de 7-metil guanozină, sub acţiunea guanil-transferazei. Se formează astfel o legătură 5’-5’ trifosfat cu primul nucleozid trifosfatat al pre-ARNm (Fig. 3.6).
Acest capăt m7GpppAp protejează molecula ARNm de degradarea enzimatică, fiind implicat și în procesul de transfer în citoplasmă. De asemenea, leagă un factor proteic care este necesar pentru iniţierea sintezei lanţului polipeptidic.

Fig. 3.6 Ataşarea capătului m7Gppp la molecula ARNm

B2. MODIFICAREA CAPĂTULUI 3’ AL MOLECULEI ARNm
După transcripţia completă, la capătul 3’ al moleculei de ARNm se adaugă 100-250 de resturi de acid adenilic (poly A), proces care poartă numele de poliadenilare şi are loc după mecanismul descris în continuare.
Secvenţa 5’–AAUAAA- 3’, amplasată la extremitatea 3’ a regiunii 3’ UTR este recunoscută de un complex alcătuit dintr-o endonuclează şi o polimerază poly A care secţionează pre-ARNm la 10-20 de nucleotide în aval de acest situs şi apoi adaugă 100-250 de resturi adenilate.
Acest capăt poly A stabilizează ARNm împotriva degradărilor exonucleolitice şi este implicat în exportul ARNm din nucleu în citoplasmă şi iniţierea translaţiei.
De asemenea, această caracteristică specifică tuturor moleculelor de ARNm este exploatată în biologia moleculară, stând la baza proceselor de separare a moleculelor de ARNm din ARN total.

B3. ELIMINAREA INTRONILOR SAU MATISAREA (“ARN SPLICING”)
Studiile efectuate asupra ARNm au evidenţiat că acesta are dimensiuni mult mai reduse, comparativ cu ADN pe care l-a transcris.
În anul 1977 s-a demonstrat că, la eucariote, ADN este format din exoni – secvenţe de ADN codificatoare care sunt transcrise şi traduse şi introni – segmente de ADN care sunt transcrise, dar nu sunt traduse, interpuse între secvenţele exonice codificatoare.
Deci ADN este un mozaic alcătuit din introni şi exoni. În cadrul procesului de maturare intronii sunt eliminaţi printr-un proces de înnădire – matisare („ARN splicing”).

Mecanismul reacţiei de eliminare a intronilor – ARN splicing
Poziţia 5’ de secţionare este reprezentată de o secvenţă GU, care separă intronul 1 de primul exon. În poziţia de secţionare 3’, este prezentă o secvenţă AG. În interiorul fiecărui intron există un punct de ramificare („branch point”) care este reprezentat de un adenozin-fosfat.
Între poziţia 5’ de secţionare şi punctul de ramificare, in interiorul intronilor sunt prezente secvenţe bogate în UA. Între punctul de ramificare şi poziţia 3’ de secţionare secvenţele sunt bogate în uridin-fosfat.
În prima etapă gruparea hidroxil de la un atom de C2’ al nucleotidei care constituie punctul de ramificare (adenozin-fosfat) atacă nucleofil legătura fosfodiester care leagă ultima nucleotidă a primului exon cu prima nucleotidă a intronului.
Se formează un exon cu o grupare OH liberă la un capăt 3’ şi o structură lariat, în care capătul 5’ al intronului este ataşat printr-o legătură 2’-5’ de nucleotida care constituie punctul de ramificare.
În timpul celei de-a doua etape, gruparea hidroxil 3’ a primului exon atacă nucleofil legătura fosfodiesterică care leagă atomul de C3’ al intronului cu atomul C5’ al celui de-al doilea exon.
Astfel sunt legaţi doi exoni între ei şi se elimină un intron (Fig. 3.7). Energia necesară pentru formarea legăturilor între exoni este furnizată prin desfacerea legăturilor intron – exon.
Procesul de eliminare a intronilor este mediat de molecule mici ribonucleoproteice (snRNP) şi anume: U1, U2, şi U4, U5 şi U6. Aceştia se leagă la situsurile de secţionare/legare formând un complex ribonucleoproteic denumit “spliceosome” de dimensiuni mari (60 S) (Fig. 3.8). Aceşti complecşi identifică puctul de separe dintre introni şi exoni iar, în final, recunosc segmentele reprezentate de exoni pe care le reunesc în ARNm matur.

Fig. 3.7 Mecanismul reacţiei de matisare sau eliminare a intronilor
(„ARN splicing”)

Fig. 3.8 Mecanismul formării complexului ribonucleoproteic (“spliceosome”) în procesul de eliminare a intronilor
(după Yu şi colab., 2011)

In timpul procesului de prelucrare a precursorilor ARN procesul de eliminare a intronilor poate să decurgă diferit faţă de mecanismul descris mai sus şi anume are loc matisarea alternativă sau diferenţială. În cadrul acestui process, descris pentru prima dată în anul 1977, anumiţi exoni pot fi sau nu incluşi în forma finală a moleculei ARNm matur codificat de o anumită genă. În consecinţă proteinele sintetizate vor avea secvenţe diferite de aminoacizi şi uneori pot avea chiar funcţii diferite.
Există mai multe mecanisme de matisare alternativă, dar cel mai adesea se întâlneşte procesul de eliminare a unui exon (“exon skipping”). Astfel, un anumit exon poate fi inclus în molecula de ARNm matur numai în anumite condiţii sau în anumite ţesuturi.
Mecanismul procesului este controlat de proteine specifice care pot funcţiona fie ca activatori ai unui anumit situs de matisare fie ca represori.
Matisarea alternativă apare ca un fenomen normal în celulele eucariote, unde sporesc biodiversitatea proteinelor care pot fi codificate de genom. La om, aproximativ 95% dintre genele multi-exonice suferă procese de matisare alternativă. Astfel este direcţionată sinteza unui număr mult mai mare de proteine decât ar fi de aşteptat de la cele aproximativ 20.000 de gene cunoscute ca gene care codifică proteine.
Unele procese anormale de matisare pot fi implicate şi în apariţia unor boli, sau chiar la dezvoltarea cancerului.

Se pare că intronii au fost prezenţi în genele ancestrale, dar au fost pierduţi în timpul evoluţiei de către organismele cu un ciclu de dezvoltare foarte rapid (eubacterii, drojdii), sub acţiunea unor presiuni de selecţie.
Intronii reprezintă porţiuni mari din moleculele ADN care se pot rupe şi recombina fără a avea vreun efect asupra proteinei codificate de gena respectivă.
Se consideră că în procesul de evoluţie au apărut proteine noi prin rearanjarea exonilor. Acest proces este un mijloc rapid şi eficient de a genera noi gene, deoarece aceste aranjări păstrează unităţile funcţionale, dar permite acestora să interacţioneze într-un mod nou.

Deci, precursorii ARNm suferă modificări complexe, pentru a ajunge la forma de ARN matur, care se deplasează apoi în nucleul, unde stau la baza procesului de sinteză a proteinelor. Centralizarea proceselor de maturare care au loc în nucleu sunt prezentate în Figura 3.9.

Fig. 3.9. Etapele parcurse de molecula ARN, de la transcripţie până la translaţie

3.1.3. MECANISMUL MOLECULAR AL PROCESULUI DE TRANSPOZIŢIE – ELEMENTE TRANSPOZABILE

Deşi elementele transpozabile au fost descoperite pentru prima dată în celulele eucariote, ele se găsesc şi în procariote. Procesul prin care aceste secvenţe sunt copiate şi inserate într-o nouă poziţie în genom poartă numele de transpoziţie.
Dacă transpoziţia apare în celulele germinale, secvenţele transferate în noile poziţii sunt transferate generaţiilor următoare. Astfel, elementele mobile s-au multiplicat şi acumulat de-a lungul evoluţiei, constituind acum o parte semnificativă din genomul multor eucariote.
Transpozonii nu sunt numai o sursă pentru creşterea cantităţii de ADN din genom, dar constituie un al doilea mecanism care, pe lângă recombinarea meiotică produce o restructurare a materialului genetic de-a lungul evoluţiei.
Barbara McClintock a descoperit pentru prima dată elementele mobile, în timpul efectuării unor experimente la porumb, în anii 1940. Ea a caracterizat aceste structuri genice care se pot insera in interiorul anumitor gene, modificând fenotipul. Teoria ei a fost controversată până în momentul în care au fost identificate elemente mobile similare la bacterii, caz în care a fost posibilă caracterizarea secvenţelor specifice de ADN şi a fost descifrată baza moleculară a procesului de transpoziţie.
O dată cu progresul cercetărilor asupra acestor elemente mobile, ele au fost împărţite în două categorii:
elemente transferate direct ca ADN – denumite transpozoni ADN;
elemente la care transferul are loc via un intermediar ARN, care transcrie elementul ADN mobil cu ajutorul ARN-polimerazei şi este apoi convertit din nou într-un fragment ADN bicatenar de către revers-transcriptază, denumite retrotranspozoni sau transpozoni ARN (Fig. 3.10).

Fig. 3.10 Mecanismul de transfer al transpozonilor

3.1.3.1. PROCESUL DE TRANSPOZIŢIE LA PROCARIOTE
Majoritatea elementelor mobile la bacterii sunt de tip ADN. Primele investigaţii moleculare ale elementelor mobile au provenit din studii asupra
unei mutaţii la E. coli, produsă de o inserţie spontană a unei secvenţe cu lungimea de 1- 2 kb în mijlocul unei gene. Această secvenţă a fost denumită secvenţă de inserţie, sau element IS. Apoi au mai fost identificate alte 20 de secvenţe IS la bacterii.
Transpoziţia la bacterii este un proces care apare rar, deoarece de obicei acest proces inactivează gene metabolice esenţiale, care conduc la moartea celulelor. Structura generală a elementelor IS este prezentată în Figura 3.11.

Fig. 3.11. Structura generală a unui element de inserţie (IS) bacterian

Intotdeauna la ambele capete al situsului de inserţie este prezentă o repetiţie inversă („inverted repeat”), cu lungimea de 50 bp. Într-o astfel de structură, secvenţa 5’-3’ a unei catene este repetată în secvenţa complementară după cum urmează:

Între repetiţiile inverse este amplasată o regiune care codifică transpozaza, o enzimă necesară pentru transpoziţia elementului IS într-un nou situs.
La cele două extremităţi, lîngă repetiţiile inverse sunt amplasate secvenţe denumite repetiţii directe („direct repeat”), cu lungimi de 5-11bp. Lungimea repetiţiilor directe depinde de fiecare tip de element IS, dar secvenţele lor depind de de situsul ţintă în care se inserează o copie a IS.
Inserţia unui astfel de element are loc după mecanismul „cut and paste”. Transpozaza mediază trei procese şi anume: (1) excizează foarte precis elementul IS din ADN donor; (2) produce secţionări în ADN ţintă; (3) inserează elementul IS în ADN ţintă.
În acest fel elementul IS a fost transferat într-un nou situs în genom, unde se menţine pe parcursul proceselor de multiplicare bacteriană, până la momentul la care suferă o nouă transpoziţie.

3.1.3.2. PROCESUL DE TRANSPOZIŢIE LA EUCARIOTE

În celulele eucariote, spre deosebire de procariote au fost evidenţiaţi atât transpozoni ADN, cât şi retrotranspozoni (transpozoni ARN).

A. TRANSPOZONI ADN
Mulţi ani după ce Barbara McClintock a studiat efectul transpozonilor asupra fenotipului la porumb, experimentele de clonare şi secvenţiere au demonstrat care este structura transpozonilor ADN. Ei conţin o secvenţa terminală denumită repetiţie inversă, care flanchează regiunea codificatoare pentru o transpozază. Această enzimă recunoaşte secvenţele terminale repetate şi catalizează transpoziţia într-un alt situs din genom.
Transpoziţia ADN, care are loc după mecanismul „cut and paste” poate să conducă la creşterea numărului de copii ale transpozonului dacă apare în timpul fazei S a ciclului celular, atunci când are loc sinteza ADN.
Acest fenomen are loc atunci când secvenţa mobilă provine dintr-una dintre cele două catene ADN, dintr-o regiune cromozomală care a fost deja replicată şi ADN ţintă se află în regiunea care nu a fost încă replicată. La finalizarea procesului de replicare, la sfârşitul fazei S, secvenţa mobilă ajunsă în noua locaţie va fi de asemenea replicată, conducând la o creştere semnificativă a numărului de transpozoni din celulă.
Atunci când o astfel de transpoziţie apare înaintea meiozei, una dintre cele patru celule germinale produse conţine copii suplimentare ale transpozonilor. Repetarea acestui proces de-a lungul evoluţiei a condus la acumularea unui număr mare de transpozoni ADN în genomul unor organisme. ADN uman conţine aproximativ 300.000 de copii de transpozoni cu secvenţă totală sau parţială, constituind aproximativ 3% din genom.

B.TRANSPOZONI ARN

Retrotranspozonii sau transpozonii ARN actíonează după sistemul “copy -paste”, care constă în copiere şi ataşare înapoi în genom, în poziţii multiple.
Ca o primă etapă a unui astfel de proces se constituie transcripţia secvenţei mobile (retrotranspozon) într-o moleculă de ARN complementară. Apoi are loc un proces de revers-transcripţie, în care molecula de ARN este transformată din nou în ADN, care este inserat înapoi în genom. Retrotranspozonii se comportă similar cu retrovirusurile, conducând la ipoteza posibilei origini evolutive a acestora. Au fost caracterizate trei categorii diferite de retrotranspozoni si anume:

Retrotranspozonii virali

Retrotransozonii virali sunt alcătuiţi dintr-o regiune codificatoare, cu o lungime de 6 – 11 kb, care conţine toate genele specifice retrovirusurile, mai puţin cele care codifică proteinele învelişului viral (revers-transcriptaza, transpozaze). Această regiune este mărginită de secvenţe terminale repetitive cu lungime mare, denumite LTR („long terminal repeats”), de asemenea specifice retrovirusurilor. Aceste fragmente, cu lungimi de 250-600 bp sunt caracteristice pentru integrarea ADN viral şi critice pentru ciclul de viaţa al retrovirusului. La ambele extremităţi sunt amplasate repetiţii directe care funcţionează ca de situs specific de inserţie sau situs ţintă (Fig. 3.12).

Fig. 3.12 Structura generală a unui retrotranspozon LTR
(„long terminal repeats”),

Mecanismul după care are loc transpoziţia este complex, fiind exploatate atât sistemele enzimatice ale celulei cât şi cele codificate de transpozon.
Secvenţa LTR stângă funcţionează ca un promotor care direcţionează ARN-polimeraza celulară să iniţieze transcripţia. După finalizarea procesului, extremitatea stângă a ARN (corespunzătoare secvenţei LTR din partea dreaptă) direcţionează enzimele care procesează ARN din celula gazdă să secţioneze transcriptul primar şi să adauge secvenţa poly A, la capătul 3’.
Molecula ARNm astfel prelucrată este transportată în citoplasmă, unde are loc copierea într-o moleculă ADN, cu ajutorul revers-transcriptazei sintetizate anterior. Fragmentul ADN este transportat din nou în nucleu şi inserat în genom cu ajutorul transpozazei.
Mecanismul de acţiune este similar cu cel al retrovirusurilor, al căror material genetic este copiat, transformat şi apoi inserat în genom.

Retrotranspozoni non-virali

Retrotranspozonii non-virali alcătuiesc clasa celor mai abundente elemente mobile din genomul uman, care codifica revers-transcriptaza, dar nu poseda secvente terminale repetitive cu lungime mare (LTR).
Aceste secvenţe mobile sunt moderat repetate şi formează două clase în genomul mamiferelor: secvenţele LINE ("long interspersed repeated sequences"), cu o lungime de 6kb, transcrise de ARN-polimeraza II si SINE ("short interspersed repeated sequences"), cu o lungime de 300bp, transcrise de RNA polimeraza III, având un sistem de acţiune similar.

LINE ("long interspersed repeated sequences")
ADN uman poate conţine trei mari familii majore de secvenţe LINE, care au mecanisme de transpoziţie similare, dar diferă în funcţie de secvenţă: L1, L2, L3. In prezent, în genomul uman se mai întâlneşte numai familia L1, pentru celelalte două nu au mai fost identificate copii funcţionale.
Secvenţele LINE constituie 21% din genom, fiind inserate în 900.000 de poziţii. Ele sunt flancate de situsuri specifice de inserţie (situsuri ţintă), alcătuite din repetiţii directe şi o regiune centrală cu o lungime de 6 kb. Regiunea centrală conţine două cadre de citire ORF („open reading frames”): ORF 1, cu o lungime de 1 kb, care codifică o proteină de legare a ARN şi ORF 2, cu o lungime de 4 kb, care codifică o proteină care prezintă o omologie înaltă cu revers-transcriptaza retrovirusurilor şi a transpozonilor virali, dar prezintă în plus activitate endonucleazică (Fig. 3.13).

Fig. 3.13. Structura generală a unei secvenţe LINE
("long interspersed repeated sequences")

Mecanismul de acţiune al secvenţelor LINE diferă de cel al retrotanspozonilor, deoarece nu conţin secvenţe terminale repetitive cu lungime mare – LTR („long terminal repeats”), care să medieze procesul de transcripţie şi de inserare în noul situs.
În cazul secvenţelor LINE, genele care alcătuiesc regiunile ORF 1 şi ORF 2 sunt transcrise cu ajutorul ARN-polimerazei celulare, care este direcţionată de către un promotor, amplasat în partea stângă a secvenţei ADN-LINE, reprezentat de o regiune bogată în A/T.
Apoi ARN-LINE este poliadenilat de către mecanismele celulare specifice şi exportat în citozol, unde sunt sintetizate proteinele ORF 1 şi ORF 2. Copii multiple ale proteinei ORF 1, se leagă la ARN-LINE, iar proteinele ORF 2 se leagă la secvenţa poly A. Sub această formă, ARN-LINE este transportat înapoi în nucleu ca un complex cu proteinele ORF 1 şi ORF 2 şi este revers- transcris în nucleu de către proteina ORF 2.
Mecanismul de inserţie presupune parcurgerea mai multor etape:
Proteina ORF 2 produce o secţionare a a ADN cromosomal, la nivelul unei catene, într-o regiune bogată în A/T;
Molecula ARN-LINE se ataşează la această catenă bogată în T (generată prin secţionarea decalată) a ADN cromozomal, denumită regiunea monocatenară inferioară, prin secvenţa proprie poly A;
Revers-transcriptaza copiază ARN-LINE, având ca primer catena ADN cromosomal care a fost secţionată;
ORF 2 transcrie ARN-LINE şi apoi începe să copieze regiunea monocatenară superioară a cromozomului;
Enzimele celulare hidrolizează apoi ARN şi extind capătul 3’ al ADN cromozomal, înlocuind catena ARN LINE cu ADN.
Un proces complet conduce la inserţia unei copii a retrotanspozonilor într-un situs nou al ADN cromozomal. O regiune scurtă, cu repetiţii directe este generată la situsul de inserţie, datorită clivării iniţiale a două catene de ADN cromozomal, fără a necesita integrază pentru inserare.

SINE ("short interspersed repeated sequences")
ADN uman conţine 13% secvenţe SINE ("short interspersed repeated sequences"), care apar în aproximativ 1,6 milioane de situsuri.
Acestea variază în lungime de la 100 la 400 bp, nu codifică proteine, dar majoritatea conţin un capăt 3’ bogat în secvenţe A/T similare cu cele ale secvenţelor LINE.
Secvenţele SINE sunt transcrise de aceiaşi ARN-polimerază nucleară care transcrie genele care codifică ARNt, 5S ARNr şi alte molecule mici ARN –ARN-polimeraza III. Se consideră că proteinele ORF 1 şi ORF 2, codificate de secvenţele LINE mediază şi revers-transcripţia şi integrarea, după acelaşi mecanism. În consecinţă, secventele SINE pot fi considerate ca paraziţi ai secvenţelor LINE, concurînd cu acestea în procesele menţionate.
1,1 milioane dintre secventele SINE sunt elemente Alu, denumite astfel deoarece conţin un singur situs de recunoaştere pentru enzima de restricţie Alu I. Aceste elemente prezintă o omologie de secvenţă considerabilă şi probabil au evoluat dintr-un tip de ARN, care formează un complex ribonucleoproteic, denumit particulă de recunoaştere a semnalului (SRP). Această particulă se găseşte în cantităţi mari în celule şi este implicată în dirijarea anumitor proteine spre membrana reticulului endoplasmatic, în timpul transportului co-translaţional (capitolul 3.4.2.). Secvenţele Alu sunt răspândite în genomul uman în poziţii în care inserţia lor nu a afectat expresia genelor şi anume: între gene, în introni, în regiunile 3 netraduse ale unor molecule ARNm.

Pseudogene
În plus faţă de elementele mobile prezentate, mai există o largă varietate de molecule ARNm care sunt integrate în ADN cromosomal. Deoarece acestor secvenţe le lipsesc intronii şi nu posedă regiuni de flancare similare cu cele ale genelor funcţionale, se consideră că ele nu pot fi simple gene duplicate care au devenit nefuncţionale. De fapt ele par să fie retrotranspozoni ai unor molecule ARN prelucrate (maturate) şi de aceea poartă numele de pseudogene. Majoritatea pseudogenelor sunt flancate de repetiţii directe scurte, care menţin ipoteza că au fost generate de evenimente de retrotranspoziţie care au implicat ARNm celular.
Aceste molecule sunt supuse unui proces de revers-transcripţie, după care, fragmentul ADN nou sintetizat este inserat înapoi în genom.
Alte tipuri de secvenţe sunt cele care reprezintă copii parţiale ale unor molecule ARN de dimensiuni reduse, cum ar fi snARN şi ARNt. Similar cu pseudogenele procesate derivate de la ARNm, aceste copii nefuncţionale sunt flancate de repetiţii directe scurte şi cel mai probabil rezultă din evenimente de retrotranspoziţie rare, care s-au acumulat în cursul evoluţiei.
Analizând modul de acţiune al secvenţelor mobile se poate spune că secvenţa ADN a unui retrotranspozon viral (LTR) este sintetizată din forma sa ARN în citozol şi transportată apoi în nucleu unde este integrată în ADN cromozomal de către integraza codificată de retrotranspozon. În contrast, forma ADN a unui retrotranspozon neviral este sintetizată în nucleu, fără a necesita integrază pentru inserţia în genom.
Toate tipurile de transpozoni au avut o contribuţie majoră la evoluţia organismelor deoarece au contribuit la mai multe procese cum ar fi:
Generarea unor familii de gene prin duplicare;
Crearea unor gene noi prin modificarea exonilor existenţi;
Formarea unor regiuni de reglare mai complexe care permit un control diferit al expresiei genelor;
În prezent cercetătorii acordă o atenţie deosebită posibilităţii de exploatare a mecanismelor transpoziţiei pentru inserarea unor gene terapeutice ca o formă a terapiei genice, sau pentru identificarea unor gene la plante.
3.1.4 REGLAREA EXPRESIEI GENELOR

Celulele oricărui organism, indiferent de structura şi funcţia lor, posedă aceeaşi informaţie genetică, deoarece rezultă prin mitoze succesive din zigot, dar expresia genică este diferită. Unele gene, constitutive („housekeeping genes”) sunt exprimate în toate tipurile de celule, în toate etapele de dezvoltare, deoarece codifică proteine necesare permanent în celule. Altele au specificitate de ţesut, sunt exprimate în stadii diferite ale dezvoltării, diferenţierii, ciclului celular sau sunt complet şi permanent inactivate.
Din această cauză a fost necesară dezvoltarea unor sisteme foarte complexe de reglare a genelor. Mecanismele de reglare a expresiei genelor au fost descifrate iniţial la procariote; ele se bazează pe celebrul “model al operonului” descris în 1961 de către Jacob şi Monod la E. coli. (Premiul Nobel, 1965).
Operonii cuprind într-o singură unitate funcţională mai multe gene structurale care codifică enzime diferite, implicate în acelaşi lanţ metabolic, precum şi gene de reglare a transcrierii. Genele reglatoare produc prin intermediul unor substanţe (represori) inactivarea sau activarea genelor structurale, de obicei sub acţiunea unor factori de mediu (inductori, co-represori).
Mecanismele de reglare evidenţiate la procariote nu sunt valabile în totalitate la eucariote, datorită dimensiunilor mult mai mari ale genomului şi împachetării complexe pe care o suferă fibrele de cromatină în nucleu. In acest caz mecanismele de reglare sunt mult mai complexe şi acţionează asupra tuturor etapelor parcurse până la obţinerea unei proteine funcţionale. Astfel a fost evidenţiată o reglare pre-transcripţională, transcripţională, pos-transcripţională, translaţională şi post-translaţională.

3.1.4.1. REGLAREA PRE-TRANSCRIPŢIONALĂ A EXPRESIEI GENICE
In nucleul celulelor eucariote, moleculele de ADN formează cu histonele structuri compacte sub forma fibrelor de cromatină. Pentru a fi posibilă iniţierea transcrierii este necesară modificarea structurii cromatinei, astfel încât factorii de expresie să poată interacţiona cu promotorii. Aceste modificări structurale sunt în general datorate unor modificări ale histonelor sau metilării ADN. Aceste modificări sunt reversibile, ceea ce le face extrem de utile în reglarea expresiei genice şi totodată au un potenţial ereditar, adică se pot transmite de la o generaţie la alta, precum şi în cursul diviziunilor celulare.

A. MODIFICĂRI CHIMICE
Modificările histonelor se asociază cu modificări ale structurii cromatinei. Atunci când cromatina se află într-o conformaţie puternic condensată, cu nucleozomi strâns legaţi între ei cu ajutorul histonei H1, este inactivă transcripţional. În schimb cromatina adoptă o conformaţie mai relaxată atunci când histonele suferă procese de metilare, acetilare sau fosforilare. Aceste reacţii au loc asupra capetelor aminoterminale, bogate în aminoacizi precum lizina, arginina şi serina, în special ale histonelor H3 şi H4, fiecare dintre aceste reacţii interesând specific anumiţi aminoacizi.
Un proces important este acetilarea histonelor produsă de enzimele histon-acetil transferaze (HAT) care disociază molecula ADN de pe complexul histonic, permiţând începerea transcrierii.
O întelegere a modului în care procesele de modificare a histonelor pot să influențeze structura cromatinei a avut loc atunci când a fost descifrată structura nucleosomului cu ajutorul razelor X cu rezoluție înaltă, în anul 1997.

În genomul uman metilarea ADN are loc aproape exclusiv în poziţia 5' a citozinei care face parte din grupul dinucleotidelor CpG, concentrate în anumite regiuni denumite insule CpG. Aceste secvenţe sunt localizate foarte adesea la nivelul regiunilor promotor a numeroase gene, precum şi în interiorul unor gene. Reacţiile de metilare sunt mediate de enzime specifice de tipul ADN-metil-transferazelor şi ADN-demetilazelor, care au rolul de a adauga sau elimina grupări metil în poziţii specifice ale bazelor azotate.
In general genele inactive au ADN metilat şi histone deacetilate, ceea ce conduce la o creştere a gradului de condensare a cromatinei. În momentul în care o genă devine activă, grupările metil suplimentare de la nucleotidele care alcătuiesc promotorul sunt eliminate, iar histonele sunt acetilate.
Se consideră că prezenţa grupărilor metil ataşate la ADN poate inhiba legarea factorilor de transcripţie la secvenţele lor ţintă. În al doilea rând, represarea expresiei genice poate fi mediată de către o serie de proteine care au capacitatea de a recunoaşte şi a se lega specific la grupările metil ataşate citozinei.
Aceste modificări în expresia genelor, care nu implică schimbări în secvenţa nucleotidelor, dar se manifestă ca markeri chimici, adăugaţi după replicare, fie la ADN, fie la proteinele care intră în alcătuirea cromatinei constituie obiectul unei noi ştiinţe, EPIGENETICA.
S-a constatat că genele comune (“housekeeping genes”) au regiuni bogate în secvenţe CpG în regiunea promotorului, care sunt nemetilate în toate tipurile de celule, în timp ce genele cu specificitate de ţesut sunt metilate în toate ţesuturile, cu excepţia celui în care genele sunt exprimate. Aceste modele de metilare sunt evident corelate cu expresia genelor.
În plus, s-a demonstrat că cele mai eficiente mecanisme de inactivare a genelor implică metilarea ADN. Modelul de metilare este stabilit încă din fază embrionară şi se menţine pe tot parcursul vieţii.

B. MODIFICĂRI STRUCTURALE
Structura ADN nu este fixă, rigidă, ea poate suferi o serie de modificări conformaţionale care influenţează interacţiunea dintre anumite secvenţe ale ADN şi diferite molecule exogene reglatoare. Trecerea moleculei ADN care intră în alcătuirea unor gene de la forma B la forma Z ar putea fi vitală pentru reglarea activităţii genice.

3.1.4.2. REGLAREA TRANSCRIPŢIONALĂ

A. REGLAREA TRANSCRIPŢIONALĂ INTERNĂ
Controlul transcripţional al expresiei genice vizează reglarea activităţii ARN-polimerazei II, enzima ce transcrie genele care codifică proteine şi sintetizează ARNm. Reglarea transcripţională implică interacţiunea unor proteine – factori trans-reglatori cu secvenţe specifice de pe ADN – elemente cis-reglatoare, proces care determină transcripţia specifică a anumitor gene, într-un anumit moment pentru a se produce o cantitate adecvată dintr-o anumită proteină.

Elementele cis-reglatoare sunt secvenţe scurte de ADN ale căror funcţii sunt limitate la o anumită genă; după fixarea unor factori "trans-reglatori" specifici, denumiţi factori de transcripţie, aceste secvenţe permit recunoaşterea genei de către ARN-polimerază şi reglează specificitatea şi intensitatea transcripţiei, în funcţie de nevoile celulare.
In capitolul 2.3.2.1 au fost descrise elementele reglatoare, care sunt constituite dintr-un promotor, alcătuit din casetele „TATA box”, „”CCAAT box” şi regiunea distală a promotorului. Regiunea distală este alcătuită din elemente de răspuns (RE), care controlează transcripţia unor gene în funcţie de anumite semnale extracelulare (expresie genică indusă), activatorii ("enhancers") care măresc nivelul de bază al transcripţiei iniţiate de promotor şi inhibitorii ("silencers"), care reduc nivelul trascripţiei şi uneori represează funcţia unor gene.
Activatorii pot fi amplasaţi fie în aval, fie în amonte de gena ţintă, sau chair în interiorul genei pe care o controlează. Anumiţi factori de transcripţie, denumiţi proteine care se leagă la activatori ("Enhancer-binding protein") se leagă la aceste regiuni de ADN situate chiar la câteva mii de baze distanţă de gena ţintă, care funcţionează ca activatori, mărind rata de transcripţie. Aceste proteine au un situs care le permite leagarea la activatori şi un altul care se ataşează la factorii de transcripţie legaţi în prealabil la nivelul promotorului. Se formează astfel o structură în formă de buclă, care permite activatorului să acţioneze asupra complexului de transcripţie (Fig. 3.14 ).

Fig. 3.14 Modul de acţiune a activatorilor ("enhancers") asupra transcrierii genelor (TF- factor de trascripţie)

Inhibitorii ("silencers") sunt regiuni de control care, la fel ca activatorii pot fi localizate la mii de baze distanţă de gena pe care o controlează. Totuşi, în momentul în care leagă anumiţi factori de transcripţie, expresia genei controlate este represată.
Se poate spune că atât activatorii cât şi inhibitorii pot să activeze sau să represeze gene situate la distanţe mari, acţionând asupra promotorilor. În această situaţie există posibilitatea ca un activator sau inhibitor să acţioneze asupra unei alte gene decât gena ţintă. Pentru a preîntâmpina o astfel de situaţie, în genom există structuri specifice de ADN denumite secvenţe "izolatoare" ("insulators"), cu o lungime de 42 bp situate între secvenţele activatoare şi promotori, sau între inhibitorii şi promotorii unor gene adiacente. Astfel activarea unei gene de către un alt activator decât cel specific nu mai este posibilă, deci acţiunea activatorilor şi inhibitorilor are o specificitate ridicată, fiind limitată numai la gena ţintă.

Factorii de transcripţie trans-reglatori sunt proteine reglatoare care se fixează pe elementele cis-reglatoare ale ADN, de obicei, în şanţul mare al moleculei ADN dublu helix şi interacţionează cu alţi factori de transcripţie, controlând iniţierea transcripţiei. Toate aceste proteine transcripţionale conţin un domeniu de fixare la ADN prin intermediul cărora proteina recunoaşte atât genele "ţintă" cât şi regiunile de reglare ale acestora şi un domeniu prin intermediul căruia interacţionează cu alţi factori de transcripţie pentru a regla transcripţia. Unele proteine trans pot conţine un al treilea domeniu care este un situs de fixare pentru hormoni, ioni etc.
Fiecare genă posedă "un sistem de reglare" alcătuit din mai mulţi factori transcripţionali care nu sunt însă specifici unei singure gene. Numărul lor este mic dar acţiunea particulară este produsă prin combinaţia specifică a anumitori factori trans şi elemente / secvenţe cis. Situaţia este comparabilă cu scrisul sau muzica, în care un număr limitat de simboluri sau sunete permite o infinitate de combinaţii diferite.

B. REGLAREA TRANSCRIPŢIONALĂ EXTERNĂ
Au fost identificate mecanisme care realizează reglarea transcripţională externă, ca răspuns la molecule semnal extracelulare, numite generic liganzi; aceştia modifică temporar şi reversibil transcripţia unor gene, purtând numele de expresia inductibilă a genelor.
În cazul acestui mecanism de reglare o cale de semnalizare activează specific un factor de transcripţie iniţial inactiv, care se fixează la secvenţele reglatoare specifice, denumite elemente de răspuns (RE), activând transcripţia genei. Pentru ca răspunsul la un stimul să fie imediat este necesar ca factorul transcripţional să fie deja prezent în celulă sub o formă inactivă. Activarea sa se poate face prin mai multe procese şi anume printr-un ligand inductibil sau prin transducţia semnalului.
În cazul activării transcripţiei printr-un ligand inductibil (controlul hormonal al transcripţiei) hormonii hidrofobi cu moleculă mică (de exemplu, hormonii steroizi) difuzează prin membrana celulelor ţintă şi se fixează pe un receptor intracelular care poate fi citoplasmatic sau nuclear. Fixarea ligandului la receptor dă naştere unui complex activ, care se fizează în continuare la elementul de răspuns (RE) localizat în promotorul mai multor gene ţintă şi activează transcripţia lor.
În cazul activării transcrierii prin transducţia semnalului anumiţi factori extracelulari (hormoni peptidici, citokine, neuro-transmiţători), care nu pot trece prin membrană se fixează pe un receptor specific de pe suprafaţa celulei. După fixarea ligandului receptorul îşi schimbă conformaţia spaţială şi devine activ prin activarea unor proteine intermediare, cum ar fi proteina G sau prin intermediul propriei activităţi kinazice. Deci, aceşti liganzi pot declanşa transcripţia unor gene fără a intra în celule.
Semnalul transmis prin activarea transcripţiei unor gene specifice este amplificat în casacadă în cadrul procesului denumit transducţia semnalului, care joacă un rol important în controlul diviziunii celulare, creşterii şi diferenţierii.

3.1.4.3. REGLAREA POST-TRANSCRIPŢIONALĂ

Reglarea expresiei genelor poate avea loc şi prin intermediul unor mecanisme ce pot interveni post-transcripţional, modificând calitativ sau cantitativ formarea ARNm matur. Astfel, există situaţii prin care, pornind de la acelaşi precursor ARN s-au format molecule ARN matur diferite.
Mai frecvent este vorba de eliminarea intronilor sau poliadenilarea alternativă, prin care o genă codifică mai multe proteine; mai rar se întâlneşte “editarea” ARN. Aceste mecanisme, deseori combinate, implică recunoaşterea unor secvenţe specifice din ARN de către proteine sau molecule de ARN reglatoare.
În unele situaţii, în procesul de maturare a precursorilor ARNm se elimină nu numai intronii ci şi unii exoni, printr-un proces de matisare alternativă sau diferenţială (Cap. 3.1.2.3 B3), dând naştere unor proteine diferite pornind de la aceiaşi genă.
De asemenea există numeroase gene care conţin la nivelul regiunii lor 3'UTR două sau mai multe semnale de poliadenilare care pot genera procese de adenilare alternativă, cu specificitate tisulară.
În acest fel, pornind de la un produs de transcripţie primar se formează mai multe molecule diferite de ARNm matur care pot sta la baza sintezei unor proteine diferite.
În plus reglarea postranslaţională poate fi controlată prin stabilitatea produsului de transcripţie. În general, o moleculă de ARNm maturat părăseşte nucleul pentru a furniza matriţa necesară pentru sinteza unei proteine. Dar, unii produşi de transcripţie sunt instabili, deoarece posedă secvenţe care indică degradarea rapidă (predominant, dar nu exclusiv în regiunea 3’ netranslatată).

3.1.4.4. REGLAREA TRANSLAŢIONALĂ

Procesul de reglare translaţională a procesului de sinteză a proteinelor este întâlnit în celulele eucariote, dar mecanismele sunt mai puţin cunoscute.
De exemplu, în multe tipuri de molecule ARNm sunt prezenţi mai mulţi codoni care codifică metionina. În acest caz abilitatea ribozomilor de a recunoaşte şi a iniţia sinteza de la codonul AUG corect poate să afecteze expresia produsului genic.
S-a demonstrat că în câteva situaţii procesul de sinteză al proteinei a fost iniţiat de un alt codon şi nu de codonul start. Acest fenomen a fost evidenţiat de mai multe ori în cazul procariotelor (studii efectuate pe E. coli), dar recent a fost observat şi în cazul procesului de sinteză a proteinelor din celulele eucariote.
În ultimii ani s-a evidenţiat un nou model de reglare a genelor, care implică şi controlul exercitat de molecule ARN de dimensiuni mici, necodante, denumite micro-ARN (miARN).
Aceste molecule pot fi implicate în stabilitatea ARNm, modificări structurale ale cromatinei sau pot să exercite un control la nivelul translaţiei ARNm.
Moleculele micro-ARN (miARN) sunt molecule scurte, non-codante, înalt conservate care apar în genomurile plantelor și animalelor, având lungimi de 17-27 nucleotide. Acestea acţionează post-transcripţional prin legarea la regiunea netradusă 3’UTR („untranslated region”) a unei secvențe de ARNm în cazul celulelor animale, în timp ce în cazul celulelor vegetale are loc asocierea cu porţiuni din regiunea codantă a ARNm. Astfel se produce fie represia genei („gene repression”) – stoparea procesului de translaţie, fie silenţierea genei („gene silencing”) – reducerea expresiei cu cel puţin 70%;
Încă din anul 2009 s-a estimat că există mai mult de 45000 de situsuri ţintă în ARNm uman pentru moleculele miARN. Începând cu anul 2014 s-a creat o bază de date cu secvenţe miARN, cu aproximativ 30000 de probe. Fiecare moleculă miARN are aproximativ 400 de molecule ARNm ţintă, cauzând silenţierea a câteva sute de gene.
Avînd în vedere că există mii de gene care codifică proteine reglate prin intermediul miARN, aceste molecule au fost denumite “master regulators” pentru multe procese biologice.
Dezvoltarea tehnicilor de investigare în genomică din ultimii ani a permis extinderea cercetărilor în domeniul controlului expresiei genelor, fiind cu precădere îndreptate spre studiul bibliotecilor de micro-ARN.

3.1.4.6. REGLAREA POSTRANSLAŢIONALĂ

După ce a avut loc translaţia, proteinele suferă o serie de modificări care includ glicozilarea, acetilarea sau formarea legăturilor bisulfurice, procese care vor fi prezentate în capitolul 3.4.
Totodată, după translaţie şi procesare proteinele sunt orientate spre locul unde îşi vor îndeplini funcţia. Anumite secvenţe ale ARNm localizate la nivelul extremităţilor 5' sau 3' pot determina localizarea ţintită a acestor molecule la nivelul anumitor compartimente ale celulelor.
Multe proteine sunt degradate rapid, în timp ce altele sunt foarte stabile. Se pare ca degradarea rapidă este semnalizată de prezenţa anumitor secvenţe de aminoacizi.
3.2. MECANISMELE MOLECULARE ALE PROCESULUI DE TRANSLAŢIE – SINTEZA PROTEINELOR

După ce moleculele de ARNm au suferit procesele de maturare acestea se deplasează în citoplasmă, unde stau la baza sintezei lanţurilor polipeptidice, alcătuite dintr-un număr de 20 de aminoacizi esenţiali.
Din punct de vedere biochimic lanţurile polipeptidice ar putea fi sintetizate prin alinierea prealabilă a subunităţilor într-o ordine corectă şi apoi legarea simultană a acestora. Dar în celulă procesul nu are loc în acest fel.
Asamblarea proteinelor este un proces care se desfăşoară în etape pornind de la un punct specific. Sinteza are loc într-o singură direcţie, până la un punct terminus, de la capătul amino-terminal spre capătul carboxil.

3.2.1. COMPUŞI IMPLICAŢI ÎN SINTEZA PROTEINELOR

3.2.1.1. ARNm – COD GENETIC
Acizii nucleici sunt polimeri liniari, care conţin patru tipuri de unităţi nucleotidice: adenozin-monofosfat (A), citozin-monofosfat (C), guanozin-monofosfat (G) şi uridin-monofosfat (U).
Deoarece patru nucleotide nu pot specifica aranjarea liniară a 20 de tipuri de aminoacizi, după principiul un nucleotid – un aminoacid, codificarea trebuie făcută de un grup de nucleotide; codul folosit trebuie să fie capabil să specifice cel puţin 20 de variante, deci cei 20 de aminoacizi.
S-a evidenţiat că unitatea de codificare este alcătuită din trei nucleotide, care constituie un codon, fiind astfel posibilă din punct de vedere matematic existenţa a 64 de codoni. Dintre aceştia, 61 specifică un anumit aminoacid, un număr de aminoacizi fiind codificaţi de mai mult decât un singur codon (Tabelul 3.3.).
Semnificaţia fiecărui codon este aceiaşi la toate organismele cunoscute, ceea ce subliniază originea lor comună.

Tabel 3.3. Semnificaţia codului genetic (după Lehlinger, 1992)

PRIMA
BAZĂ
A  DOUA  BAZĂ
A TREIA BAZĂ


U
C
A
G


U
UUU
phe
UCU
ser
UAU
tyr
UGU
cys
U


UUC
phe
UCC
ser
UAC
tyr
UGC
cys
C


UUA
leu
UCA
ser
UAA
stop
UGA*
stop
A


UUG
leu
UCG
ser
UAG
stop
UGG
trp
G

C
CUU
leu
CCU
pro
CAU
his
CGU
arg
U


CUC
leu
CCC
pro
CAC
his
CGC
arg
C


CUA
leu
CCA
pro
CAA
gln
CGA
arg
A


CUG
leu
CCG
pro
CAG
gln
CGG
arg
G

A
AUU
ile
ACU
thr
AAU
asn
AGU
ser
U


AUC
ile
ACC
thr
AAC
asn
AGC
ser
C


AUA
ile
ACA
thr
AAA
lys
AGA
arg
A


AUG
met
ACG
thr
AAG
lys
AGG
arg
G

G
GUU
val
GCU
ala
GAU
asp
GGU
gly
U


GUC
val
GCC
ala
GAC
asp
GGC
gly
C


GUA
val
GCA
ala
GAA
glu
GGA
gly
A


GUG
val
GCG
ala
GAG
glu
GGG
gly
G


Abrevieri pentru aminoacizi
ala  (A)   –   alanina                       gly (G)   –   glicina                        pro (P)   –   prolina
arg  (R)   –   arginina                      his (H)   –   histidina                      ser (S)   –   serina
asn (N)   –   asparagina                  ile (I)     –   isoleucina                     thr (T)   –   treonina
asp (D)   –   acidul aspartic            leu (L)   –   leucina                          trp (W)  –   triptofanul
cys  (C)   –   cisteina                       lys (K)   –   lizina                            tyr (Y)   –   tirozina
gln  (Q)   –   glutamina                   met (M) –   metionina                     val (V)   –   valina
glu  (E)   –   acidul glutamic           phe (F)  –   fenilalanina                   X       –   stop 

Codul genetic are o serie de caracteristici care asigură desfăşurarea în condiţii optime a procesului de sinteză a proteinelor.
Codul genetic este triplet deoarece 3 este prima putere a lui 4 (cele patru tipuri de nucleotide) care formează 64 de combinaţii, suficiente pentru cei 20 de amino acizi care se găsesc în structura proteinelor.
Codul genetic are un codon iniţiator (AUG) şi trei codoni stop (UAA, UAG, UGA), care reprezintă semnalele de început şi de finalizare a sintezei lanţului polipeptidic. Codonii stop sunt numiţi şi "codoni nonsens" deoarece nu codifică nici un aminoacid. Ceilalţi 61 de codoni sunt "codoni  sens" ce codifică cei 20 de aminoacizi.
Codul genetic este degenerat (redundant) deoarece mai mulţi codoni  codifică un acelaşi  aminoacid – "codoni sinonimi".
Cu excepţia metioninei şi triptofanului, care sunt codificaţi de un singur codon, ceilalţi 18 amino acizi sunt codificaţi de 2-6 codoni (deseori deosebiţi prin al treilea nucleotid).
Degenerescenţa nu s-a stabilit la întâmplare deoarece aminoacizii cei mai reprezentaţi în proteine sunt cei care posedă cei mai mulţi codoni şi reprezintă un avantaj pentru celulă, deoarece unele mutaţii genice ce produc codoni sinonimi  nu modifică proteina codificată de genă (mutaţii silenţioase).
Codul genetic este nesuperpozabil, deoarece codonii vecini nu au un nucleotid comun şi fără semne de punctuaţie, deoarece codonii sunt adiacenţi, definiţi de simpla grupare de câte trei. În cazul în care are loc inserţia sau delecţia unui număr de 1 sau 2 nucleotide, cadrul de citire este modificat, iar proteina sintetizată va avea o succesiune total diferită de aminoacizi.
Codul genetic este lipsit de ambiguitate întrucât un codon semnifică întotdeauna un anumit aminoacid, totdeauna acelaşi.
Codul genetic este universal, acelaşi la toate organismele, bacterie, plantă, animal sau om. Singura situaţie în care au fost identificate diferenţe ale codului genetic o reprezintă mitocondriile din celulele animale.
Universalitatea codului genetic are o importanţă deosebită în domeniul manipulării genomului sau al ingineriei genetice, deoarece o genă umană introdusă într-o celulă bacteriană, sau o genă bacteriană introdusă în genomul unei plante vor conduce la sinteza unei proteine identice cu cea din organismul de origine.

ARNt- MOLECULĂ ADAPTOR

Studiile efectuate cu privire la procesul de sinteză a proteinelor nu au evidenţiat posibilitatea recunoaşterii chimice directe dintre bazele azotate ale acizilor nucleici şi aminoacizii specifici. Aceasta înseamnă că tripletele de baze din ARNm nu pot selecta aminoacizii în mod direct. Din acest motiv sunt necesare molecule adaptor, reprezentate de ARN de transfer (ARNt) care să fie implicate în mecanismele celulare de sinteză proteică.
Moleculele de ARNt au rolul de traducători, deoarece ele produc translaţia informaţiei codificate de un codon, într-un aminoacid. Acest lucru este posibil pentru că ARNt conţine anticodonul pentru un anumit aminoacid, iar pe de altă parte, pentru că se leagă specific de acest aminoacid (Fig 3.15).

Fig. 3.15 Relaţia de asociere a unui codon cu un anticodon

Moleculele de ARNt sunt scurte (70-80 de nucleotide) şi au o conformaţie spaţială particulară. Secvenţa de nucleotide la toate tipurile de ARNt (pentru toţi aminoacizii) se termină la capătul 3’cu tripletul CCA, iar aminoacidul se leagă la adenozin-fosfatul teminal al acestui triplet.
In structura moleculei de ARNt este prezent un triplet de nucleozid-fosfaţi, denumit anticodon, care se împerechează prin complementaritatea bazelor azotate cu codonul de pe ARNm. Secvenţa anticodon a moleculei de ARNt determină cu mare precizie, conform codului genetic, aminoacidul pe care il va lega.

Ribozomii, situsul de sinteză a proteinelor
Translaţia ARNm în proteine necesită un dispozitiv molecular complex, care se deplasează de-a lungul ARNm, recunoaşte complexele ARNt – aminoacid, le aşează pe poziţie, după care leagă aminoacizii între ei pentru a forma un lanţ polipeptidic. Un astfel de dispozitiv este constituit de către ribozom.
În celulele eucariote precursorii subunităţilor ribozomale se formează prin asocierea ARNr proaspăt transcris cu proteinele ribozomale, care au fost transportate în nucleu după sinteza lor în citoplasmă. Când sinteza precursorilor ribozomali este terminată în nucleu (mai precis în nucleol), ele se deplasează în citoplasmă, prin intermediul porilor nucleari.
După deplasarea în citozol, precursorii subunităţilor ribozomale se asociază cu alte proteine şi se împachetează în structuri foarte ordonate, subunităţile ribozomale. Aproximativ 40% din masa ribozomilor este reprezentată de proteine.
Fiecare compartiment subcelular în care are loc sinteza proteinelor conţine ribozomii proprii. Astfel, celulele vegetale conţin trei tipuri diferite de ribozomi: citoplasmatici, plastidiali şi mitocondriali. Toţi ribozomii sunt alcătuiţi din cele două subunităţi – subunitatea mică şi subunitatea mare. În funcţie de tipul celulei sau al compartimentului celular în care are loc sinteza, subunităţile ribozomale au o componenţa diferită (Tabelul 3.4).

Tabel 3.4 Compoziţia şi proprietăţile unor tipuri variate de ribozomi

Localizarea
ribozomului
Dimensiunile ribozomului
Dimensiunile subunităţilor
Dimensiunile ARNr
[S]
Numărul de
proteine asociate

Citozolul celulei eucariote
80
40
18
35



60
28; 5,8; 5
50

Plastide
70
30
16
22-31



50
23; 5; 4,5
32-36

Mitocondrii
70
30
18
>25



50
26; 5
>30

Procariote
70
30
16
21



50
23; 5
31

S – constanta de sedimentare [Svedberg]


Atunci când începe sinteza proteică, cele două subunităţi ribozomale se asociază cu o moleculă ARNm, la capătul 5’ al acesteia, generând ribozomul în forma lui activă.
Apoi, ribozomul se deplasează de-a lungul ARNm traducând secvenţa nucleotidică în secvenţa unui lanţ de aminoacizi. Ribozomul utilizează ARNt ca adaptori pentru a adăuga fiecare aminoacid în poziţie corectă, la capătul lanţului polipeptidic. În final, când sinteza este terminată cele două subunităţi ale ribozomului se disociază.
Un ribozom conţine patru situsuri de legare pentru moleculele implicate în sinteza proteinelor: unul pentru molecula de ARNm şi trei denumite A, P şi E pentru ARNt – A, de la aminoacil-ARNt, P de la peptidil şi E – ieşire (exit).
O moleculă de ARNt este menţinută în situsurile A sau P numai dacă anticodonul său se împerechează cu un codon complementar de pe molecula ARNm legată la ribozom (Fig. 3.16).

Fig. 3.16 Reprezentarea grafică a unui ribozom, cu situsurile specifice de legare (după Lehlinger, 1992)

3.2.2. MECANISMUL REACŢIEI DE SINTEZĂ A PROTEINELOR

Sinteza proteică se desfășoară în citosol, pe baza moleculei de ARNm, care transmite informația genetică, cu implicarea moleculelor ARNr și ARNt. Se sintetizează astfel lanțuri polipetidice, având ca unități structurale cei 20 de aminoacizi. Procesul de sinteză este complex, fiind alcătuit din mai multe etape și anume: activarea aminoacizilor, inițierea lanțului polipetidic, elongația și translocația.

REACŢIA DE ACTIVARE A AMINOACIZILOR
În prima etapă are loc activarea aminacizilor prin legarea acestora la moleculele de ARNt specifice, cu ajutorul enzimei aminoacil-ARNt sintetaza.
ARNt are la capătul 3’ o secvență 5’CCA3’, cu o grupare -OH liberă în poziția 2’ a nucleotidei terminale (adenozin-monofosfat). Aminoacil-ARNt sintetaza mediază atașarea aminoacidului la această grupare –OH liberă, printr-o reacție de esterificare, energia necesară procesului fiind furnizată de hidroliza unei molecule ATP.
Aminoacil-ARN sintetazele au o specificitate foarte ridicată atât faţă de aminoacid cât şi faţă de molecula ARNt corespunzător. Acest lucru este foarte important pentru că, după ce aminoacil – ARNt s-a format, el este recunoscut numai prin tripletul anticodon din ARNt şi nu prin restul de aminoacid.
Aceste enzime au o capacitate atât de mare de a deosebi diferiţi aminoacizi naturali între ei, încât şansa unei erori în condiţiile normale intracelulare este de 1:10.000.

INIŢIEREA LANŢULUI POLIPEPTIDIC
Procesul de iniţiere este un proces complex, care are loc în mai multe etape şi necesită participarea a trei proteine specifice, numite factori de iniţiere (FI -1, FI-2, FI-3).
Formarea ribozomului complet funcţional are loc prin asocierea moleculelor implicate astfel: ARNm se asociază cu subunitatea mică în prezenţa factorilor de iniţiere FI-1 şi FI-3; primul aminoacil-ARNt, care la procariote este întotdeauna f Met-ARNt, leagă o moleculă de GTP, în prezenţa factorului de iniţiere FI-2. Cele două structuri se leagă între ele, dând naştere complexului de iniţiere, care se asociază în final cu subunitatea ribozomală mare. În procesul de formare a ribozomului funcţional molecula GTP este hidrolizată, iar factorii de iniţiere sunt recirculaţi, pentru a iniţia sinteza unor noi catene polipeptidice.
În cadrul acestui proces se structurează şi situsurile P (peptidil) şi A (aminoacil), iar molecula ARNm este dispusă astfel încât codonul de iniţiere AUG să se afle în dreptul situsului peptidil şi să permită ataşarea f Met-ARNt. În procesul de sinteză a proteinelor molecula ARNm este tradusă în direcţia 5’ → 3’, pornind de la codonul START, până la codonul STOP.

CICLUL DE ELONGAŢIE
În prima etapă f Met- ARNt se află pe situsul peptidil (P), iar pe situsul aminoa cil (A) se ataşează următorul aminoacil-ARNt cu anticodonul complementar codonului corespunzător din ARNm. Energia necesară pentru poziţionarea corectă a aminoacil-ARNt pe situsul (A) este furnizată de hidroliza GTP, în prezenţa unor factori de elongaţie T.
Sub acţiunea peptidil-transferazei, care este prezentă pe subunitatea 50S a ribozomului are loc formarea legăturii peptidice între gruparea amino (–NH2) a celui de-al doilea aminoacil-ARNt şi gruparea carboxil (-COOH) esterificată a f Met- ARNt.
Se formează astfel un dipeptidil – ARNt, care este legat de situsul (A), iar molecula ARNt liberă rămâne legată de situsul P. Pentru formarea noii legături peptidice nu este necesară energie furnizată prin hidroliza GTP sau ATP (Fig 3.17).

TRANSLOCAŢIA
În continuare tot complexul ARNm – lanţ polipeptidic în formare se deplasează printre cele subunităţi ribozomale pentru ca molecula dipeptidil – ARNt să ajungă pe situsul (P), eliberând situsul (A), în dreptul căruia se află poziţionat următorul codon. În acelaşi timp molecula ARNt se deplasează pe situsul de ieşire (E), după care părăseşte ribozomul, putând să participe la alte reacţii de activare a aminoacizilor.
Procesul de translocaţie are loc într-o succesiune de etape în prezenţa unei proteine specifice denumită factor de elongaţie. Acest factor, împreună cu o moleculă de GTP se ataşează la ribozom. În continuare are loc hidroliza GTP, reacţie care eliberează energia necesară proceselor de transfer prezentate mai sus.
Deci, in urma acestor procese lanţul polipeptidic în formare, este ataşat la situsul peptidil prin intermediul moleculei ARNt, iar situsul aminoacil este liber, cu un nou codon gata să primească molecula de aminoacil-ARNt corespunzatoare.
Procesele de elongaţie şi translocaţie se repetă, fiecare ciclu fiind necesar pentru alungirea lanţului polipeptidic cu un aminoacid. În acest timp molecula ARNm pare “a aluneca printr-un şanţ sau tunel din ribozom (aprox. 25 nucleotide/ribozom)” (Lehlinger, 1992).
În timpul fiecărui ciclu de formare a unei legături peptidice forma ribozomului trece printr-o serie de modificări specifice complexe.

TERMINAREA LANŢULUI POLIPEPTIDIC
Reacţia de sinteză a proteinei şi deplasarea moleculei ARNm printre cele două subunităţi ribozomale aduce în dreptul situsului aminoacil (A) codonul STOP, care este semnalul de finalizare a translaţiei. În acelaşi moment pe situsul peptidil (P) se află ataşat polipeptidul, legat prin intermediul grupării carboxil a ultimului aminoacid de molecula ARNt. Această legătură esterică este hidrolizată prin acţiunea unei peptidil-transferaze, activată de molecule specifice, denumite factori de desprindere.
În final, polipetidul nou sintetizat părăseşte ribozomul după care moleculele ARNt şi ARNm se desprind, iar cele două subunităţi ribozomale se disociază.
Cele două subunităţi, 50S şi 30S pot să lege o altă moleculă de ARNm şi să reînceapă sinteza unui alt lanţ polipeptidic.

3.3. MECANISMELE MOLECULARE DE MODIFICARE POSTRANSLAŢIONALĂ

Pentru a-şi putea îndeplini funcţiile în celule, lanţurile polipeptidice sintetizate trebuie să se plieze în conformaţii tridimensionale distincte şi uneori, mai multe lanţuri polipeptidice se asamblează într-un complex funcţional. Apoi, multe proteine suferă modificări ulterioare care sunt foarte importante pentru funcţionarea şi localizarea lor corectă în celulă:
Plierea sau împachetarea lanţurilor polipeptidice;
Maturarea lanţurilor polipeptidice, care constă în clivarea unor secvenţe, sau ataşarea unor grupări oligozaharidice sau lipidice.

3.3.1. MATURAREA LANŢURILOR POLIPEPTIDICE

Clivarea lanţului polipeptidic sau proteoliza este o etapă importantă în maturarea multor proteine. De exemplu, metionina iniţiatoare, de la capătul amino al multor polipeptide este înlăturată prin proteoliză, imediat după ce capătul NH2 iese din ribozom. De asemenea, secvenţele semnal care orientează lanţurile polipeptidice spre destinaţii intracelulare precise sunt îndepărtate după ce şi-au îndeplinit funcţia.
Glicozilarea constă în modificarea proteinelor prin adiţia oligozaharidelor, fiind un proces specific celulelor eucariote. Glicoproteinele astfel rezultate sunt de obicei secretate sau localizate pe suprafaţa celulei, dar există şi unele proteine nucleare şi citozolice glicozilate.
După situsul de ataşare al lanţului lateral glucidic, glicolipidele pot fi clasificate în N- linkate sau O-linkate. În glicoproteinele O-linkate situsul pentru ataşarea oligozaharidului îl reprezintă atomul de oxigen din catena laterală a serinei şi treoninei. În glicoproteinele N-linkate, oligozaharidul este ataşat la atomul de azot din catena laterală a asparaginei.

Glicoproteinele situate pe suprafaţa celulară au grupările glucidice orientate spre exterior, având rol în semnalizarea celulară.Glicolipidele prezente în membranele organitelor celulare au intotdeauna grupările glucidice orientate spre interior.

Ataşarea lipidelor are loc în general la proteinele asociate pe faţa citozolică a membranei plasmatice a celulelor eucariote. Procesul poate fi realizat prin trei mecanisme:
N-miristoilarea, în care acidul miristic este ataşat la un rest de glicină N-terminal.
Prenilarea, care permite ataşarea unor lipide specifice la atomii de sulf din catenele laterale ale resturilor de cisteină localizate lângă capătul C-terminal al lanţului polipeptidic. În acest mod sunt modificate numeroase proteine asociate cu membrana plasmatică, implicate în controlul creşterii şi diferenţierii celulare.
Palmitoilarea constă în adaosul acidului palmitic la atomii de sulf din catenele laterale ale resturilor de cisteină, permiţând astfel asocierea unor proteine pe faţa internă a membranei plasmatice.

3.3.2. PLIEREA, ÎMPACHETAREA LANŢURILOR POLIPEPTIDICE

Conform principiului clasic al împachetării proteinelor, toată informaţia necesară pentru ca o proteină să adopte conformaţia tri-dimensională corectă este furnizată de secvenţa sa de aminoacizi. În plus, există macromolecule specializate, care facilitează plierea corectă a lanţurilor polipeptidice. Acestea pot fi chaperone (însoţitori moleculari) sau enzime.
Chaperonele, sau însoţitorii moleculari au rolul de a facilita plierea corectă a altor proteine. Astfel, chaperonele stabilizează lanţurile polipeptidice deja formate în timpul transportului lor spre organite celulare.
De asemenea stabilizează lanţurile polipeptidice în formare, a căror translaţie se desfăşoară încă la nivelul ribozomilor. Legarea chaperonelor menţine porţiunea aminoterminală a lanţului polipeptidic într-o conformaţie nepliată, până când restul lanţului polipeptidic este sintetizat, iar proteina se poate plia corect. Totodată chaperonele menţin proteinele nepliate, pentru a media transportul lor prin canale transmembranare specifice.

Termenul de chaperonă a fost utilizat pentru prima dată pentru o proteină, nucleoplasmina care se leagă la histone şi mediază asamblarea acestora în nucleozomi, fără ca ea să fie încorportă în structura nucleozomului final.

Una dintre cele mai cunoscute molecule însoţitor este HSP („heat shock protein”) prezentă în toate celulele. Sintezele multor proteine HSP sunt iniţiate ca răspuns la un şoc termic, probabil pentru a preveni împachetarea greşită, sau pentru a repara proteinele împachetate greşit. În plus, aceste proteine pot fi implicate în translocarea şi împachetarea altor proteine şi totodată în transportul lor prin membrane.
Una dintre familiile Hsp şi anume chaperoninele sau Hsp 60, facilitează plierea proteinelor în conformaţiile lor native. O chaperonină are 16 subunităţi, aranjate sub forma a două inele, care formează în interior un canal. Lanţurile polipeptidice care urmează a fi împachetate pătrund în acest canal, fiind astfel protejate de celelalte molecule prezente în citozol. În acest mediu izolat are loc plierea corectă a lanţurilor polipeptidice, proces care este însoţit de hidroliza ATP. Energia furnizată de hidroliza ATP este folosită pentru desfăşurarea proceselor de eliberare şi reataşare a regiunilor nepliate ale lanţului polipeptidic la chaperonină, permiţând plierea gradată a polipeptidului în conformaţia corectă.

Enzimele implicate în împachetarea corectă a lanţurilor polipeptidice catalizează ruperea şi refacerea unor legături specifice.
Astfel, protein-disulfid izomeraza catalizează ruperea şi refacerea legăturilor disulfurice între resturile de cisteină, permiţând plierea corectă (Fig. 3.18).
Legăturile disulfurice sunt specifice proteinelor de secreţie şi pentru unele proteine membranare. Formarea legăturilor disulfurice în citozol nu este posibilă datorită agenţilor reducători care menţin resturile de cisteină în forma lor redusă. Legăturile S-S se formează în reticulul endoplasmatic deoarece aici se menţine un mediu oxidant.

Fig. 3.18 Acţiunea protein disulfid-izomerazei (PDI) în procesul de rearanjare a legăturilor disulfurice

Peptidil-prolil izomeraza este cea de-a doua enzimă cu un rol important în procesul de pliere a lanţurilor polipeptidice nou formate. Ea catalizează izomerizarea legăturilor peptidice care implică resturi de prolină. Peptidil-prolil izomeraza catalizează izomerizarea între configuraţiile cis şi trans ale legăturilor peptidice care preced prolina în lanţul polipeptidic.

3.3.3. REGLAREA FUNCŢIILOR PROTEINELOR

Enzimele catalizează aproape toate reacţiile biologice. Reglarea activităţii enzimatice se realizează parţial la nivelul expresiei genice, care determină cantitatea oricărei enzime sintetizată în celulă. Dar există şi sisteme de reglare a funcţiilor proteinelor deja sintetizate, după cum urmează.

REGLAREA PRIN MOLECULE MICI
Enzimele pot să-şi modifice conformaţia prin legarea unor molecule mici, cum ar fi aminoacizii sau nucleotidele, în acest fel activitatea lor enzimatică fiind alterată. De exemplu, produşii finali ai multor căi biosintetice inhibă enzimele care catalizează primul pas al sintezei lor şi astfel se asigură o cantitate adecvată de produs şi se împiedică sinteza acestuia în cantităţi excesive.
Acest tip de inhibare poartă numele de reglare alosterică, în care molecula reglatoare se leagă necovalent la un situs de pe enzimă, care este diferit de situsul catalitic.
Un alt tip de mecanism de control a activităţilor celulare intracelulare este legarea GTP. De cele mai multe ori forma legată de GTP a proteinelor reprezintă forma lor activă, în timp ce GDP este atașat formei inactive. În celule are loc un schimb permanent între GTP şi GDP ataşate la proteine, în funcţie de necesităţile de moment ale celulei.

REGLAREA PRIN MODIFICĂRI COVALENTE
Unele enzime sunt reglate prin clivarea proteolitică a precursorilor inactivi. Proteoliza este un proces ireversibil, constituind un mod covalent de reglare a activităţii enzimatice.
Un alt exemplu de modificare covalentă a proteinelor este fosforilarea. Fosforilarea este un proces rapid de activare sau inhibare a activităţii unor proteine celulare ca răspuns la stimuli externi.
Fosforilarea proteică este catalizată de protein-kinază, care transferă grupările fosfat de la ATP la grupările hidroxil ale catenelor laterale ale serinei, treoninei sau tirozinei.
Fosforilarea proteică este reversibilă datorită protein-fosfatazelor care catalizează hidroliza resturilor de aminoacizi fosforilaţi.
La fel ca protein-kinazele, majoritatea protein-fosfatazelor sunt specifice, fie pentru serină şi treonină, fie pentru tirozină, deşi unele recunosc toţi cei trei aminoacizi. Prin acţiune combinată, protein-kinazele şi protein-fosfatazele mediază fosforilarea reversibilă a multor proteine celulare.

După fosforilare, gruparea polară dar neutră din punct de vedere electric (OH) este înlocuită cu o grupare fosfat încărcată negativ, conducând la modificarea conformației tridimensionale a proteinei substrat. Astfel de modificări afectează în primul rând activitatea proteinei dar pot influenţa şi stabilitatea ei sau localizarea subcelulară.
Deci, fosforilarea/defosforilarea reprezintă un mecanism de reglare, în care proteina substrat poate fi în forma activă sau inactivă în funcţie de direcţia în care are loc procesul.

Protein-kinazele şi fosfatazele sunt componente importante ale căilor de semnalizare care controlează diviziunea celulară, creşterea, formarea citoscheletului şi metabolismul. Ele funcţionează ca amplificatori ai semnalelor şi modifică răspunsul celular la semnalele externe.

INTERACŢIUNILE PROTEINĂ – PROTEINĂ
Interacţiunile dintre lanţurile polipeptidice, care constituie subunităţile componente ale unor proteine au o mare importanță în reglarea activităţii proteice.
Astfel, la multe enzime alosterice legarea unei molecule reglatoare alterează conformaţia proteică, prin modificarea interacţiunilor dintre subunităţi.

3. 4. PROCESELE DE PRELUCRARE POST-TRANSLAŢIONALE

Aproape toate proteinele unei celule eucariote sunt codificate de ADN nuclear şi sintetizate pe ribozomii citozolici, care pot să fie ataşaţi la membrana reticulului endoplasmatic (RE) sau nu. Totuşi, proteinele codificate de ADN cloroplastic şi mitocondrial (aproximativ 100) sunt sintetizate de ribozomi în interiorul acestor organite şi încorporate direct în compartimentul organitului respectiv.
Proteinele sintetizate în citoplasmă trebuie să se deplaseze spre o destinaţie specifică, care este indicată de un domeniu de localizare specific. Domeniile de localizare sunt de obicei peptide scurte, dar pot fi şi oligozaharide ca în cazul hidrolazelor lizozomale din celulele mamiferelor. Sunt localizate de obicei la capătul aminoterminal al proteinei, dar pot să fie amplasate la capătul carboxil, sau chiar în mijlocul lanţului polipeptidic.
Domeniile de localizare sunt esenţiale pentru transportul proteinei, dar de obicei nu fac parte din forma activă a proteinei. De aceea, după atingerea destinaţiei aceste domenii sunt clivate de proteaze specifice dând naştere proteinei active, mature.
În cazul proteinelor care rămân în citozol (ex. actina, tubulina) nu sunt prezente domenii de localizare dar există domenii informaţionale care permit monomerilor să dea naştere unei structuri organizate.
Pentru a pătrunde într-un anumit compartiment celular este necesar ca proteinele să traverseze membrana acestuia. Având în vedere că majoritatea proteinelor posedă suprafeţe externe hidrofile, ele nu pot să traverseze direct miezul hidrofob al biomembranelor. De aceea procesul are loc prin intermediul unor canale transmembranare care pot fi proteine transportoare sau proteine canal, prin care molecula de transportat trebuie să treacă într-o configuraţie neîmpachetată. Menținerea lanţului polipeptidic în forma neîmpachetată se realizează prin asocierea cu proteine însoțitoare sau chaperone, care-i stabilizează structura, uşurând astfel traversarea membranei. Alte tipuri de chaperone se leagă la lanţul polipeptidic după ce a traversat membrana, asigurând împachetarea corectă. (Fig. 3.19).

Fig. 3.19 Stabilizarea lanţului polipeptidic, cu proteine chaperone specifice,
în vederea traversării membranei

Calea urmată de fiecare lanţ polipeptidic nu depinde de secvența de aminoacizi ci este determinată exclusiv de prezența sau absența domeniilor de localizare, care permit sortarea proteinelor în mai multe etape.

Prima dată proteinele sunt separate în două grupuri și anume:
Proteinele sintetizate pe ribozomii liberi din citoplasmă, care pot să rămână în acest compartiment sau să fie dirijate spre alte organite în funcţie de secvenţele de localizare specifice – plastide, mitocondrii, peroxizomi şi nuclei. Calea urmată de aceste proteine poartă numele de transport post- translațional.
Proteinele orientate spre reticulul endoplasmatic (RE) datorită prezenţei unei secvenţe semnal specifice, localizate la capătul amino- terminal. Calea urmată de aceste proteine poartă numele de transport co- translațional.
Imediat ce sinteza secvenţei semnal specifice a avut loc, întregul ansamblu ribozom – ARNm – lanț polipeptidic în formare se deplasează spre membrana reticului endoplasmatic, atașându-se la aceasta.
Proteinele sintetizate astfel sunt cele care urmează calea secretorie, adică sunt eliminate din celulă sau cele orientate spre diferite compartimente cum ar fi: perete celular, plasmalemă, vacuole şi tonoplast .

3.4.1. CALEA TRANSPORTULUI POST-TRANSLAŢIONAL

Proteinele solubile, care rămân în citoplasmă şi cele orientate spre nucleu, mitocondrii, cloroplaste sau peroxizomi sunt sintetizate pe ribozomii liberi, urmând calea transportului post-translaţional. Ribozomii liberi, deși nu sunt atașați la membrana reticului endoplasmatic pot fi uneori atașați la filamentele din alcătuirea citoscheletului.

PROTEINELE LOCALIZATE ÎN CITOPLASMĂ
Proteinele localizate în citoplasmă nu posedă în secvența de aminoacizi domenii de localizare. Sunt sintetizate pe ribozomii liberi aflaţi în citoplasmă, iar după finalizarea translaţiei sunt împachetate astfel încât să-şi îndeplinească funcţia specifică. De exemplu, monomerii actinici sunt sintetizaţi pe ribozomii liberi aflaţi în citozol, iar după sinteză se asamblează dând naştere filamentelor de actină.

PROTEINELE LOCALIZATE ÎN PLASTIDE
Majoritatea proteinelor implicate în procesul de fotosinteză sunt codificate de ADN nuclear şi importate din citoplasmă, deşi plastidele conţin propriul lor ADN şi toate sistemele enzimatice necesare transcripției și translației.
Având în vedere că plastidele sunt organite cu o structură complexă, localizarea proteinelor într-un anumit compartiment necesită prezenţa a două domenii de localizare: primul orientează proteina spre organit şi cel de-al doilea asigură localizarea precisă în compartimente.
Proteinele sintetizate pe ribozomii liberi, care sunt apoi orientate spre cloroplaste posedă un domeniu de localizare, denumit peptidă de tranzit. Această peptidă de tranzit se găsește la capătul amino al proteinei şi este alcătuită din 40-50 de aminoacizi, având rol atât în orientare cât şi în procesul de translocare prin învelişul cloroplastului, fiind eliminată de către o peptidază după ce şi-a îndeplinit funcţia.
Importul proteinelor în cloroplaste are loc prin intermediul unor canale transmembranare care se formează la locul de contact dintre membrana internă şi cea externă. În acest fel lanţurile polipeptidice străbat ambele membrane, pătrunzând în stroma cloroplastică. Până în prezent nu se cunoaşte sigur dacă peptida de tranzit interacţionează iniţial cu receptori proteici sau cu lipide din membrana externă, fiind posibil să apară ambele interacţiuni.
O excepţie o reprezintă proteinele destinate să ajungă în membrana externă a cloroplastului, care nu intră prin canalul de transport ci pătrund în membrană direct din citozol.
Înainte de a traversa canalul transmembranar lanţurile polipeptidice se asociază cu chaperone, care împiedică împachetarea pe timpul transportului şi mediază transferul în stroma cloroplastică. La finalizarea procesului peptida de tranzit, care şi-a îndeplinit funcţia de orientare spre organitul ţintă este eliminată de către o peptidază.
Dacă proteina rămâne în stromă va interveni o chaperonă complexă, de dimensiuni mari (alcătuită dintr-o subunitate mare HSP 60 şi o subunitate mică HSP 10 kDa) care va ajuta la împachetarea corectă, printr-un proces dependent de ATP.
Dacă proteina este localizată în membrana cloroplastică internă, membrana tilacoidă sau lumenul tilacoid se va activa cea de-a doua seevenţă de localizare care va orienta lanţul polipeptidic spre destinaţie.

PROTEINELE LOCALIZATE ÎN MITOCONDRII
Mitocondriile sunt prezente în aproape toate celulele eucariote. La fel ca şi cloroplastele, posedă o membrană internă şi o membrană externă, care delimitează două compartimente şi anume spaţiul intermembranar şi matrixul mitocondrial.
Fiecare membrană şi fiecare compartiment posedă un set unic de proteine, similar cu celelalte organite. Enzimele care alcătuiesc lanţul de transport al electronilor, proteinele pentru transportul substratului nutritiv şi complexele enzimatice implicate în sinteza ATP sunt amplasate în membrana internă, pe când majoritatea enzimelor care alcătuiesc ciclul acidului citric se găsesc în matrixul mitocondrial.
Prin urmare, aceste organite necesită o cantitate şi o varietate mare de proteine, care sunt codificate numai în mică măsură de către genomul propriu. Majoritatea proteinelor mitocondriale trebuie să fie importate din citozol, deoarece sunt codificate de ADN nuclear şi sintetizate în citozol.
Transportul proteinelor mitocondriale a fost studiat cu precădere la drojdii, dar se consideră că mecanismul de transport la plante este similar.
Majoritatea proteinelor mitocondriale sunt sintetizate sub forma unor precursori, având la capătul amino-terminal un domeniu de localizare denumit presecvenţă. Acest domeniu facilitează translocarea proteinelor prin ambele membrane mitocondriale fiind asemănătoare cu peptidele de tranzit prezente în secvenţa proteinelor cloroplastice.
Presecvenţele au structuri de ( helixuri cu caracter amfipatic, deoarece posedă aminoacizi hidrofobi pe una dintre feţe şi resturi de aminoacizi încărcaţi pozitiv pe cea de-a doua latură. După ce o proteină pătrunde în matrixul mitocondrial presecvenţa este clivată de către o peptidază, exact ca în cazul cloroplastelor.
Proteinele sunt transportate în mitocondrii neîmpachetate, fiind menţinute în această formă cu ajutorul chaperonelor citozolice. Procesul de translocare a proteinelor este mediat de un aparat de import, care străbate ambele membrane la punctul de contact dintre acestea. După ce proteina a pătruns în matrix, aceasta este împachetată cu ajutorul altor chaperone.
Excepţie fac proteinele specifice membranei mitocondriale interne şi spaţiului intermembranar, care necesită existenţa a două semnale şi anume: presecvenţa, care orientează proteina spre mitocondrii şi o secvenţă specifică de aminoacizi hidrofobici.
Atunci când presecvenţa este eliminată de către o peptidază din matrix, secvenţa hidrofobică nou expusă funcţionează ca un domeniu de localizare pentru a orienta proteina fie spre membrana internă, fie spre un complex de translocare care asigură transferul în spaţiul intermembranar. Forma activă funcţional a proteinei se formează după ce are loc eliminarea secvenţei hidrofobice cu ajutorul unei peptidaze.

PROTEINELE LOCALIZATE ÎN PEROXIZOMI
Peroxizomii sunt organite specializate care participă la mai multe căi metabolice fiind prezente în toate celulele eucariote. Celulele vegetale conţin cel puţin trei tipuri de peroxizomi.
Plantele tinere şi frunzele senescente conţin glioxizomi, care au rol în mobilizarea trigliceridelor stocate.
Cea de-a doua categorie de peroxizomi, prezenţi în frunze joacă un rol important în reacţia de respiraţie care însoţeşte fixarea dioxidului de carbon în plantele C3.
A treia categorie, întâlnită la unele plante leguminoase tropicale care exportă ureide, conţin enzime unice, implicate în metabolismul azotului.
Spre deosebire de cloroplaste şi mitocondrii, peroxizomii sunt mărginiţi de o membrană simplă şi ei nu conţin ADN sau ribozomi. În consecinţă toate proteinele peroxizomilor sunt sintetizate de către ribozomii liberi din citoplasmă şi importate în peroxizomi.
In urma studiilor efectuate s-a determinat că există cel puţin două domenii de localizare PTS1 şi PTS 2 implicate în importul proteinelor în matrixul mitocondrial. Secvenţa semnal PTS1 are o lungime foarte mică (trei aminoacizi), spre deosebire de alte domenii de localizare se găseşte la capătul carboxiterminal al lanţului polipeptidic şi nu este îndepărtată după translocarea în peroxizomi, marcând proteinele prezente în matrix.
Secvenţa semnal PTS2 se află la capătul aminoterminal al lanţului polipeptidic şi este îndepărtată după translocarea proteinei în matrixul peroxizomului.
Importul proteinelor în peroxizomi necesită atât un domeniu de localizare, dar şi energie furnizată de hidroliza ATP-ului. În plus, a fost evidenţiată necesitatea prezenţei unor factori citozolici, cum ar fi membri ai familiei Hsp 70, dar nu se cunoaşte încă dacă sunt necesare chaperonele pentru stabilizarea proteinelor.

PROTEINELE LOCALIZATE ÎN NUCLEU
Nucleul, organitul care controlează întreaga activitate celulară are nevoie pentru funcţionare de un număr şi o varietate mare de proteine şi enzime care să susţină procesele de replicare, transcriere şi diviziune celulară şi anum histone, ADN polimeraze, ARN polimeraze, factori de transcripţie etc.
Transportul în/din nucleu are loc prin intermediul complexului porului nuclear prin două mecanisme specifice şi anume:
Moleculele mici (sub 40 KDa) difuzează activ prin cele opt canale deschise, cu diametru de 9 nm, care sunt delimitate de ansamblul spiţe-inele din structura porului nuclear;
Macromoleculele (proteine, ADN) trec prin canalul central printr-un proces activ, în care proteinele specifice şi ARN sunt recunoscute şi transportate selectiv într-o singură direcţie.

Proteinele sunt dirijate spre nucleu prin secvenţe de aminoacizi specifice, denumite semnale de localizare nucleară NLS(„nuclear localization signal/sequence”). O astfel de structură conţine una sau mai multe secvenţe scurte, încărcate pozitiv datorită prezenţei lizinei şi argininei, expuse la suprafaţa proteinei.
Secvenţa de localizare nucleară este recunoscută de o proteină denumită importina, alcătuită din două subunităţi α şi β. Complexul format este orientat spre inelul alcătuit din particulele citoplasmatice care intră în alcătuirea porului nuclear. Apoi, proteina este trasportată prin canul central al complexului porului nuclear, iar importina este eliberată pentru a participa la alte procese de recunoaştere.

3.4.2 CALEA TRANSPORTULUI CO-TRANSLAŢIONAL

Calea transportului co-translaţional este urmată de proteinele care sunt orientate în final spre peretele celular, plasmalemă, vacuole şi tonoplast, sau sunt eliminate din celulă.
Proteinele care urmează această cale sunt orientate spre reticulul endoplasmatic (RE) încă din timpul sintezei proteice, împreună cu ribozomii. Datorită fixării temporare a unui număr mare de ribozomi reticulul endoplasmatic a fost denumit rugos. Acesta este abundent în celulele specializate în secreţia proteinelor (de exemplu celulele aleurone la cereale) sau în stocarea proteinelor vacuolare (de exemplu celulele parenchimatice ale seminţelor).
După ce procesul de sinteză s-a finalizat, proteinele sunt modificate, asamblate, sortate şi orientate spre destinaţiile în care îşi vor îndeplini funcţiile.
Proteinele care urmează calea transportului co-translaţional pot fi împărţite la rândul lor în două categorii:
Proteinele care sunt orientate spre vacuole sau spre exteriorul celulelor (perete celular şi proteine de secreţie) traversează membrana reticului endoplasmatic, regăsindu-se în forma lor finală în interiorul acestuia;
Proteinele integrale care vor intra în alcătuirea plasmalemei, tonoplastului, complexului Golgi sau membranei nucleare rămân încastrate în membrana reticulului endoplasmatic (RE).
În cazul proteinelor care urmează calea transportului co-translaţional lanţul polipeptidic nou sintetizat posedă la capătul amino-terminal un domeniu de localizare care poartă numele de peptidă semnal, cu o lungime de 16-30 de aminoacizi, care orientează lanţul polipeptidic în formare spre membrana RE.
O peptidă semnal tipică constă din unul sau mai mulţi aminoacizi încărcaţi pozitiv, urmaţi de o regiune alcătuită din 6-12 aminoacizi hidrofobici. Aminoacizii încărcaţi pozitiv permit interacţiunea acestei secvenţe cu partea polară a membranei RE, iar aminoacizii hidrofobi preîntâmpină respingerea lanţului polipeptidic de către miezul hidrofob al membranei.
Peptidele semnal sunt similare în cazul diferitelor proteine atât în celulele vegetale cât şi în cele animale şi drojdii. Prin tehnologia ADN recombinat s-a dovedit că prezenţa acestei secvenţe semnal la orice tip de proteină va conduce la orientarea ribozomului pe care are loc acea sinteză spre membrana RE.
Înainte de a se lega la RE, peptida semnal este recunoscută de o particulă de recunoaştere a semnalului (SRP – ”Signal recognition particle”) Această particulă este un complex ribonucleoproteic alcătuit dintr-o moleculă mică de ARN, cu o lungime de 300 de nucleotide care leagă 6 proteine diferite, fiecare având o funcţie specifică.
Particula de recunoaştere a semnalului (SRP) este prezentă de obicei în citozol unde aşteaptă apariţia unei peptide semnal la capătul unui lanţ polipeptidic care tocmai este sintetizat. Procesul de recunoaştere între peptida semnal şi particula de recunoaştere a semnalului are loc atunci când polipeptidul nou sintetizat are o lungime de aproximativ 70 aminoacizi cu aproximativ 40 de aminoacizi ieşiţi din ribozom. Legarea particulei de recunoaştere a semnalului (SRP) la lanţul polipeptidic în formare blochează sinteza şi evită împachetarea greşită a polipeptidului deja sintetizat.
În continuare are loc translocarea proteinelor în lumenul RE, cu implicarea particulei de recunoaştere a semnalului, receptorului acestei particule şi a unei proteine canal (complex de translocare) din membrana RE.
Receptorul este o proteină integrală transmembranară din reticulul endoplasmatic, compusă din două polipeptide dependente de GTP, amplasată în vecinătatea complexului de translocare. Acest complex este alcătuit din trei proteine transmembranare care alcătuiesc un canal prin membrana reticulului endoplasmatic.
După ce particula de recunoaştere a semnalului (SRP) s-a legat la peptida semnal care iese din ribozom, întregul ansamblu intră în contact cu receptorul specific şi se ataşează la membrana RE. Apoi, particula de recunoaştere a semnalului disociază de pe peptida semnal, utilizând energia furnizată de hidroliza GTP-ului. În continuare ribozomul şi lanţul polipeptidic în formare se ataşează la complexul de translocare iar translaţia şi translocarea în lumenul RE au loc simultan (Fig. 3.20).
În timp ce lanţul polipeptidic înaintează prin canalul transmembranar, peptida semnal este clivată de către o peptidază, un complex enzimatic din lumenul RE. Pe masură ce lanţul polipeptidic înaintează în lumenul reticulului endoplasmatic este stabilizat cu ajutorul chaperonelor specifice, care împiedică împachetarea greşită pe parcursul transferului (Fig. 3.20).
După ce procesele simultane de translaţie şi transfer s-au încheiat, lantul polipeptidic ajunge în totalitate în lumenul reticulului endoplasmatic, împachetarea lui corectă fiind mediată de chaperone specifice.

Fig. 3.20. Transferul lanţului polipeptidic prin complexul de translocare, în timpul transportului co-translaţional

Un caz particular al transportului co-translaţional îl reprezintă proteinele membranare integrale ale RE, complexului Golgi, tonoplastului şi plasmalemei. Mecanismul urmat depinde de numărul segmentelor transmembranare ale proteinei şi de orientarea acesteia.
În funcţie de numărul şi tipul domeniilor transmembranare posedate de către fiecare lanţ polipeptidic, proteinele de membrană se împart în trei categorii:
Tipul I al proteinelor de membrană, cuprinde proteinele cu un singur domeniu transmembranar.
Peptida semnal, localizată la capătul amino, care pătrunde în lumenul RE, este clivată imediat după ce proteina începe să traverseze membrana RE. Apoi translocarea este oprită înainte de finalizarea translaţiei, în momentul apariţiei unei secvenţe de stopare a transferului (secvenţă hidrofobică).
Prin urmare, regiunea care rămâne localizată în citozol se află la capătul carboxi, având o dimensiune variabilă care depinde de localizarea domeniului transmembranar în interiorul proteinei.
Tipul II al proteinelor de membrană cuprinde proteinele cu un singur domeniu transmembranar, în cazul cărora domeniul localizat în citozol se află poziţionat la capătul amino al lanţului polipeptidic.
Aceste proteine nu posedă o peptidă semnal care să fie eliminată după pătrunderea în lumenul RE. Se pare că domeniul transmembranar de natură hidrofobică acţionează ca o secvenţă semnal care direcţionează integrarea proteinei în membrana RE. Astfel, o mare porţiune a regiunii aminoterminale rămâne în citozol, iar segmentul carboxi – terminal se găseşte în lumenul RE.
Un exemplu de proteine de acest tip îl constituie proteinele membranare ale Complexului Golgi.
Tipul III al proteinelor de membrană cuprinde proteinele cu mai multe domenii transmembranare. În structura acestor lanţuri polipeptidice alternează regiuni hidrofobe, care alcătuiesc domeniile transmembranare cu regiuni hidrofile care alcătuiesc buclele de legătură. Acestea din urmă sunt poziţionate fie în citozol, fie în lumenul RE.
În cazul acestor proteine primul domeniu transmembranar acţionează ca o peptidă semnal iar cel de-al doilea funcţionează ca o secvenţă de ancorare. Al treilea domeniu acţionează din nou ca o peptidă semnal, al patrulea ca o secvenţă de ancorare, etc. Deşi atât particulele de recunoaştere a semnalului cât şi receptorii specifici sunt necesari pentru integrarea primului domeniu transmembranar ele nu sunt necesare pentru următoarele domenii transmembranare. In continuare este prezentată modalitatea de inserare în membrana reticulului endoplasmatic pentru toate cele trei tipuri de proteine membranare (Fig. 3.21).

Fig. 3.21. Transferul proteinelor membranare şi fixarea lor în membrana reticulului endoplasmatic
(I- proteine membranare tip I, II- proteine membranare tip II, III- proteine membranare tip III)
O dată ce aceste proteine sunt inserate în membrana RE ele pot să fie reţinute acolo (rezidente RE) sau să fie îndreptate spre alte destinaţii. Până în prezent nu există cunoştinţe despre domeniile care orientează proteinele spre alte destinaţii sau le menţin în calea de transport.

3.4.3. PRELUCRAREA PROTEINELOR ÎN LUMENUL RETICULULUI ENDOPLASMATIC

Modificările care au loc în lumenul reticulului endolasmatic permit proteinelor să se împacheteze corect şi să fie orientate spre compartimentul celular în care îşi vor îndeplini funcţia.
Lumenul reticulului endoplasmatic conţine un număr de enzime şi chaperone care asigură împachetarea corectă şi care au posibilitatea să degradeze polipeptidele sintetizate greşit. Astfel există certitudinea că numai proteinele corect împachetate şi asamblate sunt transportate pe calea secretorie spre destinaţia lor finală.
Proteinele care se regăsesc în lumenul RE (proteinele orientate spre vacuole, perete celular şi proteine de secreţie) pot să sufere următoarele modificări:
Adoptarea conformaţiei spaţiale corecte, care are loc fie cu ajutorul proteinelor însoţitoare (chaperoane) fie prin formarea legăturilor disulfidice între grupările SH ale resturilor cisteinice sau prin oligomerizare;
Modificări chimice care constau în ataşarea unor grupări glucidice sau glicani N-linkaţi.
Fiecare proteină suferă o parte dintre aceste modificări, dar pot să apară şi altele, după ce proteina părăseşte RE. Proteinele care nu sunt corect împachetate sau asamblate pot să fie reţinute în RE unde sunt distruse de proteaze.

ADOPTAREA CONFORMAŢIEI SPAŢIALE CORECTE A PROTEINELOR
Adoptarea conformaţiei corecte poate fi mediată de însoţitorii moleculari (chaperone), de enzime specifice sau poate consta în asocierea mai multor subunităţi.
Una dintre proteinele implicate în procesul de împachetare este chaperona BiP – “Binding protein” (70 kDa) o proteină dependentă de ATP.
BiP se leagă la proteina în formare sau la lanţul polipeptidic parţial împachetat, în special la acele segmente bogate în aminoacizi hidrofobici care nu sunt expuse în mod normal la suprafaţa unei proteine. Astfel sunt prevenite interacţiunile nespecifice ale acestor segmente, evitând în final împachetarea incorectă a proteinei.
Multe proteine de secreţie, proteine vacuolare sau proteine membranare sunt stabilizate prin legături disulfidice formate atunci când grupările SH de la cisteine sunt oxidate cu agenţi de oxidare potriviţi.
Totuşi, lanţurile polipeptidice conţin adesea mai mult de două cisteine, şi de aceea punţile disulfidice care se formează nu sunt întotdeauna cele corecte. Ruperea şi reformarea legăturilor disulfidice astfel încât să se realizeze împachetarea corectă sunt catalizate de o enzimă denumită protein-disulfid-izomeraza (PDI), o enzimă prezentă în lumenul reticulului endoplasmatic.
Alte proteine nu sunt alcătuite dintr-un singur lanţ polipeptidic ci sunt oligomeri cu două, trei, patru sau mai multe subunităţi care iau naştere în lumenul RE. De exemplu proteinele de rezervă (vicilin şi faseolin) acumulate în vacuolele de stocare sunt trimeri cu dimensiuni de 45 kDa, formaţi în lumenul RE. Dacă nu are loc formarea trimerilor subunităţile sunt degradate de către proteaze.
În general mecanismele de control prezente în lumenul reticulului endoplasmatic reţin proteinele defective structural sau care nu se pot matura corespunzător. O parte sunt degradate chiar în lumenul RE, altele sunt translocate în citozol unde sunt degradate în proteazomi. Nu se cunoaşte încă mecanismul care sortează aceste proteine şi care determină locul de desfăşurare a degradării.

GLICOZILAREA PROTEINELOR ÎN RETICULUL ENDO-PLASMATIC
Una dintre funcţiile majore ale RE este adiţia covalentă a grupărilor glucidice la proteine. S-a demonstrat ca majoritatea proteinelor care ajung în lumenul RE sunt glicozilate înainte de a fi transportate la complexul Golgi.
Reacţiile de glicozilare sunt importante pentru că produc markeri (radicali oligozaharidici) care asigură sortarea proteinelor, direcţionarea lor corectă către alte organite celulare şi totodată transportul prin diferite compartimente celulare.
Procesul de glicozilare care are loc în reticulul endoplasmatic este un proces de linkare-N, deoarece grupările glucidice sunt ataşate la o grupare
-NH2 a unei asparagine. Procesul impune parcurgerea a patru etape importante şi anume:
Sinteza lipidei purtătoare dolicol pirofosfat (dolicol -PP) în membrana reticulului endoplasmatic

Dolicolul reprezintă un grup de compuşi organici nesaturaţi cu catena lungă, alcătuiţi dintr-un număr variabil de unităţi izoprenice, având ca grupare terminală un izoprenoid α-saturat cu o grupare funcţională alcoolică.
Asamblarea intermediarului oligozaharid – lipidă, mai precis dolicol-PP-oligozaharid;
Transferul oligozaharidului de la dolicol la enzima ţintă. Enzima
glicozil-transferaza transferă gruparea oligozaharidică ancorată pe dolicol pirofosfat la un rest de asparagină prezent în proteina ţintă. Această reacţie are loc pe faţa lumenală a membranei reticulului endoplasmatic şi necesită prezenţa secvenţei de recunoaştere Asn-X-Ser/Thr. Un rest de asparagină, care nu este urmat de serină sau treonină, nu va fi recunoscut de către transferază (Fig. 3.22).
Modificarea oligozaharidelor în lumenul reticulului endoplasmatic şi în complexul Golgi.

Fig. 3.22 Mecanismul reacţiei de glicozilare a proteinelor în reticulul endoplasmatic

Deci, oligozaharidul precursor este legat la membrana RE prin intermediul unei molecule lipidice speciale denumite dolicol pirofosfat. Oligozaharidul este sintetizat pe acest lipid, treaptă cu treaptă după care este transferat in bloc pe asparagina unei molecule proteice.
După ce prima etapă a glicozilării proteinelor a fost realizată în RE, glicoproteinele rezultate sunt împachetate în vezicule şi sunt transportate prin intermediul acestora la nivelul aparatului Golgi, unde procesul este continuat.
În concluzie, proteinele eliberate în lumenul RE sunt prelucrate şi asamblate corect după care se deplasează spre alte destinaţii, în funcţie de domeniul lor de localizare. Dacă nu au un alt domeniu de localizare ele sunt secretate în afara celulei.
Există totuşi unele proteine cum ar fi BiP şi protein disulfid-izomeraza care rămân în RE. Ele sunt reţinute în acest compartiment prin două mecanisme şi anume: se leagă între ele datorită afinităţii pe care o au una faţă de cealaltă sau leagă ionii de Ca2+ care se găsesc în concentraţie mare in RE, prin intermediul domeniior cu afinitate ridicată faţă de aceşti ioni. Astfel se formează o reţea care nu permite eliminarea lor prin vezicule.

3.4.4. TRANSPORTUL ŞI PRELUCRAREA PROTEINELOR ÎN COMPLEXUL GOLGI

În complexul Golgi, organitul membranar cu rol în prelucrarea finală a proteinelor sunt supuse modificărilor proteinele de secreţie, proteinele lizozomale şi cele membranare.

PRELUCRAREA PROTEINELOR DE SECREŢIE
În sacii complexului Golgi are loc concentrarea produşilor de secreţie sintetizaţi în reticulul endoplasmatic, prelucrarea lanţurilor polipeptidice precum şi alte modificări cum ar fi sulfatarea urmată de sortare şi livrare spre diferite destinaţii.

GLICOZILAREA
În reticulul endoplasmatic proteinele sunt glicozilate cu un singur tip de oligozaharid, în special manoza. În complexul Golgi sunt supuse unor modificări mai complexe, formându-se două clase de oligozaharide: complexul oligozaharidic, format din N-acetil-glucozamină, acid N-acetil-neuroamina, galactoză şi oligozaharide formate numai din molecule de manoză.
În realizarea glicozilării sunt implicate glicozil-transferazele şi glicozidazele care sunt proteine integrale cu zona activă orientată spre interiorul sacilor membranari care intră în alcătuirea Complexului Golgi. Cele mai importante enzime de acest tip sunt sial-transferaza, galactozil-transferaza şi manozidazele, care îndepărtează manoza pentru adăugarea N-acetil-glucozaminei. O categorie specială de proteine, care sunt glicozilate în aparatul Golgi o reprezintă proteogicanii, la care lanţul glucidic rezultă printr-o polimerizare extensivă. Dintre proteoglicanii secretaţi o parte intră în componenţa matrix-ului extracelular, iar restul rămîn ancorate în membrana plasmatică.
B. CLIVAJUL PROTEOLITIC SPECIFIC
Unele proteinele sunt foarte mici şi sinteza lor pe ribozomi nu ar fi eficientă, iar împachetarea în vezicule de secreţie ar eşua. Alte proteine, cum ar fi hormonii sunt sintetizate sub această formă în reticulul endoplasmatic pentru a nu acţiona asupra celulei în care sunt sintetizaţi. Sunt apoi modificate în complexul Golgi, după care, în forma lor activă sunt exportate sb forma unor vezicule spre celulele ţintă.
Deci, produsul activ apare numai după proteoliza moleculei precursor, proces care începe în reticulul Golgi trans.

C. SORTAREA PRODUŞILOR DE SECREŢIE
În compartimentele complexului Golgi are loc separarea proteinelor de secreţie de enzimele lizozomale şi de alte tipuri de proteine, după care sunt ambalate în membrane compatibile pentru a fuziona cu plasmalema şi exportate în exteriorul celulei. Acestea pot să urmeze două căi:
Calea secretorie reglată este o cale urmată de proteinele care necesită un stimul sau un mecanism de declanşare pentru a fi secretat. Unii stimuli reglează sinteza proteinei şi de asemenea eliminarea ei din celulă.
Calea secretorie constitutivă permite secretarea proteinelor care sunt necesare în afara celulei, cum ar fi cele care intră în alcătuirea matrix-ului extracelular. Ele nu necesită stimuli, deşi procesul poate fi amplificat de către factorii de creştere.

PRELUCRAREA PROTEINELOR LIZOZOMALE
În compartimentele complexului Golgi are loc prima dată segregarea enzimelor lizozomale de ceilaţi produşi de secreţie. Enzimele lizozomale au grupări gluidice terminale sub formă de manoză – 6 – fosfat care funcţionează ca marker. Acest compus este recunoscut de un receptor specific din membrana complexului Golgi, determinând separarea enzimelor lizozomale în zona trans, de unde se desprind vezicule, care formează apoi liozomii primari.

PRELUCRAREA PROTEINELOR MEMBRANARE
Proteinele integrale de membrană, sintetizate în reticulul endoplasmatic rugos sosesc pe calea veziculelor la complexul Golgi unde sunt maturate şi eliberate sub forma unor vezicule care furnizează membranelor atât proteine cât şi lipide.
Totodată complexul Golgi este implicat în reciclarea membranelor, ca un proces de reutilizare a componentelor plasmalemei. Pe parcursul procesului de exocitoză plasmalema îşi măreşte permanent suprafaţa, datorită veziculelor cu care fuzionează. Pentru a contracara acest fenomen, din plasmalemă se desprind vezicule care se întorc la complexul Golgi unde are loc reciclarea componentelor membranare. Deci, la complexul Golgi sosesc vezicule care pot să conţină şi proteine de membrană, enzime, receptori ce pot fi modificate, separate şi refolosite.

Ţinând cont de structura complexă a aparatului Golgi, procesele mai sus menţionate pot fi localizate în anumite compartimente.
Proteinele şi lipidele sunt transportate de la reticulul endoplasmatic sub formă de vezicule, intră prin compartimentul cis în aparatul Golgi şi avansează prin toate compartimentele până sunt eliminate prin reţeaua Golgi trans. Aceste vezicule sunt acoperite de o proteină de învelire („coating protein”) care se consideră că ar juca un rol de semnal în direcţionarea transportului. Ele reglează tipul de molecule care sunt împachetate într-un anumit tip de vezicule, controlează procesul de asamblare a veziculelor indicând atât membrana ţintă cât şi sistemul care permite veziculelor să fuzioneze cu aceasta.
Compartimentul cis al complexului Golgi primeşte moleculele de la reticulul endoplasmatic şi apoi le transmite compartimentului median, având o participare redusă la procesul de modificare a proteinelor. Se îndepărtează parţial manoza şi se fosforilează oligo-glucidele care intră în alcătuirea proteinelor lizozomale.
Compartimentul median are ca funcţie primară glicozilarea, prin adăugarea N-acetilglucozaminei la moleculele proteice şi lipidice.
În compartimentul trans al complexului Golgi se adaugă acid sialic la oligozaharide, acesta reprezentând sediul sortării finale şi a exportării moleculelor cu destinaţii bine stabilite.
Transportul moleculelor prin complexul Golgi este direcţional, cisternele complexului fiind asociate cu un număr mare de vezicule de dimensiuni reduse.

3.4.5. DEGRADAREA PROTEINELOR

Nivelurile proteinelor în celule sunt determinate nu numai de ratele de sinteză, dar şi de ratele de degradare. Proteinele care nu mai sunt utile la un moment dat în celulă sau proteinele sintetizate greşit trebuie să fie eliminate din celule. Dacă nu sunt îndepărtate, aceste proteine otrăvesc celula, prin formarea unor agregate cu dimensiuni mari, insolubile. Alte proteine sunt degradate ca răspuns la semnale specifice, furnizând un alt mecanism pentru reglarea activităţii enzimatice.
Proteinele anormale apar în celule ca rezultat al mutaţiilor, erorilor apărute în sinteza sau împachetarea proteinelor, denaturării spontane, bolilor, stresului sau degradării oxidative.
Degradarea proteinelor are ca scop atât reglarea activităţii proteice prin eliminarea moleculelor care nu mai sunt utile în celulă cât şi reciclarea aminoacizilor.
Degradarea proteinelor în celule are loc prin câteva căi proteolitice, specifice fiecărui compartiment celular.
Astfel, sisteme distincte sunt prezente în vacuole, citozol, nucleu, cloroplaste, mitocondrii şi lizozomi. Mecanismul după care are loc proteoliza reflectă originea evolutivă a organitului respectiv (mecanismul proteolitic observat în cloroplaste şi mitocondrii este mai apropiat de sistemele bacteriene decât de cele localizate în citozol).

3.4.5.1 DEGRADAREA PROTEOLITICĂ CITOZOLICĂ

În fiecare celulă, numărul şi diversitatea proteinelor este extrem de mare, astfel că este necesară existenţa unor mecanisme precise atât pentru acţiunea proteazelor cât şi pentru marcarea proteinelor care urmează să fie degradate. Fără o astfel de reglare enzimele proteolitice ar degrada proteinele celulare fără discriminare.
Proteinele care nu mai sunt utile în celulă sau cele care au fost sintetizate sau împachetate greşit, posedă sisteme de recunoaştere specifică.
Proteinele citozolice destinate a avea o viaţă scurtă sunt marcate la capătul aminoterminal prin apariţia unor secvenţe scurte de aminoacizi, care par să funcţioneze ca semnal proteolitic;
Uneori căile proteolitice sunt activate de condiţiile de mediu – temperatura ridicată, expunerea la metale grele sau infecţia cu patogeni;
Alteori, proteinele aberante sau împachetate incorect implică probabil o creştere semnificativă a numărului de reziduuri hidrofobice prezente pe suprafaţa proteinei. De obicei, secvenţele hidrofobe sunt îngropate în interiorul proteinei, pentru a preveni interacţiunea lor cu mediul apos.
Atunci când o proteină a fost sintetizată sau împachetată incorect, lanţurile hidrofobe sunt expuse spre exterior. Aceste zone hidrofobe furnizează situsuri de legare pentru proteinele care reglează activitatea diverselor enzime proteolitice.
Calea cea mai importantă a degradării proteolitice selective în celulele eucariote utilizează ubiquitina ca marker pentru proteinele citozolice, care devin ţinte pentru o proteoliză rapidă.
Ubiquitina este un polipeptid mic, alcătuit din 76 de aminoacizi, înalt conservaţi în archebacterii şi eucariote. Ea se ataşează la gruparea amino laterală a unui rest de lisină şi în acest fel marchează proteina respectivă.
Apoi ubiquitine adiţionale sunt adăugate pentru a forma un lanţ poliubiquitinic. Asemenea proteine poliubiquitinice sunt recunoscute şi degradate de un complex proteazic de dimensiuni mari, numit proteazom (M=1,5 MDa). Ubiquitina este eliberată în procesul degradării proteice, astfel încât ea poate fi utilizată într-un alt ciclu.
Se cunoaşte că procesul de proteoliză în celulele eucariote necesită energie furnizată prin hidroliza ATP. Deoarece hidroliza legăturilor peptidice este favorizată din punct de vedere energetic, se consideră că ATP este necesar pentru reglarea activităţii proteolitice şi anume are rol în recunoaşterea şi marcarea proteinelor care urmează să fie degradate.
Proteasomul este o structură proteică complexă (26 S) alcătuit din trei subunităţi: un miez (20 S) cu care sunt asociate două subunităţi reglatoare (19S). Miezul este alcătuit din 4 inele suprapuse, fiecare conţinând şapte subunităţi. Inelele suprapuse formează la interior un canal care conţine situsurile active pentru proteoliză. Amplasarea centrilor catalitici în canal protejează proteinele nemarcate împotriva degradării. Subunităţile reglatoare funcţionează ca o cale de intrare în proteasom, dirijând pătrunderea proteinei marcate în canal.
Proteinele marcate cu ubiquitină, pătrund în canalul proteazomului, unde sunt amplasaţi centri catalitici, fiind degradate. După finalizarea procesului de degradare, proteazomul se disociază, iar aminoacizii şi ubiquitinele sunt eliberate în citoplasmă. Ubiquitinele se întorc în alte procese de marcare, iar aminoacizii vor sta la baza sintezei altor lanţuri polipeptidice.

3.4.5.2. DEGRADAREA PROTEOLITICĂ ÎN LIZOZOMI

Lizozomii sunt organite care intervin în metabolismul celular prin digestia proteinelor extracelulare preluate prin endocitoză, sau rezultate datorită înlocuirii permanente a organitelor citoplasmatice şi a proteinelor citozolice.
Astfel, în lizozomi pot fi degradate moleculele pătrunse în celulă din exterior – heterofagie, sau molecule sau chiar organite citoplasmatice care nu mai sunt utile în celule – autofagia.
Moleculele sau componentele care urmează a fi degradate sunt înconjurate de membrane provenite de la reticulul endoplasmatic pentru a forma vezicule. Acestea fuzionează cu lizozomii primari, dând naştere lizoxomilor secundari. Cele aproximativ 50 de enzime lizozomale, în condiţiile specifice de pH-ul acid din lizozomi digeră conţinutul veziculelor.
În unele situaţii speciale, când celula este lipsită de hrană, lizozomii preiau şi degradează în mod selectiv anumite proteine citozolice. Sunt degradate în special proteine care conţin secvenţa Lys-Glu-Arg-Gln, care se pare că le orientează către lizozomi. În procesul de degradare este implicată şi chaperona Hsp 70, care menţine lanţurile polipeptidice nepliate în timpul transportului lor prin membrana lizozomală. Pe această cale sunt degradate proteine de care celula se poate lipsi şi astfel se furnizează aminoacizi şi energie, care permit derularea proceselor metabolice fundamentale.

3.4.5.3. DEGRADAREA PROTEOLITICĂ ÎN VACUOLE

Vacuolele sunt bogate în enzime hidrolitice şi îndeplinesc mai multe funcţii în celule. Una dintre funcţiile de bază constă în degradarea proteinelor, funcţie similară cu cea a lizozomilor din celulele animale. Unii cercetători sugerează că în timpul lipsei nutrienţilor plantele transportă o serie de proteine citozolice în vacuole, unde sunt degradate pentru a genera aminoacizii necesari sintezei altor proteine.

3.4.5.4. DEGRADAREA PROTEOLITICĂ ÎN ALTE ORGANITE CELULARE

Proteoliza este prezentă în cloroplaste, deoarece acestea conţin aproximativ 50% din proteinele prezente în aparatul foliar. Una dintre proteazele identificate în cloroplaste prezintă omologie cu o enzimă de acelaşi tip, izolată din E. coli. Activitatea acestei enzime este importantă pentru prevenirea acumulării proteinelor anormale în timpul senescenţei ţesuturilor foliare. Alte organite din celulele vegetale, inclusiv mitocondriile, peroxizomii şi reticulul endoplasmatic posedă de asemenea sisteme pentru degradarea proteinelor. Aceste sisteme proteolitice nu au fost caracterizate până în prezent.

CAPITOLUL IV

TEHNICI DE BAZĂ ÎN ANALIZA ACIZILOR NUCLEICI ŞI A PROTEINELOR

Moleculele care sunt supuse analizei în investigaţiile specifice biologiei moleculare, genomicii sau proteomicii sunt moleculele ADN, ARN sau proteine.
Moleculele ADN sunt extrase şi purificate prin procedee specifice, după care pot fi supuse direct investigaţiilor, datorită stabilităţii lor. Genomul este acelaşi în toate celulele unui organism, în orice fază de dezvoltare ontogenetică, în orice condiţii de mediu şi de aceea ADN poate fi extras din orice tip de celule sau ţesuturi.
Astfel se pot obţine informaţii cu privire la structura genomului, pot fi identificate şi caracterizate gene, pot fi stabilite amprente genetice sau se poate stabili gradul de înrudire, diversitatea sau filiaţia intra sau interspecifică.
În cazul în care se urmăreşte investigarea moleculelor ARN o problemă importantă o reprezintă instabilitatea acestora. De aceea, de cele mai multe ori se obţin molecule ADN complementar, care sunt copii fidele ale ARNm, dar care prezintă o stabilitate mai ridicată, ceea ce permite aplicarea tuturor metodelor de investigaţie specifice ADN. Populaţiile de ARN din celule sunt specifice tipului de organ, etapei de dezvoltare şi condiţiilor de mediu şi de aceea este necesară alegerea în prealabil a materialului de analizat în funcţie de obiectivele urmărite.
Analizele care au ca obiect ARN permit evaluarea expresiei genelor şi anume pot fi identificate genele care se exprimă la un anumit moment, poate fi analizată comparativ supra sau sub-expresia unor gene sau efectul unor factori externi asupra expresiei genelor.
Structura, proprietăţile fizice şi chimice specifice ale acizilor nucleici şi ale proteinelor au permis de-a lungul anilor, o dată cu progresul biologiei moleculare şi a echipamentelor specifice, dezvoltarea unor tehnici de analiză moderne, care au stat apoi la baza tehnicilor de investigaţie complexe.

4.1. DENATURARE/RENATURARE/HIBRIDIZARE

Denaturarea sau disocierea (“DNA melting”) este un proces în care o moleculă de acid dezoxiribonucleic (ADN) se separă în două lanţuri monocatenare prin desfacerea legăturilor de hidrogen formate între bazele azotate complementare. Ambii termeni menţionaţi sunt utilizaţi cu referire la acelaşi proces, care are loc în general atunci când amestecul este încălzit (94-95ºC); denaturarea poate însă să se refere şi la separarea catenelor ADN sub acţiunea unor agenţi chimici cum ar fi ureea, sau prin supunerea la un mediu alcalin (pH>11).
Pentru copii multiple de ADN temperatura de disociere (“melting temperature”) – Tm este definită ca temperatura la care jumătate dintre catenele ADN sunt sub formă bicatenară şi jumătate sunt monocatenare. Temperatura de disociere depinde atât de lungimea moleculei cât şi de secvenţa nucleotidelor în fragmentul analizat.
Monitorizarea proceselor de denaturare este posibilă prin măsurarea absorbanţei, ţinând cont că moleculele de ADN au absorbţia maximă în domeniul UV, la o lungime de undă de 260 nm. Atunci când moleculele de ADN se denaturează absorbanţa va creşte până la finalizarea procesului, când în amestec se găsesc numai molecule monocatenare, după care va rămâne constantă. Acest fenomen poartă numele de efect hipocromic, iar absorbanţa ADN monocatenar este cu 50% mai mare decât a celui bicatenar.
Reacţia de denaturare/disociere poate avea loc atunci când este compensată energia de legătură, stabilită între bazele azotate complementare. Se cunoaşte că legăturile stabilite între citozină şi guanină (3 legături de hidrogen) sunt mai puternice decât cele dintre adenină şi timină (2 legături de hidrogen), prin urmare regiunile bogate în A/T pot fi mai uşor denaturate.
Au fost dezvoltate metode analitice care permit evaluarea proporţiei de citozină şi guanină din genom, denumită conţinut CG, care poate fi estimată prin măsurarea temperaturii la care ADN genomic se disociază. Cu cât temperaturile sunt mai ridicate, cu atât conținutul în CG este mai mare (Fig. 4.1).

Regiunile care alcătuiesc promotorii genelor sunt alcătuite de secvenţe de genul „TATATA”, care se denaturează mai uşor, furnizând fragmente ADN monocatenare, care permit începerea transcrierii.

Fig. 4.1. Variaţia procentului de molecule denaturate în funcţie de temperatură, pentru polinucleotide alcătuite exclusiv din C/G, respectiv A/T, comparativ cu un fragment natural de ADN

Procesul de denaturare este reversibil, astfel că molecula bicatenară poate fi refăcută. Dacă fragmentele monocatenare care refac dublul helix au la origine aceiaşi moleculă ADN, procesul poartă numele de renaturare. Dacă fragmentele de ADN monocatenare au origini diferite (ex. secvenţă ţintă, sondă moleculară) procesul poartă numele de hibridizare.
Prin scăderea temperaturii sau a pH este favorizată refacerea legăturilor de hidrogen între bazele complementare de pe cele două lanţuri unice de ADN, ARN sau ARN şi ADN. Reacţiile de renaturare se produc de regulă la temperaturi care corespund unei diferenţe de 20 – 30ºC faţă de temperatură de disociere (Tm) a acidului nucleic bicatenar; dacă temperatura însă scade brusc, catenele rămân separate.
Un factor important în procesul de hibridizare este stringenţa, sau intensitatea reacţiei. Dacă două catene unice de acid nucleic sunt formate pe toată lungimea din baze complementare, iar condiţiile de reacţie sunt favorabile, stringenţa (intensitatea) reacţiei de combinare este foarte puternică. Dacă pe cele două catene de acid nucleic există doar zone parţiale cu baze complementare, stringenţa este mai scăzută. Această situaţie apare în special atunci când cele două catene provin de la două organisme diferite.
Procesele de denaturare asociate cu renaturarea sau hibridizarea îşi găsesc o gamă largă de aplicaţii în dezvoltarea tehnicilor complexe de investigaţie în biologia moleculară.
APLICAŢII GENERALE

Evaluarea timpului de renaturare poate fi utilizată pentru a estima compoziţia în baze azotate şi totodată prezenţa unor fracţii repetitive în secvenţa analizată. Această metodă a fost aplicată în anii ”60 pentru a evidenţia diferenţele apărute în compoziţia bazelor azotate a moleculelor de ADN, provenite de la diferite organisme şi totodată pentru a demonstra că ADN eucariot conţine un procent mare de secvenţe repetitive.
La scară de genom, metoda a fost folosită pentru a estima distanţa genetică dintre două specii, proces care poartă numele de hibridizare ADN- ADN. Dacă se analizează regiuni izolate din genom, se pot utiliza geluri cu gradient de denaturare sau în gradient de temperatură pentru a detecta prezenţa unor mici nepotriviri. Totuşi, în prezent, pentru ca informaţiile cu privire la succesiunea bazelor azotate să fie mai precise se preferă utilizarea tehnicii de secvenţiere.
Procesul de denaturare ADN este de asemenea utilizat în tehnicile de biologie moleculară, în special în cadrul PCR („Polymerisation Chain Reaction”). Cunoaşterea temperaturii de disociere (Tm) are o importanţă deosebită în stabilirea temperaturii de legare a primerilor la catena matriţă, ceea ce conduce la reacţii de amplificare eficiente.
Procesele de renaturare/hibridizare au stat la baza dezvoltării tehnicilor Southern şi microarray, în care atât ADN fixat pe suport cât şi sonda moleculară sunt denaturate, iar reacţia de hibridizare se desfăşoară în condiţii prestabilite, pe baza complementarităţii bazelor.
În prezent se poate aplica metoda de “hibridizare in situ” controlabilă cu ajutorul tehnicilor de fluorescenţă. În acest caz sonde moleculare marcate se leagă la secvenţe complementare de ADN care se găsesc în cromozomii prometafazici etalaţi pe o lamă microscopică şi denaturaţi în prealabil.

4.2. SECŢIONAREA MOLECULELOR ADN CU ENDO-NUCLEAZELE DE RESTRICŢIE

Enzimele de restricţie sau endonucleazele de restricţie sunt endonucleaze de origine bacteriană. În mod natural ele clivează moleculele de ADN străin (de exemplu ADN viral pătruns în celula bacteriană respectivă), fără a cliva însă ADN bacterian propriu, deoarece acesta poartă un semn de recunoaştere, reprezentat de nişte situsuri specifice, metilate. Metilarea reprezintă un mecanism de apărare al celulei bacteriene faţă de propriile nucleaze.
Nomenclatura enzimelor de restricţie a fost stabilită de către Nathans şi Smith (1973) astfel: Prima literă indică genul bacterian de provenienţă, literele 2, 3 indică specia; alte litere indică tulpina bacteriană de provenienţă a enzimei; numerele indică ordinea de descoperire.
Luând ca exemplu enzima de restricţie denumită EcoR I, putem spune că litera E provine de la gen – Escherichia, grupul de litere co provine de la specie, coli, litera R de la tulpina RY13. Cifra romană I arată că EcoR I a fost prima enzimă izolată din această tulpină.

După izolarea primei enzime de restricţie – Hind III, în anul 1970 şi descoperirea şi caracterizarea ulterioară a numeroase alte enzime de restricţie, în 1978 a fost decernat premiul Nobel pentru Fiziologie şi Medicină lui Daniel Nathans, Werner Arber şi Hamilton Smith. Descoperirea lor a condus la dezvoltarea tehnologiei ADN recombinant care a permis, de exemplu producerea pe scară largă a insulinei umane utilizînd bacteria E. coli. De atunci au fost studiate în detaliu mai mult de 3000 de enzime de restricţie dintre care mai mult de 600 sunt disponibile comercial şi sunt utilizate în procesele de manipulare a ADN în laborator.

4.2.1. CLASE GENERALE DE ENZIME-ENDONUCLEAZE DE RESTRICŢIE

Până în prezent au fost caracterizate trei sisteme de restricţie-metilare (R-M), dintre care cea mai mare răspândire o are sistemul II (95%).

ENZIME DE RESTRICŢIE – tipul I
Enzimele de restricţie de tipul I au fost identificate prima dată şi sunt caracteristice pentru două tulpini K 12 şi B din E. coli. Aceste enzime secţionează la nivelul unui situs amplasat la o anumită distanţă (cel puţin 1000 bp) de situsul de recunoaştere. Situsul de recunoaştere este asimetric, compus din două porţiuni, una alcătuită din 3-4 nucleotide şi cea de-a doua din 4-5 nucleotide, separate de o sevenţă de separare („spacer”), cu o lungime 6-8 nucleotide.
Din punct de vedere structural, enzimele de restricţie de tipul I sunt alcătuite din trei subunităţi denumite HsdR, HsdM şi HsdS. Subunitatea HsdR este implicată în procesul de secţionare, HsdM este necesară pentru metilare (ex. adăugarea de grupări metilice la ADN gazdă, ceea ce reprezintă o activitate metil-transferazică); subunitatea HsdS are un rol în stabilirea specificităţii situsului de recunoaştere, ca o completare la activitatea metiltransferazei.
Activitatea acestor enzime este asigurată de câţiva cofactori enzimatici şi anume S-Adenosyl methionina (AdoMet), adenozin-trifosfatul (ATP) şi ionii de magneziu (Mg2+).

ENZIME DE RESTRICŢIE – tipul II
Enzimele de restricţie de tipul II, cele mai comune şi mai utilizate tipuri de enzime, sunt compuse dintr-o singură subunitate, iar situsurile de recunoaştere sunt de obicei nedivizate şi palindromice, cu o lungime de 4-8 nucleotide. Aceste enzime recunosc şi secţionează secvenţe specifice din molecula ADN bicatenar şi nu necesită ATP sau S-Adenosyl methionina (AdoMet) pentru funcţionare, dar Mg2+ acţionează ca şi cofactor.
In anii 1990 şi la începutul anilor 2000 au fost descoperite noi tipuri de enzime din aceiaşi familie, care nu urmează criteriile clasice ale acestei clase de enzime.
Astfel, enzimele care nu respectă întru-totul caracteristicile specifice acestei clase au fost catalogate în subgrupe, definite prin adăugarea unei litere la sfârşit.
Tipul II B de enzime de restricţie (Bcg I şi Bpl I) sunt multimeri, alcătuiţi din mai mult de o subunitate. Acestea secţionează molecula ADN de o parte şi de alta a situsului de recunoaştere şi necesită prezenţa ambilor cofactori AdoMet şi Mg2+.
Tipul II E (Nae I) secţionează molecula ADN în urma interacţiunii cu două copii ale secvenţei de restricţie. Un situs de recunoaştere acţionează ca ţintă pentru secţionare, în timp ce cel de-al doilea acţionează ca activator alosteric mărind eficienţa de secţionare a enzimei.
Similar cu tipul II E, tipul II F (Ngo M IV) interacţionează cu două copii ale situsului de restricţie, dar secţionează ambele secvenţe în acelaşi timp.
Tipul II G (Eco 57I) are o singură subunitate la fel ca tipul II clasic de enzime de restricţie , dar necesită cofactor AdoMet pentru a fi activ.
Tipul II M, cum ar fi Dpn I, este capabil să recunoască şi să secţioneze ADN metilat.
Tipul II S (Fok I), având o structură dimerică, secţionează ADN la o distanţă definită de situsul de recunoaştere care este asimetric şi non-palindromic.
Similar, tipul II T (Bpu 10I şi Bsl I) este compus din două subunităţi diferite. Unele recunosc secvenţe palindromice în timp ce altele au situsuri de restricţie palindromice.

ENZIME DE RESTRICŢIE – tipul III
Enzimele de restricţie de tipul III (Eco P15) recunosc două secvenţe separate, non-palindromice care sunt orientate invers, secţionând la 20-30 perechi de baze după situsul de recunoaştere. Aceste enzime conţin mai mult de o subunitate şi necesită AdoMet şi ATP ca şi cofactori, datorită rolului lor în metilare şi restricţie.

4.2.2. ASPECTE GENERALE PRIVIND ENZIMELE DE RESTRICŢIE CU UTILIZARE COMUNĂ ÎN TEHNICILE DE BIOLOGIE MOLECULARĂ

Enzimele cele mai utilizate sunt enzimele de tip II, care recunosc o secvenţă specifică din molecula ADN dublu catenar, se ataşează la nivelul acelei secvenţe, producând secţionarea.
Aceste secvenţe, denumite situsuri de recunoaştere sunt alcătuite dintr-un număr redus 4, 6 sau 8 perechi de nucleotide ce formează două secvenţe palindromice situate în jurul unui punct de simetrie. Cele mai uzuale sunt enzimele care au situsuri de recunoaştere alcătuite din 6 bp.
Enzimele al căror situs de recunoaştere este alcătuit dintr-un număr redus de perechi de baze secţionează moleculele de ADN mai des, deoarece probabilitatea de a întâlni acele secvenţe în genom este mai mare. Cu cât lungimea unui situs de recunoaştere este mai mare, cu atât se va regăsi în mai puţine poziţii în genom.
Unele enzime de restricţie taie simultan ambele catene în acelaşi punct, rezultând fragmente cu capete netede, în timp ce altele taie catenele după o schemă defazată, rezultând fragmente ADN cu capete coezive monocatenare (Fig. 4.2). Dacă fragmentele monocatenare se află situate la capetele 3’, extremităţile poartă numele de „capete coezive 3’”, iar dacă rămân fixate în zona 5’ sunt denumite „capete coezive 5’”.
Aceste aspecte referitoare la extremităţile fragmentelor formate în urma secţionării cu o enzimă de restricţie au o importanţă deosebită în procesele de formare a moleculelor de ADN recombinat, deoarece pot fi legate numai fragmente care au capete netede, iar cele cu capete coezive trebuie să fi fost secţionate cu aceiaşi enzimă de restricţie, pentru a avea extremităţi monocatenare complementare.

Fig. 4.2. Mecanismul de acţiune al enzimelor de restricţie
Săgeţile reprezintă legăturile fosfodiesterice care vor fi desfăcute de către enzimele de restricţie

În continuare sunt prezentate trei tipuri de enzime de restricţie care generează capete diferite.

În urma acţiunii enzimelor de restricţie ambele catene ale moleculei ADN sunt secţionate. De fiecare dată enzima secţionează o legatură fosfodiesterică generând grupări -OH la capetele 3’ şi fosfat la capetele 5’ formate în urma reacţiei.

Fiecare enzimă de restricţie prezintă o activitate optimă în anumite condiţii de temperatură, care coincid cu temperatura mediului de viaţă al tulpinii bacteriene din care a fost extrasă.
În general enzimele de restricţie izolate din surse diferite recunosc secvenţe de nucleotide diferite. Există însă enzime care au situsuri identice, deşi nu au fost izolate din aceiaşi tulpină bacteriană, prin urmare au şi denumiri diferite. Atsfel de enzime poartă numele de izoschizomeri. De exemplu enzimele Cla I şi Bsu I, au acelaşi situs de recunoaştere: AT(CGAT.
În plus, există unele enzime care recunosc o secvenţă de patru nucleotide, iar această secvenţă se află în interiorul unei secvenţe de 6 nucleotide, care reprezintă situsul de recunoaştere al altei enzime. De exemplu Mbo I şi Bam H I. Situsurile de recunoaştere pentru aceste enzime sunt următoarele.

Mbo I 5’ ↓ G A T C 3’ Bam H I 5’ G ↓ G A T C C 3’
3’ C T A G ↑ 5’ 3’ C C T A G↑G 5’

APLICAŢII GENERALE

Enzimele de restricţie sunt foarte mult utilizate în tehnicile de genetică moleculară. Ele stau la baza tehnologiei ADN recombinat şi de asemenea sunt folosite în alcătuirea hărţilor de restricţie şi evidenţierea polimorfismului cu ajutorul markerilor RFLP („Restriction Fragment Length Polymorphism”), AFLP („Amplified Fragment Length Polymorphism”) sau CAPS („Cleaved Amplified Polymorphic DNA”).

4.3. SINTEZA ADN, CU AJUTORUL ADN POLIMERAZELOR

ADN polimerazele sunt reprezentate de un grup de enzime care asigură sinteza unei noi catene de ADN, utilizând o altă catenă ca matriţă.
În cadrul procesului de replicare a ADN, in vivo, la un moment dat are loc desfacerea legăturilor de hidrogen dintre cele două lanţuri polinucleotidice, care devin astfel independente şi servesc fiecare ca matriţă pentru formarea unui lanţ polinucleotidic complementar. În acest proces este implicat un sistem enzimatic complex, în care ADN polimeraza ocupă un loc central.
Astfel, pentru sinteza ADN, atât in vivo cât şi in vitro, trebuie să existe o catenă de ADN care să funcţioneze ca matriţă, un fragment (primer) care să pună la dispoziţie o grupare OH la un capăt 3’ şi cei patru dezoxi-nucleozid trifosfaţi (dATP, dTTP, dCTP şi dGTP), care să furnizeze moleculele din care va fi sintetizată noua catenă.
ADN polimeraza catalizează adiţia unităţilor mononucleotidice la capătul 3’- hidroxil liber al catenei ADN primer, direcţia procesului de sinteză a ADN fiind întotdeauna 5’→3’. Reacţia are loc printr-un atac nucleofil, în care gruparea 3’-hidroxil din restul nucleotidic terminal al catenei de ADN în creştere, reacţionează cu atomul de fosfor aflat în poziţia 1 a dezoxi-nucleozid-5’-trifosfatului următor, determinând formarea legăturii fosfo-diesterice şi eliminarea de pirofosfat (Fig. 4.3).

Fig. 4.3 Mecanismul alungirii catenei prin acţiunea ADN polimerazei

În biologia moleculară, caracteristica ADN polimerazelor de a sintetiza noi catene de ADN a fost exploatată foarte mult, permiţând dezvoltarea unei game largi de investigaţii.
Astfel, descoperirea ADN polimerazelor stabile termic a permis introducerea la scară largă a proceselor PCR – amplificarea prin reacţia în lanţ a polimerazei, revoluţionând astfel biologia moleculară.

4.3.1. METODA AMPLIFICĂRII PRIN REACŢIA ÎN LANŢ A POLIMERAZEI

Amplificarea prin reacţia în lanţ a polimerazei este o metodă analitică de investigare a acizilor nucleici, care constă din amplificarea enzimatică in vitro a unui fragment ADN, cu secvenţă necunoscută, poziţionat între două regiuni cu secvenţe cunoscute. Astfel este posibilă amplificarea unei singure copii ADN în milioane de copii în numai câteva ore.
Metoda este cunoscută în limba engleză sub numele de “Polymerase Chain Reaction” – reacţia în lanţ a polimerazei – abreviată prin acronimul PCR. Această abreviere este acreditată în literatura de specialitate de circulaţie internaţională, implicit în literatura de limba franceză.
Această nouă metodă a fost iniţiată în perioada 1980-1983 de către Kerry Mullis (Mullis, 1990), care a primit premiul Nobel pentru Chimie în anul 1993. Metoda, percepută ca o revoluţie metodologică în biologia moleculară se remarcă prin faptul că face posibilă obţinerea unui număr impresionant de copii ale unor secvenţe specifice din ADN care pot fi gene, fragmente de gene sau alte secvenţe ADN.
Pentru a fi posibilă desfăşurarea unei reacţii de amplificare sunt necesare două oligonucleotide cu secvenţe specifice, denumite uzual “amorse” (fr. amorces) sau “primeri” (engl. primers), complementare cu secvenţele care flanchează fragmentul ADN de amplificat. Aceste oligonucleotide furnizează grupările libere OH, la capetele 3’, necesare ADN polimerazei pentru a începe sinteza. Dezvoltarea acestei tehnici a cunoscut o amploare deosebită după ce a fost izolată o ADN polimerază termostabilă, care să rămână activă pe parcursul tuturor etapelor de încălziri şi răciri repetate.

4.3.1.1. COMPONENTELE UNEI REACŢII DE AMPLIFICARE – CARACTERISTICI ŞI MOD DE UTILIZARE

Componentele (reactivii) necesari desfăşurării unei reacţii de amplificare sunt ADN matriţă, primerii, ADN polimeraza, cei patru dezoxi-nucleozid-trifosfaţi şi o soluţie tampon, care asigură condiţiile optime de reacţie (pH, tărie ionică, MgCl2). Fiecare dintre aceste componente trebuie să îndeplinească o serie de caracteristici pentru ca, după derularea programului de amplificare să rezulte un număr suficient de fragmente, care să permită vizualizarea în gel de agaroză.

ADN MATRIŢĂ („Template”)
Referitor la moleculele ADN de amplificat trebuie să se ţină cont de mai multe aspecte referitoare în special la calitatea acestora şi mai puţin la cantitate, deoarece pe parcursul desfăşurării reacţiei sunt parcurse cicluri în care amplificarea este exponenţială.
De obicei pot fi amplificate fragmente cu lungimi mai mici de 3kb. Amplificarea fragmentelor mari necesită utilizarea unor polimeraze cu caracteristici speciale.
Nu sunt necesare cantităţi mari de ADN, deoarece are loc o amplificare a fragmentelor ţintă, iar cantităţile mari de ADN favorizează obţinerea de produşi PCR nespecifici. Calitatea ADN este însă importantă, deoarece prezenţa unor urme din anumiţi compuşi folosiţi în procedurile de extracţie (fenol, EDTA, proteinază K) pot să inhibe activitatea polimerazei.
Totodată fragmentele ADN trebuie să fie intacte pe o lungime mai mare decât cea care urmează a fi amplificată, în caz contrar amplificarea nefiind posibilă. Acest aspect apare mai ales atunci când sursa din care se realizează extracţia este reprezentată de ADN fosil, urme biologice etc.

PRIMERI
Primerii sunt fragmente monocatenare de ADN (oligonucleotide)
cu o lungime de 15-30 nucleotide. Cu cât lungimea primerilor creşte, cu atât creşte şi specificitatea legării lor.
Aceste secvenţe flanchează fragmentul ţintă de interes din ADN matriţă, fiecare primer legându-se la capătul 3’al unei catene. Legarea primerilor este antiparalelă, aceştia furnizând grupări OH la capetele 3’, care permit alungirea ulterioară a catenelor ADN (Fig. 4.4).
Procesul de legare a primerilor este hotărâtor în desfăşurarea unei reacţii de amplificare şi de aceea este supus unor procese de optimizare. Trebuie să fie acordată o atenţie deosebită atât secvenţei fiecărui primer, cât şi stabilirii unei temperaturi optime de legare.

Fig. 4.4. Modul de ataşare şi de stabilire a secvenţei primerilor

Secvenţa primerilor
La stabilirea secvenţei primerilor trebuie să fie respectate o serie de condiţii, pentru ca reacţiile de amplificare să se desfăşoare în condiţii optime.
Conţinutul în nucleotide GC (numărul de baze C şi G, ca un procent din numărul total de baze) trebuie să se încadreze în intervalul 40-60%.
Prezenţa bazelor G şi C printre ultimele baze de la capătul 3' favorizează legarea specifică, datorită legăturilor puternice dintre bazele complementare C şi G. Dar un număr mai mare de trei G sau C trebuie să fie evitat între ultimele cinci baze de la capătul 3'.
Structura secundară a primer-ului are o importanţă deosebită; se poate stabili atât intra cât şi intermolecular şi poate afecta afecta eficienţa reacţiei. Structurile care trebuiesc evitate sunt prezentate în continuare:
Formarea structurilor „ac de păr” („hairpin”) datorită interacţiunilor intramoleculare;
Formarea unui dimer prin interacţiunea intermoleculară dintre doi primeri, de acelaşi sens;
Formarea unor dimeri prin interacţiunea celor doi primeri – sens şi antisens, datorită complementarităţii bazelor.

În secvenţa primerilor trebuie să fie evitată prezenţa unor di-nucleotide care se repetă consecutiv de mai multe ori (ex. ATATATAT) deoarece conduc la ataşări eronate la ADN matriţă.
Trebuie să fie de asemenea evitată o secvenţă de forma AGCGGGGGATGGGG, în care o bază se repetă de cinci ori. Numărul maxim de repetiţii acceptat este de 4 nucleotide.

Temperatura de legare a primerilor
Un aspect foarte important în procesele PCR este temperatura de ataşare a primerilor la secvenţele complementare, secvenţele ţintă („target”) de pe catena matriţă, deoarece este un parametru critic în procesul de amplificare.
Temperatura de disociere – Tm („melting temperature”) a unui primer cu o lungime mai mică de 25 de nucleotide se poate estima cu ajutorul relaţiei:
Tm =4(G+C) + 2(A+T), unde G, C, A şi T reprezintă numărul nucleotidelor respective în structura primerului.
Temperatura optimă de legare a primerilor se stabileşte la o valoare cu 5ºC mai redusă comparativ cu media temperaturilor de disociere (Tm) ale celor doi primeri. Dar, temperatura de disociere a celor doi primeri trebuie să nu difere prin mai mult de 5ºC, deci conţinutul în bazele GC şi lungimea lor trebuie să fie apropiate.
Dacă primerul are o lungime mai mare de 25 de nucleotide, temperatura de disociere trebuie să fie calculată cu ajutorul soft-urilor speciale (Ex: PrimerPremier, PrimerPlex), în care sunt evaluate inter-acţiunile dintre bazele adiacente, influenţa concentraţiei sărurilor etc.

ADN POLIMERAZA
În general, în reacţiile de amplificare se utilizează Taq polimeraza, care este o polimerază termostabilă, denumită după numele bacteriei termofile Thermus aquaticus din care a fost izolată iniţial de către Thomas D. Brock în 1965.
Thermus aquaticus este o bacterie care trăieşte în izvoare termale prin urmare posedă o polimerază stabilă la temperaturi ridicate. Această enzimă este capabilă să reziste la condiţiile de denaturare a ADN (temperatură ridicată) necesare în timpul desfăşurării reacţiei PCR. Astfel, a fost posibilă înlocuirea ADN polimerazei din E. coli, care era utilizată iniţial în reacţiile PCR.
Taq polimeraza are o activitate optimă în intervalul de temperatură 75-80ºC, cu un timp de înjumătăţire de 9 minute la temperatura de 97,5ºC şi poate replica 1000 de baze perchi în mai puţin de 10 secunde la 72°C.
Un dezavantaj al Taq polimerazei este fidelitatea relativ redusă în procesul de replicare deoarece îi lipseşte activitatea 3' – 5' exonucleazică având o rată a erorii ridicată. Taq polimeraza conduce la sinteza unor produşi care au o grupare dezoxi-adenozin fosfat (A) la capetele 3’. Prezenţa acestei grupări poate fi exploatată în procesul de clonare directă a produşilor PCR în vederea secvenţializării.
De aceea au fost izolate şi alte ADN polimeraze termostabile din alte bacterii termofile, cum ar fi Pfu ADN polimeraza, extrasă din Pyrococcus furiosus, care posedă activitate exonucleazică. Fidelitatea acestei enzime este cuprinsă între 7.7 × 105 şi 1 × 106, fiind de aproximativ 6 ori mai ridicată comparativ cu Taq polimeraza.
Enzimele menţionate pot fi utilizate separat sau împreună, pentru a obţine o rată mai înaltă de fidelitate a amplificării.

DEZOXI-NUCLEOZIDTRIFOSFAŢI (dNTP)
Prezenţa dezoxi-ribonucleozid trifosfaţilor (dNTP) în amestecul de amplificare furnizează moleculele de bază pentru sinteza noilor catene ADN. Este foarte important ca toţi cei patru dezoxi-nucleozid trifosfaţi (dATP, dTTP, dCTP şi dGTP) să fie prezenţi în concentraţii egale, bine stabilite, pentru ca reacţia de amplificare să se desfăşoare în condiţii optime.

CLORURA DE MAGNEZIU (MgCl2)
MgCl2 are rolul de a forma complecşi solubili cu dNTP, proces esenţial pentru încorporarea acestora în noua catenă ADN şi totodată stimulează activitatea polimerazei. O cantitate redusă de ioni de Mg2+ conduce la cantităţi mici de produşi PCR. O concentraţie ridicată favorizează însă formarea produşilor nespecifici. Cantităţi reduse de Mg2+ sunt recomandate atunci când este importantă fidelitatea sintezei ADN. Dacă probele ADN conţin EDTA (acid etilen-diamino-tetraacetic) sau alte substanţe care pot să lege ionii Mg2+, concentraţia acestora în amestecul de reacţie trebuie să fie crescută corespunzător.

4.3.1.2. MECANISMUL DE AMPLIFICARE PRIN REACŢIA PCR

Reacţia PCR are la bază mecanismul de replicare a ADN in vivo. ADN dublu catenar este denaturat, copiat şi renaturat. Această tehnică presupune desfăşurarea mai multor cicluri alcătuite fiecare din 3 etape. În plus, la începutul reacţiei are loc o etapă de denaturare iniţială, iar la sfârşit o reacţie de extensie finală (Fig. 4.5).

Etapa de denaturare iniţială
Denaturarea completă a ADN matriţă la începutul reacţiei PCR are loc la temperatura de 94-95ºC, având ca scop desfacerea moleculelor bicatenare de ADN iniţial şi formarea moleculelor monocatenare. Timpul de denaturare este cu atât mai mare cu cât conţinutul de dezoxi-guanozin-fosfat (G) şi dezoxi-citidin-fosfat (C) este mai mare.

Ciclul de amplificare, alcătuit din trei etape:
B.1. Etapa de denaturare
Fiecare ciclu de amplificare demarează cu o etapă de denaturare, care conduce la desfacerea moleculelor dublu catenare, atât a celor iniţiale, cât şi a celor formate pe parcursul derulării procesului. Timpul de denaturare depinde din nou de conţinutul de CG.
B.2. Etapa de legare a primerilor (“annealing”) – ataşarea celor două oligonucleotide utilizate ca primeri la secvenţele complementare din ADN matriţă, care se desfăşoară la temperaturi variabile.
B.3. Extensia, sinteza ADN, proces care are loc prin adăugarea de nucleotide la capetele 3’ ale primerilor, cu ajutorul ADN polimerazei, în prezenţa ionilor de Mg2+.
De obicei etapa de extensie are loc la temperatura de 70-75ºC, rata de sinteză la această temperatură, în prezenta Taq polimerazei fiind ridicată. Timpul recomandat pentru extensie este de 1 minut, pentru sinteza unor fragmente cu lungime mai mare de 2 kb. Dacă se sintetizează fragmente mai mari, timpul de extensie este de obicei mărit cu 1 minut pentru fiecare 1000bp.

Numărul de cicluri
Numărul de cicluri PCR depinde de cantitatea de ADN matriţă de la care se porneşte şi de cantitatea de produşi de amplificare aşteptată. Pentru mai puţin de 10 copii iniţiale ale ADN matriţă ar trebui să fie derulate 40 de cicluri. Dacă iniţial cantitatea de ADN matriţă este mai mare, sunt suficiente 25-35 de cicluri.

C. Etapa de extensie, sinteză ADN finală
După ultimul ciclu, este necesară menţinerea amestecului la 72ºC, timp de 5-15 minute pentru a completa toate golurile din produşii de amplificare obţinuţi. De asemenea, de-a lungul acestei etape activitatea de transferază terminală a Taq polimerazei permite adăugarea de dezoxi-adenozin-fosfat la capetele 3’ale produşilor PCR. Astfel, dacă fragmentele PCR urmează să fie clonate în vectori T/A această etapă poate să fie prelungită la 30 minute.
Cele trei etape: denaturarea, legarea primerilor şi extensia alcătuiesc un singur ciclu al amplificării. După fiecare ciclu, fragmentul de ADN nou sintetizat va servi ca matriţă într-un nou ciclu de amplificare. Produsul major al acestor reacţii exponenţiale este un segment ADN dublu catenar, ale cărui extremităţi sunt date de capetele 5’ ale primerilor şi a cărui lungime este determinată de distanţa dintre primeri (Fig.4.5).

Fig. 4.5. Etapele care alcătuiesc un proces de amplificare amplificare prin reacţia în lanţ a polimerazei – PCR
(după http://www.cs.mcgill.ca/~rwest/wikispeedia/wpcd/wp/p/ Polymerase_chain_reaction.htm)
1 – etapa de denaturare
2- etapa de legare a primerilor
3- etapa de sinteză ADN, în prezenţa ADN polimerazei (P)
4- ciclurile repetate, care conduc la amplificarea ADN

După primul ciclu de amplificare produşii sintetizaţi au lungimi diferite, care depăşesc distanţa dintre situsurile de legare ale celor doi primeri. După al doilea ciclu aceste molecule generează fragmente ADN cu lungime bine definită, care se vor acumula exponenţial de-a lungul ciclurilor de reacţie şi vor forma produşii de reacţie predominanţi (Fig. 4.6).
După amplificare numărul de copii ale fragmentului de interes este dat de relaţia m x 2n, unde n este numărul de cicluri şi m numărul iniţial de copii ale fragmentului de interes,

/

Fiecare dintre componentele unei reacţii de amplificare este hotărâtoare în desfăşurarea unei reacţii de amplificare eficientă.
ADN polimerazele stabile termic au o largă utilizare în tehnicile de biologie moleculară, dar au fost identificate şi alte enzime, cu utilizări în alte domenii, cum ar fi completarea unor fragmente ADN parţial monocatenare (formate în urma secţionării cu enzime de restricţie) sau în marcarea unor fragmente ADN.

APLICAŢII GENERALE
Pe baza principiilor tehnicii PCR s-au dezvoltat o serie de metode de investigaţie, cum ar fi PCR cu punct final ”End-point PCR”, PCR în timp real („Real-time PCR”), PCR asociat cu revers-transcripţia (”Reverse transcription polymerase chian reaction”), cu largi aplicaţii în domeniul evidenţierii prezenţei sau absenţei unei gene, sau secvenţe ADN, amplificarea unui fragment ADN, generarea unor markeri moleculari, detectarea şi cuantificarea unei secvenţe ADN şi studiul expresiei genelor.
4.3.2. SINTEZA ADN ÎN SCOPUL COMPLETĂRII UNOR EXTREMITĂŢI MONOCATENARE

In cadrul proceselor de secţionare cu enzime de restricţie există posibilitatea formării unor capete coezive, alcătuite din fragmente scurte monocatenare. Completarea acestor secvenţe poate să aibă loc printr-o reacţie de sinteză, catalizată de o ADN polimerază.
În acest scop se utilizează fragmentul Klenow al ADN polimerazei I, care reprezintă un fragment mare (75 kDa) al acestei enzime, care şi-a păstrat activitatea 5'-3' polimerazică şi 3'-5' exonucleazică, dar şi-a pierdut activitatea exonucleazică 5'-3'. De aceea, această enzimă se utilizează atunci când este necesară evitarea degradării moleculelor ADN nou sintetizate.
Mecanismul de reacţie este similar cu al celorlalte polimeraze, prin urmare necesită o grupare – OH liberă, la un capăt 3’.

În cazul fragmentelor monocatenare formate în urma secţionării cu enzime de restricţie, gruparea de iniţiere a reacţiei este furnizată chiar de capetele 3’ care delimitează secvenţele monocatenare. ADN polimeraza adaugă la acestea dezoxi-nucleozid-trifosfaţi, ţinând cont de comple-mentaritatea bazelor, astfel încât are loc formarea unor capete netede.

APLICAŢII GENERALE
Metoda de completare a secvenţelor monocatenare de ADN se aplică în cazul în care se doreşte formarea unor molecule de ADN recombinat, pornind de la fragmente ADN care au fost secţionate cu enzime de restricţie diferite, generatoare de capete coezive. În această situaţie este necesară completarea capetelor monocatenare, permiţând astfel ADN ligazei să refacă legăturile fosfodiesterice între fragmente cu capete netede.

4.3.3. SINTEZA ADN ÎN PROCESE DE MARCARE A SONDELOR MOLECULARE

În cadrul proceselor de marcare radioactivă sau enzimatică a fragmentelor de ADN utilizate ca sonde moleculare se folosesc drept matriţe catene unice de ADN, rezultate dintr-o denaturare prealabilă a unei catene, iar enzima implicată este ADN polimeraza I, fragment Klenow.
Reacţiile de sinteză a noilor catene de acid nucleic pornesc de la primeri cu o lungime de 6 nucleotide, cu secvenţă întâmplătoare, care găsesc secvenţe complementare în mai multe puncte în fragmentul care urmează a fi copiat. Acestea furnizează grupările OH, la capetele 3’, necesare ADN polimerazei pentru a începe sinteza. În catena nou formată vor fi înglobaţi nucleozid-trifosfaţii, în funcţie de complementaritatea bazelor, dintre care numai unul a fost marcat în prealabil (radioactiv sau chimic) (Fig. 4.7).

Fig. 4.7. Etapele reacţiei de marcare chimică sau enzimatică

a. Moleculele ADN dublu catenare care urmează să fie marcate sunt mai întâi denaturate;
b. Hexanucleotidele cu secvenţe de baze total întâmplătoare se vor lega la lanţurile monocatenare pe baza complementarităţii bazelor; Aceste nucleotide au rol de primeri pentru sinteza noii catene de ADN; Se adaugă ADN polimeraza Klenow, si cei patru nucleozid trifosfaţi, dintre care numai unul a fost marcat în prealabil (dATP, dTTP, dGTP şi dCTP*)
c. Enzima leagă nucleotidele la capătul 3’ al primerului (hexanucleotid), respectând complementaritatea bazelor.

Catena ADN originară serveşte drept matriţă pentru sinteza fragmentelor ADN marcate. Reacţia are loc sub acţiunea ADN polimerazei Klenow; întotdeauna noile nucleotide se adaugă la capătul 3’, alungirea lanţului realizându-se în direcţia 5’→3’.

APLICAŢII GENERALE
Marcarea radioactivă sau enzimatică a unor fragmente ADN, se realizează în scopul utilizării ulterioare a acestora ca sonde moleculare. Este astfel posibilă identificarea prezenţei unor fragmente ADN într-un amestec, care poate să fie fixat fie pe o membrană – transfer Southern, fie într-un preparat microscopic – hibridizare in situ.

4.4. LEGAREA MOLECULELOR ADN, CU AJUTORUL ADN LIGAZELOR

In vivo, ADN ligazele sunt enzime implicate în legarea fragmentelor de ADN, având rol în refacerea punţilor fosfodiesterice între grupările OH de la capetele 3’ şi grupările fosfat de la capete 5’, intervenind în unirea fragmentelor Okazaki şi totodată acţionează în procesele reparatorii în urma acţiunii radiaţiilor UV.
In vitro, modul lor de acţiune este similar, fiind necesar ca fragmentele de ADN care urmează să fie legate să aibă capete compatibile – netede sau coezive complementare (generate prin secţionarea cu aceiaşi enzimă de restricţie) (Fig. 4.8).

Fig. 4.8. Mecanismul de acţiune al ADN ligazelor

Conform mecanismului de acţiune al ADN ligazei, gruparea OH de la capătul 3’ al unui fragment se leagă covalent la atomul de fosfor de la capătul 5’ al celui de-al doilea fragment, catalizând formarea unei legături fosfodiesterice, cu ajutorul energiei furnizate de hidroliza ATP.
În cazul în care fragmentele care urmează să fie legate au fost secţionate cu enzime de restricţie care au generat capete netede este necesar ca secvenţele monocatenare să fie complementare. Astfel, în prima etapă se formează legăturile de hidrogen între bazele azotate complementare, după care intervine acţiunea ADN ligazei, care leagă ambele catene, formând o moleculă bicatenară de ADN (Fig. 4.9).

Fig. 4.9. Reacţia de refacere a legăturilor fosfodiesterice între capete coezive generate în urma secţionării cu enzime de restricţie

APLICAŢII GENERALE
Ligazele au o largă utilizare în tehnologia ADN recombinat, deoarece catalizează formarea moleculelor hibride, alcătuite din vectorii de clonare şi fragmentele de ADN care urmează a fi multiplicate. Ligazele utilizate în acest scop sunt cele de natură bacteriană, izolate din tulpini de E. coli, infectate sau neinfectate cu bacteriofagul T4.

4.5. SINTEZA ADN COMPLEMENTAR CU AJUTORUL REVERS-TRANSCRIPTAZELOR

Investigaţiile din domeniul studiului expresiei genelor se orientează spre analiza populaţiilor de ARNm, care reprezintă 1 – 2% din totalul de ARN celular şi sunt constituite din câteva mii de tipuri diferite, corespunzătoare proteinelor prezente în acel moment în celulă.
Datorită cantităţii foarte reduse, extracţia şi purificarea ARNm nu este posibilă şi de aceea se lucrează cu ARN total. Apoi, moleculele ARNm pot fi separate pe baza pe structurii lor specifice şi anume resturile adenilate (100-250) prezente la extremitatea 3’ – secvenţa poly A.

Capetele poly(A) nu sunt codificate de ADN, dar sunt adăugate post translaţional, înainte ca ARNm să fie exportat din nucleu în citoplasmă. Un complex enzimatic, care include o endonuclează şi o polimerază poly(A), recunoaşte o secvenţă semnal (5’ – AAUAAA’) din apropierea capătului 3’ al produsului de transcripţie, secţionează pre-ARNm în aval de acest semnal şi adaugă 100-250 de resturi adenilate la capăzul 3’. Capetele poly(A) facilitează exportul ARNm din nucleu, stabilizează ARNm împotriva degradării exonucleazice şi par să fie implicate în iniţierea translaţiei.

Pentru separarea ARNm dintr-un amestec de ARN total se utilizează oligonucleotide dT (poly T), care sunt fixate pe un suport solid. Acest suport este amplasat fie ca umplutură în coloane sau se fixează pe particule magnetice.
În primul caz amestecul de ARN total se trece pe coloane, ARNm se leagă de oligonucleotidele dT, datorită complementarităţii bazelor iar celelalte tipuri de molecule ARN sunt eliminate. Recuperarea ARNm are loc printr-o simplă eluare cu solvenţi specifici.
În cel de-al doilea caz soluţia ARN total este pusă în contact cu particulele magnetice ataşate la oligonucleotidele dT, pe care se fixează ARNm. Are loc apoi separarea într-un câmp magnetic, după care moleculele de acid nucleic se recuperează cu solvenţi specifici.
În cazul aplicării unor tehnici mai avansate nu este necesară separarea ARNm, ci se analizează direct ARN total.
În continuare are loc sinteza moleculelor de ADN complementar (ADNc), care reprezintă numai informaţia pură formată din secvenţele de exoni care alcătuiesc anumite gene. Fragmentele de ADNc se sintetizează artificial în laborator, pe o moleculă de ARNm, ca o copie complementară, în prezenţa enzimei reverstranscriptaza.
Revers-transcriptaza denumită şi ADN polimeraza dependentă de ADN este o polimeraza care transcrie o moleculă monocatenară de ARN într-o moleculă monocatenară de ADN. Această enzimă a fost descoperită de doi cercetători care au lucrat independent, Howard Temin şi David Baltimore în 1970, care au primit premiul Nobel pentru Fiziologie şi Medicină în anul 1975. În mod natural revers-transcriptaza se găseşte în virusurile ARN (ribovirusuri), iar descoperirea ei a adus un argument împotriva aşa numitei dogme a geneticii conform căreia informaţia genetică este transferată întotdeauna în direcţia ADN →ARN→proteine.
Pentru ca revers-transcriptaza să fie activă este necesară prezenţa unei secvenţe scurte dublu catenare la capătul 3’, care acţionează ca un primer pentru polimerază.
Acest punct de pornire poate fi furnizat de către o nucleotidă dT, de dimensiuni scăzute, care se leagă la capătul poly(A) al moleculei de ARNm şi funcţionează ca un primer.
Apoi, revers-transcriptaza adaugă dezoxi-nucleotide la capătul 3’ al primerului, în direcţia specifică 5’→3’, ţinând cont de complementaritatea bazelor.
Produsul de reacţie este o moleculă hibridă ADNc –ARNm, alcătuită deci din ARN matriţă şi o moleculă complementară de ADN monocatenar.
Revers-transcriptaza poate cauza la capătul 5’ al moleculei ARNm, o răsucire a noii catene ADN prin utilizarea ultimelor baze ale acesteia ca matriţă pentru sinteza unui alt lanţ complementar, cu o lungime de 12-20 bp. Acest fragment formează o buclă, care furnizează, un primer (o grupare –OH la un capăt 3') de la care începe sinteza ADN polimerazei.
Apoi, molecula ARNm este degradată prin tratare cu substanţe alcaline sau prin fierbere (procese care conduc la degradarea exclusivă a ARN), iar molecula ADNc monocatenară va reprezenta matriţa de copiat pentru ADN polimerază.
Bucla formată la capătul 3' al moleculei ADNc monocatenară furnizează un primer natural pentru următoarea etapă în care este utilizată ADN polimeraza I, fragment Klenow, pentru a transforma molecula monocatenară într-una bicatenară. În această reacţie polimeraza utilizează molecula monocatenară de ADNc pentru a sintetiza o secvenţă identică cu ARNm original.
Produsul obţinut este un dublu helix, cu o buclă la unul dintre capete. Pentru a se genera o moleculă bicatenară de ADN bucla este degradată de către nucleaza S1, care secţionează în special fragmente de ADN monocatenar (Fig. 4.10).
Metodele de sinteză a ADN complementar se bazează pe capacitatea enzimei revers-transcriptaza de a transcrie ARN mesager într-o moleculă de ADN complementar monocatenară, într-o reacţie denumită de sinteză a primei catene. Totuşi, datorită faptului că revers-transcriptaza nu poate transcrie întreaga moleculă de ARNm, capătul 5’ tinde să rămână nereprezentat în populaţia de ADNc.
Această sinteză incompletă apare mai ales atunci când moleculele ARNm au o lungime mare sau sunt împachetate datorită structurilor secundare care se formează. Prin urmare se formează molecule ADNc incomplete deoarece acţiunea revers-transcriptazei încetează înainte de realizarea completă a transcripţiei. Pentru a corecta aceste dezavantaje pot fi aplicate tehnici mai avansate de sinteză, care sunt prezentate în capitolul 5.1.3.

Fig. 4.10. Sinteza moleculei ADNc, cu ajutorul unui primer oligo dT şi a revers-transcriptazei

APLICAŢII GENERALE
Moleculele de ADNc sunt sintetizate ori de câte ori se doreşte efectuarea unor investigaţii la nivel de ARN. Astfel, este posibilă obţinerea unor biblioteci ADNc, care să fie utilizate în procesele de cartare genetică, fizică sau în scopul identificării genelor. Totodată ADNc permite evaluarea cantitativă sau calitativă a expresiei genelor prin tehnici de amplificare PCR sau microarray.

4.6. IDENTIFICAREA PROTEINELOR SPECIFICE CU AJUTORUL ANTICORPILOR

Analizele moleculare se efectuează în general la nivelul acizilor nucleici, ceea ce conferă informaţii cu privire la structura genomului sau la transcripţia genelor. De mai multe ori prezintă interes şi obţinerea de informaţii cu privire la procesele translaţionale, respectiv post-translaţionale.
În cazul din urmă, dacă se doreşte identificarea anumitor proteine este necesară utilizarea anticorpilor specifici, care formează cupluri cu proteina de interes.
Anticorpii sunt proteine, având ca unitate de bază un monomer constituit din patru structuri polipeptidice, organizate în regiuni simetrice. Structura tridimensională este conferită de legăturile disulfidice. Două dintre structuri sunt lanţuri grele H („heavy”), cu greutate moleculară mare şi două sunt lanţuri uşoare L („light”), asocierea între ele realizându-se în ordinea L-H-H-L. La rândul lor aceste lanţuri se subdivid în regiunea V (variabilă) de la capătul NH2 terminal şi C (constantă) din zona C-terminală, repartizându-se astfel: pe lanţul H-VH, CH1, CH2 şi CH3, iar pe lanţul L-VL şi CL (Fig. 4.11.)
În structura anticorpilor se diferenţiază două regiuni, Fab şi Fc, care prezintă diferenţieri din punct de vedere funcţional. Fragmentul Fab („fragment antigen binding”), situat în regiunea aminoterminală a lanţurilor grele şi uşoare are rol în legarea proteinei. Fragmentul Fc, situat la extremitatea distală, la capătul COOH, interacţionează cu receptorii specifici, fiind implicat în fixarea pe celule.
În funcţie de modul lor de producere, anticorpii pot fi împărţiţi în două categorii: policlonali sau monoclonali.

Fig. 4.11 Structura anticorpilor utilizaţi pentru identificarea proteinelor

Anticorpii policlonali sunt produşi în animale de talie medie, în urma injectării cu proteina de interes. În urma imunizării, în organismul animal se sintetizează anticorpi specifici care sunt apoi purificaţi din sânge.
Anticorpii policlonali. au o sensibilitate ridicată dar o specificitate de recunoaştere mai redusă, comparativ cu anticorpii monoclonali.
Anticorpii monoclonali sunt sintetizaţi în culturi de celule hibride, obţinute prin fuzionarea in vitro a unor celule producătoare de anticorpi (splenocite sau limfocite obţinute de la animale imunizate cu o anumită antigenă) cu celule neoplazice obţinute din mieloame sau limfoame. Sunt astfel exploatate caracteristicile ambelor tipuri de celule – capacitatea de diviziune nelimitată, preluată de la celulele tumorale şi proprietatea de a produce anticorpi, preluată de la splenocite (Fig. 4.12).
Anticorpii monoclonali au unele avantaje deoarece ei exprimă o afinitate şi specificitate uniformă faţă de un singur determinant antigenic sau epitop şi pot fi produşi în cantităţi mari, in vitro, în culturile de celule.
După sinteză, ambele tipuri de anticorpi necesită etape suplimentare de purificare, după care pot să fie utilizaţi pentru identificarea unor proteine specifice.

Fig. 4.12. Procedura de obţinere a anticorpilor monoclonali în celule hibride, obţinute prin fuzionarea unor celule producătoare de anticorpi cu celule tumorale (după http://xelonet.com/antibody-production/)

APLICAŢII GENERALE
Anticorpii permit identificarea oricărei proteine prin testări imunologice cum sunt: Western Blotting şi ELISA (“Enzyme Linked Immunosorbent Assay”). În funcţie de tipul proteinei ţintă este posibilă detectarea unei afecţiuni induse enzimatic, prezenţa unor patogeni sau a unor organisme modificate genetic.

4.7. ANALIZA MOLECULELOR DE ACIZI NUCLEICI/PROTEINE PRIN ELECTROFOREZĂ

Electroforeza este o metodă analitică de separare a particulelor încărcate electric sub acţiunea unui câmp electric uniform aplicat din exterior.
În funcţie de mediul în care se efectuează separarea, metodele electroforetice se împart în două clase: electroforeza în mediu liber – proces care se bazează pe electromigrarea liberă a speciilor ionice într-o soluţie tampon corespunzătoare şi electroforeza în mediu stabilizant – proces care presupune utilizarea unor medii suport care pot fi inerte: hârtie de filtru, acetat de celuloză, silicagel, alumină sau dimpotrivă pot participa activ în separare, interacţionând cu particulele care migrează: geluri de amidon, agaroză, poliacrilamidă.

4.7.1. ELECTROFOREZA ÎN GEL DE AGAROZĂ

Separarea acizilor nucleici se realizează de obicei prin electroforeză în gel de agaroză care este cea mai avantajoasă metodă de analiză atât pentru ADN cât şi pentru ARN.
Agaroza este un polizaharid inert, care conduce la formarea unui gel cu pori de anumite dimensiuni, în funcţie de concentraţie. Sub acţiunea câmpului electric acizii nucleici care sunt macromolecule încărcate parţial negativ (datorită reziduurilor fosfat) migrează spre anod (+).
Rata de migrare a moleculelor de acizi nucleici liniari, într-un câmp electric este invers proporţională cu lungimea moleculelor, astfel că pot fi separate fragmente de dimensiuni diferite, iar lungimile lor pot fi apreciate prin compararea cu un marker ADN/ARN, pentru care se cunosc dimensiunile fragmentelor.
Benzile de acizi nucleici prezente în gelul de agaroză se vizualizează direct, prin colorare cu o substanţă fluorescentă, bromura de etidiu şi iluminare UV. Această metodă de vizualizare este foarte sensibilă, permiţând detectarea unor benzi de ADN care conţin până la 2 ng de ADN.

Bromura de etidiu, abreviată în general ca BrEt este un colorant fluorescent pentru acizi nucleici, cu o moleculă plană (Fig.4.13). Aceasta se intercalează între bazele azotate ale unei molecule de acid nucleic, formând complecşi care absorb radiaţia în domeniul UV şi o retransmit în vizibil. Astfel este posibilă vizualizarea fragmentelor de acizi nucleici, în urma expunerii la o lumină UV. Bromura de etidiu are o acţiune mutagenă, cancerigenă sau teratogenă în funcţie de organism şi de condiţiile externe.

Fig. 4.13 Structura bromurii de etidiu (a) şi modul de intercalare în molecula ADN (b)

Rata de migrare electroforetică a ADN depinde de mai mulţi parametri importanţi şi anume:

Dimensiunea fragmentelor de ADN
Fragmentele de ADN migrează cu viteze care sunt invers proporţionale cu logaritmul greutăţii lor.

Concentraţia gelului
Cantitatea de agaroză prezentă în gel determină dimensiunile porilor care se formează, influenţând rata de migrare a fragmentelor de acizi nucleici. De aceea concentraţia gelului trebuie să fie aleasă cu grijă, pentru a permite separarea optimă a fragmentelor analizate.
Fragmentele mari de acizi nucleici (5-60 kb) pot fi separate în geluri cu concentraţie redusă 0,3 – 0,5 %, iar fragmentele mici (0,1-3,0 kb) pot fi analizate în geluri cu concentraţie mare 2%. O concentraţie medie, de 0,8% poate să conducă la o separare bună a fragmentelor din domeniul 0,5-10 kb. Concentraţia gelului de agaroză se alege deci în funcţie de intervalul în care se încadrează fragmentele analizate.

Conformaţia ADN
Formele circulare sau liniare de acizi nucleici cu aceiaşi greutate moleculară migrează diferit, nefiind posibilă compararea lor.

Tensiunea la care are loc migrarea
La tensiuni scăzute viteza de migrare a fragmentelor liniare este proporţională cu tensiunea. Dacă se utilizează tensiuni prea ridicate rata de separare scade. Pentru a obţine o rezoluţie maximă, migrarea trebuie să se producă la o tensiune de 3-10V/h/cm.

Temperatura
Temperatura nu afectează mobilitatea electroforetică, dacă se menţine în intervalul 4-30°C. În general electroforeza în geluri de agaroză are loc la temperatura camerei. Dacă se utilizează geluri cu concentraţii mai mici de 0,5% este necesară menţinerea gelului la temperaturi scăzute, deoarece la temperaturi mai ridicate acesta se poate lichefia.

4.7.2. ELECTROFOREZA ÎN GEL DE POLIACRILAMIDĂ

În cazul electroforezei în gel de poliacrilamidă pot fi analizate fragmente de acizi nucleici cu dimensiuni mici (<1kb), sau fracţii proteice în formă denaturată.
Faţă de alte medii suport, gelul de poliacrilamidă are următoarele avantaje practice: putere mare de rezoluţie, reproductibilitate; posibilitatea controlului dimensiunilor porilor pe un domeniu larg; inerţia, stabilitatea chimică la variaţii mari de pH, temperatură şi forţă ionică, transparenţă perfectă, rezistenţă şi flexibilitate.
Obţinerea gelurilor de poliacrilamidă se realizează printr-o reacţie de polimerizare ireversibilă a doi monomeri: acrilamidă şi bisacrilamidă, având ca iniţiator persulfatul de amoniu (NH4) S2O8 şi catalizator tetra metilen-diamina (TEMED). Bisacrilamida funcţionează ca agent de reticulare.
Mărimea efectivă a porilor în gelurile de poliacrilamidă depinde de concentraţia totală a monomerilor (acrilamidă si bisacrilamidă) (T%) şi de gradul de reticulare (C%), care reprezintă raportul dintre cantitatea de agent de reticulare (bisacrilamidă) şi cantitatea totală de monomeri (acrilamidă si bisacrilamidă).
Concentraţia gelurilor de poliacrilamidă, respectiv gradul de reticulare se stabilesc în funcţie de dimensiunile particulelor care urmează să fie separate.
Fracţiunea reprezentată de proteinele de analizat este extrasă şi analizată apoi prin electroforeză în gel de poliacrilamidă. Benzile, care reprezintă fracţiile proteice sunt fixate şi developate din gel cu soluţii de coloranţi speciali.
După extragere în soluţii de extracţie specifice, proteinele analizate, sunt denaturate în prezenţa dodecilsulfatului de sodiu (SDS), un detergent anionic care distruge aproape toate legăturile necovalentesau cu ajutorul mercaptoetanolului care desface punţile de sulf din structura proteinelor.
SDS-ul mai are proprietatea de a se lega în raport constant (1,4g SDS/1g proteină) la toate proteinele. Se formează astfel complexe SDS-proteină denaturată, încărcate negativ. Sarcinile intrinseci ale polipeptidelor sunt nesemnificative comparativ cu sarcinile electrice negative rezultate după legarea SDS-ului, fiind astfel posibilă separarea strict în funcţie de dimensiunile polipeptidelor.
Desfăşurarea electroforezei se urmăreşte vizual, datorită introducerii în probele analizate a unei soluţii colorant de migrare.
După terminarea migrării, fracţiile proteice separate în gel se vizualizează în prezenţa colorantului Comassie Brillant Blue sau a azotatului de argint. Colorarea cu azotat de argint este mai laborioasă, dar permite vizualizarea unor cantităţi foarte mici de proteină – 0,02 μg, comparativ cu colorantul menţionat – 0,1μg.

APLICAŢII GENERALE
Analizele prin electroforeză a acizilor nucleici şi a proteinelor au o gamă foarte largă de utilizare, deoarece permit vizualizarea fragmentelor ADN formate în urma secţionării cu enzime de restricţie, a amplificării PCR, a produşilor pentru secvenţiere, a evaluării moleculelor de ADN recombinat. Totodată această tehnică stă la baza dezvoltării tehnicilor Southern, Northern şi Western, care sunt prezentate în capitolul 5.2

CAPITOLUL V

PROCEDEE COMPLEXE DE ANALIZĂ ŞI EVALUARE A MOLECULELOR DE ACIZI NUCLEICI ŞI PROTEINE

5.1. METODE DE INVESTIGAŢIE BAZATE PE PCR (Polymerisation Chain Reaction)
O dată cu dezvoltarea tehnicilor de investigaţie în biologia moleculară, tehnica PCR a suferit o serie de modificări, care permit lărgirea posibilităţilor de utilizare. În continuare vor fi prezentate cele mai importante variante ale amplificării PCR.

5.1.1. METODA AMPLIFICĂRII PRIN REACŢIA ÎN LANŢ A POLIMERAZEI – PCR cu punct final
În literatura de specialitate acronimul PCR este utilizat pentru tehnica PCR tradiţional, care mai este denumită PCR cu punct final, deoarece rezultatul poate fi evidenţiat numai la sfârşitul reacţiei de amplificare. În literatura de limba engleză metoda este cunoscută sub denumirea de ”End-point PCR”.
În acest caz amplificarea fragmentului specific de ADN dublu catenar, denumit şi fragment ţintă se desfăşoară după principiile metodologice descrise în capitolul 4.3.1.
Pentru a verifica dacă în urma amplificării au fost sintetizate fragmentele aşteptate, produşii PCR sunt separaţi prin electroforeză în gel de agaroză. Dimensiunile fragmentelor sunt determinate prin compararea cu un marcator de greutate moleculară (în limba engleză „molecular weight marker”).
Se poate aprecia astfel dacă secvenţa ţintă este prezentă în proba analizată şi totodată dacă are dimensiunea aşteptată. Din acest considerent metoda amplificării prin PCR cu punct final este indicată pentru “detectarea” secvenţelor dintr-un eşantion biologic, fiind deci o metodă calitativă.
Accesibilitatea metodei de amplificare prin PCR cunoaşte şi limite, condiţionate de lungimea fragmentului amplificabil, deci a ADN iniţial. Astfel amplificarea fragmentelor de 100-1000 nucleobaze este relativ facilă. Se estimează că limita superioară a lungimii fragmentelor amplificabile atunci când se lucrează cu Taq polimerază este de 3 kb, pentru că, la valori mai mari scade randamentul amplificării.
Prin această metodă este posibilă evidenţierea prezenţei unei anumite secvenţe de ADN, fără a oferi informaţii privitoare la numărul de copii sau cantitatea de ADN existentă în proba de analizat.
În continuare este prezentată detecţia genei zeină în ADN extras din şase probe diferite de furaje prin tehnica PCR cu punct final (Fig. 5.1). Se cunoaşte că zeina este o genă cu specificitate de specie pentru porumb, având o singură copie în genom, cu primerii specifici ZEIN3: 5’AGTGCGA CCCATATTC CAG3’ şi ZEIN4: 5’GACATTGTGGCATCATCATT3’.

Fig. 5.1. Analiza prin electroforeză în gel de agaroză a produşilor rezultaţi în urma reacţiei de amplificare cu primerii ZEIN3/ZEIN4, care flanchează gena zeină la porumb
1,2,3,4,5 – probe analizate, 6 – martor pozitiv, 7- martor negativ,
8- marker molecular

Rezultatele obţinute evidenţiază prezenţa genei zeină în toate probele de furaje, cu o lungime a fragmentului amplificat de 277 bp, la fel ca şi martorul pozitiv.

5.1.1.1. PCR MULTIPLEX
PCR multiplex se încadrează în categoria PCR cu punct final, deoarece analiza produşilor de amplificare se realizează la sfârşitul reacţiei, dar se diferenţiază prin posibilitatea de desfăşurare a mai multor reacţii de amplificare în acelaşi timp.
În amestecul de amplificare se introduc mai multe seturi de primeri, fiecare specific pentru o anumită secvenţă. Teoretic, reacţiile de amplificare ar trebui să aibă loc în acelaşi timp, fiecare set de primeri amplificând o anumită secvenţă ADN. Practic, în astfel de reacţii de amplificare va exista întotdeauna un risc ridicat al obţinerii unor rezultate eronate deoarece:
Fiecare set de primeri necesită condiţii de reacţie diferite (de exemplu regim de temperaturi diferit sau o concentraţie diferită a reactanţilor);
Combinarea diferitelor seturi de primeri poate să crească riscul amplificării altor fragmente decât secvenţele ţintă;
Atunci când într-o reacţie PCR sunt amplificate mai multe fragmente ţintă, ele concurează pentru reactanţi. În această competiţie, un fragment care este prezent într-un număr mai mare de copii la început va predomina asupra altor fragmente care sunt prezente în număr mai redus.
De obicei tehnica PCR multiplex este utilizată pentru un screening general al probelor de analizat, după care probele posibil pozitive sunt reanalizate cu un singur set de primeri.
In continuare este prezentată analiza unor probe complexe provenite din ţesuturi animale prin tehnica de amplificare multiplex, folosind patru perechi de primeri care amplifică regiuni din ADN mitocondrial16S ARNr sau 12 ARNr şi anume:
Primerii specifici speciilor rumegătoare şi anume Bos taurus, Capra hircus, Ovis aries, cu următoarele secvenţe: 5’GAAAGGACAAGAGAA ATAAGG3’ şi 5’TAGGCCCTTTTCTAGGGCA3’;
Primerii specifici pentru detecţia componentelor provenite de la specii de păsări şi anume Gallus gallus, Meleagris meleagridis, cu următoarele secvenţe: 5’TGAGAACTACGAGCACAAAC3’ şi 5’GGGCTA TTGAGCTCACTGTT3’
Primerii specifici pentru detecţia componentelor provenite de la specii de peşti şi anume Sardinops melanostictus, Sardinella hualiensis, Pagrus major, Tracurus japonicas, cu următoarele secvenţe: 5’TAAGA GGGCCGGTAAAACTCA3’ şi 5’GTG GGGTATCTAATCC CAG3’.
Primerii specifici pentru detecţia componentelor provenite de la porc (Sus scrofa), cu următoarele secvenţe: 5’CTACATAAGAA TATCCACCACA3’ şi 5’ACATTGTGGGATCTTCTA GGT3’ (Fig. 5.2).
Dimensiunile fragmentelor amplificate sunt 104bp (1), 183bp (2), 225bp (3), respectiv 290bp (4).
Se poate observa că în probele 1-16 au fost identificate diferite compoziţii ale amestecurilor şi anume: 1-4: porc şi pasăre, 5-8: porc, pasăre şi rumegătoare; 9-12: pasăre şi rumegătoare şi 13-16: peşte, pasăre şi rumegătoare. În proba martor pozitiv au fost identificate fragmentele celor patru specii animale luate în studiu

Fig. 5.2. Analiza prin electroforeză în gel de agaroză a produşilor rezultaţi în urma reacţiiilor de amplificare multiplex, cu cele patru perechi de primeri enumerate mai sus
1-16 – probe complexe provenite din ţesuturi animal; 17- martor negativ, 18-martor pozitiv (care conţine cele patru tipuri de ţesut: rumegătoare, pasăre, peşte şi pasăre); 19- martor negativ de amplificare
20- marker molecular (Ultra Low Range DNA Ladder)

Prin urmare, dacă reacţiile de amplificare sunt bine optimizate din punctul de vedere al concentraţiei reactanţilor şi al temperaturii de legare a primerilor se pot obţine rezultate corecte, chiarr dacă se lucrează cu 3-4 perechi de primeri simultan.

5.1.1.2. PCR CANTITATIV COMPETITIV

Tehnica PCR cantitativ competitiv este asemănătoare cu PCR clasic, dar în acest caz are loc amplificarea simultană a două tipuri de ADN, care conţin secvenţe asemănătoare, amplificabile cu acelaşi set de primeri. Primul tip de ADN este extras din proba de analizat, iar cel de-al doilea este un standard intern denumit competitor. La fel ca la PCR calitativ, produşii de amplificare sunt analizaţi la sfârşitul reacţiei.
PCR competitiv furnizează posibilităţi foarte bune pentru o detectare simplă şi sigură a anumitor secvenţe în probele de analizat şi totodată o determinare semi- cantitativă a acestora.
În acest caz, în reacţia de amplificare se introduce ADN extras din proba de analizat care este purtătorul potenţial al unei secvenţe ţintă şi un ADN competitor, sau standard intern, care poartă o secvenţă ţintă puţin modificată, dar care poate fi amplificată cu acelaşi set de primeri. În cazul competitorului secvenţa ţintă a fost fie scurtată, prin deleţie, fie mărită prin inserţie. Aceste modificări nu afectează însă situsurile de legare ale primerilor.
Ca standarde interne sau competitori sunt utilizate produse care conţin secvenţa ţintă cu o concentraţie cunoscută.
Deci, ADN standard intern cu concentraţie cunoscută este adăugat în amestecul de reacţie şi amplificat împreună cu ADN ţintă al probei cu concentraţie necunoscută. La sfârşitul reacţiei de amplificare produşii obţinuţi se analizează prin electroforeză în gel de agaroză şi sunt vizualizaţi prin iluminare UV în prezenţa bromurii de etidiu. Produşii au o intensitate a fluorescenţei care este proporţională cu cantitatea de ADN amplificat şi ei apar în gelul de agaroză ca două benzi distincte, cu intensităţi diferite (Fig. 5.13).
Dacă se realizează o singură reacţie de amplificare se poate preciza numai dacă concentraţia probei necunoscute este mai mare, sau mai mică comparativ cu standardul intern.
În scopul obţinerii unor rezultate mai complexe, se realizează mai multe amestecuri de amplificare în care pentru standardul intern se realizează diluţii seriale, iar proba cu concentraţie necunoscută se menţine constantă. Produşii de reacţie se analizează prin electroforeză în gel de agaroză şi se compară intensitatea benzilor rezultate din fiecare amestec de amplificare. Apoi, se identifică amestecul pentru care intensitatea celor două benzi este identică, considerându-se că în acest caz concentraţia probei necunoscute este identică cu cea a standardului intern. Dacă pentru nici unul dintre amestecurile de reacţie nu se vizualizează fragmente cu aceiaşi intensitate, atunci se pot efectua alte diluţii ale probei standard, în aşa fel încât să fie posibilă în final evaluarea concentraţiei probei necunoscute.
O variantă mai complexă a PCR cantitativ competitiv este PCR cantitativ dublu competitiv, care are la bază acelaşi principiu, aplicat de două ori: o dată pentru o genă specifică speciei şi standardului ei intern şi a doua oară unei gene specifice şi standardului intern corespunzător. Rezultatele obţinute din ambele amplificări PCR permit calcularea conţinutului de iniţial al secvenţei de interes, comparativ cu genă specifică speciei..
Atât PCR cantitativ competitiv, cât şi sistemul dublu competitiv prezintă un avantaj major deoarece nu necesită nici un echipament în plus, comparativ cu PCR cantitativ. Metodele mai sus menţionate sunt totuşi considerate a fi semi cantitative, deoarece ele necesită un standard cu care să fie comparate. Compararea se realizează vizual, din această cauză fiind posibilă apariţia unor erori. Rezultatul poate fi de formă mai mare, egal sau mai mic comparativ cu proba standard.

În continuare este prezentată analiza unor molecule ADNc, specifice genei oxid de azot sintetaza – eNOS (“nitric oxide synthase”), în comparaţie cu un fragment ADNc modificat (eNOS-C) (Fulton şi colab., 2000). Ambele fragmente pot fi amplificate cu aceiaşi pereche de primeri (5′-GGAATCC AGGTGGACAGAG-3 şi 5′-TAGTTGAGCATCTCCTGGTGG-3′) dar generează benzi cu lungimi diferite şi anume 411, respectiv 332bp. Se realizează opt reacţii de amplificare diferite, cu ambele tipuri de ADN, cu menţiunea că pentru proba eNOS-C concentraţiile sunt cunoscute (332; 166; 83; 41,5; 20,8; 10,4; 5,2 şi 2.6 nmol) (Fig. 5.3).

Fig. 5.3. Analiza prin electroforeză în gel de agaroză a produşilor de rezultaţi dintr-o reacţie PCR competitiv (după Fulton şi colab., 2000)

Analiza comparativă a intensităţii benzilor obţinute permite evaluarea cantităţii de ADN în probele analizate.

5.1.1.3. AMPLIFICAREA PRIN REACŢIA ÎN LANŢ A POLIMERA-ZEI – PCR cu temperatură variabilă de legare a primerilor

În cazul utilizării tehnicii PCR, uneori rezultatele aşteptate nu sunt corespunzătoare, deoarece legarea primerilor la catena matriţă are loc cu o eficienţă scăzută. În această situaţie se consideră că temperatura de legare a primerilor, stabilită teoretic nu asigură condiţiile optime de desfăşurare a reacţiei. De aceea este necesară optimizarea procesului prin urmarea unui program cu gradient de temperatură, sau „PCR Touchdown”.

Programele cu gradient de temperatură presupun folosirea condiţiilor similare de amplificare şi anume acelaşi amestec de reacţie, aceeaşi matriţă ADN, aceiaşi primeri; reacţiile se desfăşoară în acelaşi timp în aparatul thermalcycler, dar temperatura de legare a primerilor diferă pe coloane. Astfel se poate stabili temperatura optimă a acestui pas de care depinde în mare măsură reuşita unei reacţii de amplificare.

Programele PCR Touchdown se utilizează mai ales atunci când se urmează tehnica PCR Multiplex şi anume se doreşte amplificarea unui ADN matriţă în acelaşi timp cu mai mulţi primeri.
Programul de tip Touchdown presupune folosirea unei variaţii a temperaturii de legare a primerilor, în cadrul aceleiaşi reacţii de amplificare. Diferenţele faţă de programele cu gradient de temperatură constau în faptul că nu se mai urmăreşte stabilirea unei temperaturi optime de legare ci se doreşte ca amplificarea să se producă în cadrul aceluiaşi program pentru un număr cât mai mare de perechi de primeri, în condiţii optime.
Un astfel de program este compus din aceeaşi paşi ai reacţiei de amplificare, dar temperatura fiecărui ciclu de legare a primerilor diferă. Într-o etapă de amplificare temperatura creşte cu o rată de 2°C la fiecare două cicluri, pornind de la premisa că perechile de primeri folosite vor atinge optimul de legare la una dintre temperaturile folosite.
Aceste programe se folosesc cu succes, deoarece pentru anumiţi primeri este necesară o temperatură optimă de legare doar la debutul amplificării, după care procesul decurge normal chiar dacă temperatura de legare scade.
De menţionat că primerii folosiţi în acest program de amplificare trebuie să fie specifici, precişi şi robuşti, pentru a preîntâmpina apariţia posibilă a produşilor de amplificare nespecifici.

5.1.2. PCR ÎN TIMP REAL

În biologia moleculară tehnica PCR în timp real, denumită şi PCR cantitativ în timp real (Q-PCR/qPCR) este o tehnică de laborator care permite amplificarea şi cuantificarea simultană a unei secvenţe ţintă de ADN.
În literatura de specialitate de limbă engleză metoda este cunoscută sub denumirea de „real-time polymerase chain reaction” – reacţia în lanţ a polimerazei urmărită în timp real sau „quantitative real time polymerase chain reaction” – reacţia în lanţ a polimerazei, cantitativă, urmărită în timp real, notată abreviat prin acronimul (Q-PCR/qPCR).
Această tehnică urmează principiul PCR, caracteristic fiind faptul că ADN amplificat este cuantificat în timp real, pe măsură ce se acumulează în reacţie, după fiecare ciclu de amplificare. Astfel este posibilă determinarea numărului absolut al copiilor unei secvenţe ADN specifice sau poate avea loc o cuantificare relativă, atunci când se raportează la o genă de referinţă.
Tehnica PCR în timp real a devenit disponibilă în anul 1996, o dată cu introducerea pe piaţa a primului echipament care a permis urmărirea desfăşurării reacţiei de amplificare în timp. De atunci şi până în prezent a rămas cea mai precisă şi sensibilă tehnică aplicată pentru detectarea şi cuantificarea acizilor nucleici.

PCR în timp real este un sistem bazat pe o monitorizare continuă a produşilor PCR, care se realizează prin măsurarea semnalului fluorescent al unei probe interne de-a lungul reacţiei. O problemă în procesul de monitorizare a fost găsirea unei metode care să permită detecţia produşilor PCR pe măsură ce ei se formează. În acest scop se aplică în prezent două strategii importante: una utilizează un colorant fluorescent care are capacitatea de a se lega numai la moleculele de ADN bicatenare iar cea de-a doua se bazează pe prezenţa unor sonde oligonucleotidice, alcătuite din ADNmc, care se leagă în interiorul fragmentului ADN care urmează să fie amplificat şi devin fluorescente după ce reacţia a avut loc.

5.1.2.1. CUANTIFICAREA ACIZILOR NUCLEICI CU AJUTORUL COLORANŢILOR SPECIFICI

Cea mai simplă şi economică modalitate pentru detectarea şi cuantificarea produşilor PCR este utilizarea SYBR Green, o substanţă fluoroforă care are proprietatea de a se cupla cu moleculele ADN bicatenar (ADNbc), mărindu-şi astfel fluorescenţa de peste 1000 de ori.
SYBR green este un colorant fluorescent sintetic, introdus la începutul anilor 1990, care se leagă la fragmentele ADN dublu catenar cu o specificitate foarte mare. Este utilizat pe scară foarte largă în cercetările de biologie moleculară pentru a cuantifica şi vizualiza ADN dublu catenar.
Este un colorant cianinic asimetric, stabil într-un interval larg de temperatură, ceea ce înseamnă că poate fi utilizat pentru a monitoriza reacţiile biochimice (Fig. 5.4.). Complexele ADN-colorant absorb lumina în spectrul albastru (λmax = 488 nm) şi emit lumină verde (λmax = 522 nm).

Fig. 5.4. Structura colorantului SYBR Green

Pe măsură ce cantitatea de ADNdc sporeşte ca rezultat al amplificării secvenţelor specifice, creşte şi gradul de fluorescenţă al amestecului de reacţie, datorită ataşării colorantului SYBR Green la ADNdc. Energia emisă de fluorofor în urma excitării în UV este înregistrată la sfârşitul fiecărui ciclu de amplificare, fiind proporţională cu cantitatea iniţială a secvenţelor ADN ţintă.
Dezavantajul utilizării colorantului SYBR green este legarea lui la orice moleculă de ADN dublu catenar din reacţie, inclusiv dimerii alcătuiţi de primeri şi alţi produşi de reacţie nespecifici, ceea ce conduce la o supraestimare a concentraţiei secvenţelor ţintă.
SYBR Green este totuşi cea mai economică alegere pentru detectarea produşilor PCR în timp real, deoarece este ieftin, uşor de utilizat şi sensibil. El poate fi utilizat în orice reacţie de amplificare, fără a fi necesară pregătirea unor sonde pentru fiecare secvenţă ţintă particulară care urmează a fi analizată. Pentru că legarea este nespecifică procesul de detecţie necesită o optimizare considerabilă şi sunt necesare alte metode ulterioare pentru validarea rezultatelor.

5.1.2.2. CUANTIFICAREA ACIZILOR NUCLEICI CU AJUTORUL SONDELOR MOLECULARE SPECIFICE

De-a lungul timpului au fost dezvoltate mai multe sisteme de marcare, denumite sonde moleculare, care se leagă la fragmentul ţintă, dar devin fluorescente numai după ce reacţia de amplificare a avut loc. În continuare sunt prezentate cele mai uzuale tipuri de sonde moleculare, cu utilizare în tehnica Real-Time PCR.

SONDE MOLECULARE „TaqMan”

Sondele moleculare TaqMan sunt fragmente scurte de ADN, marcate cu un colorant care emite fluorescenţă (R – “Reporter”) şi un colorant absorbant pentru fluorescenţă (Q – „Quencher”), fiind denumite şi sonde interne. Atunci când cei doi coloranţi se află în apropiere, legaţi la acelaşi fragment ADN nu este emis semnal fluorescent.
Secvenţa sondelor este astfel stabilită încât să se lege exact în regiunea care urmează să fie amplificată. Deci, pentru fiecare secvenţă ţintă trebuie să fie utilizată o sondă „TaqMan” specifică.
În cadrul fiecărui ciclu de amplificare prima dată ADN este denaturat şi separat în două molecule monocatenare. A doua etapă este legarea primerilor şi în acelaşi timp şi a probei interne. Primerii se leagă la capetele fragmentului care urmează a fi amplificat, iar proba internă se leagă în mijlocul acestuia. În ultima etapă ADN polimeraza sintetizează noile catene de ADN, pornind de la primeri. Deoarece polimeraza aleasă are o activitate exonucleazică 5’ – 3’ foarte pronunţată, atunci când ajunge în dreptul probei interne o secţionează în nucleotidele componente. În această situaţie colorantul care emite fluorescenţă şi absorbantul nu mai sunt apropiaţi, astfel ca semnalul fluorescent poate fi detectat. Semnalul fluorescent este înregistrat la sfârşitul fiecărui ciclu de amplificare, fiind proporţional cu cantitatea iniţială a secvenţelor DNA ţintă (Fig. 5.5).
Monitorizarea în timp real a desfăşurării reacţiei de amplificare prin măsurarea fluorescenţei conduce la trasarea unor curbe de amplificare alcătuite dintr-o fază exponenţială, una liniară şi una de platou. Se investighează în paralel probe standard, cu concentraţii cunoscute şi totodată probele de analizat.
Se stabileşte o valoare de prag „Threshold” în zona de amplificare exponenţială, după care se stabileşte valoarea CT („threshold cycle”), care reprezintă numărul de cicluri necesare unei probe pentru a ajunge la valoarea de prag. Cu cât cantitatea iniţială de ADN a fost mai mare, cu atât valoarea CT va fi mai mică. Valorile CT pentru probele standard vor sta la baza trasării unei drepte de etalonare. Raportarea valorilor CT ale probelor de analizat la dreapta de etalonare permite stabilirea concentraţiei iniţiale de secvenţă ţintă în probă ADN analizată (Fig. 5.6).

Fig. 5.5. Desfăşurarea procesului Real-Time PCR cu sonde moleculare TaqMan (Fp, Rp -primerii specifici, P-proba internă, R- colorantul care emite fluorescenţă şi Q-colorantul absorbant) (după http://cbc.arizona.edu/classes/bioc471/media/Lecture12.html)

Fig. 5.6. Stabilirea pragului de amplificare, determinarea valorilor CT şi trasarea dreptei de etalonate

Analizele Real-Time PCR cu sonde moleculare TaqMan sunt utilizate în studiile de expresie a genelor, identificarea virusurilor şi a bacteriilor, discriminarea alelelor, cuantificarea ADN şi genotiparea polimorfismului unei singure nucleotide.

SONDE “Molecular beacons”

Sondele “Molecular beacons” sunt oligonucleotide monocatenare, cu o structură de “ac de păr”. În prezenţa unei secvenţe ţintă ele se desfac, se leagă şi devin fluorescente. Sondele menţionate sunt compuse din patru subunităţi (Fig. 5.7).

Fig. 5.7. Structura unei sonde „Molecular beacons”

Aceste sonde pot să identifice prezenţa unui acid nucleic specific dintr-o soluţie omogenă. În prezenţa unei secvenţe complementare regiunile liniare (“stem”), se separă, rezultând o sondă care hibridizează cu secvenţa ţintă.
Pe parcursul procesului de amplificare sonda moleculară intervine activ, după cum urmează: în timpul unei etape de denaturare sonda are o conformaţie alungită şi emite fluorescenţă; pe măsură ce temperatura scade, pentru a permite legarea primerilor, regiunile liniare se asociază rapid, astfel că semnalul fluorescent nu mai este emis; dacă însă sondele se leagă la secvenţa ţintă, fluorescenţa este emisă din nou; la creşterea temperaturii, pentru a facilita sinteza ADN, sondele disociază de secvenţele ţintă, ne- interferând cu polimerizarea; câte o nouă reacţie de hibridizare are loc în timpul fiecărei etape de legare a primerilor, din fiecare ciclu, iar intensitatea fluorescenţei este corelată cu acumularea de produşi de amplificare (Fig. 5.8).

Fig. 5.8. Desfăşurarea procesului Real-Time PCR cu sonde „Molecular beacons”

Pe baza informaţiilor cu privire la semnalul fluorescent înregistrat este posibilă cuantificarea numărului iniţial de copii ale secvenţei ADN de interes.
Utilizarea sondelor “molecular beacons” permite dezvoltarea unui număr mare de aplicaţii cum ar fi: identificarea polimorfismului la nivel de nucleotide; detecţia acizilor nucleici în timp real; cuantificare prin tehnica Real-Time PCR; identificarea şi discriminarea alelică; tehnici de diagnostic clinic.

Avantajele utilizării sondelor „Molecular beacons”
Structura specifică a acestor sonde permite evidenţierea nepotrivirii unei singure perechi de baze, deoarece moleculele legate greşit sunt mai puţin stabile din punct de vedere termodinamic, comparativ cu moleculele hibride formate între sondele liniare şi secvenţele ţintă parţial complementare.
Mai mult, spre deosebire de sondele liniare, în cazul sondelor „molecular beacons” transferul de energie se realizează direct, de la colorantul emiţător la cel absorbant. Astfel se pot utiliza ca emiţători un număr mare de posibili fluorofori, cu un colorant absorbant comun.
Acest avantaj are o importanţă deosebită atunci când se doreşte identificarea concomitentă a mai multor secvenţe ţintă (experiment multiplex), situaţie în care pot fi utilizate mai multe sonde, cu diferiţi fluorofori ca raportori.

SONDE – PRIMERI “SCORPIONS”

Tehnica “Scorpion” presupune utilizarea unor molecule bi-funcţionale, în care un primer este ataşat covalent la o sondă moleculară. Aceste molecule conţin de asemenea şi cei doi coloranţi specifici – emiţător şi absorbant. În absenţa secvenţei ţintă, colorantul absorbant reţine toată flurescenţa emisă de fluorofor. In timpul reactiei de amplificare, în prezenţa secvenţei ţintă fluoroforul şi absorbantul se separă, proces care determină creşterea fluorescenţei.
Primerul “Scorpion” are legată sonda moleculară la capătul 5'. Această sondă are o regiune liniară (stem) cu o secvenţa complementară, avînd la un capăt emiţătorul la celălalt absorbantul şi o buclă, care conţine un agent de blocare a reacţiei PCR (Fig. 5.9).

Fig. 5.9. Structura unei sonde “Scorpion”

Reacţia de amplificare în prezenţa sondelor “Scorpion” urmează un mecanism complex. În primul ciclu PCR, primerul se leagă la secvenţa ţintă şi iniţiază reacţia de sinteza ADN sub acţiunea polimerazei. La sfârşitul primului ciclu, secvenţa ţintă nou sintetizată se află pe aceiaşi catena cu sonda moleculară.
Urmează al doilea ciclu de denaturare, în care sonda moleculară şi secvenţa ţintă hibridizează. Prin urmare, bucla sondei moleculare hibridizează cu o parte a produsului nou format în urma reacţiei PCR. Cei doi coloranţi se separă, astfel încât fluorescenţa produsă de emiţător nu mai este captată de absorbant, fiind posibilă înregistrarea ei.
Această tehnică poate fi utilizată cu succes pentru examinarea şi identificarea mutaţiilor punctiforme prin utilizarea mai multor sonde moleculare. Fiecare sondă poate fi etichetată cu coloranţi diferiţi, pentru a emite radiaţii cu lungimi de undă diferite.
În cazul sondelor “Scorpion”, primerul este cuplat fizic de sondă, ceea ce înseamnă că reacţia de amplificare conduce la generarea unui semnal unimolecular., spre deosebire de tehnicile TaqMan sau Molecular Beacons care necesită o asociere bimoleculară.

Toate tipurile de sonde moleculare utilizate în cadrul reacţiilor Real-Time PCR au ataşate două tipuri de coloranţi, unul care emite radiaţii la o anumită lungime de undă şi cel de-al doilea care absoarbe radiaţia.
Alegerea unui anumit colorant ca emiţător depinde în special de tipul aparatului pe care realizăm amplificarea. Cei mai uzuali coloranţi, compatibili cu cele mai multe aparate fac parte din categoria fluoresceinelor. Denumirile şi lungimile de undă de emisie sunt prezentate în continuare: FAM (520nm), TET (539nm), HEX (555nm) Cy5 (668nm). Alte exemple de coloranţi care pot fi utilizaţi sunt VIC (554nm), NED (575nm), JOE(548nm) şi ROX(602 nm).
Cel mai mult folosit este colorantul FAM, care are o sensibilitate mult mai mare comparativ cu alţi coloranţi.
În cazul unor experimente multiplex este necesară utilizarea mai multor coloranţi simultan (câte unul pentru fiecare reacţie de amplificare), care să aibă lungimi de undă de emisie diferite prin cel putin 15 nm (ex: VIC şi FAM, NED şi TET).
Alegerea coloranţilor absorbanţi se face după câteva criterii. Dacă sistemul de citire este FRET (“Fluorescence resonance energy transfer”) , spectrul de absorbţie al absorbantului trebuie să se suprapună cu cel al emiţătorului. Prima generaţie de sonde moleculare dublu marcate au utilizat colorantul TAMRA ca absorbant. Dar acest colorant are o emisie proprie la
577 nm, ceea ce contribuie la fluorescenţa de fond. De aceea se preferă coloranţi absorbanţi care nu posedă fluorescenţă nativă, cum ar fi BHQ.
Dacă sistemul de citire este “static quenching“ trebuie avută în vedere structura coloranţilor, deoarece are loc formarea unui dimer. Această asociere care are loc în solvenţi organici este controlată electrostatic, steric şi prin interacţiuni hidrofobe.
Astfel, coloranţi ca cianinele (Cy3, Quasar 670) şi rodaminele (Cal Orange, Cal Red, ROX), care au o structură plană, hidrofobă, cu sarcini electrice delocalizate datorită atomilor de carbon cuaternari au o acţiune mai bună cu absorbantul BHQ comparativ cu fluoresceinele (FAM, JOE, TET, HEX).
5.1.3. PCR ASOCIAT CU REVERS-TRANSCRIPŢIA
(RT-PCR)

În ultima vreme, în biologia moleculară se acordă o atenţie tot mai mare studiului expresiei genelor, deoarece o serie de procese metabolice din celulele vii sunt controlate pe această cale.
Astfel s-au dezvoltat tehnici de investigare asupra ARN, cum ar fi tehnica PCR asociată cu revers-transcripţia. În literatura de limba engleză metoda este cunoscută sub denumirea de ”Reverse transcription polymerase chian reaction”, notată abreviat cu RT-PCR.
În cazul în care revers transcripţia este asociată unei reacţii PCR în timp real, tehnica poartă numele de tehnica PCR asociată cu reverstranscripţia urmărită în timp real. În literatura de limba engleză metoda este cunoscută sub denumirea de ”Real-time reverse-transcription polymerase chian reaction”, notată abreviat cu qRT-PCR, RRT-PCR, sau RT-rt PCR.
În general, acronimul RT-PCR semnifică PCR asociat cu revers- transcripţia şi nu PCR în timp real, dar unii autori nu au aderat la această convenţie.
Tehnica RT-PCR presupune două etape şi anume revers-transcripţia (RT), proces în care ARN este copiat într-o moleculă de ADN complementar (ADNc), cu ajutorul revers-transcriptazei şi a primerilor, după care are loc o amplificare PCR, care urmează toate etapele descrise anterior. Etapa de sinteză a ADNc este foarte importantă deoarece în cadrul PCR pot fi amplificate numai molecule ADN.
Procesul RT-PCR a fost dezvoltat după ce au fost caracterizate revers- transcriptazele sau ADN-polimerazele dependente de ARN de către H.M. Temin şi D. Baltimore, la virusurile tumorale, descoperire pentru care au primit Premiul Nobel pentru Medicină în anul 1975. Revers-transcriptazele sintetizează ADN în direcţia 5’-3’, la fel ca ADN polimerazele ADN-dependente şi ARN-polimerazele, utilizând dezoxi-ribonucleozid-5’-trifosfaţi (dNTP) ca precursori şi necesitând atât prezenţa matriţei pe care o vor copia, cât şi o catenă primer (amorsă) care să furnizeze capetele 3’-hidroxil libere.
Astfel, în cazul procesului de revers-transcripţie este necesară prezenţa unei matriţe, constituită din moleculele de ARN şi de un primer care să furnizeze punctul de pornire al sintezei ADN.
În stabilirea mecanismelor după care se desfăşoară revers- transcripţia, o importanţă deosebită o prezintă structura moleculelor ARNm. Se cunoaşte că moleculele ARNm suferă o serie de modificări post translaţionale prin ataşarea la capătul 3’a unui fragment poly (A), conţinând 100-250 de resturi adenozin-monofosfat (AMP), denumit extremitatea poly A . Această structură specifică a moleculelor ARNm stă la baza dezvoltării sistemelor de primeri (amorse) care să iniţieze sinteza ADNc. În prezent se cunosc trei tipuri de primeri:
o oligonucleotidă alcătuită din resturi poly-T, denumită primer oligo-dT, care se poate lega la toate moleculele de ARNm în acelaşi timp, pe baza complementarităţii poly A – poly T (Fig. 5.10 A)- metoda utilizată tradiţional.
un primer cu o secvenţă specifică, care va conduce la o copiere selectivă a unei singure molecule ARNm (Fig. 5.10 B);
un primer cu o secvenţă întâmplătoare, care se poate lega la orice moleculă ARNm, în orice poziţie. Se produc astfel fragmente ADNc mai scurte, deoarece primerul nu se va lega exclusiv la capătul 3’ al moleculei de ARNm (Fig. 5.10 C).
Utilizarea primerului cu secvenţă întâmplătoare măreşte probabilitatea ca extremitatea 5’ a moleculei de ARNm să fie convertită în ADNc. Atunci când se utilizează metoda tradiţională (cu primeri poly-T) revers-transcriptaza nu atinge întotdeauna capetele 5’ ale moleculelor de ARNm cu o lungime mare.

Fig. 5.10. Tipurile de primeri şi acţiunea lor în procesul de sinteza a ADNc (A) primer oligo-dT, (B) primer cu secvenţa specifică; (C) primer cu secvenţă întâmplătoare
(după http://www.bio.davidson.edu/genomics/method/cDNAproduction.html)

ADNc sintetizat cu ajutorul revers-transcriptazei poate fi supus apoi amplificării prin PCR cu punct final, dacă se doreşte o evaluare calitativă sau semicantitativă. În acest caz produşii de amplificare sunt analizaţi prin electroforeză în gel de agaroză, iar benzile obţinute pot fi analizate comparativ.
Revers-transcripţia poate avea loc în acelaşi tub cu amplificarea PCR, procesul numindu-se RT-PCR într-o singură etapă (“one-step RT-PCR”) sau cele două reacţii pot avea loc succesiv.
Dar, PCR cu punct final este o tehnică cu o sensibilitate mai redusă, cu un risc mai mare de contaminare a probelor datorită proceselor de manipulare care au loc după amplificare.
De aceea se utilizează pe scară tot mai largă tehnica PCR asociată cu revers-transcripţia urmărită în timp real. În acest caz în reacţia de amplificare se introduce ADNc, urmându-se apoi toate etapele descrise în cadrul tehnicii PCR în timp real.

5.1.4. APLICAŢII ALE AMPLIFICĂRII PRIN REACŢIA ÎN LANŢ A POLIMERAZEI (PCR)

5.1.4.1. APLICAŢII ALE PCR CU PUNCT FINAL”End-point PCR”

EVIDENŢIEREA PREZENŢEI SAU ABSENŢEI UNEI GENE SAU SECVENŢE ADN
Datorită posibilităţii de evidenţiere a unei secvenţe ADN prin amplificare, urmată de analiză prin electroforeză în gel de agaroză sau poliacrilamidă, tehnica PCR poate fi utilizată pentru evidenţierea prezenţei sau absenţei unei gene/secvenţe ADN într-o probă analizată. În funcţie de tipul genei identificate se pot desprinde o serie de aplicaţii practice ale tehnicii PCR.

Aplicaţii în medicină
detectarea infecţiilor bacteriene sau virale, dacă secvenţa a cărei prezenţă a fost identificată este constituită din ADN viral sau bacterian;
detectarea unor boli, dacă acestea sunt condiţionate de apariţia unor mutaţii ale unor gene cunoscute;
posibilitatea pronosticului unor boli congenitale, în cazul în care acestea au un determinism genetic;
stabilirea sexului la produsul de concepţie, chiar din stadiul embrionar, investigaţie posibilă datorită markerilor specifici amplasaţi pe cromosomul Y.

Aplicaţii în agricultură şi industria alimentară
identificarea prezenţei OMG (organisme modificate genetic) în produsele agricole şi alimentare, investigaţie posibilă deoarece genele transferate la plante sunt cunoscute;
identificarea infecţiilor bacteriene sau virale în produse agricole, dacă secvenţa identificată este constituită din ADN viral sau bacterian;

AMPLIFICAREA UNOR FRAGMENTE ADN
Datorită posibilităţii amplificării unei secvenţe, prin tehnica PCR pot fi obţinute cantităţi mari de ADN care să fie apoi utilizate în diferite scopuri:
generarea de sonde moleculare care, în urma marcării radioactive sau chimice sunt utilizate în procese de hibridizare în tehnicile Southern sau Northern;
producerea unor fragmente ADN care să poată fi secvenţializate prin tehnica Sanger, pornind de la secvenţa unuia dintre primerii utilizaţi la amplificare;
producerea unor cantităţi suficiente dintr-un fragment ADN, astfel încât să fie posibilă obţinerea unei molecule ADN recombinant.

GENERAREA UNOR MARKERI ADN
Tehnica PCR poate sta la baza generării unui număr mare de markeri moleculari cum ar fi: EST – etichetarea secvenţelor exprimate („Expressed Sequence Tag”), RAPD – amplificarea întâmplătoare a ADN polimorfic („Random Amplified Polymorphic DNA”), AFLP – polimorfismul lungimii fragmentelor amplificate („Amplified Fragment Length Polymorphism”), SSR – secvenţe simple repetate („Simple Sequence Repeats”), CAPS – polimorfismul fragmentelor amplificate şi secţionate („Cleaved Amplified Polymorphic Sequence”), SCAR- Regiuni amplificate secventializate („Sequence characterized amplified region”).
Markerii moleculari, care evidenţiază polimorfismul la nivel de ADN cu ajutorul tehnicii PCR pot să-şi găsească o paletă foarte largă de aplicaţii: cartarea genomului, în cadrul căreia se stabileşte poziţia fiecărui marker molecular pe harta genetică, pe baza frecvenţei de recombinare; selecţia asistată de markeri, care poate avea loc dacă anterior au fost identificaţi markeri moleculari linkaţi cu caractere fenotipice de interes; evaluarea diversităţii genetice intra sau inter specifice; analiza distanţelor genetice, prin stabilirea gradului de înrudire; verificarea şi perfecţionarea clasificărilor taxonomice; analiza filogenetică; investigaţii criminalistice şi teste de paternitate, posibile în cazul organismului uman, care a fost secvenţializat în totalitate.

5.1.4.2. APLICAŢII ALE TEHNICII PCR ÎN TIMP REAL („Real-time PCR”)
PCR în timp real sau PCR cantitativ permite estimarea cantităţii unei secvenţe date, prezente într-o probă. În funcţie de tipul secvenţei identificate şi cuantificate se desprind aplicaţiile acestei tehnici:
Detectarea şi cuantificarea ADN viral în diferite probe biologice; tehnica este precisă, cu o sensibilitate foarte ridicată, permiţând detecţia virusului imediat după infecţie;
Detecţia şi cuantificarea unor gene, provenite de la organisme modificate genetic;

Real-Time PCR este o metodă care câştigă o tot mai largă aplicabilitate şi în domeniul evidenţierii SNP ”Single Nucleotide Polymorphism” – Polimorfismul unei Singure Nucleotide.
Se utilizează strategia bazată pe sonde TaqMan marcate fluorescent care au secvenţe complementare cu regiunea din ADN ţintă în care a apărut mutaţia (SNP). Sondele se vor lega la această secvenţă numai dacă potrivirea este perfectă.
Desfăşurarea reacţiei de amplificare, în cazul variantelor care au legat sonda moleculară va conduce la o creştere a fluorescenţei, deoarece polimeraza aleasă are o activitate exonucleazică 5’ – 3’ foarte pronunţată, iar atunci când ajunge în dreptul sondei o secţionează în nucleotidele componente, separâd colorantul emiţător şi cel absorbant.
Atunci când sonda moleculară nu se leagă la fragmentul ţintă din cauza SNP, nu va apărea semnal fluorescent.
Aplicarea acestei tehnici de investigare permite evidenţierea a două situaţii – detectarea fluorescenţei, legată de prezenţa alelei sălbatice şi absenţa acesteia, determinată de alela mutantă (SNP).

5.1.4.3. APLICAŢII ALE TEHNICII PCR ASOCIAT CU REVERS-TRANSCRIPŢIA ( ”Reverse transcription polymerase chian reaction”)

În cazul în care PCR este combinat cu procesul de revers-transcripţie este posibilă determinarea cantitativă a abundenţei unor molecule de ARNm, ca măsură a expresiei genelor. Pot fi astfel evidenţiate modificările induse la nivelul expresiei genelor de către factorii de mediu, apariţia unor boli etc.
Identificarea genelor a căror expresie este modificată în anumite condiţii reprezintă un pas important în descifrarea mecanismelor de apărare care se declanşează în organismele vii pentru contracararea efectului factorilor de stres.
Având în vedere că în cadrul reacţiei PCR asociat cu revers-transcripţia (RT-PCR) se analizează ARN, aplicaţiile tehnicii sunt specifice acestui tip de acid nucleic:
Determinarea semi-cantitativă a abundenţei diferitelor molecule de ARNm într-o celulă sau un ţesut, ca o măsură a expresiei genelor.
Clonarea genelor eucariote în organisme procariote în scopul producerii proteinelor; ADNc generat în urma reacţiilor RT-PCR reprezintă exact secvenţa de acid nucleic care se regăseşte în secvenţa proteinei sintetizate;
Studiul genomului retrovirusurilor cum ar fi virusul gripal sau virusul HIV;

5.2. TEHNICILE DE TRANSFER ŞI ANALIZĂ A ACIZILOR NUCLEICI/PROTEINELOR

Tehnica SOUTHERN BLOTTING a fost imaginată în 1975 de către Southern, în scopul identificării unor fragmente specifice de ADN cu ajutorul sondelor moleculare marcate. Tehnica se bazează pe proprietatea ADN de a se denatura şi de a renatura alături de orice fragment ADN care posedă secvenţe complementare.
Prin analogie, au fost imaginate tehnicile NORTHERN BLOTTING, care presupune analiza ARN şi WESTERN BLOTTING, care presupune analiza proteinelor.
Tehnicile menţionate se desfăşoară după aceleaşi principii, dar prezintă şi particularităţi datorate tipului de molecule analizate.

5.2.1. TEHNICA SOUTHERN BLOTTING

Tehnica Southern presupune parcurgerea mai multor etape şi anume: separarea fragmentelor de ADN, transferul fragmentelor de ADN, în formă denaturată pe membrane solide, hibridizarea cu sonde moleculare marcate şi identificarea prezenţei secvenţelor ţintă.

5.2.1.1. SEPARAREA FRAGMENTELOR ADN
Într-o primă etapă are loc izolarea şi purificarea ADN, cu metode specifice speciei sau ţesutului din care se realizează extracţia. Apoi, ADN este secţionat cu enzime de restricţie, care taie molecula de ADN la nivelul unor secvenţe specifice (capitolul 4.2).
Apoi, fragmentele secţionate sunt separate în funcţie de greutatea lor moleculară prin electroforeză în gel de agaroză, sau poliacrilamidă (capitolul 4.7). Fragmentele de ADN nu pot fi analizate direct în gelurile în care au fost separate şi de aceea sunt transferate pe suporturi solide, care permit evaluarea ulterioară.

5.2.1.2. TRANSFERUL FRAGMENTELOR ADN DIN GEL, PE MEMBRANE SOLIDE
Fragmentele ADN sunt transferate pe membrane de nitroceluloză sau nylon pe care pot fi păstrate timp nelimitat. Aceste membrane au o încărcare pozitivă, pentru a asigura o afinitate bună pentru acizii nucleici, care posedă grupări negative. Poziţia fragmentelor de ADN pe membrane este identică cu cea din gel, ceea ce permite identificarea lor după hibridizarea cu sonde moleculare.

MECANISMUL PROCESULUI DE TRANSFER
Pentru a realiza transferul efectiv al fragmentelor ADN din gel pe membrană se realizează ansambluri alcătuite dintr-o structură tip „sandwich”. Astfel, gelul se va aşeza pe un suport poros, care este imersat într-o soluţie implicată atât în procesul de transfer, cât şi în denaturare. Peste gel se va aşeza membrana, care va fi acoperită la rândul ei cu un strat de hârtii absorbante. Este necesar ca tot acest ansamblu, menţinut cu ajutorul unei greutăţi, să fie aranjat pe verticală.
Datorită hârtiilor absorbante soluţia de denaturare/transfer va fi antrenată din vasul în care se află, spre partea superioară a ansamblului. Astfel soluţia va trece prin gel, va denatura fragmentele de ADN şi le va antrena în sus, unde vor întâlni membrana. Soluţia de transfer va fi absorbită spre partea superioară, dar fragmentele de ADN vor rămâne imobilizate pe membrană.
După terminarea transferului, fragmentele denaturate sunt fixate pe suport prin tratament termic sau prin iradiere UV.

5.2.1.3. HIBRIDIZAREA MEMBRANELOR CU SONDE MOLE-CULARE MARCATE ŞI IDENTIFICAREA FRAGMENTELOR ŢINTĂ
Hibridizarea este o tehnică de recombinare a acizilor nucleici, care vizează alcătuirea unei molecule de acid nucleic dublu catenar din două catene unice, separate, pe baza complementarităţii perechilor de baze. Împerecherea de baze complementare se poate realiza între ADN-ADN, ADN-ARN sau ARN-ARN.
Prin această tehnică este posibilă identificarea unei secvenţe de acid nucleic monocatenar (secvenţa ţintă), cu ajutorul unei sonde moleculare marcate. Sonda moleculară reprezintă un fragment de acid nucleic (ADN sau ARN), cu secvenţă cunoscută, care este marcat radioactiv sau chimic şi denaturat în prealabil.
Atât ADN ţintă cât şi sonda moleculară marcată sunt supuse unui proces de denaturare, după care are loc procesul de hibridizare, în condiţii de temperatură şi concentraţie a sărurilor bine precizate.
După ce procesul de hibridizare a avut loc, sonda moleculară în exces se elimină, pentru a evita identificarea unor probe fals pozitive. Apoi membrana este supusă unui proces de developare şi analiză, specific sistemului de marcare utilizat.
Acele fragmente ADN la care s-a ataşat sonda moleculară sunt vizualizate sub forma unor spoturi întunecate, colorate sau fluorescente, în funcţie de metoda de marcare aplicată.
În figura următoare (Fig. 5.11) sunt prezentate etapele parcurse pentru identificarea prezenţei unor secvenţe prin tehnica Southern Blotting.

Fig. 5.11. Etapele care alcătuiesc un experiment de identificare a fragmentelor ADN prin tehnica Southern blotting (după Kaksonen, 2007)

O etapă metodologică necesară, după ce fragmentele ADN denaturate au fost fixate pe membrane este marcarea sondelor moleculare.

MARCAREA SONDELOR MOLECULARE
Sondele moleculare reprezintă fragmente de ADN, cu secvenţe cunoscute, care trebuie să fie marcate radioactiv sau chimic, înainte de utilizare. Iniţial se obţin dezoxi-ribonucleozid trifosfaţi marcaţi, care se înglobează apoi în fragmente de acizi nucleici, copii ale secvenţei sondei moleculare.

MARCAREA RADIOACTIVĂ
Marcarea radioactivă se realizează cu radioizotopi 3H, 35S, 125I, 32P, introduşi într-un anumit dezoxi-ribonucleozid trifosfat, care prin dezintegrare emit raze β. Astfel, după cuplarea sondei moleculare cu secvenţa ţintă, izotopul radioactiv va emite radiaţii care pot fi evidenţiate prin auto-radiografiere (impresionarea unei plăci Roentgen sau a unui clişeu autoradiografic care se developează ulterior), sau pot fi preluate direct, prin intermediul unor echipamente speciale.
La alegerea izotopilor trebuie ţinut cont de timpul de înjumătăţire, timp necesar pentru ca substanţa radioactivă să se descompună în proporţie de 50%: 3H- 12,35 ani, 35S- 87,4 zile, 125I- 60 zile, 32P- 14,3 zile.
În cazul în care izotopul ales este 32P, înregistrarea semnalului radioactiv şi transmiterea la un sistem computerizat se realizează cu ajutorului unor echipamente speciale.
In procesul de marcare se folosesc ca matriţe catene unice de ADN, rezultate dintr-o denaturare prealabilă a unei catene de ADN. Se foloseşte enzima Klenow polimeraza, care reprezintă un fragment de ADN-polimerază căruia îi lipseşte activitatea 5’-3’exonucleazică.
Reacţiile de sinteză a noilor catene de acid nucleic pornesc de la primeri cu o lungime de foarte mică, cu secvenţă întâmplătoare, care găsesc secvenţe complementare în mai multe puncte în fragmentul care urmează a fi copiat. Acestea furnizează grupările OH, la capetele 3’, necesare ADN polimerazei pentru a începe sinteza.
În catena nou formată vor fi înglobaţi nucleozid trifosfaţii, în funcţie de complementaritatea bazelor, dintre care numai unul a fost marcat în prealabil radioactiv (capitolul 4.3.3).
Fragmentele ADN astfel pregătite sunt utilizate apoi ca sonde marcate în diferite variante ale reacţiilor de hibridizare.
În ultima vreme există tendinţa ca substanţele radioactive să fie abandonate din cauza efectului lor nociv asupra experimentatorului şi înlocuite cu marcarea enzimatică.

MARCAREA CHIMICĂ
În procesele de marcare chimică se utilizează cel mai adesea oligomarcarea, principiul fiind similar cu cel al marcării radioactive, cu deosebirea că nucleozid-trifosfatul marcat radioactiv este înlocuit cu un nucleozid-trifosfat marcat chimic. Marcarea chimică se realizează cel mai frecvent cu biotină sau digoxigenină.
Biotina se leagă printr-o structură de ataşare, denumită spacer de uracilul dintr-un nucleozid-trifosfat. Acest braţ de legare va uşura şi legarea ulterioară a biotinei la sistemele de identificare.
Bio-UTP: „Biotina-spacer-uracil-riboză-trifosfat”
În mod normal, uracilul se înglobează numai în ARN, dar nu şi în ADN. Pentru a fi totuşi posibilă şi marcarea ADN, sunt create structuri artificiale uracil-dezoxiriboză, care vor putea ulterior să facă parte dintr-o catenă ADN.
Bio-dUTP: „Biotina-spacer-uracil-dezoxiriboză-trifosfat”
Atât Bio-UTP cât şi Bio-dUTP sunt derivate biotinate ale dezoxi-uridin-trifosfatului, respectiv ribo-uridin-trifosfatului şi vor fi înglobate în ADN (în locul dezoxi-timidin-trifosfatului), respectiv în ARN.
Prezenţa biotinei poate fi detectată apoi prin legarea la compuşi cu afinitate ridicată – avidina şi streptavidina sau anticorpi specifici, marcaţi în prealabil cu substanţe care pot fi identificate ulterior.
Digoxigenina este un steroid izolat din Digitalis pupurea şi Digitalis lanata. Deoarece florile şi frunzele acestor plante sunt singurele surse naturale de digoxigenină (DIG), anticorpii anti-DIG nu se vor lega la alţi compuşi. Aceasta se va lega în poziţia 5’ a unei uridine prin intermediul unei structuri de ataşare – spacer, alcătuită din 11 atomi de carbon. Nucleotidele marcate cu DIG pot fi încorporate în probe de acizi nucleici de către ADN polimerază şi totodată de către ARN polimerază şi terminal transferază prin procese de: oligomarcare întâmplătoare (“random primed labelling”), translaţie prin tăiere (“nick translation”), PCR, marcarea terminală a lanţurilor ADN (“3’–end labelling/tailing”) sau transcripţie in vitro.
Fragmentele hibridizate cu DIG pot fi detectate cu ajutorul anticorpilor cu afinitate ridicată – anticorpi anti -DIG care sunt conjugaţi cu fosfataza alcalină, peroxidaza, fluoresceina, rodamina sau particule coloidale de aur.
Sensibilitatea procesului de detecţie depinde de metoda utilizată pentru vizualizarea anticorpului anti-DIG conjugat. Dacă acesta este marcat cu fosfataza alcalină poate fi vizualizat:
– Colorimetric, în prezenţa substratului NBT – (Nitro-Blue Tetrazolium Chloride) şi BCIP (5-Bromo-4-Chloro-3-Indolyphosphate p-Toluidine); aceşti reactivi reacţionează cu fosfataza alcalină, formând un precipitat albastru-violet sau
– Fluorescent, în prezenţa HNPP (2-hydroxy-3-naphtoic acid-2-phenylanilide phosphate).
Un alt sistem de marcare chimică utilizează nucleotidele marcate cu fluoresceină (fluorescein-dUTP/UTP/ddUTP), care pot fi încorporate enzimatic într-o secvenţă de acid nucleic.
Deoarece fluoresceina reprezintă un sistem de marcare direct, nu sunt necesare proceduri de vizualizare imunocitochimică, semnalul de fond fiind mai redus. Totuşi această metodă prezintă un dezavantaj comparativ cu metodele indirecte şi anume sensibilitatea mai redusă.
Nucleotidele marcate cu fluoresceină pot fi detectate şi cu anticorpi anti-fluoresceină conjugaţi enzimatic, procesul având în acest caz o sensibilitate similară cu cea a metodelor indirecte.

5.2.1.4 APLICAŢII ALE TEHNICII SOUTHERN BLOTTING
Tehnica Southern permite localizarea în mod particular a unor fragmente ADN, dintr-un amestec complex, astfel că pot fi identificate gene sau fragmente anonime de ADN.
În continuare este prezentată imaginea obţinută prin autoradiografierea unei membrane care cuprinde opt probe ADN plasmidial secţionate cu o enzimă de restricţie, hibridizată cu o sondă moleculară marcată radioactiv (Fig. 5.12).

Fig. 5.12. Analiză prin autoradiografiere a probelor de ADN plasmidial (1-8) hibridizate cu o sondă moleculară marcată cu 32P.
Se observă că probele 1 şi 8 sunt identice, sonda moleculară ataşându-se la două fragmente ADN (1 şi 2). În cazul probei 4 a fost identificat ca pozitiv un alt fragment (3) cu lungime mai mare. Probele 2, 3, 5, 6 şi 7 nu au în structura lor nici un fragment complementar cu sonda moleculară utilizată.
Deci, a fost posibilă identificarea acelor probe care conţin o anumită secvenţă ţintă şi totodată numărul şi dimensiunea fragmentelor de restricţie în care se află acest fragment.
Pe baza acestei tehnici s-au dezvoltat markerii RFLP („Restriction Fragment Length Polymorphism”) care asigură investigaţii directe sau indirecte şi datorită preciziei şi versatilităţii au devenit un instrument indispensabil în domeniile identificării genelor şi cartare, în diagnostic, criminalistică, filogenie şi evoluţionism.
Este posibilă de asemenea determinarea greutăţii moleculare a fragmentelor de restricţie, detectarea prezenţei unei secvenţe ADN într-o probă, determinarea numărului de copii al unei secvenţe ADN, evaluarea amprentei genetice a unui individ etc.
Totodată aceasta tehnică poate fi aplicată pentru a determina polimorfismul unei singure nucleotide (SNP) prin metoda de hibridizare specifică a alelelor sau hibridizarea cu o oligonucleotidă specifică alelei ASO („hybridization with allele-specific oligonucleotides”).
În acest caz se utilizează două sonde moleculare scurte, având o nucleotidă complementară cu varianta alelică a SNP în poziţia centrală.
Sondele sunt hibridizate la secvenţa ţintă care conţine SNP, în condiţii în care numai fragmentele formate pe baza unei complementarităţi de 100% sunt stabile, iar hibrizii care conţin nepotriviri sunt instabili. Prezenţa hibrizilor stabili este evidenţiată prin metode specifice, caracteristice sistemului de marcare al sondei moleculare.
O îmbunătăţire a acestei tehnici este utilizarea unor chip-uri ADN pe care sondele moleculare sunt sintetizate direct. Pot fi astfel identificate SNP prin tehnica microarray, urmărind oligonucleotidele la care s-au ataşat probele ţintă de ADN.

5.2.2. TEHNICA NORTHERN BLOTTING

Tehnica Northern Blotting a fost dezvoltată în anul 1977, de către James Alwine, David Kemp şi George Stark, iar denumirea a fost dată prin analogie cu tehnica Southern, dezvoltată de un cercetător cu acelaşi nume.
În cazul aplicării acestei tehnici, care permite evaluarea nivelului de expresie a genelor în timpul diferenţierii, morfogenezei sau în anumite condiţii de mediu, sunt urmate aceleaşi etape ca la transferul Southern, cu câteva particularităţi date de caracteristicile moleculei ARN.
Astfel, fragmentele ARN sunt extrase, moleculele de ARNm sunt separate pe baza structurii lor specifice (capete poly A), după care sunt analizate prin electroforeză în gel de agaroză sau poliacrilamidă.
Nu este necesară secţionarea cu enzime de restricţie deoarece fragmentele analizate au dimensiuni reduse, corespunzătoare regiunilor codificatoare ale fiecărei gene.
Moleculele ARNm sunt oligonucleotide monocatenare care pot adopta diverse structuri secundare, care le măresc volumul. Pentru a preîntâmpina astfel de situaţii, gelul de electroforeză trebuie să asigure condiţii denaturante. Fragmentele ARN sunt apoi transferate pe membrane solide, fără a mai fi necesară denaturarea şi fixate prin tratament termic sau cu radiaţii UV.
Etapele ulterioare de hibridizare, marcare a sondelor moleculare şi analiză a rezultatelor obţinute se desfăşoară după aceleaşi reguli ca cele de la transferul Southern.

APLICAŢII ALE TEHNICII NORTHERN BLOTTING
Tehnica Northern Blotting permite evaluarea expresiei unei anumite gene, în diferite ţesuturi, organe, stadii de dezvoltare, în diferite condiţii de stres, la atacul patogenilor sau în cursul unui tratament.
Tehnica poate fi de asemenea utilizată pentru a determina supra/sub expresia anumitor gene. Dacă expresia unei gene este accentuată („up-regulate”) se observă un semnal mai intens pe membrana hibridizată, în dreptul genei respective. Apoi, fragmentul ADN poate fi secvenţializat, pentru a determina dacă reprezintă o genă cunoscută sau nu, prin comparare cu bazele de date existente în prezent.
Dacă se utilizează o singură sondă moleculară este posibilă determinarea aproximativă a dimensiunii produsului de transcripţie maturat (ARNm), ceea ce furnizează informaţii cu privire la reglarea post-transcripţională a genei – modificări care au avut loc după transcripţie.

5.2.3. TEHNICA WESTERN BLOTTING

Tehnica Western Blotting a fost dezvoltată de către George Stark, iar denumirea a fost introdusă de către W. Neal Burnette, în 1981, prin analogie cu tehnicile Southern şi Northern.
În acest caz este posibilă detectarea unor proteine specifice într-un extract; proteinele, în formă nativă sau denaturată se separă prin electroforeză în funcţie de lungimea lanţului polipeptidic, dacă se utilizează condiţii denaturante sau de structura lor tridimensională, în condiţii non-denaturante.

SEPARAREA PROTEINELOR
Proteinele extrase şi purificate se separă prin electroforeză, în funcţie de punctul izoelectric (pI), de greutatea moleculară, sarcina electrică sau de o combinaţie a acestor factori. Natura procesului de separare depinde de tratamentul la care au fost supuse probele de analizat sau de natura gelului.
Cele mai utilizate procedee utilizează geluri în care s-a adăugat SDS (dodecil-sulfat de sodiu), denumite şi SDS-PAGE („SDS polyacrylamide gel electrophoresis”). În aceste condiţii proteinele sunt menţinute într-o formă denaturată, în care punţile disulfidice [S-S] sunt desfăcute. SDS, adăugat atât în geluri cât şi în probe asigură, pe lângă condiţiile denaturante o încărcare uniform negativă a proteinelor, ceea ce permite în final separarea numai în funcţie de greutatea lor moleculară.

TRANSFERUL PROTEINELOR DIN GEL, PE MEMBRANE SOLIDE
Pentru ca proteinele să poată fi accesibile detecţiei cu anticorpi, este necesar transferul lor pe membrane solide de nitroceluloză sau poliviniliden difluorură (PVDF), suporturi care au o afinitate uniformă pentru toate tipurile de proteine. Transferul proteinelor din gel pe membrană poate fi realizat printr-o procedură de lucru similară cu cea descrisă anterior (Southern Blotting), prin capilaritate sau poate avea loc sub acţiunea unui câmp electric – electroblotting.
În acest fel fracţiile proteice analizate sunt transferate pe membrane în aceleaşi poziţii în care se află în gel. Deoarece membranele utilizate au o mare afinitate pentru toate proteinele, inclusiv anticorpii este necesară blocarea acesteia imediat după transfer. Astfel, membrana se tratează cu o soluţie diluată de proteine (albumină serică bovină – BSA sau lapte praf degresat), care se vor ataşa uniform la membrană, în afară de poziţiile în care s-a legat proteina ţintă. Acest tratament măreşte precizia şi claritatea rezultatelor şi elimină rezultatele fals pozitive.

TRATAREA MEMBRANELOR CU ANTICORPI MARCAŢI ŞI IDENTIFICAREA PROTEINELOR ŢINTĂ
În continuare membrana pe care au fost transferate toate fracţiile proteice se pune în contact cu o soluţie de anticorp, care se va lega specific la proteina ţintă. Pentru a fi posibilă vizualizarea poziţiei în care s-a legat anticorpul este necesar ca acesta să fie marcat. Pot fi aplicate două strategii şi anume: reacţia într-o singură etapă sau în două etape.
Reacţia într-o singură etapă necesită un singur anticorp marcat, care se va lega la proteina ţintă şi este vizualizat printr-un procedeu specific sistemului de marcare.
Reacţia în două etape necesită doi anticorpi, dintre care numai unul este marcat. Primul anticorp se leagă la proteina ţintă, ataşată la membrană, după care este recunoscut de cel de-al doilea anticorp care a fost în prealabil marcat. Deşi necesită doi anticorpi această metodă este totuşi mai ieftină comparativ cu cea într-o singură etapă deoarece cel de-al doilea anticorp marcat poate fi utilizat pentru un număr mare de reacţii de identificare. Astfel, primul anticorp recunoaşte foarte specific şi se ataşează la proteina ţintă; cel de-al doilea anticorp marcat recunoaşte o anumită regiune din primul anticorp, la care se ataşează. Regiunea recunoscută de cel de-al doilea anticorp poate fi specifică speciei în care a fost produs anticorpul, deci specificitatea este foarte redusă. De exemplu, se poate utiliza acelaşi anticorp marcat pentru orice anticorp primar care a fost produs în cobai, fiind denumit "antimouse antibody".
Vizualizarea este specifică procedeului de marcare utilizat care poate fi colorimetric, chemiluminiscent, radioactiv sau fluorescent.
Un exemplu de marcare a anticorpilor este legarea fosfatazei alcaline. Prezenţa acestei enzime este evidenţiată cu ajutorul p-nitro-fenil- fosfatului, care este un substrat cromogen.
În urma interacţiunii dintre p-nitro-fenil-fosfat şi fosfataza alcalină se formează p-nitrofenol, un produs solubil, de culoare galben intens care permite identificarea probelor pozitive.

Fosfataza alcalină + p-nitro-fenil-fosfat(pNPP) → p-nitrofenol + fosfat

Dacă reacţiile se desfăşoară în mediu lichid este posibilă determinarea cantitativă a proteinei la care s-a legat anticorpul marcat prin determinări spectofotometrice la lungimea de undă de 405 nm.

APLICAŢII ALE TEHNICII WESTERN BLOTTING
Tehnica Western Bloting îşi găseşte utilizări multiple în medicină, fiind produse kituri pentru confirmarea unor maladii, cum ar fi HIV, encefalită bovină spongiformă sau hepatită B.
De asemenea tehnica menţionată poate conduce la identificarea prezenţei oricărei proteine într-un preparat, cu condiţia ca aceasta să fi fost izolată şi purificată în prealabil, pentru a fi posibilă producerea anticorpilor specifici. Este posibilă şi determinarea aproximativă a greutăţii moleculare, ceea ce furnizează informaţii cu privire la eventualele modificări postranslaţionale ale proteinei.
5.2.4. HIBRIDIZAREA  IN  SITU

            Hibridizarea in situ este o metodă citogenetică directă de localizare a unui fragment specific de ADN pe cromozom.
Se utilizează sonde moleculare (fragmente ADN identificate şi clonate în prealabil), care se leagă numai la acele regiuni cromozomale în care găsesc un grad înalt de similaritate a secvenţelor.
Astfel, o secvenţă de ADN clonat (sondă moleculară) se hibridizează pe cromozomii prometafazici etalaţi pe o lamă microscopică, după ce au fost denaturaţi în prealabil (pentru ca moleculele ADN să devină monocatenare).
Sonda moleculară, marcată radioactiv (cu izotopi de tritiu), sau chimic, cu biotină sau digoxigenină (Dig), se va lega pe o regiune cromozomală complementară.
Dacă marcarea sondei moleculare a fost radioactivă, molecula hibridă poate fi localizată prin acoperirea preparatului cu o emulsie sensibilă la razele X. Poziţia granulelor "radioactive" pe o anumită bandă cromozomică reflectă localizarea genei.
Dacă sondele sunt marcate cu biotină, moleculele hibride pot fi identificate cu molecule fluorescente cum ar fi avidina şi streptavidina. Dacă pentru marcare s-a utilizat digoxigenină (Dig), detecţia se realizează cu anticorpi anti-DIG conjugaţi enzimatic. În cazul marcării chimice vizualizarea/poziţionarea semnalului fluorescent pe un anumit cromozom se realizează cu un microscop cu fluorescenţă, astfel că tehnica poartă numele FISH („Fluorescence in Situ Hibridization”) (Fig. 5.12).
Nivelul de rezoluţie al localizării corespunde unei regiuni de 1-2 milioane bp din cromozomul metafazic. Rezoluţia creşte la 50-500 kb pentru fibrele de cromatină interfazică şi la câteva kb pentru fibrele de cromatină alungite/întinse artificial (“fiber-FISH”).

APLICAŢII ALE TEHNICII FISH („Fluorescence în Situ Hibridization”)
Tehnica FISH are a o gamă largă de aplicaţii în biologia moleculară şi în medicină, în investigaţiile de diagnostic şi mutaţii cromozomale, studii ale structurii şi funcţiilor celulare şi în experimentele de cartare.
În cercetările clinice tehnica FISH poate fi utilizată pentru diagnoza prenatală a aberaţiilor cromozomale moştenite, diagnoza postnatală a bolilor genetice moştenite, a bolilor infecţioase, virale sau bacteriene, diagnoza citogenetică a tumorilor şi detecţia expresiei aberante a genelor.
În cercetările de laborator, tehnica FISH poate fi utilizată pentru cartarea genomului, studii de evoluţie, analiza organizării şi dinamicii nucleare, replicare, sortarea cromozomilor.
Recent, această tehnică a fost tot mai mult utilizată pentru stabilirea ordinii şi poziţiei markerilor moleculari în regiunile cromozomale de interes – cartarea citogenetică.

Fig. 5.12. Identificarea prezenţei pe cromozom a unei secvente specifice de ADN, prin tehnica FISH („Fluorescence in Situ Hibridization”)
(după https://en.wikipedia.org/wiki/Fluorescence_in_situ_hybridization)

5.2.5. TEHNICA MICROARRAY

Tehnica microarray este o tehnică modernă, care îmbină descoperiri atât din domeniul biologiei moleculare cât şi al automaticii şi informaticii, care permite identificarea prezenţei anumitor gene, evaluarea expresiei genelor sau identificarea polimorfismului unei singure nucleotide (SNP ”Single nucleotide polymorphism”).
Principiul unui experiment microarray, spre deosebire de analizele clasice Northern-blotting este următorul: ARNm dintr-o anumită linie celulară sau ţesut este utilizat pentru a genera sonde marcate, denumite uneori “ţintă” care sunt hibridizate în paralel cu un număr mare de secvenţe ADN, imobilizate pe o suprafaţă solidă într-o distribuţie ordonată.
Prin această metodă pot fi detectate şi cuantificate simultan zeci de mii de specii de produşi de transcripţie. Pentru derularea unui astfel de experiment este necesară prezenţa unor suporturi, pe care se fixează sondele moleculare şi a moleculelor ADN ţintă, care au fost marcate în prealabil.

5.2.5.1. SONDELE MOLECULARE UTILIZATE ÎN MICROARRAY
În timp, suporturile pe care sunt imobilizate fragmentele au evoluat, pornind de la o membrană şi ajungând în prezent la cip-uri.

Macrodispozitive ADN (DNA macroarray)
Macrodispozitivele ADN – membrane de hibridizare – sunt predecesoarele micro-dispozitivelor ADN şi a chip-urilor ADN. În acest caz sonde provenite din biblioteci ADNc sunt stocate cu o densitate de câteva zeci/cm2 pe suporturi speciale (membrane de nylon), cu dimensiuni de 8×12 cm, pe care sunt fixate cu ajutorul iradierii UV. Secvenţele ţintă sunt molecule ADNc, marcate radioactiv cu 32P. Detecţia produşilor de hibridizare se realizează prin autoradiografiere.

Microdispozitive ADN de sticlă (DNA microarray)
Microdispozitivele sunt constituite din lamele de sticlă, cu dimensiuni de 1,8 x 1,8 cm, pe care sunt fixate câteva mii de sonde, constituite din molecule ADNc sau clone EST (secvenţe exprimate), care au fost secvenţiate în prealabil. Secvenţele ţintă sunt molecule ADNc, marcate cu coloranţi fluorescenţi. Detecţia produşilor de hibridizare are loc prin scanare cu un laser confocal.

Chip ADN („DNA chips”)
În ultimii ani tehnologia ADN microarray a avansat rapid, datorită posibilităţii de producere automatizată a unor chip-uri obţinute din materiale speciale, care permit robotizarea. Chip-urile sunt lamele de sticlă sau silicon, acoperite cu epoxi-silan, amino-silan sau poliacrilamidă, care asigură legătura între suport şi fragmentele ADN fixate.
Se pot diferenţia două tipuri de investigaţii, în funcţie de moleculele fixate pe suport: ADN complementar sau oligonucleotide. Materialul fixat pe suport poate fi asimilat cu termenul “sondă” care se utilizează în tehnica Northern blotting.
În cazul microarray cu ADNc sondele sunt reprezentate de produşi obţinuţi în urma reacţiilor PCR generate de biblioteci ADNc sau colecţii de clone, utilizând fie primeri specifici vectorului fie unor gene şi sunt fixate pe suportul solid sub forma unor spoturi, în locaţii bine stabilite. Spoturile au dimensiuni de 100-300 µm şi sunt aşezate la o distanţă egală unele de altele. Cu ajutorul acestei tehnici suportul (‚chip”) cuprinde mai mult de 30.000 de molecule ADNc.
În cazul microarray cu oligonucleotide, se sintetizează fragmente cu lungimi de 20-25 nucleotide şi se fixează simultan pe suport. Acestea pot reprezenta 10.000 de gene diferite, cu câte 40-50 oligonucleotide/genă. Avantajul acestei metode constă în faptul că oferă o gamă foarte variată de molecule, fără a fi necesară manipularea ADNc. De asemenea, aceste sonde pot fi gândite astfel încât ele să reprezinte părţi unice ale unui produs de transcripţie, făcând posibilă detecţia unor gene înrudite.
Deoarece oligonucleotidele scurte pot să conducă la hibridizări nespecifice şi sensibilitate redusă, mai recent au fost dezvoltate tehnici care presupun fixarea pe suport a unor oligonucleotide mai lungi (50 –100 nucleotide), dar costul unor astfel de dispozitive este ridicat.
În prezent, produsele comerciale care se utilizează în aproape toate laboratoarele provin de la Compania Affymetrix, cu dimensiuni de 1,28 cm2 şi au fixate un număr mai mare de 500.000 de sonde.

5.2.5.2. SECVENŢE ŢINTĂ UTILIZATE ÎN MICROARRY
În cazul în care se doreşte investigarea genomului, experimentele au ca obiect de studiu ADN, care poate fi utilizat ca atare.
Dacă studiile se îndreaptă spre evaluarea expresiei genelor, atunci este necesară sinteza ADNc, care reprezintă copia populaţiei ARNm, prezentă la un moment dat în celule (capitolul 4.5).
Moleculele fluorescente cele mai utilizate pentru marcare sunt membri ai familiei cianinelor Cy3 şi Cy5. După hibridizare semnalele sunt detectate utilizând un scanner fluorescent. Utilizarea a două substanţe fluorofore permite determinarea semnalelor de hibridizare de la două procese distincte, într-un singur experiment. O dată ce au fost obţinute intensităţile fluorescenţei, cea mai mare parte a muncii implică analiza datelor pentru a extrage informaţii interpretabile din punct de vedere biologic.
Scanerele actuale utilizează diferite tipuri de lasere care emit de obicei la 532 şi 635 nm şi filtre în domeniile (550-600 nm şi 655-695 nm), pentru a elimina contaminarea de fond („background”).
Posibilitatea distingerii între două probe marcate cu coloranţi diferiţi permite analiza comparativă a două probe distincte.

5.2.5.3. ETAPELE UNEI TEHNICI DE INVESTIGARE MICROARRAY

Dacă secvenţele ţintă au fost marcate şi chip-urile care au legate sondele moleculare de interes sunt disponibile, derularea unui experiment microarray presupune parcurgerea mai multor etape şi anume:
Hibridizarea, constă în introducerea secvenţelor ţintă marcate într-o cameră de hibridizare, în care se află cip-ul cu sondele de interes fixate, procesul având loc în condiţii precizate de temperatură.
Spălarea secvenţelor ţintă în exces, pentru a evita obţinerea unor rezultate false.
Scanarea cip-ului şi identificarea spot-urilor la care s-au legat secvenţele ţintă marcate.
Achiziţia imaginilor şi analiza datelor obţinute (Fig. 5.13).
Secvenţele ţintă, reprezentate de ADN sau ADNc sunt marcate fluorescent, pentru ca identificarea produşilor de hibridizare să fie posibilă.
În figura de mai jos este prezentat un studiu de evaluare comparativă a genelor provenite din două probe diferite A şi B.
ARN total a fost extras din ambele probe, s-a separat ARNm, după care a avut loc sinteza moleculelor ADNc. În fiecare probă va exista un set diferit de molecule ADNc, corespunzătoare genelor transcrise în celule, la momentul la care s-a efectuat extracţia ARN.

Fig. 5.12 Etapele parcurse în cadrul unui experiment microarray
după https://cellbiology.med.unsw.edu.au/cellbiology/index.php/ File:Microarray_technology.gif

Cele două seturi de molecule ADNc sunt marcate cu doi coloranţi fluorescenţi diferiţi (A – verde şi B – roşu), după care are loc hibridizarea.
Analiza datelor obţinute va evidenţia pe “chip” spoturi de culori diferite: roşu, pentru genele transcrise numai în proba B, verde pentru cele din proba A şi galben pentru genele exprimate în ambele probe. Această analiză se poate realiza numai cu ajutorul unor soft-uri speciale, care convertesc informaţia preluată de pe “chip” (o suprafaţă de 1,28 cm2 care cuprinde câteva zeci sau sute de mii de spoturi) într-o imagine vizibilă cu ochiul liber. O astfel de imagine cuprinde un număr uriaş de informaţii, astfel că poate fi analizată numai computerizat.
Rezultatul final permite analiza comparativă a datelor obţinute, atât la nivel calitativ – care gene sunt exprimate şi care nu, în anumite condiţii, dar şi la nivel semi-cantitativ – care gene prezintă supraexpresie sau subexpresie, deci care sunt activate respectiv represate în anumite condiţii, în anumite ţesuturi, organe etc.
5.2.5.4. APLICAŢII ALE TEHNICII MICROARRAY

Tehnica microarray are în prezent o gamă largă de aplicaţii, atât pentru analiza ADN cât şi ARN.
Profilul expresiei genelor
În cadrul experimentelor care urmăresc profilul expresiei genelor este posibilă monitorizarea simultană a mii de gene pentru a determina efectul unui anumit tratament, al unei boli sau al unui stadiu de dezvoltare asupra procesului de transcripţie. De exemplu este posibilă identificarea acelor gene a căror expresie este modificată ca răspuns la acţiunea patogenilor sau a altor organisme, prin compararea probelor extrase din ţesuturi infectate şi neinfectate.
Identificarea genelor (GeneID)
Atunci când se analizează probe ADN este posibilă detectarea prezenţei unor gene în alimente şi furaje, provenite din organisme modificate genetic (OMG), din micoplasme în culturile de celule sau de la anumiţi patogeni care produc boli.
Detecţia polimorfismului unei nucleotide (SNP)
Tehnica microarray permite identificarea polimorfismului unei singure nucleotide între alele, intra sau inter-populaţional. Cele mai importante aplicaţii permit genotiparea, analizele criminalistice, determinarea predispoziţiei la o anumită boală, evaluarea mutaţiilor, evaluarea heterozigoţiei sau analiza linkage-ului genetic.
Hibridizarea genomică comparativă
Dacă se analizează comparativ două probe ADN, provenite din organisme diferite sau ţesuturi diferite ale aceluiaşi organism este posibilă identificarea genelor comune sau diferite, printr-o hibridizare genomică comparativă.
Imunoprecipitarea cromatinei
Secvenţele ADN legate la o anumită proteină pot fi izolate prin imunoprecipitarea acelei proteine; aceste fragmente pot fi apoi hibridizate pe un “chip”, care permite determinarea situsului de legare al unei proteine în genom.

5.3. CLONAREA FRAGMENTELOR ADN

Prin clonare se înţelege producerea unor copii identice ale unei gene sau ale oricărui alt fragment de ADN. Metoda a fost aplicată pentru prima dată la începutul anilor ’70 şi se bazează pe tehnologia ADN recombinat şi anume legarea in vitro a două molecule de ADN, aparţinând unor surse diferite (fragmentul ADN de interes şi vectorul de clonare) şi introducerea lor în celule vii, în care se vor replica.
La baza dezvoltării acestei metode a stat izolarea unor tulpini bacteriene E. coli, care nu au posibilitatea de a secţiona moleculele de ADN străin. De asemenea, descoperirea enzimelor de restricţie a contribuit mult la dezvoltarea domeniului.

Etapele unui proces de clonare sunt:
Pregătirea inserţiei – a fragmentului sau fragmentelor care urmează să fie clonate;
Pregătirea vectorului de clonare;
Formarea moleculelor ADN recombinat, în prezenţa ADN ligazei;
Introducerea moleculei de ADN recombinat în celule bacteriene gazdă;
Selecţia bacteriilor eficient transformate.

Vectori de clonare
De-a lungul timpului au fost utilizate diferite tipuri de vectori, care permit clonarea unor fragmente cu lungimi diferite: plasmide (~10kb), bacteriofagi (9-23 kb), cosmide (~40 kb), BAC – Cromosomul Artificial Bacterian (~100-300 kb), YAC- Cromosomul Artificial de Drojdie (~ 500 kb până la 3 Mb). În funcţie de scopul urmărit se alege un anumit tip de vectori, care asigură multiplicarea fragmentelor ADN inserate.

Din punct de vedere practic este avantajoasă utilizarea unor vectori care acceptă ca inserţii fragmente mari de ADN, pentru că în acest fel probabilitatea ca gena, respectiv secvenţa de ADN de interes să fie prezentă într-o singură clonă este mai mare.

5.3.1. CLONAREA ÎN PLASMIDE

5.3.1.1 CARACTERISTICILE PLASMIDELOR CA VECTORI DE CLONARE
Plasmidele reprezintă clasa celor mai utilizaţi vectori de clonare. Acestea sunt molecule de ADN circular închise, cu dimensiuni cuprinse între 1 şi 200 kb, prezente în mod natural în celulele bacteriene. Cele mai multe plasmide conţin gene de rezistenţă la diferite antibiotice, conferind această rezistenţă şi celulelor bacteriene care le poartă.
Unele plasmide au replicarea cuplată cu cea a cromozomului bacterian, astfel încât în fiecare celulă bacteriană este prezentă una, sau cel mult câteva copii ale plasmidei. Alte tipuri însă au o replicare independentă, astfel încât în fiecare celulă bacteriană pot exista 10-200 de copii ale aceleiaşi plasmide.
Caracteristice naturale ale plasmidelor au fost exploatate în cadrul tehnologiei ADN recombinat, realizându-se plasmide artificiale, care pot să fie utilizate ca vectori de clonare.
Pentru a putea fi utilizată ca vector de clonare o plasmidă trebuie să îndeplinească următoarele condiţii:
să fie relativ mică;
să posede o origine a replicării;
să posede una sau două gene marker, care să permită selecţia bacteriilor eficient transformate;
să posede un singur loc de recunoaştere pentru una sau mai multe enzime de restricţie într-o zonă care nu este importantă pentru replicare, care să fie utilizat ca situs de clonare; este preferabil ca situsul de clonare să fie amplasat în interiorul unei gene de selecţie, astfel încât introducerea fragmentului de ADN străin să dezactiveze gena.
Genele marker pot să fie gene care conferă rezistenţă la anumite antibiotice sau care dau o reacţie de culoare.

VECTORUL DE CLONARE pUC 19
O plasmidă reprezentativă pentru vectorii de clonare utilizaţi pentru clonarea unor fragmente mici de ADN (<10 kb) este pUC 19.
Vectorul pUC19 posedă o genă care-i conferă rezistenţă la ampicilină şi o regiune a operonului lac, care reprezintă factori de selecţie (Fig. 5.13). Totodată posedă o secvenţă care funcţionează ca origine a replicării (rep), având rolul de a menţine plasmida în celulele bacteriene. Acest vector are o replicare independentă de cea a cromozomului bacterian, ceea ce conduce la acumularea unor cantităţi mari de ADN plasmidial în celulele bacteriene.

Fig. 5.13. Harta genetică a vectorului de clonare pUC 19
(după catalog Promega)

În interiorul operonului lac a fost introdusă o oligonucleotidă (54bp), care conţine 13 secvenţe de recunoaştere unice pentru mai multe enzime de restricţie, care pot să fie utilizate ca situsuri de clonare (MCS – ‚Multiple Cloning Sites’) (Fig. 5.14). Sunt de asemenea cunoscuţi doi primeri M13 sens şi M13 antisens, care pot fi utilizaţi în procesele de determinare a secvenţei inserţiei prin metoda Sanger.

5' GTT GTAAAACGACGGCCAGT GAATTC GAGCTCGGTACCCGG GGATCC TCTAGA

GTCGACCTGCAGGCATGCAAGCTTGGCGTAATCATG GTCATAGCTGTTTCCTG 3'

Fig. 5.14 Secvenţa multiplă de clonare a vectorului pUC 19
Fragmentul operonului lac din E. coli este alcătuit din gena structurală lac Z, responsabilă de sinteza -galactozidazei, gena lacI, responsabilă pentru sinteza represorului proteic şi un segment denumit secvenţă multiplă de clonare (MCS). Aceasta conţine secvenţe de recunoaştere pentru un număr mare de endonucleaze de restricţie, care pot funcţiona ca situsuri de clonare.
Atunci când celulele bacteriene care poartă vectorul nemodificat sunt dezvoltate pe mediu care conţine izopropil-tiogalactozidază –IPTG (un inductor al operonului lac), represorul codificat de gena lac I este dezactivat, nu se mai poate lega la operator, astfel că fragmentul genei lac Z este transcris. Proteina rezultată se combină cu o proteină codificată de ADN-ul cromozomal, pentru a alcătui o formă hibridă activă a -galactozidazei. Dacă în mediu este prezent substratul cromogen 5-brom-4-clor-3-indolil--galactozidaza (X-gal), acesta este hidrolizat de către -galactozidaza hibridă, rezultând un produs albastru. Astfel, coloniile bacteriene care conţin vectorul nemodificat au culoare albastră.
Secvenţa multiplă de clonare este introdusă în interiorul fragmentului operonului lac, dar nu împiedică producerea -galactozidazei, datorită dimensiunilor mici pe care le are. Dacă într-unul dintre situsurile de clonare este introdusă însă o inserţie de dimensiuni mai mari, operonul este dezactivat, iar enzima nu se mai produce. Coloniile bacteriene care conţin vectorul modificat au culoare albă.
Segmentul operonului lac, alături de gena care conferă rezistenţă la ampicilină reprezintă markeri de selecţie importanţi pentru identificarea celulelor bacteriene eficient transformate.

VECTORUL BAC – Cromosomul Artificial Bacterian
(Bacterial Artificial Chromosom)
Sistemul de clonare BAC se bazează pe factorul de fertilitate F prezent în E.coli. Plasmida F este o moleculă circulară de ADN, mult mai mică decât cromosomul bacterian, având o dimensiune de aproximativ 100kb. Atunci când este utilizată ca vector de clonare sunt eliminate porţiuni de ADN, care nu sunt esenţiale pentru funcţionare.
În anul 1992 a fost obţinut vectorul de clonare pBAC 108L, iar în prezent este utilizat vectorul pBelo BAC II (Fig. 5.17) care are la bază plasmida F, în care a fost introdusă o oligonucleotidă sintetică. Vectorul astfel rezultat are dimensiuni de 7,5 kb şi posedă proprietăţi specifice plasmidei F şi totodată caracteristici provenite de la fragmentul nou introdus.
De la plasmida F a fost preluată gena care îi conferă rezistenţă la cloramfenicol, genele ori S şi rep E, care mediază replicarea unidirecţională şi genele par A şi par B, care menţin numărul de copii la una sau cel mult două într-o celulă bacteriană.
Oligonucleotida sintetică conţine fragmentul operonului lac din E. coli şi un segment denumit secvenţă multiplă de clonare (MCS). Aceasta conţine secvenţe de recunoaştere pentru un număr mare de endonucleaze de restricţie, care pot funcţiona ca situsuri de clonare.
Segmentul operonului lac, alături de gena care conferă rezistenţă la cloramfenicol reprezintă markeri de selecţie importanţi, utilizaţi la alcătuirea şi caracterizarea bibliotecii de ADN.
Clonele obţinute cu ajutorul vectorului BAC au o serie de caracteristici:
au o mare stabilitate în timp;
se menţin într-un număr foarte redus de copii în celulele bacteriene în care au fost introduse, scăzând astfel foarte mult posibilitatea apariţiei recombinărilor între inserţii;
ADN-ul plasmidial poate fi izolat cu uşurinţă;

Dacă sunt clonate fragmente de dimensiuni mari, în cazul în care numărul de plasmide/celulă bacteriană ar fi ridicat există pericolul apariţiilor unor recombinări necontrolate. Astfel, ADN plasmidial care ar fi recuperat după clonare ar purta inserţii cu secvenţe diferite.
Pentru a preîntâmpina acest neajuns, atunci când se doreşte clonarea unor fragmente de dimensiuni mare se utilizează întotdeauna vectori care se menţin într-o singură copie în fiecare celulă bacteriană.

VECTORI DE EXPRESIE
Vectorii de expresie sunt vectori de clonare care conţin secvenţe suplimentare reprezentate de: un promotor inductibil, regiunea care codifică o secvenţă specifică pentru legarea ARNm pe cromosom şi o secvenţă terminală. La sfârşitul regiunii care codifică secvenţa de legare pe cromozom este introdusă o secvenţă de recunoaştere pentru o anumită enzimă de restricţie, care se utilizează ca situs de clonare (Fig. 5.15).

Fig. 5.15. Secvenţele suplimentare prezente într-un vector de expresie – promotor şi secvenţe UTR – transcrise dar netraduse, cu rol în legarea ARNm la ribozom

Utilizarea vectorilor de expresie are ca scop producerea unei proteine de interes de către o bacterie.
Orice secvenţă care începe cu codonul start (AUG) poate fi plasată în poziţia marcată de săgeată şi va fi transcrisă în celulele bacteriene.
După obţinerea moleculei de ADN recombinat în care a fost inserat fragmentul ADN de interes, aceasta este introdusă în celule bacteriene cărora le-a fost indusă competenţa. În celulele transformate va fi sintetizată proteina care corespunde exact cu regiunea de codificare inserată.
Dacă este clonată secvenţa unei gene provenite de la un organism eucariot, pot să apară probleme deoarece bacteriile nu posedă tot mecanismul necesar eliminării intronilor şi legării exonilor între ei. Din această cauză este indicat să fie clonată (introdusă într-un vector de exprimare) o moleculă de ADN complementar.
O altă tehnică este aceea de a insera secvenţa de codificare puţin după începutul unei secvenţe care codifică o proteină bacteriană; în acest fel, după translaţie se produce o proteină hibridă şi anume: regiunea N-terminală este constituită dintr-o porţiune de proteină bacteriană a cărei secvenţa a fost întreruptă, iar restul proteinei corespunde secvenţei de codificare străine.
Această secvenţă N-terminală bacteriană este de obicei scurtă, rolul ei fiind acela de a proteja proteina hibridă împotriva unei eventuale degradări produse de bacterie sau poate constitui secvenţa semnal care să asigure secreţia proteinei hibride în mediu.

VECTORI SPECIFICI PENTRU PRODUŞII DE AMPLIFICARE (PCR)
În capitolul 4.3.1.2 a fost prezentată proprietatea de transferază terminală a Taq polimerazei, aceea de adăugare a unei o grupări dezoxi-adenozinfosfat (A) la capetele 3’.
Prezenţa acestei grupări poate fi exploatată în procesul de clonare denumit „TA”, în care se utilizează un vector de clonare cu o grupare dezoxi-timidin fosfat (T) neîmperecheată, la capătul 3', care comple-mentează dezoxi-adenozin fosfatul (A) neîmperecheat al produsului PCR.
Un astfel de sistem de clonare este TOPO TA, un vector liniarizat, care permite inserarea directă a produşilor de PCR amplificaţi cu ajutorul Taq polimerazei, fără a fi necesare proceduri post PCR. Sistemul enzimatic utilizat pentru formarea legăturilor fosfodiesterice este topoizomeraza I.

Un alt sistem de clonare pentru produşi PCR, care permite secvenţierea directă este sistemul pGEM.
Acest vector liniar permite clonarea unor produşi PCR de dimensiuni mai mici de 1 kb şi conţine promotorii T7 şi SP6 care flanchează regiunea de clonare multiplă. De asemenea are o genă de rezistenţă la ampicilină şi o regiune a operonului lac, care ajută la selecţia transformanţilor. Conţine situsuri unice de recunoaştere pentru 16 enzime de restricţie şi de asemenea cei doi primeri M13 sens şi M13 antisens, care pot fi utilizaţi în procesele de determinare a secvenţei inserţiei prin metoda Sanger (Fig. 5.17).
Vectorul prezentat permite deci clonarea produşilor PCR prin sistemul T/A, deoarece posedă situsul de inserţie corespunzător; poate funcţiona ca un un vector de expresie, deoarece are în structura sa doi promotori şi totodată poate fi utilizat în secvenţiere pentru că posedă cei doi primeri specifici M13, sens şi antisens.

Fig. 5.17 Harta vectorului pGEM (A) şi secvenţa multiplă de clonare (B)
(după catalog Promega)

5.3.1.2 ETAPELE PROCESULUI DE CLONARE ÎN PLASMIDE

Clonarea în plasmide presupune parcurgerea etapelor specifice pentru orice proces de clonare, care presupune formarea moleculelor de ADN recombinat, introducerea acestora în celule bacteriene pregătite în prealabil şi selecţia clonelor care conţin fragmentele de interes.

A. FORMAREA MOLECULELOR DE ADN RECOMBINAT
În principiu, clonarea în plasmide este foarte facilă. Într-o primă etapă vectorul este secţionat cu o enzimă de restricţie şi legat în vitro cu un alt fragment de ADN. În reacţia de recombinare poate să fie introdus unul sau mai multe fragmente ADN pentru care se doreşte multiplicarea.
Legarea se realizează în prezenţa ADN ligazei, care are capacitatea de a reface legături fosfodiesterice între o grupare OH aflată la un capăt 3’ şi o grupare fosfat aflată la un capăt 5’ al unui fragment ADN. Pentru a fi posibilă desfăşurarea unor astfel de reacţii este necesar ca ambele tipuri de ADN, atât vectorul cât şi fragmentele de interes să aibă capete compatibile.
Fragmentele ADN au capete compatibile fie dacă au rezultat în urma secţionării cu aceiaşi enzimă de restricţie (în cazul în care enzimele utilizate generează capete coezive) fie au fost secţionate cu enzime diferite, care generează capete netede.
În cazul în care fragmentele care urmează să fie legate nu au capete compatibile, este posibilă sinteza acestora cu ajutorul ADN polimerazelor specifice (capitolul 4.3.2).
Pentru a mări specificitatea reacţiilor, de obicei se realizează secţionări cu enzime de restricţie care generează capete coezive, atât pentru vector cât şi pentru fragmentul/fragmentele de clonat. Astfel, reacţia de ligare are loc cu uşurinţă, generându-se molecule ADN recombinat – alcătuite din vectorul de clonare, care a inclus un fragment de ADN străin (Fig. 5.18).

Fig. 5.18 Formarea moleculelor ADN recombinat

Atât vectorul, cât şi moleculele ADN au fost secţionate cu aceiaşi enzimă de restricţie (EcoR I), care a generat capete coezive complementare, fiind astfel posibilă apropierea fragmentelor, formarea legăturilor de hidrogen între bazele complementare şi apoi refacerea legăturilor fosfodiesterice în prezenţa ADN ligazei.

Una dintre problemele majore care apare în cazul clonării în plasmide este recircularizarea acestora fără a include fragmentul ADN străin. Acest proces poate fi limitat prin ajustarea concentraţiilor de ADN străin şi vector, în timpul reacţiei de ligare sau prin tratarea vectorului secţionat cu fosfatază.
În timpul legării celor două molecule, ADN ligaza catalizează formarea unei legături fosfodiesterice între două nucleotide adiacente numai dacă una dintre nucleotide posedă o grupare fosfat la capătul 5’ iar cealaltă o grupare OH la un capăt 3’.
Recircularizarea plasmidei poate fi împiedicată dacă gruparea 5’ fosfat este îndepărtată de la ambele capete ale ADN plasmidial liniarizat, utilizând fosfataza alcalină bacteriană. Ca rezultat, nici una dintre catenele duplexului nu mai poate forma o legătură fosfodiesterică. Totuşi, segmentul de ADN străin, care posedă o grupare fosfat la capătul 5’ poate fi legat eficient cu plasmida defosforilată, rezultând o moleculă circulară (Fig. 5.19).
Moleculele de ADN recombinat formate în urma reacţiei de ligare sunt introduse apoi în celule bacteriene în vederea multiplicării, proces care poartă numele de transformare.
În procesele de transformare se utilizează tulpini bacteriene selecţionate, care nu au capacitatea de a distruge ADN străin pătruns în celule. Totodată din aceste celule au fost îndepărtate toate plasmidele naturale, astfel încât, în urma transformării să se regăsească numai moleculă de ADN recombinat nou introdusă.
Celulelor bacteriene care vor fi utilizate în reacţia de transformare trebuie să li se fi indus în prealabil competenţa, adică învelişul lor celular să fie permeabilizat, astfel încât să permită pătrunderea ADN străin.

B. INTRODUCEREA MOLECULEI DE ADN RECOMBINANT ÎN CELULE BACTERIENE GAZDĂ
Moleculele de ADN recombinat se introduc într-o celulă gazdă, care devine tranzitoriu acceptoare de ADN străin. Se pot utiliza în acest scop bacteriile (E. coli), drojdiile (Saccharomices cerevisiae) sau culturile de celule (linii celulare CHO – Chinese hamster ovary), care îndeplinesc condiţiile necesare: să aibă o rată de multiplicare ridicată, să prezinte susceptibilitate pentru vector şi să prezinte un balast proteic minim.
Cel mai des sunt utilizate tulpini speciale E. coli naturale (E. coli DH 10B sau E. coli HB 104) care au o rată de multiplicare ridicată.

Cu cât celula gazdă este mai prolifică, cu atât se obţin cantităţi mai mari de ADN recombinat, conducând la sinteza de copii ADN identice fragmentului genic înserat. Pornind de la o singură moleculă se poate ajunge la 1012copii de ADN recombinat.

PREPARAREA CELULELOR COMPETENTE E. coli
Susceptibilitatea celulelor bacteriene faţă de vector, sau competenţa se induce artificial prin metode specifice procedurii utilizate la transformare. Dacă celulele competente vor fi transformate prin metoda şocului termic, este necesară permeabilizarea lor, prin crearea unor pori în membrană, cu ajutorul CaCl2. În cazul în care, pentru transformare se va utiliza electroporarea nu este necesară o permeabilizare prealabilă, ci numai o îndepărtare a urmelor de săruri provenite de la mediul de cultură, în scopul evitării formării unor arcuri electrice.
În condiţii ideale, diviziunea bacteriei E. coli se produce exponenţial, rata de creştere depinzând de mediul de cultură, de genotipul bacteriei, de temperatură şi de gradul de aerare.
Rata de multiplicare este urmărită prin măsurarea periodică a densităţii optice la o lungime de undă de 600 nm. Relaţia dintre densitatea optică şi numărul de celule variază de la o tulpină la alta şi este recomandabil să se alcătuiască curbe de calibrare care să reflecte această relaţie.
Pentru a obţine celule competente care dau o rată mare de transformare este necesar ca în cultura bacteriană numărul de celule să fie de 5×107 celule/ml. Din curba de calibrare se poate determina densitatea optică corespunzătoare acestui număr de celule, pentru fiecare tulpină bacteriană în parte. După ce celulele bacteriene au fost pregătite, are loc introducerea moleculelor de ADN recombinat în acestea, proces care poartă numele de transformare.
În cazul în care vectorul de clonare a fost o plasmidă, sau plasmida specială BAC, transformarea poate avea loc prin şoc termic sau prin electroporare. Cultura bacteriană rezultată în urma transformării se cultivă pe mediu de cultură solid suplimentat cu factorii de selecţie potriviţi.
Fiecare celulă eficient transformată va generă un ansamblu de celule care poartă numele de clonă. Deci, fiecare colonie care se dezvoltă pe mediul de cultură solid este o clonă, în care toate celulele poartă acelaşi tip de ADN recombinat (Fig. 5.20).

C. SELECŢIA CLONELOR OBŢINUTE
Cultivarea pe medii suplimentate cu factori de selecţie permite numai dezvoltarea celulelor care au fost eficient transformate (care conţin vectorul de clonare purtător al genelor de selecţie).
În continuare este necesară identificarea acelor clone care conţin moleculele de ADN recombinat şi cele care conţin vectorul recircularizat. Această selecţie se realizează de obicei pe baza testării rezistenţei la anumite antibiotice sau prin apariţia unor reacţii de culoare. De cele mai multe ori se realizează pe baza reacţiei de culoare, în prezenţa substratului X-gal (5-brom-4-clor-3-indolil--galactozidaza). Astfel, vor fi analizate în continuare numai acele clone care au generat colonii de culoare albă. Clonele care au generat colonii albastre conţin vectorul recircularizat, neavând importanţă din punctul de vedere al procesului de clonare.
Apoi este necesară selectarea acelor clone care conţin ADN recombinat purtător al unei secvenţe ADN de interes.

Fig. 5.21. Transformarea celulelor bacteriene şi selecţia bacteriilor eficient transformate

5.3.2. UTILIZAREA TEHNOLOGIEI ADN RECOMBINAT ÎN PRODUCEREA INSULINEI

În perioada 1963-1965, trei grupe de cercetători (americani, germani şi chinezi) au reuşit sinteza artificială a insulinei prin intermediul a 170 de reacţii chimice, lucru ce făcea imposibilă producerea insulinei pe cale industrială.
Noile tehnologii industriale de obţinere a insulinei umane au fost posibile odată cu identificarea genei insulinei (anul 1980) şi crearea moleculelor recombinate de ADN, utilizând o plasmida ca vector de clonare. Insulina este o proteină mică, cu masa de 5734 daltoni şi cuprinde 51 resturi aminioacidice. Este alcătuită din două lanţuri, un lanţ A (cu 21 resturi aminoacidice) şi unul B (cu 30 resturi aminoacidice) legate prin două punţi disulfurice (A7-B7 şi A20-B19); o a treia legătură disulfurică leagă restul Cys-A6 cu Cys-A11.
În procesul de clonare, segmente de gene corespunzătoare lanţurilor mature de insulină A şi B sunt introduse în plasmide diferite, care prezintă rezistenţă la un antibiotic şi gena structural β-gal ca markeri.
Plasmidele sunt transferate separat în E. coli. În cultura bacteriană, în prezenţa antibioticului de selecţie se dezvoltă numai acele celule bacteriene care au fost eficient transformate. Inducţia expresiei β-gal (prin adăugarea de β-galactoză) determină exprimarea genelor pentru insulină, care sunt transcrise şi traduse în celulele bacteriene. Lanţurile insulinice sunt extrase din celulele bacteriene după care sunt puse în contact, formându-se insulina activă biologic (Fig. 5.21).

5.22. Procesul de producere a insulinei prin tehnologia ADN recombinant
(după https://www.mun.ca/biology/scarr/Insulin_cloning.html)

Datorită utilizării tehnologiei ADN recombinant, se obţin aproximativ 200 grame de insulină de pe 1 m3 de mediu de cultură, adică tot atât cât se poate extrage din aproape 1600 kg de pancreas de bou sau porc.
Insulina umană este singura proteină animală produsă în bacterii pentru care structura este absolut identică cu cea a moleculei naturale.
Iniţial au apărut unele probleme cauzate de contaminarea produşilor finali cu celule bacteriene, care prezentau un risc de îmbolnăvire pentru pacienţi, problemă care a fost rezolvată prin introducerea unor procedee avansate de purificare. În prezent insulina este produsă în drojdii, care secretă o moleculă cu o structură tridimensională perfectă, care nu mai necesită operaţiuni costisitoare de purificare avansată.
Probele clinice efectuate cu insulina umană, produsă prin tehnici de inginerie genică, au demonstrat că ea nu are efecte secundare şi că poate fi comercializată, adică folosită la tratarea bolnavilor de diabet (din 1982 în SUA şi din 1983 în Marea Britanie).

5.4. ALCĂTUIREA BIBLIOTECILOR ADN

Bibliotecile ADN sunt colecţii de clone care au ca inserţii fragmente ADN genomic sau complementar, care pot fi menţinute în condiţii speciale şi care pot fi multiplicate în funcţie de necesităţi.

5.4.1. BIBLIOTECILE ADN GENOMIC

Bibliotecile de ADN genomic conţin câteva zeci de mii de clone, fiecare dintre acestea având ca inserţie un fragment din ADN genomic. Având în vedere că procesul de clonare are loc la întâmplare este posibil ca unele fragmente să fie prezente în mai multe clone, iar altele să nu fie reprezentate, dar în general inserţiile clonelor sunt diferite. Pentru a fi siguri că a fost acoperit tot genomul, deci probabilitatea de a exista fragmente nereprezentate să fie foarte mică este necesar ca suma inserţiilor tuturor clonelor să fie de aproximativ 7 ori mai mare decât dimensiunea genomului

OBŢINEREA BIBLIOTECILOR GENOMICE
Bibliotecile genomice se obţin prin procedee clasice de clonare, cu unele caracteristici specifice. Este necesară existenţa unei surse de ADN genomic pentru specia de interes şi un vector de clonare care să-i confere următoarele caracteristici:
clonele care o alcătuiesc să fie stabile, pentru a putea fi utilizate un timp îndelungat;
să aibă dimensiunile inserţiilor suficient de mari, astfel încât un număr cât mai mic de clone să acopere fragmente cât mai mari din genom;
ADN-ul plasmidial să poată fi izolat şi purificat cu uşurinţă, pentru a simplifica procesele de analiză a clonelor;
Există mai multe sisteme de clonare care îndeplinesc aceste condiţii, şi anume cromozomul artificial de drojdie – YAC şi cromozomul artificial bacterian – BAC. Acesta din urmă este cel mai mult utilizat pentru producerea de biblioteci genomice.
În alcătuirea bibliotecii genomice se parcurg mai multe etape şi anume:
Izolarea nucleilor intacţi;
Extracţia ADN genomic din nuclei prin liza învelişului nuclear.
Este necesară aplicarea unei proceduri speciale de extracţie a ADN pentru că în cazul metodelor uzuale de extracţie şi purificare a ADN genomic, din cauza secţionărilor mecanice care apar în timpul diferitelor etape de lucru se obţin fragmente ADN cu dimensiuni relativ reduse (100 -200 kb).
Secţionarea parţială a ADN genomic cu o endonucleaza de restricţie.
Este necesară secţionarea parţială a ADN genomic, pentru ca fragmentele care se vor regăsi ca inserţii în clonele bibliotecii de genomice să se suprapună pe anumite porţiuni. Astfel, va fi posibilă alcătuirea hărţilor fizice prin identificarea clonelor cu inserţii suprapuse.
Separarea prin electroforeză în câmp electric pulsatoriu (PFGE – pulsed field gel electroforesis) şi izolarea porţiunii de gel care conţine fragmentele de ADN cu dimensiuni cuprinse între 200 şi 500kb;
Sunt selectate fragmentele cu lungimi mari (200-500 kb), deoarece în cazul introducerii în reacţia de ligare a unui amestec cu fragmente de diferite dimensiuni, includerea fragmentelor mici în moleculele de ADN recombinat este favorizată din punct de vedere energetic.
În cazul construirii bibliotecilor genomice se doreşte obţinerea unor clone cu inserţii mari, care să asigure acoperirea întregului genom.
Secţionarea vectorului de clonare cu aceiaşi enzimă de restricţie, care trebuie să posede un situs de recunoaştere unic, plasat în secvenţa multiplă de clonare (MCS);
Obţinerea ADN-ului recombinat prin punerea în contact a vectorului de clonare şi a fragmentelor de ADN genomic, ambele secţionate cu aceiaşi endonuclează de restricţie, în prezenţa ADN ligazei. Între cele două tipuri de fragmente se formează legături fosfodiesterice, datorită existenţei capetelor coezive.
Electroporarea, adică introducerea moleculelor de ADN recombinat în celule bacteriene electrocompetente, cărora li s-a indus în prealabil competenţa;
Selecţia coloniilor bacteriene eficient transformate pe baza rezistenţei la antibioticul specific;
Selecţia coloniilor bacteriene care conţin ADN recombinat, pe baza reacţiei de culoare (Fig. 5.21).

Fig. 5.21 Etapele principale de alcătuire a unei biblioteci genomice
secţionarea ADN genomic cu o enzimă de restricţie;
secţionarea vectorului de clonare cu aceiaşi enzimă de restricţie;
formarea moleculelor de ADN recombinat;
transformarea, introducerea moleculalor de ADN recombinat în celulele bacteriene.

Având în vedere că noţiunea de clonă defineşte ansamblul de celule care provin de la o celulă unică, se consideră că fiecare colonie albă reprezintă o clonă BAC, constituită din celule bacteriene E. coli, care posedă acelaşi tip de ADN recombinat.
În general se selectează un număr de 30-40.000 de clone, care sunt transferate pe plăci speciale, distribuite pe rânduri şi coloane şi alcătuiesc biblioteca genomică.

TRANSFERUL CLONELOR BAC CARE ALCĂTUIESC BIBLIOTECA GENOMICĂ PE SUPORTURI SOLIDE
Pentru ca biblioteca genomică să poată fi analizată în continuare este necesar ca toate clonele care o alcătuiesc să fie transferate pe suporturi solide – membrane de nylon. Acestea sunt transferate cu ajutorul unor roboţi speciali, pentru a asigura o distribuţie foarte ordonată.

CARACTERIZAREA BIBLIOTECII GENOMICE
O bibliotecă genomică conţine deci 30- 40.000 de clone BAC, cu o dimensiune medie a inserţiilor de aproximativ 100 – 150 kb.
Dimensiunile însumate ale inserţiilor clonelor trebuie să depăşească de 5-7 ori genomul speciei, pentru a fi siguri că fiecare fragment de ADN genomic este prezent în cel puţin o clonă.
Deoarece ADN genomic a fost secţionat parţial, cel mai probabil este ca fragmentele de ADN care alcătuiesc inserţiile clonelor BAC să se suprapună în anumite porţiuni. Având în vedere că procesul de clonare este statistic, există posibilitatea ca unele fragmente de ADN să nu fie regăsite ca inserţii ale clonelor BAC iar altele să fie prezente în mai multe clone.
În cazul în care se alcătuiesc biblioteci genomice ale plantelor superioare, trebuie să se ţină cont de faptul că acestea deţin o cantitate mare de ADN repetitiv, care nu se exprimă dar care produc o cantitate mare de fragmente de restricţie.
Pentru a depăşi acest inconvenient se utilizează enzime de restricţie sensibile la metilare, deoarece regiunile transcrise sunt mult mai puţin metilate decât regiunile cu secvenţe repetitive.
O enzimă precum Pst I va genera fragmente foarte mari în regiunile repetate metilate, fragmente care nu pot fi clonate şi/sau amplificate şi fragmente de mărimi medii în regiunile care conţin gene sau secvenţe moderat repetate.

5.4.2. BIBLIOTECILE ADN COMPLEMENTAR (ADNc)

O bibliotecă ADN complementar reprezintă o colecţie de clone, care
au ca inserţii moleculele de ADN complementar (ADNc) corespunzătoare populaţiei de ARNm existentă la un moment dat în celule.
O astfel de bibliotecă cuprinde informaţia pură, formată numai din secvenţe de exoni. Spre deosebire de o bibliotecă de ADN genomic, care rezultă din clonarea fragmentelor de ADN originare direct din genom, fragmentele ADNc se sintetizează artificial în laborator, pe o moleculă de ARN mesager matur, ca o copie complementară (capitolul 4.5).
În timp ce clonele de ADN genomic sunt identice pentru toate celulele aceluiaşi organism, clonele ADNc sunt specifice ţesutului, stadiului de dezvoltare, condiţiilor de mediu etc. Prin urmare, atunci când se alcătuieşte o bibliotecă ADNc, trebuie să se ţină seama de aspectele menţionate, iar alegerea materialului să se realizeze în funcţie de scopul urmărit.
De exemplu, dacă se doreşte evaluarea expresiei genelor în condiţii de stres, este necesară alcătuirea a două biblioteci ADNc. Una va proveni din ARNm al lotului control, iar cea de-a doua de la un lot supus factorilor de stres.

OBŢINEREA BIBLIOTECILOR ADNc
Pentru obţinerea bibliotecilor ADNc, prima etapă este extracţia ARN, separarea ARNm, după care are clonarea, urmând toate etapele specifice acestui proces, cu câteva particularităţi datorate structurii moleculelor de ADNc.
Ca vectori de clonare se aleg în general plasmidele sau vectorii de expresie. Având în vedere că fragmentele clonate sunt gene, secvenţe codante de ADN, este posibilă alegerea unor vectori de expresie atunci când scopul nu este numai multiplicarea ADN, ci şi producerea de proteine.
În procesul de clonare nu mai este necesară secţionarea moleculelor de ADN, deoarece populaţia de ADNc este alcătuită din fragmente cu dimensiuni mici. Dar, pentru a mări eficienţa procesului de formare a moleculelor de ADN recombinat, ADNc este prelucrat suplimentar, după cum urmează:
Metilarea moleculelor de ADNc, pentru a le proteja împotriva secţionării cu enzime de restricţie;
La capetele moleculelor ADNc se leagă fragmente de ADN denumite adaptoare cu situs de restricţie („Restriction site linker”), oligonucleotide care conţin în secvenţa lor un situs de recunoaştere al unei enzime;
Etapele procesului de clonare sunt următoarele:
Obţinerea moleculelor ADN recombinat prin punerea în contact a vectorului de clonare şi a fragmentelor de ADNc prelucrate, ambele secţionate cu aceiaşi endonuclează de restricţie, în prezenţa ADN ligazei. Între cele două tipuri de fragmente se formează legături fosfodiesterice, datorită existenţei capetelor coezive.
Transformarea, adică introducerea moleculelor de ADN recombinat în celule bacteriene, cărora li s-a indus în prealabil competenţa;
Selecţia coloniilor bacteriene eficient transformate pe baza rezistenţei la antibioticul specific;
Selecţia coloniilor bacteriene care conţin ADN recombinat, pe baza reacţiei de culoare.
Dintre coloniile bacteriene, care reprezintă fiecare o clonă este selectat un număr de 106-107, care sunt transferate pe membrane solide, după un procedeu similar cu cel aplicat în cazul bibliotecii ADNc.

CARACTERIZAREA BIBLIOTECII ADNc
O bibliotecă ADNc trebuie să conţină deci 106-107 de clone ADNc, cu o dimensiune a inserţiilor care depinde de lungimea produsului de transcripţie.
Este necesar un număr atât de mare de clone pentru ca probabilitatea ca anumiţi produşi de transcripţie să nu fie prezenţi să fie cât mai redusă.
Având în vedere că procesul de clonare este statistic, fragmentele ADNc care corespund unor gene cu o transcripţie abundentă se vor găsi într-un număr foarte mare de clone, iar cele care provin de la gene cu transcripţie ocazională vor fi extrem de rare, sau chiar vor lipsi.

5.5. SECVENŢIEREA FRAGMENTELOR ADN

Secvențierea ADN a parcurs un drum lung de-a lungul timpului, pornind de la cromatografia bidimensională din anii ‘70. Incepând cu anul 1977 a fost introdusă electroforeza capilară (CE), ceea ce a permis secvențierea în totalitate a genomului oricărei specii, într-o manieră sigură și reproductibilă.
Zece ani mai târziu, Applied Biosystems a realizat primul instrument automatizat de secvențiere, bazat tot pe electroforeză capilară. Această prima generație de instrumente a fost considerată foarte avansată până în anul 2005, când a fost introdus “Genetic Analyzer”, un echipament care a mărit numărul de nucleotide secvenţiate în cadrul fiecărei reacţii de la 84 kb la 1 Gb (1×106 kb).
Această tehnică de secvenţiere rapidă a unor fragmente foarte mari de ADN se bazează pe o abordare diferită fundamental de ceea ce a existat înainte, revoluţionând domeniul şi permiţând lansarea noii generaţii “next-generation” în genomică. În timp, tehnologia a avansat tot mai mult, astfel că în anul 2014 rata de secvenţiere a crescut la 1,8 Tb (1,8x109kb) pe fiecare reacţie, ceea ce reprezintă o creştere de 1000 de ori faţă de procedurile anterioare.
Comparând procesele de secvenţiere ale genomului uman putem spune că primul proiect de acest tip, care s-a finalizat în 2001 a durat 15 ani şi a costat aproximativ 3 miliarde de dolari, în timp ce generaţia cea mai nouă de echipamente permite secvenţierea a 45 de genomuri umane într-o singură zi, cu un preţ de 1000$/genom.

5.5.1. METODE UTILIZATE PENTRU SECVENŢIERE

5.5.1.1. METODA DE SECVENŢIERE SANGER
Metodele pentru determinarea secvenţei nucleotidice a unor fragmente de ADN au fost dezvoltate independent de Walter Gilbert – o tehnică de degradare chimică şi Fred Sanger – o tehnică de sinteză enzimatică, care în 1980 au primit premiul NOBEL.
Metoda Gilbert se bazează pe modificarea ADN, urmată de secţionarea la nivelul bazelor specifice. Metoda necesită marcare radioactivă şi o purificare avansată a fragmentelor care urmează să fie secvenţiate, şi de aceea a fost abandonată, fiind înlocuită de metoda Sanger.
Metoda Sanger presupune o sinteză enzimatică în prezenţa unei polimeraze, prin urmare este necesară utilizarea unui primer specific care să inţieze reacţia.
Dacă sunt secvenţiate fragmente despre care nu există informaţii prealabile cu privire la secvenţa, este necesară clonarea în vectori specifici (capitolul 5.3.1). Astfel secvenţele care flanchează orice fragment clonat sunt cunoscute, pentru ele fiind disponibili primeri de secvenţiere. Pentru fiecare vector de clonare utilizat la secvenţiere, există pe piaţă primeri specifici care pot fi utilizaţi în acest proces. Deci aceiaşi primeri specifici vectorului de clonare pot fi utilizaţi pentru secvenţerea oricărui fragment ADN.
Un caz particular îl reprezintă fragmentele rezultate în urma unei reacţii PCR, care au la capetele 3’ ataşată o grupare deoxi-adeninfosfat (A). Acestea pot fi introduse în vectori specifici, pentru care au fost desemnaţi primerii de secvenţiere, prin procesul de clonare denumit „TA”, (capitolul 5.3.1.1).
Perfecţionarea în timp a tehnicilor de secvenţiere permite în prezent utilizarea în reacţie a primerilor care au fost utilizaţi la amplificarea iniţială.
Deci, în cazul clonării fragmentelor de secvenţiat este posibilă utilizarea aceloraşi primeri în orice reacţie, dar dacă se secvenţiază direct fragmente PCR este necesară utilizarea primerilor specifici fiecărui tip de fragment.
Metoda Sanger se bazează pe utilizarea unei molecule, didezoxinucleozid trifosfat (ddNTPs), un compus care, spre deosebire de deoxiriboză nu are o grupare OH în poziţia 3’. Această moleculă are proprietatea de a bloca sinteza ADN, deoarece îi lipseşte gruparea necesară pentru formarea unei legături fosfodiester între două nucleotide.

Pentru a se desfăşura o reacţie de secvenţiere sunt necesare următoarele componente: o moleculă de ADN matriţă, monocatenară; un primer, ADN polimerază, nucleotide marcate radioactiv sau fluorescent şi nucleotidele modificate (dideoxi), care au proprietatea de a bloca sinteza ADN. Având în vedere că procesul de secvenţiere se bazează pe o reacţie de sinteză a ADN, începe întotdeauna la capătul 5’ al fragmentului de analizat.
Proba de ADN se împarte în patru reacţii, fiecare conţinând toate cele patru deoxinucleotide marcate (dATP, dGTP, dCTP şi dTTP) şi ADN polimeraza (Fig. 5.22). În fiecare reacţie se adaugă una dintre cele patru dideoxinucleotide (ddATP, ddGTP, ddCTP, sau ddTTP).

Fig. 5.22 Desfăşurarea reacţiei de secvenţilaizare, cu nucleotide marcate

De exemplu, dacă fragmentul de analizat are secvenţa de mai jos, în reacţia ce va stabili localizarea C se va adauga ddGTP; atunci când dideoxiribonucleotidul respectiv este încorporat în catena în curs de formare, sinteza se opreşte. Când polimeraza întâlneşte următorul dezoxicitidin fosfat (C), fenomenul se repetă şi rezultă astfel fragmente de 3, 6, 9 şi 13 nucleotide.
/

Reacţii similare pentru dezoxadenozin fosfat (A) dezoxitimidin fosfat (T) dezoxguanozin fosfat (G) vor furniza serii corespunzătoare de fragmente.
Catenele nou sintetizate, marcate datorită includerii dideoxi-nucleotidelor marcate, sunt denaturate termic şi separate în funcţie de dimensiuni (cu o rezoluţie de o nucleotidă) prin electroforeză într-un gel denaturant de poliacrilamidă. Amestecurile de reacţie migrează în acelaşi gel, în godeuri individuale (linia A, T, C, sau G).
Benzile ADN sunt vizualizate apoi prin autoradiografiere sau prin iluminare UV, astfel că ansamblul celor patru reacţii poate fi citit pe o “scară” poziţională direcţionată de la fragmentele cele mai mici la cele mai mari; astfel se poate determina secvenţa de nucleotide a fragmentului analizat.
O dată cu dezvoltarea tehnicilor de investigare a fost introdusă o altă variantă a acestei metode, care se desfăşoară similar cu cea prezentată anterior, cu diferenţa că toate cele patru amplificări au loc în cadrul aceleiaşi reacţii. Decelarea între cele patru nucleotide se realizează cu ajutorul dideoxi-nucleozid-trifosfaţilor marcaţi cu coloranţi fluorescenţi diferiţi, ceea ce a determinat şi denumirea metodei “Dye-terminator sequencing” sau secvenţierea cu colorant terminal.
Astfel, amplificarea are loc într-o singură reacţie, iar produşii de amplificare sunt analizaţi prin electroforeză capilară. La ieşirea din gel fragmentele ADN sunt scanate de către un laser, care înregistrează automat colorantul corespunzător fragmentului respectiv. Separarea fragmentelor ADN se realizează în funcţie de dimensiuni, astfel încât este posibilă trasarea unei diagrame care precizează ordinea bazelor azotate în fragmentul matriţă (Fig. 5.23).
La interpretarea rezultatelor trebuie să se ţină seama de faptul că în prima parte a secvenţei 15-40 de nucleotide corectitudinea procesului de secvenţiere este mai redusă, la fel ca şi după ce a fost parcursă o lungime a fragmentului de 700-900 nucleotide. Prin urmare, secvenţierea unui fragment mai mare nu va furniza rezultate reale.

Fig. 5.23. Etapele procesului de secvenţiere prin metoda
“Dye-terminator sequencing” (după Aliyu, 2014)

Dacă se doreşte analizarea unor fragmente cu o lungime mai mare este posibilă secvenţierea din două direcţii (pornind de la cele două situsuri de inserţie ale fragmentului ADN în vectorul de clonare). Se vor obţine două secvenţe cu orientare opusă, care vor fi comparate şi apoi suprapuse şi aliniate, pentru a determina secvenţa reală a fragmentului analizat (Fig. 5.24.).
De asemenea este posibil ca prima parte a secvenţei determinate să provină din vectorul de clonare (care flanchează fragmentul de analizat), fapt care trebuie să fie luat în considerare atunci când se interpretează rezultatele obţinute.

Fig. 5.24 Secvenţierea unui fragment ADN, pornind din două direcţii de sinteză
Determinarea secvenţei are loc în direcţia 5’-3’, pentru fiecare catenă ADN

Dezvoltarea informaticii a deschis drumul automatizării astfel că în prezent sunt folosite secvenţiatoare automate.
Instrumentele automatizate pot să secvenţializeze până la 384 de probe ADN în acelaşi timp, într-o singură migrare, fiind posibile 24 de migrări pe zi. Secvenţiatoarele sunt dotate cu sisteme de electroforeză capilară pentru separarea fragmentelor ADN în funcţie de dimensiuni iar detecţia, înregistrarea fluorescenţei şi a rezultatelor are loc sub forma unor cromatograme (5.25). Reacţiile de amplificare, purificare şi resuspendare în soluţie tampon, care se desfăşoară înainte de secventializare sunt automatizate. Există soft-uri care pot să elimine automat urmele de ADN de calitate redusă. Precizia unor astfel de algoritmi este mai redusă comparativ cu examinarea vizuală de către un operator, dar suficientă pentru a permite automatizarea procesării unei game foarte mari de date.

Fig. 5.25. Cromatogramă, care reprezintă rezultatul final al unui proces de secvenţiere automatizată prin tehnica “Dye-terminator sequencing”

5.5.1.2. METODA DE SECVENŢIERE “Pyrosequencing”
Metoda de secvenţiere “Pyrosequencing”, la fel ca metoda Sanger se bazează tot pe sinteza enzimatică, dar în acest caz nu se monitorizează nucleotidele încorporate în noua catenă de ADN sintetizată ci cantitatea de pirofosfat (PPi) care se eliberează în urma încorporării unei nucleotide în noua catenă.
Tehnica a fost dezvoltată de către Mostafa Ronaghi and Pål Nyrén în 1996 şi constă în amplificarea unei molecule monocatenare de ADN şi monitorizarea cantităţii de pirofosfat (PPi) formată, în condiţiile în care se adaugă pe rând fiecare dintre cei patru dezoxinucleozid-trifosfaţi (dNTP). Astfel se cunoaşte nucleotida care a determinat producerea moleculei de pirofosfat (PPi) prin încorporarea ei în catena ADN sintetizată.
Deci, catena matriță (ADNmc) este hibridizată cu un primer și incubată în prezența ADN polimerazei. În plus, în reacție se adaugă dATP sulfurilaza, luciferaza şi apiraza, având ca substrat adenosin 5´-fosfo-sulfat (APS) și luciferin (Fig. 5.26).

Fig. 5.26. Etapele parcurse în timpul secvenţierii “Pyrosequencing” şi pirograma – rezultatul final al procesului de secvenţiere automatizată

În primul rând, primerul specific de secvențiere se atașează la catena de ADN matriță, inițiind reacția de amplificare. Se adaugă în reacție primul dintre cei patru dezoxinucleozid – trifosfați. ADN polimeraza catalizează încorporarea acestuia în catena nou sintetizată, dacă este complementar cu baza azotată din catena matriță.
Fiecare reacție de încorporare a unui dezoxinucleozid trifosfat este însoțită de eliminarea unei grupări pirofosfat (PPi) şi a unui proton (H*), în cantități echimoleculare cu cantitatea de nucleotide încorporate.
De exemplu, dacă se introduce dGTP, iar baza azotată care urmează în catena matriță nu este C, nu se elimină nici o grupare PPi, semnalul luminos fiind 0; dacă baza azotată din catena matriță este C, se înregistrează un semnal luminos, datorat unei grupări pirofosfat; dacă în catena matriță sunt mai multe baze azotate C succesive, semnalul luminos va fi crescut, proporțional cu numărul de grupări PPi care se formează, respectiv cu numărul de nucleotide incorporate.
În continuare, ATP sulfurilaza convertește PPi în ATP, în prezența adenozin 5´-fosfatului. ATP-ul format mediază conversia luciferinei în oxi-luciferină, în prezența luciferazei. Radiația generată în urma reacției catalizate de luciferază este preluată de către un dispozitiv de detecție și transformată într-un grafic cu ajutorul soft-ului specific. Fiecare semnal luminos este proporțional cu numărul de nucleotide incorporate.
Apoi, apiraza degradează toate dNTP neîncorporate, inclusiv ATP în exces. După finalizarea reacției de degradare se adaugă un alt dNTP, fiecare dintre cei patru dezoxinucleozid-trifosfaţi fiind adaugaţi pe rând, în cicluri succesive.
Trebuie menționat că în amestecul de reacţie se adaugă dATP sulfurilaza (dATPαS) în loc de dATP, deoarece încorporarea lui de către polimerază este mai eficientă şi mai ales nu este recunoscut de către luciferază.
Procesul continuă, noua catenă ADN fiind sintetizată până la copierea totală a catenei matriță, secvența de nucleotide fiind determinată din semnalele înregistrate în pirogramă.

5.5.1.3. METODA DE SECVENŢIERE “Ion semiconductor”
Metoda de secvenţiere “Ion semiconductor” este similară cu metoda prezentată anterior, având la bază tot sinteza enzimatică, cu menţiunea că de data aceasta nu se monitorizează cantitatea de pirofosfat, ci protonii care rezultă în urma ataşării fiecărei nucleotide în catena nou formată.
Deci, are loc amplificarea unei molecule monocatenare de ADN cu ajutorul unui primer specific, fiecare dintre cei patru dezoxinucleozid-trifosfaţi (dNTP) fiind adăugaţi pe rând, în cicluri succesive. Încorporarea fiecărei nucleotide în catena nou formată conduce la eliminarea un proton (H+) şi declanşarea unui senzor electric, care monitorizează desfăşurarea reacţiei.
Dacă în catena matriţă sunt prezente succesiuni de nucleotide cu aceiaşi bază azotată, se vor încorpora mai multe molecule dNTP într-un singur ciclu. Astfel, numărul de protoni eliminaţi creşte, proporţional cu semnalul electric.
Această tehnologie diferă de celelalte tipuri de secvenţiere deoarece nu presupune nici monitorizarea nucleotidelor încorporate şi nici un semanl optic. De aceea se mai poate numi secvenţiere mediată de pH sau secvenţiere pe bază de semiconductori.

5.5.1.4. METODE DE SECVENŢIERE “Next generation”
În ultimii ani, cu ajutorul progreselor din automatizare, electronică şi informatică s-au dezvoltat tehnologii moderne de secvenţiere, denumite “Next generation sequencing”, care au ca punct de pornire principiile prezentate mai sus.

“ION TORRENT SEQUENCERS” SAU “PROTON ION SEMICONDUCTOR SEQUENCERS”
Tehnologia specifică echipamentelor “Ion Torrent Sequencers” sau “Proton Ion Semiconductor Sequencers” a fost denumită “Ion Torrent”, având la bază principiile secvenţierii pe bază de semiconductori. Prin urmare are loc monitorizarea cantităţii de protoni eliberată din reacţia de încorporare a nucleozid trifosfaţilor într-o nouă catenă de ADN sintetizată, ţinând cont că cei patru dNTP se adaugă în reacţie pe rând, în cicluri succesive.
Dar, în cadrul tehnologiei “Ion Torrent” a fost inventat primul dispozitiv comercial capabil să traducă direct semnalele chimice (modificarea pH datorită eliberării H+ din reacţie) în informații digitale, cu ajutorul unui “chip” semiconductor. Pe fiecare “chip” semiconductor se află o reţea cu densitate foarte mare de mini-godeuri, care furnizează milioane de reactoare în care se pot desfăşura reacţiile de secvenţiere. Această structură unică permite transformarea directă a informaţiei genetice (ADN) în informaţie digitală (secvenţă ADN), genereazând rapid cantităţi uriaşe de date care urmează a fi procesate (80×106 fragmente secvenţiate/ analiza).
Prin urmare, tehnologia “Ion Torrent” permite secvenţierea simultană a unui număr foarte mare de fragmente ADN, ceea ce conduce la scăderea considerabilă a timpului necesar pentru analiza unui întreg genom.
Având în vedere că se pot analiza simultan un număr foarte mare de fragmente, prima etapă constă în generarea unei biblioteci de fragmente ADN la care se ataşează adaptori specifici “Ion Torrent”.
Apoi fragmentele ADN din bibliotecă sunt amplificate clonal (un număr foarte mare de copii pentru fiecare fragment ADN din bibliotecă) pe suprafaţa unor microsfere, aplicând tehnica PCR în emulsie.
Microsferele acoperite cu ADN matriţă sunt aplicate pe “chip” printr-o etapă scurtă de centrifugare. În urma acestei centrifugări fiecare sferă se va localiza într-un microgodeu, care are posibilitatea de a măsura diferenţele foarte mici de pH care apar în cazul încorporării nucleotidelor.
Deci, fiecare godeu conţine o microsferă, care are legate fragmente ADN ţintă de acelaşi fel. În continuare, în fiecare godeu se introduce primul dNTP; dacă acesta găseşte o secvenţă complementară pe ADN matriţă va fi încorporat în noua catena sintetizată. Reacţia pune în libertate un proton, care va acţiona asupra senzorilor din fiecare godeu, indicând că încorporarea a avut loc. Dacă în catena matriţă sunt prezente succesiuni din aceiaşi bază azotată, semnalul electric va fi proporţional mai mare. Dacă numărul de nucleotide repetate este mai mare de opt, precizia citirii pentru acele regiuni scade foarte mult.
Se poate spune că tehnologia “Ion Torrent” permite secvenţierea simultană, cu o precizie de 98% a unui număr de până la 80×106 fragmente cu lungimi mai mici de 400 bp. Având în vedere că această tehnica este foarte rapidă şi echipamentele utilizate nu au preţuri foarte ridicate, poate fi utilizată cu succes în reacţiile de secvenţiere a genomului sau analiza unor biblioteci de ADNc sau microARN.

“ILLUMINA NEXT GENERATION SEQUENCER” (NGS)
Tehnologia specifică echipamentelor “Illumina Next Generation Sequencer” a fost denumită prescurtat NGS sau „NextGen” având la bază principiile secvenţierii prin sinteză, în care ADN polimeraza catalizează încorporarea unor dezoxinucleozid-trifosfaţi (dNTP) marcaţi fluorescent.
În timpul fiecărui ciclu, după ce a avut loc reacţia de încorporare, fiecare nucleotidă marcată este identificată pe baza marcării fluorescente specifice, prin electroforeză capilară.
În cazul tehnologiei NGS apare o diferenţiere evidentă, deoarece a fost extinsă secvenţierea de la un fragment de 400-900bp la câteva miliarde de fragmente care sunt procesate în paralel (6×109 fragmente secvenţiate/ analiză). In acest scop se utilizează celule „Flow Cells” cu opt canale, de dimensiunea unei lame de microscop, pe care sunt fixaţi primeri specifici pentru reacţia de amplificare.
La fel ca şi în cazul tehnologiei „Ion torent” se analizează simultan un număr foarte mare de fragmente, ceea ce presupune crearea unei biblioteci de fragmente. Biblioteca poate fi alcătuită fie din fragmente de ADN genomic, obţinute prin secţionare fie din molecule de ADNc sau microARN. La ambele capete ale acestor fragmente se ataşează adaptori specifici, complementari cu primerii fixaţi pe suprafaţa celulei.
Amestecul ADN care alcătuieşte biblioteca se încarcă în celulă, iar fiecare fragment se va ataşa la suprafaţa acesteia într-o anumită poziţie, datorită complementarităţii dintre adaptor şi primer. In continuare fiecare fragment este amplificat clonal, generând un grup de fragmente identice, distribuite în vecinătate. Amplificarea prin care are loc multiplicarea poartă numele de „bridge amplification”.
Apoi se adaugă reactivii pentru secvenţiere, inclusiv nucleotidele marcate fluorescent. După ce a fost adăugată prima nucleotidă la toate fragmentele analizate are loc înregistrarea fluorescenţei fiecărui grup. Lungimea de undă şi intensitatea fluorescenţei sunt analizate pentru a identifica baza azotată adaugată în cazul fiecărui grup (fiecare nucleotidă este marcată cu un colorant fluorescent care emite la o altă lungime de undă). Ciclurile se repetă de „n” ori, pentru a determina secvenţa unor fragmente cu lungimea de „n” nucleotide.
Secvenţele determinate pentru fiecare grup sunt aliniate între ele şi cu o secvenţă de referinţă cu ajutorul unor soft-uri speciale pentru acest scop. După aliniere, pot fi identificate diferenţele dintre genomul de referinţă şi noile secvenţe citite.
Se poate spune că tehnologia NGS permite secvenţierea simultană, cu o precizie de 99,9% a unui număr de până la 6×109 fragmente cu lungimi mai mici cuprinse între 50 şi 300 bp.
Tehnologia de secvenţiere prin sinteză Illumina este cea mai răspândită în prezent, furnizând cele mai precise rezultate, cu cea mai mică rată a erorilor, chiar dacă aparatul are un preţ foarte ridicat. Pot fi realizate secvenţieri pe scară foarte largă, în funcţie de modelul aparatului şi aplicaţia dorită.

5.5.2. APLICAŢII ALE PROCESULUI DE SECVENŢIERE

În ultima perioadă tehnicile de secvenţiere ADN s-au dezvoltat tot mai mult, astfel încât pot fi secvenţiate genomurile în întregime. Dar, această tehnologie nu poate înlocui secvenţializarea capilară – Sanger deoarece fiecare analiză generează un număr de milioane sau chiar miliarde de baze, ceea ce necesită un suport informatic important pentru interpretare. Prin urmare, pentru secvenţierea unui anumit fragment se utilizează în continuare metoda clasică Sanger, iar pentru secvenţierea unui întreg genom sau a unei biblioteci de ADNc sau micro ARN se apelează la una dintre metodele moderne, “Next Generation”.

5.5.2.1. SECVENŢIEREA UNUI FRAGMENT ADN/ADNc

SECVENŢIEREA ADN
După cum a fost deja precizat, în cazul în care se doreşte determinarea secvenţei unui fragment ADN se utilizează o metodă clasică de secvenţiere, cum ar fi electroforeza capilară.
Strategia adoptată în acest scop depinde de tipul fragmentului ADN de analizat. Dacă fragmentul ADN a rezultat în urma unei secţionări cu o enzimă de restricţie este necesară întroducerea acestuia într-un vector de clonare, care să furnizeze secvenţele specifice ale primerilor. Dacă fragmentul a rezultat în urma unei reacţii PCR , acesta poate fi clonat într-un vector specific (clonare TA) sau poate fi secvenţiat direct, cu ajutorul primerilor care l-au generat.
Secvenţierea unor anumite fragmente de ADN genomic poate sta la baza studiilor de sistematică şi anume identificarea şi clasificarea organismelor („Barcoding”). Sunt cunoscute genele a căror secvenţă permite încadrarea precisă într-o anumită categorie, prin comparaţie cu informaţiile existente în bazele de date.
Procesul de secvenţiere al unui fragment ADN poate sta la baza identificării mutaţiilor punctiforme, sau polimorfismului unei singure nucleotide SNP („Single Nucleotide Polymorphism”), care pot să însoţească apariţia unei boli. Evidenţierea acestor mutaţii prin secvenţiere permite diagnosticarea precisă şi precoce a bolii.
Alteori procesele de secvenţiere au ca obiect de analiză fragmente ADN, care provin din regiuni cromosomale diferite. Astfel, dacă se identifică regiuni cromosomale de interes, în care se află aplasate gene, cu ajutorul bibliotecilor genomice este posibilă cartarea fizică, urmată de secvenţiere.
SECVENŢIEREA ADNc
În unele situaţii fragmentele pentru care se doreşte identificarea secvenţei fac parte din regiunile codante ale genelor şi de aceea atenţia s-a îndreptat spre investigarea ARNm, respectiv a ADNc.
Pentru a extinde mai mult cercetările se utilizează bibliotecile ADNc, ale căror clone sunt reprezentante ale tuturor moleculelor ARNm prezente la un moment dat în ţesutul analizat. Dintre acestea pot fi selectate clonele de interes, iar inserţiile lor pot fi secvenţiate.
Nu poate fi realizată o secvenţiere integrală deoarece lungimea inserţiilor este în general mai mare decât posibilităţile de analiză (700-900 nucleotide).
Prin urmare se determină secvenţele ambelor extremităţi 5’ şi 3’, denumite EST – etichete ale secvenţelor exprimate („Expressed Squence Tags”), care furnizează informaţii cu privire la secvenţa moleculei ARNm:
5’ EST reprezintă secvenţa unei părţi a transcriptului, care de obicei codifică o proteină (exoni). Aceste regiuni sunt conservate între specii şi nu se modifică prea mult în cadrul unei familii de gene.
Secvenţa 3’ EST provine într-o mai mare măsură din secvenţa 3’ UTR (secvenţă transcrisă dar netradusă) şi de aceea conţine într-o proporţie mai mare secvenţe necodante. Această situaţie se datorează lungimii mai mari a secvenţei 3’ UTR comparativ cu 5’ UTR.
Toate secvenţele EST determinate până în prezent (aproximativ 75 de milioane) se găsesc în baza de date “GenBank” – dbEST”, EST -NCBI site – (http://www.ncbi.nlm.nih.gov/dbEST/).
Acest tip de secvenţe a fost dezvoltat iniţial pentru identificarea produşilor de transcripţie ai unor gene, dar pe parcurs utilizarea lor s-a extins în domeniul identificării genelor, pentru obţinerea unor date privind expresia şi reglarea genelor, determinarea secvenţelor şi pentru dezvoltarea unor sisteme de markeri moleculari cum ar fi: RFLP– polimorfismul lungimii fragmentelor de restricţie („Restriction fragment length polymorphism”), SSR – secvențe simple repetate (microsateliţi) („Simple sequence repeats”), SNP polimorfismul unei singure nucleotide („Single nucleotide polymorphism”), CAPS – polimorfismul fragmentelor amplificate şi secţionate („Cleaved amplified polymorphic sequence”).
De asemenea secvenţele EST pot fi utilizate în scopul design-ului unor sonde ADN cu utilizare în analizele microarray, pentru evaluarea expresiei genelor.
Sondele moleculare dezvoltate pe baza EST vor recunoaşte secvenţe unice în genom, ceea ce constituie un avantaj major în procesele de alcătuire a unor hărţi genetice cu densitate mare şi a hărţilor fizice.

5.5.2.2. SECVENŢIEREA SIMULTANĂ A UNUI NUMĂR MARE DE FRAGMENTE ADN

SECVENŢIEREA ADN
În cadrul acestui capitol au fost descrise tehnologiile “Next Generation”, care permit secvenţierea simultană a unui număr foarte mare de fragmente.
În acest caz este posibilă determinarea secvenţei întregului genom dacă fragmentele analizate au rezultat în urma secţionării moleculelor ADN nuclear ale unui organism. O importanţă deosebită o constituie sortarea şi alinierea tuturor secvenţelor, atât între ele cât şi cu o secvenţă de referinţă cu ajutorul soft-urilor specifice.
Dacă este secvenţiat genomul unei persoane, se realizează în acelaşi timp şi compararea cu o secvenţa de referinţă, ceea ce permite identificarea eventualelor mutaţii.
SECVENŢIEREA ADNc
În cazul în care se doreşte investigarea transcriptomului, moleculele de ARN sunt purificate şi sortate suplimentar pentru a separa ARNm, sARN sau microARN.
Dacă se realizează secvenţierea întregii populaţii de ARNm, prin intermediul unei biblioteci ADNc, se poate crea o imagine clară cu privire la toate genele exprimate la un moment dat într-un ţesut. Este astfel posibilă identificarea atât a produşilor de transcripţie comuni cât şi a celor rari.
SECVENŢIEREA microARN
De un mare interes este şi investigarea moleculelor microARN, a căror implicare în expresia genelor a fost identificată în ultima perioadă. După separarea moleculelor microARN dintre celelalte specii ARN, se crează o bibliotecă, a cărei secvenţiere este posibilă. Astfel se înţelege cum contribuie reglarea post-translaţională la apariţia unui anumit fenotip sau pot fi identificaţi biomarkeri.
APLICAŢIILE SECVENŢIERII ÎN EPIGENETICĂ
În domeniul epigeneticii este de interes studierea procesului de metilare al citozinei (5-mC), care apare în regiuni de reglare cum ar fi promotorii sau heterocromatina. Până în prezent au fost dezvoltate mai multe metode de investigare, dar tehnologiile de secvenţiere “Next Generation” aduc un progres considerabil în domeniu.
Se cunosc două metode şi anume WGBS („whole- genome bisulfite sequencing”) şi RRBS („reduced representation bisulfite sequencing”)
În cadrul primei metode citozinele metilate sunt convertite în uracil cu ajutorul bisulfitului de sodiu, după care are loc secvenţierea conform unei tehnologii NGS.
În cadrul celei de-a doua metode, moleculele ADN sunt secţionate cu enzima MspI (situs de recunoaştere 5’ CCCG 3’), o enzimă de restricţie care nu este afectată de metilare. Sunt izolate fragmente cu dimensiuni de 100-150 bp, pentru a avantaja regiunile bogate în CG. Apoi se crează biblioteci, care sunt analizate conform oricărei tehnologii de secvenţiere NGS.
Astfel este posibilă identificarea modelului de metilare al tuturor regiunilor CpG din întregul genom, fiind posibilă evidenţierea metilării oricărei citozine pentru cele mai multe specii.

CAPITOLUL VI

APLICAŢII SPECIFICE ALE SISTEMELOR COMPLEXE DE ANALIZĂ ŞI EVALUARE MOLECULARĂ

Dezvoltarea continuă a sistemelor de investigare la nivel molecular a permis extinderea domeniului de aplicaţii, astfel că în prezent se pot obţine informaţii complete cu privire la organizarea genomului, secvenţa acestuia, expresia genelor şi chiar manipularea materialului genetic. Este totodată posibilă identificarea căilor metabolice implicate în diferitele procese, cu importanţă atât teoretică cât şi practică în cunoaşterea legilor care guvernează procesele desfăşurate într-un organism viu.

6.1. CARTAREA GENOMULUI

Încă de la începutul secolului al-XX-lea au fost efectuate primele experimente de cartare, care au permis stabilirea dispunerii schematice a cromozomilor şi au condus la alcătuirea cariotipului diferitelor specii.
La sfârşitul anilor 1960 au fost alcătuite hărţile citogenetice, ca diagrame în cadrul cărora cromozomii au fost identificaţi pe baza modelului de bandare, sau de colorarea diferenţiată, în funcţie de gradul de condensare al cromatinei. A fost astfel posibilă identificarea modificărilor apărute la nivel cromozomal, modificări care pot genera diferite maladii.
Mai târziu, o dată cu dezvoltarea tehnicilor de analiză moleculară s-au dezvoltat hărţi cromozomale mai complexe şi anume hărţile genetice, sau hărţile de linkage, care se bazează pe stabilirea poziţiei relative a unor markeri de-a lungul cromozomilor şi hărţile fizice, care permit evaluarea distanţelor genice în unităţi de măsură absolute – kb (perechi de nucleotide) şi totodată conduc la posibilitatea de secvenţiere a fragmentelor de ADN de interes.
În prezent, toate informaţiile obţinute la nivel molecular sunt corelate cu hărţile citogenetice, furnizându-se astfel informaţii referitoare la poziţionarea unor fragmente ADN cu secvenţe bine stabilite pe cromozomi.

6.1.1. CARTAREA GENETICĂ. ALCĂTUIREA HĂRŢILOR DE LINKAGE

Hărţile genetice sau hărţile de linkage au fost considerate mult timp reprezentări grafice ale cromozomilor şi a genelor care alcătuiesc diferite grupe de linkage, gene plasate pe cromozomi la distanţe relative exprimate în procente de recombinare.
În prezent, hărţile genetice sunt alcătuite pe baza markerilor moleculari. Un marker molecular reprezintă orice caracteristică moleculară moştenită, diferită între indivizi, care se poate detecta uşor şi a cărei segregare în descendenţă poate fi urmărită.
Astfel, pe o hartă genetică markerii moleculari (gene sau fragmente anonime de ADN) sunt dispuşi într-o ordine liniară de-a lungul cromozomilor, în anumite poziţii, distanţa dintre loci fiind relativă, exprimată ca procent de recombinare (1 cM = 1% recombinări între loci). Pentru a fi posibilă urmărirea segregării lor, markerii trebuie să fie polimorfici în populaţia de cartare.
Alcătuirea unei hărţi genetice de linkage presupune parcurgerea mai multor etape bine definite şi anume: alegerea formelor parentale, identificarea markerilor moleculari care evidenţiază polimorfismul între acestea, stabilirea frecvenţelor de recombinare şi analiza statistică a datelor.
Cel mai important pas în analizele de segregare este selecţia celor mai potrivite linii parentale, care trebuie să fie destul de diferite din punct de vedere genetic încât să manifeste suficient polimorfism, dar în acelaşi timp nu trebuie să fie foarte îndepărtate pentru că ar putea cauza sterilitatea descendenţilor. De obicei se aleg forme parentale care aparţin aceleiaşi specii şi se diferenţiază la nivel fenotipic printr-un caracter de interes.
Formele parentale sunt încrucişate pentru a dezvolta o populaţie de cartare, care va fi analizată din punctul de vedere al polimorfismului manifestat la nivelul markerilor moleculari. În cartarea moleculară se utilizează în general descendenţele F2, obţinute prin autopolenizare, backcross sau linii recombinate.
Pentru a putea fi utilizată eficient în cartarea genetică, o populaţie trebuie să fie alcătuită din câteva sute de indivizi, proveniţi de la formele parentale selectate. Mărimea populaţiilor determină rezoluţia finală a hărţii – un număr mai mic de 50 de indivizi nu permite o evaluare corectă a rezultatelor, iar dacă se doreşte o rezoluţie înaltă (o densitate mare a markerilor moleculari) sunt necesare populaţii de 1000 sau mai mulţi indivizi.
În cazul cartării genetice pot fi utilizate toate categoriile de markeri moleculari, cu menţiunea că markerii codominanţi conduc la o interpretare mai precisă a rezultatelor obţinute.
Este posibilă utilizarea cu succes a unor markeri moleculari care au fost cartaţi la speciile model sau la speciile înrudite, datorită fenomenului de colinearitate a acestora. S-a dovedit că markerii moleculari au o poziţie similară şi sunt aranjaţi în aceiaşi ordine pe cromozomii speciilor înrudite, fenomen care poartă numele de sintenie. În cazul în care nu sunt disponible informaţii referitoare la cartarea genetică a speciei studiate pot fi utilizate ca sonde moleculare inserţii ale clonelor genomice sau ADNc, cu condiţia ca acestea să nu conţină secvenţe repetitive.
Markerii moleculari care au permis evidenţierea polimorfismului între formele parentale, în procesul iniţial de screening sunt utilizaţi în continuare în procesul de cartare, urmărindu-se segregarea lor în descendenţă.
Prin urmare, toţi indivizii care alcătuiesc populaţia de cartare vor fi analizaţi cu fiecare marker selectat, stabilindu-se frecvenţa de recombinare pentru fiecare pereche de loci (markeri moleculari).

Frecvenţele de recombinare şi erorile standard pentru fiecare pereche de markeri sunt estimate folosind metoda maximei probabilităţi, iar unităţile hărţii sunt determinate folosind o funcţie de cartare. Un scor LOD este calculat ca log (în baza 10) al unui raport între şansele ipotezei ca un linkage să existe şi cele ca acesta să nu apară. Construcţia hărţilor de linkage este facilitată prin folosirea unor programe (softuri) cum ar fi MAPMAKER.
Numărul markerilor dintr-o hartă genetică poate depăşi 1000, dar ei nu sunt distribuiţi uniform pe cromozomi, fiind grupaţi în unele regiuni şi absenţi în altele. De exemplu regiunile aflate în apropierea centromerilor indică o recombinare foarte slabă ceea ce este reflectat prin aglomerarea markerilor în această zonă, pe harta genetică.
În general, cu cât doi markeri sunt mai apropiaţi cu atât este mai puţin probabil ca un eveniment de recombinare (crossing over în timpul meiozei) să separe alelele şi cu atât este mai mare probabilitatea să fie moştenite împreună. Dacă doi loci sunt foarte îndepărtaţi pot să apară două sau mai multe recombinări astfel că un număr de recombinări cu soţ refac combinaţiile originale ale alelelor şi sunt cuantificate ca 0 crossing over. Un număr impar de recombinări crează o combinaţie alelică recombinată şi se consideră a fi un eveniment crossover. Un proces de recombinare de 50% corespunde la o segregare independentă, fiind posibilă măsurarea directă numai a unor distanţe mai mici de 50 de unităţi de cartare.
Deci, distanţa dintre punctele unei hărţi genetice este o reflecţie a frecvenţei de recombinare dintre cele două puncte. Această unitate este măsurată în centimorgani (cM), după geneticianul Thomas Hunt Morgan (Fig. 6.1). Doi markeri se află poziţionaţi la o distanţă de 1 cM dacă sunt separaţi cu o frecvenţă de recombinare de 1%. Această distanţă genică nu poate fi tradusă în distanţă fizică şi anume de cantitatea totală de ADN care separă markerii, deoarece relaţia dintre distanţa genică şi cea fizică variază între specii, dar şi între diferitele locaţii din genom ale unei singure specii.

Până în prezent au fost alcătuite hărţile genetice la majoritatea speciilor importante, acestea ajutând la înţelegerea structurii, funcţionalităţii şi evoluţiei unui genom. Studiile recente au arătat că hărţile genetice ale multor specii înrudite (de exemplu cerealele) sunt similare în ceea ce priveşte conţinutul şi locaţia genelor. De aceea, în prezent se încercă identificarea modalităţii în care informaţiile cuprinse într-o hartă genetică a unei specii pot fi aplicate unei alte specii înrudite. Pentru aceasta au fost elaborate anumite sisteme model pentru care fost elaborate hărţi genetice, aplicate ulterior la rude mai complexe din punct de vedere genetic, care pot fi specii de cultură importante.

6.1.2. IDENTIFICAREA MARKERILOR MOLECULARI LINKAŢI CU UN CARACTER DE INTERES

Poziţia pe cromozom a genelor care determină caractere utile poate fi stabilită prin analize ale linkage-ului cu ajutorul markerilor, într-o hartă genetică a unei specii.
Analiza oricăror markeri polimorfici şi a oricărui caracter segregant poate fi utilă pentru identificarea markerilor linkaţi. Odată ce un marker segregant este identificat, pot fi folosite diferite metode de analiză, pentru a asocia markerul cu un caracter important. Există totuşi şi posibilitatea de a găsi un marker linkat care nu a fost cartat, prin evidenţierea directă a polimorfismului.
În general, atunci când se urmăreşte identificarea markerilor moleculari amplasaţi în imediata vecinătate a unei gene de interes poate fi aplicată metoda liniilor izogene sau analiza segregării în amestec – BSA („Bulked Segregant Analysis”).
Obţinerea materialului de lucru în cazul aplicării metodei liniilor izogene necesită un timp îndelungat şi de aceea de cele mai multe ori se utilizează tehnica BSA.
Aplicarea analizei segregării în amestec (BSA) presupune existenţa unei populaţii care segregă pentru gena de interes, având ca părinte un organism mutant. În acest caz, dacă este posibilă identificarea unor markeri moleculari la nivelul cărora se determină polimorfism între fenotipul mutant şi cel sălbatic se poate afirma că acei markeri sunt apropiaţi de gena de interes şi segregă împreună cu aceasta.

PRINCIPII METODOLOGICE
Analiza segregării în amestec – BSA („Bulk Segregant Analysis”) presupune deci identificarea polimorfismului dintre două probe ADN, izolate din majoritatea indivizilor populaţiei segregante. O primă probă conţine ADN de la indivizi care exprimă un anumit caracter (forma sălbatică a genei), iar a doua conţine ADN de la indivizi care au suferit o mutaţie, caracterul de interes nefiind prezent. Polimorfismul ADN dintre cele două probe diferite este corelat cu genele care condiţionează apariţia caracterului urmărit, fiind posibilă cartarea mutaţiilor.
Această tehnică oferă un avantaj important în identificarea markerilor asociaţi cu un caracter fără a fi nevoie de alcătuirea unei hărţi genetice complete. Totuşi, necesită markeri care pot fi testaţi uşor, care evidenţiază un număr cât mai mare de benzi polimorfice în urma unei singure etape de analiză.
Metoda permite utilizarea unei game largi de structuri populaţionale şi poate fi adesea aplicată unui material produs în cadrul unui program de ameliorare.
Un dezavantaj al acestei metode îl reprezintă imposibilitatea de determinare a distanţei genice dintre marker şi caracter. De aceea, ca o confirmare suplimentară a asocierii marker-caracter se analizează toţi indivizii care au alcătuit cele două amestecuri şi se determină proporţia de linii care conduc la amprenta ADN aşteptată.
Identificarea markerilor linkaţi cu caractere de interes poate fi exploatată cu succes în analize genetice mai complexe cum ar fi identificarea şi clonarea genei care condiţionează apariţia acelui fenotip, sau stabilirea unei metodologii de selecţie asistată de markeri (MAS).

CARTAREA FIZICĂ

În general cartarea fizică are ca obiect regiuni cromozomale de interes în care au fost poziţionate gene, cartarea fizică constituindu-se ca o etapă în procesul de identificare a genelor prin clonare poziţională.
Regiunile cromozomale de interes sunt delimitate cu ajutorul markerilor moleculari, amplasaţi în prealabil pe harta genetică.
Deci, pentru a fi posibilă alcătuirea unei hărţi fizice pentru o regiune cromozomală este necesară existenţa unei hărţi genetice pentru specia luată în studiu şi totodată cunoaşterea poziţiei genei într-o regiune delimitată de markeri moleculari.
Cu ajutorul markerilor moleculari şi având la dispoziţie o bibliotecă genomică a speciei luate în studiu este posibilă desfăşurarea procesului de cartare fizică, care presupune mai multe etape şi anume:
Identificarea clonelor ale căror inserţii provin din regiunea cromozomală care urmează a fi cartată;
Identificarea clonelor suprapuse, prin metoda “mersului pe cromozom” (chromosome walking), cu ajutorul clonelor ale căror inserţii provin din regiunea cromozomală de interes.

IDENTIFICAREA CLONELOR ALE CĂROR INSERŢII PROVIN DIN REGIUNEA CROMOSOMALĂ CARE URMEAZĂ A FI CARTATĂ

Markerii moleculari care delimitează regiunea cromozomală de interes sunt utilizaţi ca sonde moleculare marcate (radioactiv sau enzimatic) în procesul de analiză a bibliotecii genomice, pentru a identifica clonele BAC care au secvenţe complementare în inserţie (Fig. 6.2).

Fig. 6.2. Identificarea clonelor BAC ale căror inserţii provin din regiunea cromosomală de interes

a – harta genetică a regiunii cromozomale; M1-M5 reprezintă markerii moleculari care delimitează această regiune;
b – inserţiile clonelor din biblioteca genomică care provin din regiunea cromozomală de interes şi conţin secvenţe complementare markerilor moleculari M1-M5; C1-C5 reprezintă denumirile clonelor BAC determinate ca pozitive pentru fiecare marker molecular.

6.1.3.2. IDENTIFICAREA CLONELOR CU INSERŢII SUPRAPUSE

Clonele genomice ale căror inserţii provin din regiunea cromozomală de interes pot fi utilizate ca jaloane în procesul de determinare a clonelor suprapuse, prin metoda “mersului pe cromozom” („chromosome walking”).
Pentru a putea fi aplicată metoda “mersului pe cromozom” este necesar ca extremităţile inserţiilor clonelor genomice determinate iniţial ca pozitive să fie identificate şi apoi izolate. Apoi, aceste fragmente sunt utilizate pe rând ca sonde moleculare în procese de hibridizare a membranelor pe care se află transferată întreaga bibliotecă genomică. Astfel pot fi identificate clonele ale căror inserţii sunt suprapuse cu inserţiile clonelor iniţiale (Fig. 6.3).
Fiecare ciclu de izolare a extremităţilor inserţiilor şi apoi de determinare a clonelor cu inserţii suprapuse reprezintă o etapă în "mersul pe cromozom".
Procesul continuă până când este identificat un număr mare de clone ale căror inserţii sunt suprapuse şi acoperă toată regiunea cromozomală de interes.

Fig. 6.3. Alcătuirea hărţii fizice a unei regiuni cromosomale prin metoda
"mersului pe cromozom"

(1) analiza bibliotecii genomice cu markerul M1 ca sondă moleculară şi identificarea clonei pozitive C1;
(2) identificarea şi izolarea capetelor inserţiilor clonei C1; utilizarea capetelor inserţiei clonei C1 ca sonde moleculare pentru analiza bibliotecii genomice şi identificarea clonelor pozitive C2 şi C3;
(3) identificarea şi izolarea capetelor inserţiilor clonelor C2 şi C3;
Utilizarea fragmentelor de ADN care reprezintă capetele inserţiilor clonelor ca sonde moleculare în analiza bibliotecii genomice şi identificarea clonelor pozitive C4 şi C5;

Astfel, este posibilă alcătuirea hărţii fizice pentru o anumită regiune cromosomală, compusă dintr-o înşiruire de clone cu inserţii suprapuse. Având în vedere că dimensiunile fragmentelor care constituie inserţiile clonelor genomice sun cunoscute se poate spune că, în cazul cartării fizice, distanţele relative dintre doi markeri moleculari (cM) sunt transformate în unităţi de măsură absolute – bp (perechi de nucleotide). Relaţia de corespondenţă „cM-bp” nu este universal valabilă, ci este specifică fiecărei regiuni cromozomale în parte. Inserţiile clonelor de interes pot fi secvenţiate.

CARTAREA CITOGENETICĂ

Generarea unei hărţi citogenetice necesită informaţii provenite atât din cartările genetice cât şi din cele citologice. Hărţile genetice prezintă ordinea liniară a markerilor şi procentul de recombinare între markerii linkaţi şi nu conţin informaţii despre distanţele fizice sau cele citologice, nici despre numărul de perechi de baze dintre markeri.
Hărţile citogenetice încorporează datele oferite de hărţile genetice şi caracteristicile citologice ale cromozomilor, cum sunt centromerii, telomerii şi mai recent, semnalele obţinute prin hibridizarea fluorescentă în situ -FISH (“fluorescent în situ hybridization”).
Astfel, integrarea hărţilor citogenetice şi genetice poate fi realizată prin hibridizarea secvenţelor cartate genetic direct pe cromozomi şi vizualizarea acestora prin tehnici de microscopie.
Hărţile citogenetice sunt alcătuite prin determinarea microscopică a poziţiei unor structuri vizibile marcate, pe cromozomii fixaţi. Se aseamănă cu hărţile fizice, cu deosebirea că nu permit identificări ale secvenţelor ADN.
Hărţile citogenetice se bazează pe cromozomi meiotici sau mitotici şi nu conţin date de recombinare şi nici despre numărul perechilor de baze dintre structurile citologice. Poziţia unui marker marcat este exprimată de obicei ca procent din lungimea totală a unui braţ cromozomal. Lungimea absolută a cromozomului suferă modificări dramatice pe parcursul ciclului celular şi numărul de perechi de baze cuprins în unitatea de lungime depinde de gradul de condensare a cromatinei.
De obicei, hărţile citogenetice sunt reprezentate, prin aşezarea hărţii genetice lângă reprezentarea grafică a cromozomului şi indicarea punctelor de intersectare ale acestora. Astfel de hărţi oferă informaţii despre poziţia genetică şi citologică a unui marker, nefiind însă posibilă obţinerea unor date referitoare la secvenţa ADN (Fig. 6.4).
Până în prezent hărţile citogenetice sunt limitate ca număr datorită numărului mic de caractere citologice vizibile prin marcarea cromozomilor. Acestea se limitează de obicei la centromeri, hetero-cromatina din jurul lor (heterocromatina centrică), regiunile de organizare nucleolară sau regiuni de eucromatină şi regiuni de heterocromatină noncentrică cum sunt cromomerii.
Hărţile genetice, fizice şi citogenetice furnizează informaţii cu privire la organizarea şi funcţionarea genomului, constituind un punct de plecare în procesele de identificare, izolare şi studiu al genelor.

6.2. IDENTIFICAREA ŞI IZOLAREA GENELOR

Strategiile aplicate pentru izolarea genelor exploatează una sau mai multe dintre cele patru caracteristici care le definesc: au o anumită structură primară, ocupă un anumit loc în genom, codifică o moleculă de ARNm cu un mod de expresie particular şi cele mai multe îndeplinesc o funcţie specifică.
Unele tehnici facilitează izolarea genelor de la orice specie, în timp ce altele se pot aplica numai la una sau câteva specii. Există gene care se exprimă în toate celulele unui organism, care sunt relativ uşor de identificat şi izolat. Sunt însă şi gene care se exprimă diferenţiat în timp şi spaţiu, respectiv numai o scurtă perioadă de timp în cursul dezvoltării sau numai într-un anumit tip de celule (de ex. numai în celulele meristematice).
În ultimii ani, strategiile de identificare şi izolare a genelor s-au dezvoltat ca urmare a automatizării proceselor de secvenţiere, miniaturizării membranelor utilizate în hibridizare, etc. În plus, strategiilor de identificare directă a unei singure gene li s-au alăturat strategii care permit analiza transcriptomului adică a ARNm exprimat în proba analizată.
Dacă se doreşte identificarea prezenţei unei gene, care a fost caracterizată şi cel puţin parţial secvenţiată, metodologia de investigare se îndreaptă spre tehnici simple, care au la bază reacţia PCR sau transferul Southern. Dacă se cunosc secvenţele primerilor specifici, respectiv secvenţa unei sonde moleculare, acestea pot fi utilizate pentru evidenţierea prezenţei unei gene într-o probă, genă care poate să indice prezenţa unui patogen, a unei maladii etc.
În cazul în care scopul cercetărilor este identificarea, izolarea şi caracterizarea unor gene necunoscute, strategiile de investigare sunt corelate cu informaţiile existente cu privire la acea genă.
În funcţie de scopul urmărit, procedurile pot lua în studiu fie ADN genomic, fie ARNm. În cadrul procedurilor pe bază de ADN genomic se diferenţiază mutageneza de inserţie, aplicată atunci când se cunoaşte caracterul de interes, dar nu există nici o altă informaţie cu privire la gena care îl induce. O altă metodă, clonarea poziţională poate fi aplicată dacă se cunoaşte fenotipul produs de mutaţia unei gene, dar sunt necesare informaţii prealabile cu privire la harta genetică, poziţionarea aproximativă a genei pe cromozom şi în plus, este necesară existenţa unei biblioteci genomice.
Metodele care investighează moleculele ARNm se bazează în general pe procesul de hibridizare, diferenţiindu-se două categorii – hibridizarea prin diferenţă, în cadrul căreia se compară direct populaţiile de ARNm existente în două probe de analizat, sau microarray, metodă prin care fiecare populaţie de ARNm hibridizează cu un set complex de sonde moleculare, după care rezultatele obţinute sunt comparate computerizat.
O altă categorie de metode de investigare se bazează pe secvenţiere şi anume: secvenţierea etichetelor pentru secvenţele exprimate – EST („Expressed Sequence Tags”), metodă care utilizează informaţiile provenite de la produşii de transcripţie, pentru identificarea şi secvenţierea unor fragmente ADN şi analiza în serie a expresiei genelor – SAGE („Serial Analysis of Gene Expression”), care permite identificarea unui set de gene specifice unei probe de analizat, prin compararea profilelor ARNm obţinute de la o variantă martor şi una experiment.

6.2.1. MUTAGENEZA DE INSERŢIE

6.2.1.1. CONSIDERAŢII GENERALE
Utilizarea mutagenezei de inserţie pune la dispoziţie o cale mai rapidă de a identifica şi clona gene prin inducerea de mutaţii.
În acest caz, spre deosebire de mutageneza clasică, este posibilă producerea unei game foarte largi de mutaţii, care sunt etichetate, astfel că genele corespunzătoare pot fi identificate cu uşurinţă.
Mutaţiile sunt produse cu ajutorul unor elemente ADN, capabile să se insereze la întâmplare într-un cromozom, cum ar fi transpozonii sau ADN-T din Agrobacterium tumefaciens. Inserţia unui astfel de element poate induce o mutaţie, care conduce la pierderea funcţiei unei gene şi implicit la o modificare fenotipică.
ADN-T este un segment specific al plasmidei Ti (prezentă în Agrobacterium tumefaciens), modificată artificial, care poate conţine gene marker de selecţie şi/sau gene de interes, care se află sau nu sub controlul unor promotori. Acesta este transferat de la bacterie în celula gazdă a plantei şi inserat în genomul nuclear în timpul procesului de transformare (mecanismul detaliat al procesului de transformare genetică la plante este prezentat în capitolul 6.3).
Utilizarea ADN-T ca un mutagen de inserţie prezintă nenumărate avantaje în comparaţie cu transpozonii deoarece inserţia ADN-T nu îşi mai schimbă poziţia după ce a fost transferată, se găseşte într-un număr redus de copii, iar modificările la nivel de ADN sunt stabile din punct de vedere fizic şi chimic de-a lungul mai multor generaţii. În plus, ADN-T se inserează la întâmplare şi nu afectează numai expresia genei în care s-a inserat, dar acţionează şi ca un marker pentru identificarea mutaţiei.
De aceea, metoda care utilizează mutageneza prin intermediul ADN-T câştigă tot mai mult teren, fiind posibilă aplicarea unor strategii diferite, în funcţie de scopul urmărit.

6.2.1.2. OBIECTIVE URMĂRITE ÎN MUTAGENEZA DE INSERŢIE

IDENTIFICAREA UNEI GENE
Obţinerea unor mutanţi cu fenotip modificat, datorat expresiei alterate a unei gene funcţionale, în care s-a inserat fragmentul ADN-T face posibilă identificarea acesteia. ADN-T conţine în general o genă marker de selecţie, care permite identificarea plantelor modificate şi secvenţe ADN de etichetare care pot fi utilizate cu succes în procesul de identificare a genei mutante.

IDENTIFICAREA UNOR ELEMENTE DE REGLARE A GENELOR
Identificarea unor elemente ale secvenţelor de reglare ale genei se realizează diferit în funcţie de elementul de reglare de interes.
În cazul în care se urmăreşte identificarea unor promotori, tehnica poartă numele de „promotor trapping”. Se utilizează fragmente ADN-T cu o genă raportor care permite identificarea fără echivoc a plantelor modificate, care nu a fost pusă sub controlul nici unui promotor.
În acest scop se utilizează gena GUS (uidA), care codifică β-glucuronidaza sau gena GFP („Green Fluorescent Protein Gene”) care dă o reacţie de fluorescenţă atunci când plantele sunt expuse la lumina ultravioletă (~ 395 nm) sau lumină albastră (~490 nm) (Capitolul 6.4).
Dacă sunt identificate plante transformate, pe baza prezenţei produşilor de transcripţie ai genei raportor, se consideră că gena s-a inserat în apropierea unui promotor nativ, care a iniţiat transcripţia. Regiunea cromozomală în care a avut inserţia ADN străin poate fi izolată, iar promotorul investigat, clonat şi utilizat în alte procese de transformare genetică.
În cazul în care se urmăreşte identificarea unor elemente activatoare („enhancer trapping”) secvenţele ADN-T conţin gene raportor puse sub controlul unor promotori. În cazul identificării unor plante transformate în care expresia genei raportor este mai accentuată comparativ cu alte plante de acelaşi tip, se consideră că inserarea fragmentului ADN străin a avut loc în apropierea unui activator („enhancer”) nativ. Analiza regiunii cromozomale în care s-a inserat ADN-T permite studierea şi clonarea activatorului identificat.
Dacă se urmăreşte inducerea supraexpresiei unei gene native, fragmentul ADN-T inserat poartă elemente puternic activatoare. Dacă inserţia a avut loc în apropierea unei gene, expresia ei este accentuată, ceea ce permite identificarea mutantului respectiv. Studiile referitoare la segmentul cromozomal în care a avut loc inserţia ADN străin permit identificarea genei respective.

Cele mai avansate studii în acest domeniu au fost efectuate la Arabidopsis thaliana, care este planta model în studiile de genetică, datorită dimensiunilor foarte reduse şi simplităţii genomului. În plus, în anul 2000 a fost finalizată secvenţierea genomului acestei specii, ceea ce a oferit posibilităţi multiple pentru accelerarea cercetărilor în domeniul ştiinţelor vegetale. Având la dispoziţie o secvenţă completă, a fost posibilă orientarea cercetărilor ulterioare spre genomica funcţională.
Având în vedere că în cazul acestei specii intronii au dimensiuni reduse, iar materialul intergenic este de asemenea puţin abundent, inserţia unei secvenţe ADN-T, cu o lungime de 5-25 kb produce în general o alterare a funcţiei unei gene. Dacă se produce o populaţie suficient de numeroasă de linii transformate, probabilitatea de a identifica o plantă transgenică care să poarte inserţia ADN-T în interiorul unei gene de interes este foarte mare. Până în prezent au fost create câteva sute de mii de linii de inserţie care sunt disponibile la Centrul de Resurse Biologice Arabidopsis („Arabidopsis Biological Resource Center – ABRC”).

6.2.1.3. STRATEGII DE IDENTIFICARE A FRAGMENTULUI
ADN-T INSERAT ÎN GENOMUL VEGETAL
Următoarea etapă, după ce plantele mutante au fost selectate în funcţie de fenotip, este identificarea genei în care a avut loc inserţia. Fragmentul ADN-T funcţionează ca o etichetă, flancată de ambele părţi de fragmente ale genei de interes. Pentru investigarea regiunii cromozomale din apropierea ADN-T pot fi aplicate mai multe strategii şi anume: strategia de recuperare a plasmidei („plasmid rescue”), tehnica PCR invers şi tehnica „TAIL PCR”.
Strategia de recuperare a plasmidei („plasmid rescue”) implică secţionarea cu o enzimă potrivită a ADN genomic al plantei mutante. De preferat ca enzima să nu posede situsuri de recunoaştere în secvenţa fragmentului ADN-T.
Moleculele formate în urma secţionării sunt supuse unui proces de ligare, în prezenţa ADN ligazei („self-ligation”), iar moleculele formate sunt introduse în celule bacteriene E. coli (proces de clonare). Se formează un număr foarte mare de fragmente circular închise, dar în populaţia bacteriană se poate menţine numai acel fragment care posedă o secvenţă specifică, denumită originea replicării care se află în segmentul ADN-T. După clonare, din cultura bacteriană obţinută se extrage ADN plasmidial, care este analizat în continuare (Fig. 6.5). De interes este secvenţierea fragmentelor care mărginesc fragmentul ADN-T pentru că ele fac parte din gena a cărei mutaţie a indus apariţia fenotipului de interes.
Pentru secvenţiere se utilizează primeri specifici vectorului de clonare, iar secvenţele obţinute sunt comparate cu cele prezente în bazele de date pentru a determina posibile similitudini.

Cea de-a doua strategie presupune utilizarea tehnicii PCR invers, care presupune secţionarea ADN genomic extras de la fenotipul mutant cu o enzimă de restricţie care are un singur situs de recunoaştere în fragmentul ADN-T şi situsuri cu distribuţie aleatoare în genom. În urma secţionării se obţine un număr mare de fragmente ADN, care sunt supuse procesului de ligare, în urma căruia se formează molecule circular închise. Două dintre aceste molecule conţin părţi din fragmentul ADN-T, dar numai una conţine secvenţa denumită origine a replicării. Moleculele circulare sunt clonate, adică sunt introduse în celule bacteriene pentru multiplicare. În populaţia bacteriană se va menţine numai acea moleculă care posedă secvenţa ori.
ADN plasmidial se recuperează din clona obţinută şi se analizează în continuare, ţinând cont că reprezintă numai unul dintre fragmentele care
flanchează situsul de inserţie al ADN-T (Fig. 6.6).

Strategia „Tail PCR” implică trei etape consecutive de amplificare, realizate cu un set de primeri specifici SP1, SP2 şi SP3 şi un primer de dimensiuni mici, cu secvenţă arbitrară.
Secvenţele primerilor specifici sunt astfel alese încât poziţiile lor să fie consecutive (SP1, SP2, SP3), cu aceiaşi orientare 5’-3’, spre unul dintre fragmentele care flanchează ADN-T. Aceştia permit desfăşurarea unei proceduri de amplificare tip „Nested PCR”. Primerul cu secvenţă arbitrară degenerată, notat AD va găsi aleator secvenţe complementare în moleculele de ADN genomic.
Prima reacţie de amplificare se desfăşoară în prezenţa primerilor SP1 şi AD. Primul primer are o poziţie complementară bine stabilită, dar primerul arbitrar se va lega la întâmplare. Dacă distanţă de legare dintre cei doi primeri nu este prea mare, se va amplifica un fragment ADN, care cuprinde parţial fragmentul ADN-T şi în plus, secvenţa flancatoare de ADN genomic.
Următoarele reacţii, în prezenţa primerilor SP2 şi AD, respectiv SP3 şi AD vor restrânge porţiunea amplificată, reducând foarte mult segmentul provenit din ADN-T.
Fragmentul amplificat în final este clonat şi supus reacţiei de secvenţiere. Astfel, se obţine secvenţa unei gene, implicată în inducerea unui fenotip cunoscut, care poate fi caracterizată în continuare (Fig. 6.7).

6.2.2. CLONAREA POZIŢIONALĂ

6.2.2.1. CONSIDERAŢII GENERALE
Clonarea poziţională sau clonarea pe bază de hartă („map-based cloning”) permite identificarea oricărei gene pentru care se cunoaşte fenotipul indus, cu condiţia ca acest caracter să fie monogenic şi să se datoreze unei mutaţii.
Această tehnică poate fi aplicată numai atunci când există cercetări anterioare care să pună la dispoziţie o hartă genetică moleculară cât mai completă pentru specia luată în studiu şi o bibliotecă genomică ale cărei clone posedă ca inserţii fragmente mari de ADN provenite de la aceiaşi specie.

6.2.2.2. STATEGII APLICATE ÎN PROCESUL DE CLONARE POZIŢIONALĂ
Prima etapă a clonării pe bază de cartare este identificarea unui marker molecular, poziţionat în apropierea genei de interes (o distanţă de câţiva cM). Pentru screening-ul iniţial poate să fie utilizată o populaţie cu dimensiuni mai reduse (60-150 indivizi).
Următorul pas este de a satura regiunea din jurul markerului molecular original cu alţi markeri, într-o populaţie mult mai extinsă (300-600 indivizi). Se încearcă astfel identificarea unor markeri care segregă împreună cu caracterul de interes, caz în care numărul de recombinări între marker şi gena care condiţionează apariţia caracterului de interes este foarte redus.
Apoi markerul care segregă împreună cu gena este utilizat pentru screening-ul unei biblioteci (BAC sau YAC) pentru a identifica clona/clonele pozitive. O astfel de clonă conţine în inserţie o secvenţă complementară cu cea a markerului molecular.
Ţinând cont de modalitatea de alcătuire a unei biblioteci genomice (capitolul 5.4) putem spune ca inserţia acestei clone este de fapt un fragment ADN care provine din regiunea cromosomală în care a fost cartat markerul molecular. Această clonă poate fi utilizată ca un jalon în procesul ulterior de determinare a clonelor suprapuse, prin metoda “mersului pe cromozom” („chromosome walking”) (Fig. 6.8).

Fig. 6.8. Desfăşurarea procesului de mers de-a lungul cromosomului („chromosome walking”) prin identificarea clonelor cu inserţii suprapuse, provenite din regiunea cromozomală de interes

După derularea primei etape a „mersului pe cromozom” fragmentele care reprezintă extremităţile inserţiei clonei BAC sunt utilizate la rândul lor ca markeri moleculari pentru screening-ul populaţiei de cartare. Este de preferat ca populaţia utilizată în această etapă să aibă dimensiuni foarte mari (1000-3000 de indivizi).
Scopul acestui screening este de a identifica un set de markeri care co-segregă întotdeauna cu gena de interes, fără a fi posibilă nici o recombinare. Cu cât dimensiunile populaţiei analizate în această etapă sunt mai mari, cu atât creşte probabilitatea de a găsi markeri amplasaţi foarte aproape de gena de interes.
Termenul de co-segregare se utilizează dacă, ori de câte ori este exprimată o alelă a genei, markerul asociat este de asemenea prezent, neapărând nici o recombinare între genă şi marker.
În cazul în care se găsesc recombinări între fragmentele provenite din extremităţile inserţiei clonei şi genă, se trece la următoarea etapă a mersului pe cromozom.
De această dată fragmentele analizate anterior (care provin din inserţia clonei) sunt utilizate pe rând ca sonde moleculare în procese de hibridizare a membranelor pe care se află transferată întreaga bibliotecă genomică. Astfel pot fi identificate clonele BAC ale căror inserţii sunt suprapuse cu inserţiile clonei iniţiale.
Procesul de screening al populaţiei şi de identificare a clonelor suprapuse continuă până când se identifică markeri care co-segregă întotdeauna cu gena, în final fiind identificată o clonă care cuprinde în inserţia proprie chiar gena de interes.
Acest fragment este introdus într-un vector de clonare specific şi este introdus în genomul unei plante mutante pentru caracterul de interes, prin transformare genetică. Dacă plantele modificate genetic au dobândit caracterul de interes, înseamnă că gena căutată este prezentă în fragmentul introdus în genomul plantei. Tehnica poartă numele de complementare a mutaţiei, reprezentând o confirmare a ipotezei că gena de interes se găseşte în fragmentul ADN identificat.
Apoi fragmentul care conţine gena de interes se secvenţiază, direct sau în urma subclonării, în vederea identificării unei regiuni centrale a unei gene – ORF („open reading frame”), secvenţă care foarte probabil codifică o proteină.
Există posibilitatea de a identifica numai o regiune centrală – ORF, ceea ce reprezintă o situaţie favorabilă, dar de cele mai multe ori se găsesc mai multe astfel de structuri. În cea de-a doua situaţie este necesară producerea altor plante modificate genetic, prin transformare cu fiecare regiune în parte.
Se identifică în final regiunea centrală care complementează mutaţia şi apoi se realizează studii moleculare şi biochimice asupra noii gene clonate. Secvenţa ei se compară cu secvenţele existente în bazele de date, se identifică astfel proteina codificată şi rolul posibil pe care poate să-l îndeplinească în celule şi calea metabolică în care poate fi implicată.
În continuare va fi prezentată, pentru exemplificare, procedura de identificare a locusului HY1, care codifică o hem-oxigenază prin clonare poziţională şi izolarea genei candidate (Fig. 6.9).
Harta genetică a cromozomului 2, după cum reise din bazele de date Arabidopsis thaliana defineşte poziţia genetică a genei HY1, ca fiind linkată cu markerul ER. Asamblarea hărţii fizice prin identificarea clonelor BAC suprapuse, pornind de markerul ER a permis identificarea a două gene posibil candidate pentru HY1 (AtHO 1 şi 2), pe baza omologiei cu o secvenţă cunoscută.

Fig. 6.9.. Etapele procesului de identificare a unei gene prin clonarea poziţională (după Davis şi colab., 1999)

Structura genei AtHO1a fost dedusă prin compararea secvenţei cu cea a ADNc cu lungime întreagă. În figură de mai jos – structura genei HY1, dreptunghiurile albe şi negre reprezintă regiunile codante, respectiv cele care nu sunt traduse. Liniile indică intronii şi regiunile netranscrise. Au fost identificate trei mutaţii (hy1) în regiunile codante, iar secvenţele ADN care le cuprind sunt indicate şi aliniate cu tipul sălbatic (HY1). Nucleotidele subliniate evidenţiază diferenţele de secvenţă între mutanţi şi tipul sălbatic, iar cu majuscule sunt reprezentate nucleotidele din exoni, iar cu litere mici intronii. Au fost astfel prezentate etapele care trebuiesc parcurse pentru identificarea şi caracterizarea unei gene.

6.2.3 METODE DE IDENTIFICARE A GENELOR
PE BAZA REACŢIILOR DE HIBRIDIZARE

Aplicarea metodelor bazate pe hibridizare este avantajoasă deoarece nu necesită existenţa unor informaţii anterioare cu privire la secvenţa de nucleotide şi se pot realiza cu cantităţii mici de ADN sau ARNm.
În acest fel pot fi identificate gene atât pornind de la molecula de ADN cât şi de la produşii de transcripţie (ARNm).

6.2.3.1. HIBRIDIZAREA PRIN DIFERENŢĂ („subtractive hybridization”)
Hibridizarea prin diferenţă este o tehnică extrem de utilă care permite compararea a două populaţii de ARNm şi obţinerea clonelor pentru genele care sunt exprimate diferenţiat doar într-una dintre cele două populaţii. Deşi există mai multe metode diferite, principiul care stă la baza diferenţierii este acelaşi.
În primul rând cele două populaţii de ARNm sunt convertite în ADNc; populaţia ADNc care conţine produşi de transcripţie specifici (cu expresie diferenţiată) poartă numele de „experiment” (tester) iar populaţia ADNc de referinţă se numeşte „control” (driver).
ADNc experiment şi control se denaturează şi se pun în contact, astfel încât toate fragmentele complementare dau naştere unor molecule hibride, bicatenare. În acest fel se leagă moleculele ADNc care provin de la gene exprimate atât la varianta „control” cât şi la cea „experiment”. Aceste molecule sunt eliminate, iar moleculele ADNc nehibridizate, care rămân, vor reprezenta genele exprimate exprimate în varianta experiment, dar sunt absente la varianta martor.
Cu toate că metodele tradiţionale de hibridizare prin diferenţă au avut unele rezultate, ele necesită hibridizări repetate şi nu permit identificarea unor produşi de transcripţie rari. În prezent a fost dezvoltată o metodă bazată pe amplificarea selectivă a secvenţelor exprimate diferenţiat, metodă care a reuşit să depăşească limitele tehnice ale metodelor de diferenţiere tradiţionale.
Tehnica hibridizării prin diferenţă este eficientă şi reproductibilă, necesită cantităţi mici de ARNm, iar separarea fizică a moleculelor monocatenare şi dublu catenare nu mai trebuie realizată. În final, are loc amplificarea moleculelor ţintă, care provin de la genele care au o exprimare diferenţiată.
După amplificare fragmentele sunt clonate şi secvenţiate, find posibilă astfel compararea cu informaţiile existente în bazele de date şi extinderea cercetărilor în scopul determinării funcţiei şi căii metabolice în care este implicată gena identificată.

6.2.3.2. MICROARRAY
Metoda microarray poate fi aplicată pentru identificarea genelor (GeneID) prezente într-o anumită probă.
În acest caz se fixează pe suport (“chip”) toate genele care pot fi prezente în organismele modificate genetic, sau toate genele care produc toxine, în funcţie de scopul urmărit. Suportul se hibridizează cu o probă ADN extrasă din materialul de analizat, fiind astfel posibilă identificarea tuturor genelor care sunt prezente atât în proba de analizat cât şi pe suport.
Astfel poate fi detectată prezenţa unor gene în alimente şi furaje, provenite din organisme modificate genetic (OMG), din micoplasme, în culturile de celule sau de la anumiţi patogeni care produc boli etc.
În alte situaţii este posibilă detectarea variaţiei numărului de copii pentru anumite secvenţe, cu un nivel de rezoluţie mare array CGH, hibridizarea genomică comparativă de tip array – („Array comparative genomic hybridization”).
În cazul aplicării acestei metode se analizează ADN extras de la o probă test şi una de referinţă, care se marchează diferenţiat cu fluorofori diferiţi. Pe suport (“chip”) se fixează câteva mii de sonde moleculare derivate de la cele mai cunoscute gene sau regiuni non-codante din genom. Hibridizarea dintre cele două elemente menţionate permite evaluarea raportului dintre fluorescenţa probei test şi a celei de referinţă, care conduce la determinarea modificărilor în numărul de copii pentru o locaţie particulară din genom.
Utilizând această metodă pot fi detectate modificări ale numărului de copii la un nivel de rezoluţie de 5-10 kb. În prezent s-au dezvoltat metode cu o rezoluţie chiar mai mare, care pot să detecteze variaţii structurale la un nivel de rezoluţie de 200bp. Este astfel posibilă identificarea unor modificări cromozomale recurente cum ar fi microdeleţiile şi duplicaţiile în anumite condiţii (de boală, de mediu) datorită aberaţiilor cromozomale apărute.
Tehnica menţionată poate fi utilizată şi pentru cariotiparea virtuală, care poate să înlocuiască cu succes cariotiparea citogenetică, datorită nivelului de rezoluţie mult mai ridicat.
În acest scop se utilizează suporturi pe care sunt fixate câteva milioane de sonde moleculare, provenite dintr-o regiune de interes din genom. Probele ţintă sunt probe ADN secţionate, marcate şi apoi hibridizate la suport. Intensităţile semnalelor de hibridizare pentru fiecare probă sunt analizate cu ajutorul unui soft special, care generează un raport test/martor pentru fiecare sondă de pe suport.
Cunoscând poziţia fiecărei sonde pe suport şi totodată poziţia în genom, soft-ul aliniază sondele în ordinea cromozomală şi reconstruieşte genomul virtual. Se alcătuieşte astfel un cariotip virtual, care are o rezoluţie foarte ridicată comparativ cu citogenetica convenţională.
În prezent există un tip de test array, utilizabil pentru cariotipare umană care conţine 1,8 milioane de markeri polimorfici şi non-polimorfici cu o rezoluţie de 10-20 kb (aproximativ dimensiunile unei gene). Aceasta rezoluţie este de aproximativ 1000 de ori mai mare comparativ cu cea furnizată de citogenetica convenţională.
Aplicabilitatea metodologiilor prezentate mai sus se îndreaptă în special spre investigaţiile medicale deoarece este necesară pregătirea unor suporturi (“chip”-uri) speciale, cu un număr foarte mare de sonde moleculare care sunt specifice fiecărui genom, având deci costuri ridicate. Este posibilă astfel identificarea unui număr mare de maladii produse de mutaţii cromozomale.

6.2.4. METODE DE IDENTIFICARE A GENELOR PE BAZA REACŢIILOR DE SECVENŢIERE

Aceste tehnici pot depăşi limitele impuse de metodele bazate pe hibridizare dar ele nu pot atinge eficienţa analizelor de secvenţiere în paralel a milioane de fragmente. În continuare sunt prezentate cele mai cunoscute metode bazate pe secvenţiere.

SECVENŢIEREA FRAGMENTELOR – EST („Expressed Sequence Tags”)
În prezent, în baza de date „GenBank – dbEST” (http://www.ncbi.nlm.nih.gov/dbEST/) sunt stocate un număr foarte mare (aproximativ 75 milioane) de secvenţe de tip EST („Expressed Sequence Tags”) care au fost izolate, clonate şi secvenţiate, provenind de la un număr mare de specii, dar în special de la organismele considerate model pentru studiile de genetică (capitolul 5.5.2.1). Această baze de date este actualizată continuu, accesul fiind public.
Având în vedere că secvenţele EST reprezintă copii ale regiunilor codante din genom, ele sunt deosebit de utile în procesul de identificare a genelor atât intra cât şi interspecific. De asemenea secvenţele EST prezintă o serie de avantaje practice cum ar fi faptul că pot fi generate rapid şi ieftin (printr-un singur experiment de secvenţiere).
Dacă se doreşte identificarea unei gene, la o anumită specie, poate fi utilizată secvenţa EST corespunzătoare, existentă în baza de date menţionată. În plus este necesară o bibliotecă genomică a speciei luate în studiu, alcătuită cel mai adesea în vectorul de clonare BAC („Bacterial Artificial Chromosome”)
Având în vedere că o bibliotecă genomică este alcătuită dintr-un număr foarte mare de clone (câteva zeci de mii), analiza acesteia este complexă, fiind posibile două strategii de investigare: hibridizarea sau amplificarea.
Dacă se urmează strategia de hibridizare, secvenţa EST va furniza o sondă moleculară. ADN plasmidial al clonelor care alcătuiesc biblioteca genomică este transferat pe membrane, care sunt apoi hibridizate cu sonda moleculară EST marcată (capitolul 5.4). Este astfel posibilă identificarea unei clone genomice pozitive care să fie analizată în continuare.
Dacă se alege strategia de amplificare, secvenţa EST stă la baza design-ului primerilor. ADN plasmidial corespunzător clonelor care alcătuiesc biblioteca genomică va reprezenta matriţa unor reacţii PCR succesive, în care sunt realizate amestecuri ADN după algoritmi matematici. În final, va fi posibilă identificarea unei clone care dă amplificare pozitivă.
Clonele genomice, identificate ca pozitive prin una dintre cele două strategii menţionate mai sus conţin în inserţia lor o secvenţă corespondentă a markerului EST. Se consideră că investigaţiile cu privire la inserţia clonei pot să aducă informaţii suplimentare privind gena analizată. De cele mai multe ori această inserţie se secvenţiază direct sau în urma unor procese de subclonare (pentru a reduce dimensiunile fragmentelor de secvenţiat).
Secvenţele obţinute sunt analizate, comparate (aliniate) cu secvenţele existente în bazele de date pentru a identifica similitudinile existente.
Secvenţele EST pentru care nu există corespondenţi în bazele de date sunt gene exprimate care nu au fost încă identificate, care pot fi secvenţiate şi introduse în aceste baze, în scopul dezvoltării lor.
Atunci când este identificată o nouă secvenţă, aceasta este comparată cu bazele de date existente, pentru a obţine informaţii cu privire la posibila implicare într-o anumită cale metabolică. Tehnicile foarte sofisticate de investigare, cum ar fi microarray, secvenţiere, completate cu instrumentele bioinformaticii permit identificarea unui număr mare de secvenţe ADN, dar stabilirea cu certitudine a funcţiei unei gene nou identificate este încă o provocare pentru cercetările actuale

6.3. STUDIUL EXPRESIEI GENELOR

Cunoscând etapele parcurse în procesul de sinteză al unei proteine se consideră că evaluarea expresiei genelor se poate realiza fie prin cuantificarea proteinei sintetizate, fie a produşilor de transcripţie. Având în vedere că proteinele suferă o serie de modificări translaţionale, cea mai bună metodă rămâne cuantificarea moleculelor ARNm (Fig. 6.10).

Unele proceduri permit evidenţierea calitativă a genelor exprimate în anumite situaţii, dar există şi metode cantitative, care permit cuantificarea produşilor de transcripţie prin comparaţie cu o genă de referinţă. Astfel, tehnica microarray permite evaluarea semicantitativă, simultană a expresiei pentru un număr foarte mare de gene, pe când tehnicile care au la bază reacţia PCR permit evaluarea semicantitativă sau cantitativă a unei singure gene. A fost utilizată în trecut şi tehnică Northern, dar aceasta şi-a pierdut din importanţă o dată cu dezvoltarea tehnicilor moderne de biologie moleculară.

6.3.1. ANALIZA ÎN SERIE A EXPRESIEI GENELOR – SAGE („Serial Analysis of Gene Expression”)
Analiza în serie a expresiei genelor este o alternativă la metoda secvenţierii etichetelor pentru secvenţele exprimate, fiind o tehnică experimentală care permite o evaluare directă şi cantitativă a expresiei genelor.
Metoda SAGE se bazează pe izolarea unei secvenţe unice (10 -14 bp) din fiecare moleculă ARNm individual, considerată a fi o „etichetă” specifică. Această secvenţă trebuie să conţină suficientă informaţie pentru a permite identificarea precisă, unică a produsului de transcripţie.
Etichetele specifice, provenite de la un număr mare de molecule ARNm sunt legate împreună, rezultând o moleculă ADN serială, care este clonată şi apoi secvenţiată.
Se determină apoi de câte ori apare o anumită secvenţă etichetă în molecula serială, valoare corelată cu nivelul de expresie a genei corespunzătoare (Fig. 6.11).

Fig. 6.11. Etapele tehnicii SAGE – analiza în serie a expresiei genelor
(„Serial Analysis of Gene Expression”)
după http://www.sagenet.org/findings/index.html

Orice fenomen biologic, cu posibile implicaţii asupra nivelului de expresie a genelor poate fi evaluat cu ajutorul tehnicii SAGE. Aceasta constă într-o procedură complexă, care nu oferă numai informaţii generale cu privire la expresia genelor într-un anumit tip de celule sau ţesuturi, în anumite condiţii, dar permite şi identificarea unui set de gene specifice pentru anumite condiţii celulare, prin compararea profilelor obţinute de la o variantă martor şi una experiment
Tehnica SAGE permite identificarea genelor exprimate în anumite condiţii şi cuantificarea relativă a expresiei genelor. Necesită cantităţi mici de material de pornire (pot fi realizate studii chiar pe o singură celulă), furnizează date despre produşii de transcripţie a mii de gene, fără a necesita cunoştinţe anterioare cu privire la secvenţe şi exploatează toate avantajele conferite de tehnicile de secvenţiere. În plus este o tehnică uşor de abordat ieftină şi rapidă, comparativ cu alte tipuri de investigaţii.
Dar, având în vedere dezvoltarea tehnicilor moderne de investigare, această metodă, care permite evaluarea expresiei unui număr de câteva mii de gene a fost înlocuită cu microarraz sau secvenţierea “Next generation”.

6.3.2. UTILIZAREA TEHNICII MICROARRAY ÎN EVALUAREA EXPRESIEI GENELOR

Tehnica microarray s-a dezvoltat foarte mult în ultimii ani în special în domeniul studiului expresiei genelor.
Prin această tehnică este posibilă monitorizarea simultană a zeci de mii de gene pentru a determina efectul unui anumit tratament, al unei boli sau al unui stadiu de dezvoltare asupra procesului de transcripţie.
În acest caz, două probe ARNm, provenite din surse diferite, denumite martor şi experiment sunt copiate în moleculele corespunzătoare de ADNc, marcate diferit şi utilizate într-un proces de hibridizare a unui “chip” microarray (Fig. 6.12). Pe suport sunt fixate în mod ordonat un număr foarte mare de fragmente oligonucleotidice, cu secvenţe cunoscute (capitolul 5.2.5.3.).
Analiza finală a rezultatelor permite identificarea acelor oligo-nucleotide care apar în proba experiment şi nu sunt prezente la proba martor. Având în vedere că secvenţa oligonucleotidelor este cunoscută, pot fi identificate genele a căror expresie este diferită.
Astfel, poate realizată o analiză comparativă a datelor obţinute, atât la nivel calitativ, evidenţiind genele care sunt exprimate într-un anumit tip de ţesut, dar şi la nivel cantitativ, subliniind genele care sunt represate sau supraexprimate.
În final, se poate întocmi lista genelor care au acelaşi nivel de expresie atât în proba martor cât şi în cea experiment, nefiind influenţate în nici un fel de condiţiile de experimentare. Totodată se înregistrează genele care au expresia sporită sau micşorată în proba experiment, evidenţiind implicarea proteinelor codificate în răspunsul la condiţiile de experimentare

Fig. 6.12. Identificarea genelor care se exprimă diferenţiat într-o probă test comparativ cu proba martor (după https://en.wikipedia.org/wiki/DNA_microarray

6.3.3. UTILIZAREA TEHNICII RT-PCR ÎN EVALUAREA EXPRESIEI GENELOR

Amplificarea exponenţială via RT-PCR este o tehnică cu o acurateţe ridicată şi poate fi folosită atât în diagnosticarea bolilor genetice dar şi în determinarea abundenţei unei molecule ARN dintr-o celulă sau ţesut ca o măsură a expresiei genelor.
Dintre toate tehnicile de evaluare a expresiei genelor în ţesuturi şi celule, tehnica RT-PCR s-a dovedit a fi cea mai precisă şi mai versatilă. Această tehnică poate fi folosită pentru a determina prezenţa sau absenţa unui transcript, pentru a estima nivelul de expresie şi pentru a clona produşi ADNc, fară a mai fi ncesară construirea şi screeningul unei biblioteci de gene.
Tehnica PCR asociată cu revers-transcripţia, RT-PCR, este o metodologie de lucru care permite analiza moleculelor ARNm, prezente într-o anumită probă de analizat. Cele două reacţii, de revers-transcripţie şi de amplificare pot avea loc simultan, în acelaşi tub sau succesiv, în două reacţii diferite.
Oricare ar fi metoda aplicată într-o primă etapă are loc sinteza moleculelor ADNc, care sunt amplificate apoi cu primeri specifici genei de analizat. Întotdeauna se analizează în paralel o genă de referinţă (“housekeeping gene”), cu o expresie constantă, care nu depinde de natura ţesutului sau condiţiile de mediu. Poduşii de amplificare pot fi cuantificaţi la sfârşit sau pe parcursul desfăşurării reacţiei, adică în timp real.

6.3.3.1. RT-PCR CU PUNCT FINAL („revers-transcriptase PCR”)
Etapele de desfăşurare a reacţiei PCR asociată cu revers-transcripţia a fost prezentată detaliat în capitolul 5.1.3. După ce reacţia de amplificare a avut loc produşii se analizează prin electroforeză în gel de agaroză. Prezenţa unei benzi (datorată produsului de amplificare) indică formarea produsului de transcripţie, deci expresia genei de interes. Intensitatea benzilor obţinute poate fi evaluată semicantitativ, în cazul în care cantitatea de ARN utilizat în toate reacţiile de amplificare a fost aceiaşi (Fig. 6.13).
Analiza vizuală permite o evaluare relativă, care subliniază că în cazurile 2 şi 3 se înregistrează o supraexpresie a genelor, iar în cazul 4 o subexpresie, datorită intensităţii mai accentuate, respectiv mai scăzute a benzilor, comparativ cu gena de referinţă.

Fig. 6.13 Analiza prin electroforeză în gel de agaroză a produşilor rezultaţi în urma reactiei RT-PCR
1 – gena de referinţă
2-4 – gene de interes
Imaginile gelurilor obţinute pot fi analizate în vederea stabilirii nivelului de expresie a genelor şi cu ajutorul unui soft de tip ImageJ (http://rsb.info.nih.gov/ij/idex.html), care permite cuantificarea intensităţii benzilor vizibile în geluri (cunoscute în literatura de specialitate drept teste de densitometrie) şi transformarea acestora în valori numerice care permit estimarea precisă a nivelului de expresie prin comparaţie cu gena de referinţă.
Aplicarea metodei descrise mai sus prezintă o serie de avantaje cum ar fi precizia, fiind ideală pentru determinarea prezenţei sau absenţei unui transcript. Comparativ cu RT-PCR în timp real, care permite o cuantificare foarte precisă a produşilor de transcripţie, tehnica de analiză cu punct final este mai ieftină, dar permite numai o evaluare semicantitativă.

6.3.3.2. RT-PCR ÎN TIMP REAL („revers-transcriptase PCR real time”)
Dacă se utilizează tehnica RT-PCr în timp real, după ce a avut loc extracţia ARNm din proba experiment şi proba martor, sunt sintetizate populaţiiile ADNc.
Se stabilesc genele de interes şi gena de referinţă, pentru care se realizează design-ul unor primeri specifici pentru amplificările Real-Time PCR. De asemenea se alege strategia de amplificare si anume utilizarea colorantului SYBR Green sau a unei sonde moleculare.
Genele se referință („housekeeping genes”) se selectează dintre genele constitutive, cu un nivel de expresie constant în toate țesuturile, a căror transcripția nu este afectată de factorii experimentali. Cele mai utilizate gene de referință, denumite și controale interne sunt: actina (act), β-tubulina(tub) și gliceraldedid-3-fosfat dehidrogenaza (GADPH).
Indiferent de strategia aleasă, produşii reacţiilor de amplificare sunt monitorizaţi în timp real, atât pentru gena de interes, cât şi pentru gena de referinţă, pentru ambele probe, martor şi experiment. Soft-ul ales va trasa curbele de amplificare pentru toate probele, ceea ce va permite stabilirea valorii de prag (“treshold”). Apoi, pentru fiecare dintre variantele analizate se va stabili valoarea Ct, care reprezintă numărul de cicluri necesar fiecărei probe pentru a atinge valoarea de prag (Fig. 6.14).

Fig. 6.14 Curbele de amplificare pentru gena de interes A și gena referință, pentru variantele de experimentare și martor
Pe grafic a fost marcată valoarea de prag, care permite determinarea valorii Ct pentru toate variantele studiate

Atunci când se evalueazează comparativ expresia unei gene A în variantele experiment și martor se realizează prima dată procesul de normalizare, în care expresia genei de interes A, în ambele variante studiate se raportează la gena de referință, calculându-se valoarea ΔCt, după cum urmează:
ΔCtAM= CtAM – CtRM, pentru gena A, proba martor
ΔCtAE= CtAE – CtRE, pentru gena A, proba experiment
Unde CtAM – gena A, varianta martor,
CtAE – gena A, varianta experiment,
CtRM – gena de referință, varianta martor,
CtRE – gena de referință, varianta experiment.
Deci, pentru fiecare varianta studiată (experimentare și martor) a fost dereminată valoarea ΔCt, ca diferență între valoarea Ct a genei de interes și a celei de referință. În continuare se calculează valoarea ΔΔCt, ca diferenţă între valoarea ΔCt a probei experiment şi cea a probei martor.
ΔΔCtA = ΔCtAE – ΔCtAM
Pentru a evalua nivelul relativ al expresiei genei A în anumite condiții, se calculează valoarea 2-ΔΔCtA , care ne arată de câte ori este mai mare/mică expresia genei A în varianta experiment comparativ cu valoarea martor.
Investigațiile pot fi extinse și anume pot fi utilizate mai multe condiții de experimentare diferite, sau pot fi urmărite comparativ mai multe gene. Astfel pot fi identificate genele care sunt activate, repectiv represate în anumite condiții de experimentare.
Tehnica Real-time PCR se utilizează atunci cînd se cunosc deja genele a căror expresie poate fi modifică în anumite condiții – de stres, boală, etc. ca urmare a unui experiment microarray. În urma unui screening microarray se obține un număr mai mare de gene candidate, a căror expresie este diferită la varianta de experimentare comparativ cu martorul. Rezultatele obținute sunt validate printr-o reacție Real-time PCR, care permite investigarea genelor individual, mărind foarte mult precizia rezultatelor.

6.4. MANIPULAREA GENETICĂ LA PLANTE

6.4.1. CONSIDERAŢII GENERALE

Modificarea genetică la plante câştigă o tot mai mare importanţă în dezvoltarea ştiinţelor vegetale, pe măsură ce tehnicile de biologie moleculară se dezvoltă, permiţând identificarea, clonarea şi chiar secvenţierea unui număr tot mai mare de gene.
Scopul final al procedurilor de modificare genetică se diferenţiază în funcţie de natura genei introduse în genom. Pot fi realizate experimente de modificare genetică care să conducă la identificarea şi investigarea altor gene de interes, sau pot fi obţinute plante care au dobândit noi caractere, care le conferă însuşiri agronomice importante. În plus, procesul de transfer al genelor poate avea loc intra sau interspecific, gena nou introdusă provenind de la aceiaşi specie sau specii diferite.
Indiferent de scopul urmărit, procedura de modificare genetică presupune parcurgerea aceloraşi etape (Fig. 6.15).
Etapele de clonare a genelor în vectori de expresie, transformarea genetică şi caracterizarea plantelor modificate genetic sunt proceduri de rutină, care s-au perfecţionat de-a lungul timpului, chiar dacă la început dimensiunea mare a genomului vegetal şi prezenţa peretelui celular de natură celulozică au fost piedici care trebuiau să fie depăşite. Alte caracteristici însă, cum ar fi posibilitatea de cultivare in vitro pe medii sintetice şi totipotenţa celulelor vegetale au fost argumente în favoarea transferului de gene şi mai ales a regenerării plantelor după transformare.

Fig. 6.15. Etapele parcurse pentru obţinerea unei plante modificate genetic

Procedeele de manipulare genetică, care presupun modificarea structurii genetice a plantei prin transferul şi integrarea stabilă a unor gene manipulate in vitro, pot fi clasificate în funcţie de scopul urmărit sau de provenienţa genei care este introdusă în genomul vegetal.

Dacă se doreşte identificarea unor gene sau a unor secvenţe de reglare – promotori („promotor trapping”) sau elemente activatoare („enhancer trapping”) se utilizează mutageneza de inserţie, care presupune transferul în genomul plantei a unor regiuni de dimensiuni reduse (ADN-T şi o genă marker raportor) care au rolul de a induce modificări în organizarea acestuia.
Dacă scopul urmărit este de a investiga funcţionalitatea unor gene nou identificate se aplică tehnica de complementare a mutaţiei. Gena de studiat, împreună cu regiuni reglatoare potrivite sunt introduse prin transformare genetică în genomul unei plante mutante pentru caracterul de interes. Dacă în urma transformării plantele dobândesc caracterul studiat, înseamnă că gena nou identificată este funcţional activă.
În multe situaţii scopul manipulării genetice este transferul unor caractere valoroase din punct de vedere agronomic, alimentar sau economic. Această direcţie de cercetare a fost posibilă datorită dezvoltării tehnicilor de genetică moleculară şi extinderea lor în domeniul vegetal, permiţând identificarea unui număr tot mai mare de gene de interes, cu produşi implicaţi în căi metabolice determinante pentru apariţia anumitor caractere.

În cazul în care genele transferate provin de la specii diferite (de cele mai multe ori de la bacterii) procesul poartă numele de TRANSGENEZĂ. O variantă alternativă la transgeneză o constituie CISGENEZA, un proces în cadrul căruia genele transferate provin de la forme ce aparţin aceleiaşi specii, de multe ori populaţii locale sau rude sălbatice. Cisgeneza este astfel un proces care preia atât avantajele hibridării intraspecifice şi anume transferul unor gene de interes de la indivizi ai aceleiaşi specii, cât şi cele ale transgenezei şi anume transferul selectiv al unui singur fragment ADN.
Etapele parcurse în obţinerea unei plante modificate genetic, fie prin transgeneză, fie prin cisgeneză sunt aceleaşi: identificarea genei care să confere caracterul de interes, stabilirea metodei optime de transformare genetică, introducerea genei de interes în genomul plantei urmată de regenerarea plantelor modificate genetic.

6.4.2. STRATEGII APLICATE ÎN VEDEREA MANIPULĂRII GENETICE LA PLANTE

În studiile aplicative privind “modificarea genetică la plante”, în funcţie de speciile de plante care fac obiectul cercetărilor, se aplică în principal următoarele metode:
Transformarea mediată de Agrobacterium;
Metoda biolistică sau bombardamentul cu microproiectile;
Transformarea protoplaştilor.

6.4.2.1 TRANSFORMAREA MEDIATĂ DE Agrobacterium
Genul Agrobacterium include bacterii care trăiesc în sol şi infectează plantele la nivelul unor leziuni. Aceste bacterii sunt capabile să transfere în ţesutul lezat un fragment de ADN propriu, ADN-T, de pe plasmida Ti („Tumor inducing”), în cazul speciei Agrobacterium tumefaciens sau Ri în cazul Agrobacterium rhizogenes, care se integrează în genomul plantei. Ca urmare, bacteria Agrobacterium tumefaciens induce formarea de tumori la nivelul coletului („crown gall disease”) iar Agrobacterium rhizogenes formarea de rădăcini firoase („hairy roots”). O extindere mai mare o are transformarea mediată de Agrobacterium tumefaciens şi de aceea în continuare va fi descris acest sistem de transformare.

Agrobacterium – promotorul ingineriei genetice naturale
Plasmida Ti (“Tumor inducing”) este prezentă în celulele bacteriene Agrobacterium tumefaciens şi conţine majoritatea genelor necesare pentru formarea tumorilor. Plantele rănite sintetizează compuşi fenolici care stimulează genele de virulenţă (genele vir). Genele de virulenţă codifică un set de proteine responsabile pentru excizarea, transferul şi integrarea ADN-T în genomul vegetal. Genele din regiunea T-ADN sunt responsabile pentru procesul de formare a tumorilor, unele dintre ele direcţionând producerea hormonilor de creştere care cauzează proliferarea celulelor transformate. Regiunea ADN-T este flancată la ambele capete de două segmente cu lungimea de 25bp, denumite extremităţile T-ADN. Extremitatea stângă nu este esenţială pentru transfer, dar cea dreaptă este indispensabilă.
Formarea tumorilor, proces biologic foarte complex este un adevărat caz de inginerie genetică naturală, care a fost exploatat în vederea dezvoltării tehnicilor de modificare genetică la plante.

Elemente genice naturale, exploatate în manipularea genetică
Proprietatea Agrobacterium tumefaciens de a transfera o parte din propriul ADN în genomul plantei a fost exploatată în dezvoltarea tehnicilor de manipulare genetică.
Cercetările efectuate au demonstrat că există cel puţin trei elemente, preluate de la Agrobacterium, necesare pentru transferul genelor la plante.
Primul este reprezentat de extremităţile de 25 bp lungime (LB şi RB), care delimitează ADN-T din plasmida Ti, indispensabile procesului de transfer. Având în vedere că între cele două extremităţi nu există gene necesare transferului această regiune poate fi îndepărtată, ceea ce conduce la “dezarmarea” ADN-T. Plasmidele astfel modificate sunt în continuare capabile de transformarea celulei vegetale dar nu vor mai produce tumori, prin urmare plantele regenerate vor fi “normale” din punct de vedere fenotipic (Fig. 6.16).
/
Fig. 6.16 Modificarea regiunii ADN-T în vederea obţinerii unor
Vectori de transformare genetică la plante

Al doilea element necesar pentru transferul de ADN-T este constituit dintr-un număr de gene codificate de cromozomul bacteriei Agrobacterium tumefaciens. Unele dintre aceste gene cum ar fi chvA, chvB sau pscA sunt esenţiale pentru producţia de exo-polizaharide, ele fiind implicate în ataşarea bacteriei la celula vegetală şi formarea microfibrelor celulozice. Locusul ros aflat tot pe cromozom influenţează eficienţa expresiei regiunii vir.
Este evident că o combinaţie a plasmidei Ti cu unele suşe bacteriene pot influenţa considerabil virulenţa lor.

Al treilea element necesar pentru transferul de ADN-T este reprezentat de genele pentru virulenţă, care sunt activate de moleculele fenolice ale plantelor rănite. Regiunea vir, amplasată pe plasmida Ti, în afara regiunii ADN-T conţine cel puţin 22 de gene organizate în 7 operoane (virA-virG). O parte dintre genele vir alcătuiesc un sistem de reglare al celorlalte gene care sunt implicate în transfer.

STRUCTURA CONSTRUCŢIEI UTILIZATE ÎN TRANSFERUL DE GENE
În construcţiile utilizate în transferul de gene elementele prezentate sunt organizate pe două plasmide care alcătuiesc un vector binar – o plasmidă dezarmată care conţine extremităţile LB şi RB, între care pot fi amplasate gene de interes şi o plasmidă Ti helper, care conţine genele pentru virulenţă, (Fig. 6.17). În plus acest sistem este introdus în tulpini specializate de Agrobacterium tumefaciens, pe al cărui cromozom sunt prezente genele implicate în interacţiunea plantă-bacterie.
Ţinând cont de toate aceste aspecte au fost dezvoltate construcţii speciale care să conţină toate elementele necesare pentru transfer şi în plus să permită inserarea genelor de interes.
În regiunea dintre cele două extremităţi LB şi RB ale plasmidei dezarmate sunt introduse fragmentele care urmează a fi transferate, alcătuite din regiuni centrale ale genelor (ORF), care codifică proteine specifice, însoţite de sistemele de reglare, reprezentate în special din promotori, secvenţe terminale (UTR) sau activatori, în funcţie de scopul urmărit.

/
Fig. 6.17 Structura unui vector binar utilizat în transformarea genetică la plante

În general genele străine, introduse în regiunea T-DNA, între cele două extremităţi sunt:
Genele de interes, care urmează a fi studiate sau gene care conferă, prin intermediul proteinei codificate caractere importante economic (toleranţă la erbicide, rezistenţa la salinitate, rezistenţa la dăunători şi/sau agenţi patogeni etc);
Genele marker selectabile, care codifică în general proteine cu proprietatea de a inactiva substanţe chimice incluse în mediul de cultură, permiţând selecţia celulelor care au fost eficient transformate. Cele mai folosite codifică enzime ce conferă celulelor rezistenţă la antibiotice şi erbicide. Aceste gene permit selectarea celulelor eficient transformate încă din primele etape ale procesului de transformare.

Dacă scopul manipulării genetice este mutageneza de inserţie sau studiul unor noi gene identificate, prezenţa genelor marker selectabile nu prezintă importanţă.
Atunci când se doreşte obţinerea unor produse comerciale se încearcă restrângerea cât mai mult posibil a fragmentului inserat în genomul vegetal şi în special eliminarea genelor marker, ceea se ar mări gradul de acceptare a acestor plante de către consumatori.
În acest scop pot fi urmate mai multe strategii cum ar fi recombinarea situs specifică, recombinarea omoloagă intracromosomală, transpoziţia sau co-transformarea, care sunt însă laborioase şi costisitoare.
În prezent, o dată cu dezvoltarea tehnicilor de investigare a ADN, se încearcă eliminarea în totalitate a genelor marker selectabile. Astfel, după ce procesul de transformare a avut loc se selectează un număr foarte mare de regeneranţi, care se testează prin amplificare PCR specifică în scopul evidenţierii fragmentelor inserate şi selectarea plantelor eficient transformate. Prin urmare, analizele moleculare laborioase pot să înlocuiască necesitatea utilizării genelor marker selectabile.

Genele raportor sau genele marker identificabile codifică proteine care determină formarea unui produs vizibil, ce permite identificarea celulelor transformate.
Genele raportor sunt prezente în construcţiile de transformare în special atunci când se urmăreşte mutageneza de inserţie sau studiul unor gene. În cazul mutagenezei de inserţie construcţia utilizată la transformare conţine fragmentul ADN-T, cu o singură genă raportor care trebuie să permită selecţia rapidă şi facilă a plantelor eficient transformate. În acest caz cea mai des utilizată în prezent este gena GFP („Green Fluorescent Protein Gene”). In acest caz plantele obţinute în urma modificării genetice sunt iluminate cu o lampă UV, selectându-se plantele care emit fluorescenţă.

Proteina verde fluorescentă (GFP), un compus care emite lumină verde atunci când este expusă la radiaţii ultraviolete (~ 395 nm) sau lumină albastră (~490 nm), nu necesită nici un fel de substrat pentru detecţie.
Gena gfp care codifică această proteină are o expresie stabilă în plantele superioare, nu depinde de specie, iar dacă este pusă sub controlul unui promotor constitutiv poate fi detectată în orice organ.
Această genă furnizează un marker transgenic universal, nedistructiv, care permite testarea unui număr foarte mare de plante în acelaşi timp, permiţând evidenţierea vizuală a plantelor transformate în urma iluminării UV sau cu lumină albastră.

O altă genă raportor este gena uid A (gus A), care codifică enzima β-glucuronidaza. Această enzimă dă o reacţie de culoare în prezenţa substratului cromogen 5-bromo-4-cloro-3-indolil glucuronid (X-gluc), iar activitatea ei specifică poate fi măsurată în prezenţa substratului fluorogenic 4-metil umbeliferil- glucuronid (MUG). Un dezavantaj al acestui sistem de marcare este necesitatea prelevării unei probe de ţesut din plantele de analizat, ceea ce îi conferă un caracter distructiv.

Pentru a fi funcţionale în ţesuturile vegetale, atât genele de interes cât şi cele marker sunt puse sub controlul unor promotori care pot fi constitutivi, inductibili sau specifici unui ţesut.
Promotorii constitutivi sunt utilizaţi atunci când expresia genelor nou introduse în genomul vegetal este necesară în toate ţesuturile plantelor; cel mai utilizat promotor constitutiv, în cazul transformării plantelor dicotiledonate provine de la virusul mozaicului conopidei şi aparţine genei care determină sinteza unei molecule ARN 35S (promotor 35S);
În cazul promotorilor inductibili expresia genelor nou introduse este indusă de acţiunea unor compuşi specifici, cum ar fi hormonii, factorii de stres biotic sau abiotic sau de semnale din mediu.
Promotorii specifici unui ţesut asigură expresia genelor nou introduse numai în anumite ţesuturi, deci caracterul conferit prin modificarea genetică are o manifestare localizată.

În cazul în care se realizează mutageneza de inserţie în scopul identificării unor gene, se utilizează în general promotorii constitutivi. Dacă în schimb se doreşte identificarea unor elemente din regiunile de reglare a genelor pot fi utilizaţi promotori inductibili sau specifici unui ţesut, în funcţie de scopul urmărit.
În produsele comerciale alegerea tipului de promotor se realizează în funcţie de scopul urmărit, aceştia fiind fie constitutivi fie specifici ţesutului în care proteina codificată de transgenă îşi îndeplineşte funcţia.

MECANISMUL PROCESULUI DE TRANSFER DE GENE LA PLANTE
Procesul de transfer şi integrare a fragmentului de ADN-T în genomul celulei vegetale presupune parcurgerea mai multor etape:

Recunoaşterea de către Agrobacterium a semnalului emis de celula vegetală rănită
Procesul de transformare începe cu rănirea plantei. Ca răspuns la rănire, celulele plantelor dicotiledonate produc o varietate de compuşi fenolici (acetosyringona sau α-hidroxiacetosyringona) şi zaharuri. În mod normal aceste substanţe fac parte din mecanismul de apărare al plantei, fiind implicate în sinteza fitoalexinelor şi a ligninei. Aceste molecule sunt difuzate dinspre locul rănirii şi se comportă asemeni unui semnal care atrage orice agrobacterie din sol.

Ataşarea bacteriei la celulele vegetale
Ataşarea Agrobacterium la celulele vegetale presupune iniţial asocierea prin intermediul unor polizaharide (produsul locusului attR). Apoi bacteria colonizează locul rănirii formând microfibre celulozice care o fixează la celulele vegetale. În procesul de ataşare a celulelor bacteriene de celulele vegetale sunt implicate mai multe gene cromozomale (genele chv). Genele chvA şi chvB sunt implicate în producerea şi secreţia β-1-2-glucan, iar gena pscA este implicată în secreţia succinoglicanului.

Activarea genelor din regiunea vir
Moleculele semnal ca acetosyringona, prezente în concentraţii mari activează un receptor membranar Vir A (produsul codificat de gena vir A) care activează un factor de transcripţie, Vir G. Proteina Vir G activată interacţionează cu elementele activatoare şi promotorii operonilor vir A, vir B, vir C, vir D şi vir E, conducând la accentuarea nivelului de expresie. Genele vir A şi vir G au o expresie constitutivă, iar celelalte gene vir o expresie indusă de interacţiunea cu Agrobacterium.
Produşii acestor gene vir sunt implicaţi în prelucrarea ADN-T din plasmida Ti şi în transferul ADN-T în celula vegetală.

Producerea catenei T
Extremităţile dreaptă şi stângă sunt recunoscute de produsul complexului VirD1/VirD2 iar VirD2 produce o secţionare la nivelul catenei inferioare de ADN. După secţionare proteina Vir D2 se ataşează covalent la capătul 5’ a monocatenei ADN-T detaşate, în proces fiind implicată şi proteina Vir C1. Catena detaşată este înlocuită prin sinteză.

Transferul fragmentului de ADN-T în celula vegetală
Complexul care se formrază, ADN-T/Vir D2/Vir E2 este exportat din celula bacteriană prin intermediul unui pil-T compus din proteine codificate de operonul virB (proteinele Vir B1-11 intră în structura unui por membranar al celulei vegetal şi în aparatul de translocare).
Proteina VirE2 protejează catena de acţiunea nucleazelor, facilitează integrarea în nucleu şi conferă conformaţia corectă complexului pentru trecerea prin porii nucleari. Această proteină conţine un semnal de localizare nuclear (SLN), amplasat la capătul C-terminal care orientează molecula ADN spre nucleu, unde factori ai celulei gazdă facilitează integrarea în nucleu, posibil mediat de sistemul de reparare a ADN. Dacă nu există similarităţi între genomul vegetal şi fragmentul ADN-T, integrarea are loc la întâmplare în genomul nuclear (Fig 6.18 şi Fig 6.19).

Fig. 6.18. Transferul genelor mediat de Agrobacterium tumefaciens

Fig. 6.19. Mecanismul genetic al procesului de transformare genetică mediată de Agrobacterium tumefaciens (după Pitzschke, 2010)

În urma procesului de transfer al genelor fragmentul ADN cuprins între cele două extremităţi ale fragmentului ADN-T (LB şi RB) este transferat în genomul plantei, într-o poziţie întâmplătoare, de obicei într-un număr redus de loci (numărul de copii ale transgenei este de obicei redus),inserarea având loc în unul dintre cromozomii omologi.

6.4.2.2. TRANSFORMAREA GENETICĂ PRIN METODA BIOLISTICĂ
Metoda biolistică este o metoda de transformare, cu o aplicabilitate largă, atât pentru plante mono cât şi dicotiledonate, utilizată pentru prima dată în anul 1987 pentru transformarea cerealelor (grâu şi porumb).
Metoda constă în precipitarea ADN pe microparticule (1µm diametru) din tungsten sau aur coloidal, care sunt introduse apoi în celulele vegetale. Accelerarea particulelor se realizează cu dispozitive speciale, denumite „gene gun”, cu ajutorul heliului sub presiune. Particulele penetrează peretele celular şi de obicei pătrund în stratul superficial al ţesutului, alcătuit din 1-2 celule.
Încercările de optimizare ale sistemului s-au axat pe trei aspecte ale acestui proces: tipul de microparticule şi prepararea lor, accelerarea microparticulelor şi alegerea ţesutului ţintă. S-a constatat că este necesar să existe un echilibru între numărul şi mărimea particulelor accelerate asupra unui ţesut ţintă, vătămarea ţesuturilor şi cantitatea de ADN aflată pe particule. O cantitate prea mică de ADN poate conduce la o frecvenţă mică de transformare, iar o cantitate mare de ADN duce la număr mare de copii şi re-aranjamente ale construcţiei genetice.
Recent, s-a obţinut o eficienţă mai mare de transformare la o concentraţie scăzută de ADN, în cazul în care microparticulele sunt alcătuite din aminosiloxani.
Ţesuturile vegetale utilizate în bombardamentul cu microparticule pot fi: explante cărora li se induce embriogeneza după transformare sau culturi embriogenetice care sunt transformate, după care sunt supuse unor procese de proliferare, urmate de regenerare.
Pentru a proteja ţesutul vegetal de vătămare în timpul procedurii de bombardare se recurge la tratamente ce induc o plasmoliză uşoară sau cultură pe medii cu osmolaritate ridicată.
Datorită avantajelor sale metoda biolistică a devenit metoda favorită în numeroase laboratoare, permiţând transformarea cu succes a unor plante pentru care alte metode nu au dat rezultate cum ar fi: soia, porumbul, ovăzul, orezul, sorgul, trestia de zahăr, grâul, plante forestiere etc, dar numărul mare de copii pentru genele inserate şi posibilele re-aranjamente constituie probleme care trebuie să fie menţionate.

6.4.2.3. TRANSFORMAREA GENETICĂ PRIN METODA PROTOPLAŞTILOR
Protoplaştii, celulele vegetale lipsite de perete celular, constituie un sistem experimental optim pentru manipulări genetice, putând fi făcuţi să înglobeze material genetic exogen.
Pentru transferul DNA, de obicei plasmidial, în protoplaştii izolaţi se pot utiliza diferite metode, şi anume:
Tratamente chimice cu agenţi permeabilizanţi (mai ales polietilenglicol – PEG); PEG şi alţi agenţi chimici pot permeabiliza membrana plasmatică permiţând intrarea moleculelor DNA în citoplasmă.
Electroporarea, care implică permeabilizarea reversibilă a membranei plasmatice în prezenţa unor impulsuri electrice având amplitudine crescută şi durată foarte scurtă; porii formaţi în membrană permit intrarea DNA străin în citoplasmă;
Sonicarea, care presupune permeabilizarea membranei protoplastelor în prezenţa ultrasunetelor;
Microinjectarea, proces care constă în introducerea cu ajutorul unei micropipete a ADN direct în protoplasti;
Manipularea protoplaştilor vegetali este foarte dificilă datorită problemelor asociate cu regenerarea de plante fertile, iar ADN utilizat în transformare este susceptibil la degradare şi rearanjamente. În ciuda acestor limitări, posibilitatea de izolare a protoplaştilor la un număr mare de specii prezintă un avantaj.
În cazul în care sunt transformaţi cloroplaşti, metoda protoplaştilor înlocuieşte cu succes metoda biolistică.

6.4.2.4. REGENERAREA PLANTELOR MODIFICATE GENETIC ŞI CARACTERIZAREA LOR MOLECULARĂ
Indiferent de metoda utilizată pentru modificarea genetică, celulele posibil transformate sunt multiplicate, timp în care are loc şi selecţia cu factorii de selecţie corespunzători genelor marker utilizate.
În etapa următoare, din celulele transformate sunt regenerate plante, care sunt supuse unor teste moleculare complexe. Fiecare plantă regenerată este un eveniment de transformare unic, care se analizează separat; gena se inserează în genom la întâmplare, astfel că nu vor exista două plante identice.
În cazul în care s-a utilizat o genă raportor, plantele eficient transformate pot fi identificate cu ajutorul testelor specifice (tratarea cu un substrat cromogen în cazul genei uid A sau iluminarea UV, în cazul genei gfp).
Având în vedere că genele utilizate la transformare au fost caracterizate şi secvenţiate în prealabil, testele moleculare sunt orientate spre analiza acizilor nucleici şi a proteinelor specifice acestora.
Astfel, inserarea transgenei în genom se identifică prin testul PCR, în care are loc amplificarea ADN genomic cu primeri specifici genei de interes. Prezenţa produşilor de amplificare dovedeşte prezenţa genei de interes în genomul studiat.
Numărul de copii al genei nou introduse se determină cu ajutorul tehnicii Southern, în care ADN genomic al plantelor transformate este secţionat cu enzime de restricţie, denaturat şi fixat pe membrane solide, iar sonda moleculară este constituită din secvenţa genei de interes Apariţia unor semnale pozitive corespunzătoare mai multor fragmente genomice indică prezenţa unui număr mare de copii ale transgenei. Sunt selectate de obicei plante care au o singură copie, deoarece modificările produse în genomul celulei vegetale sunt minime. O metoda mai recentă, dar mai costisitoare este Real-Time PCR, care permite determinarea numărului de copii al transgenei prin comparaţie cu o genă de referinţă, prezentă într-o singură copie.
Funcţionalitatea genei nou introdusă poate fi determinată prin detectarea moleculei ARNm corespunzătoare, dar de cele mai multe ori este identificată prezenţa proteinei codificate de transgenă prin metodele ELISA („Enzyme-linked immunosorbent assay”) sau Western Blotting. Metoda ELISA permite detecţia prezenţei proteinei şi în acelaşi timp cuantificarea acesteia ca o evaluare a expresiei genei de interes. Metoda Western permite, pe lângă identificarea prezenţei proteinei şi o evaluare aproximativă a dimensiunilor acesteia. Mai recent a fost introdusă metoda RT-PCR (revers-transcriptase PCR) pentru evaluarea expresiei transgenei prin investigarea ADNc, corespunzător moleculei ARNm sintetizată în timpul transcrierii.
O investigare importantă este şi secvenţierea, atât a genei nou introduse, cât şi a secvenţelor din genomul vegetal care flanchează această genă. Determinarea secvenţei genei are o importanţă deosebită pentru a dovedi că, pe parcursul tuturor etapelor parcurse pentru modificarea genetică, aceasta nu a suferit transformări. Secvenţele regiunilor care mărginesc gena de interes pot evidenţia structura şi funcţia locusului de inserţie. În cazul în care în aceste secvenţe sunt regăsite regiuni ale unor gene vegetale, evenimentul de transformare respectiv îşi pierde utilitatea practică, deoarece poate să perturbe căi metabolice importante.
Testele de laborator permit selecţia plantelor eficient transformate, după care au loc testele în condiţii de mediu controlate şi testele de câmp. În funcţie de tipul genei inserate, o mare importanţă o are testul biologic, care certifică nu numai transferul eficient al unei gene funcţionale, dar şi manifestarea caracterului dorit (rezistenţă la atacul insectelor, rezistenţă la acţiunea erbicidelor, toleranţă la secetă, etc.).
Tot în această etapă se determină şi modul de segregare şi transmiterea transgenei în descendenţă. Regeneranţii primari sunt hemizigoţi pentru gena de interes (au o singură alelă, pe unul dintre cromozomii omologi). În cazul plantelor cu înmulţire sexuată în descendenţă vor fi selecţionate liniile homozigote, care vor trece în etapa următoare, de evaluare a însuşirilor agronomice prin testarea în câmp.

6.4.3. IDENTIFICAREA PLANTELOR MODIFICATE GENETIC

Dezvoltarea metodelor de identificare a plantelor modificate genetic se realizează în prezent de către compania producătoare, o dată cu efectuarea testelor moleculare.
În funcţie de nivelul de specificitate dorit pot fi identificate una sau mai multe fragmente din genomul plantei transformate. Au fost alese pentru testare tehnicile PCR, datorită preciziei, acurateţii rezultatelor şi uşurinţei de utilizare.
Astfel, orice testare începe cu verificarea specificităţii de specie, care demonstrează că ADN analizat este amplificabil şi aparţine speciei luate în studiu (Fig. 6.20).

Fig. 6.20 Identificarea plantelor modificate genetic la diferite niveluri de specificitate

Următorul nivel este screening-ul primar, care permite identificarea prezenţei unui promotor, sau secvenţă terminală care sunt însă specifice unui număr foarte mare de plante modificate genetic (PMG). De aceea, în urma unui astfel de test se poate afirma numai dacă o probă conţine sau nu PMG, fără nici o altă informaţie particulară.
Pentru o specificitate mai ridicată este posibilă identificarea prezenţei genelor transferate – specificitate de genă. În acest fel poate fi identificată compania căreia îi aparţine produsul, dar nu cu certitudine, deoarece în unele situaţii există mai multe companii care utilizează aceleaşi gene pentru transformare. Apoi, specificitatea de construcţie evidenţiază prezenţa unei regiuni de joncţiune dintre diferite elemente ale inserţiei transgenice (de exemplu joncţiunea genă-promotor).
Nivelul cel mai înalt de detecţie este dat de specificitatea de eveniment de transformare, în care fragmentul amplificat se află la joncţiunea dintre fragmentul transferat şi molecula ADN vegetal. Acest fragment este unic, specific fiecărui eveniment de transformare şi permite identificarea unui anumit produs MG.

6.4.4. APLICAŢII ALE MANIPULĂRII GENETICE LA PLANTE

In anul 1996 au fost cultivate primele soiuri de plante modificate genetic in scopul comercializarii. Zece ani mai tarziu suprafaţa cultivată în întreaga lume a fost de 102 milioane de hectare, iar în prezent aproximativ 182 milioane de hectare (http://www.isaaa.org/resources).
In prima generație de plante modificate genetic introduse în cultură şi comercializare sunt incluse plantele rezistente la erbicide, la dăunatori şi boli. Dobândirea acestor caractere a reprezentat un avantaj în primul rând pentru cultivatori ceea ce a favorizat scepticismul privind siguranţa alimentară.
De aceea au fost dezvoltate sisteme de transformare din ce în ce mai performante, în cadrul cărora au fost eliminate genele marker. Aceste gene conferă în general rezistenţa la antibiotice şi eliminarea lor din construcţiile utilizate la transformarea genetică a reprezentat un pas înainte în realizarea unor produse mai sigure.
Mai târziu au fost obţinute plante modificate genetic cu toleranţa la factorii de stres abiotic, ceea ce a permis cultivarea unor soiuri potrivite cu condiţiile climatice şi de sol din diferite regiuni ale globului.
Cele mai noi realizari ale ingineriei genetice le reprezintă obţinerea acelor soiuri care aduc un plus de valoare produselor agricole din punctul de vedere al consumatorilor cum ar fi ameliorarea valorii nutritive, a însuşirilor de calitate sau a însuşirilor tehnologice.
In continuare vor fi prezentate succint principalele categorii de plante modificate genetic a căror producere a fost posibilă datorită dezvoltării tehnicilor de biochimie şi genetică moleculară, care au permis elucidarea căilor de biosinteza ale unor produşi, identificarea enzimelor implicate în aceste procese şi totodată identificarea genelor care le codifică.

Plante modificate genetic rezistente la erbicide pot fi obţinute prin transferul unei gene mutante care codifică enzime insensibile la erbicidul respectiv sau a unei gene care codifică o enzimă ce degradează erbicidul. Plantele astfel obţinute sunt tolerante faţă de erbicide totale, biodegradabile, fără efect negativ asupra mediului şi netoxice pentru om şi animale. Aplicarea unui singur erbicid total presupune mai puţină muncă, cheltuieli mai reduse şi totodată beneficii asupra mediului înconjurător prin reducerea poluării solului şi a apei.
Rezistenţa la insecte s-a obţinut prin transferul unei gene pentru o endotoxină izolată de la bacteria Bacillus thuringiensis, aşa numita toxină Bt. A fost astfel produs porumb rezistent la atacul sfredelitorului european al tulpinilor și la viemele rădăcinilor (Diabrotica) şi cartof rezistent la atacul gândacului din Colorado. In celulele plantelor se sintetizează o proteină insecticid care este toxică pentru dăunatorii menţionaţi, dar nu are efect toxic sau alergen asupra mamiferelor. Pe lângă sporurile semnificative de producţie obţinute în cazul cultivării acestor plante trebuie menţionat şi efectul pozitiv asupra mediului, datorită eliminării tratamentelor cu insecticide (Badea, 2001).
Obţinerea plantelor modificate genetic rezistente la boli a fost posibilă o dată cu stabilirea căilor metabolice implicate în sistemele de apărare a plantelor. Rezistența la virusuri poate fi mediată de proteine capsidale, care interferează cu procesul de decapsidare, sau pot șă apară procese de inactivare a genomului viral.
De o importanţa deosebită sunt plantele modificate genetic pentru toleranţa la stresul abiotic. In ultimii ani condițiile de mediu s-au degradat tot mai mult și de aceea plantele tolerante la seceta, la temperaturi înalte sau scăzute, la stres salin, sau toleranţa la prezenţa aluminiului şi a metalelor grele prezintă un interes tot mai mare. De exemplu, în plante se pot sintetiza osmoprotectori – prolina, glicin betaina, sau proteine care pot inactiva metalele grele. Obţinerea unor plante cu o toleranța mare la prezența metalelor, care au în acelaşi timp şi o capacitate mare de acumulare a acestora deschide noi căi spre un domeniu de maxim interes în zilele noastre şi anume fitoremedierea.
Plantele modificate genetic din generaţia a doua au avut ca scop ameliorarea valorii nutritive a produselor agricole. Au fost produse plante de rapiţă, soia şi porumb având uleiuri de calitate superioară pentru consumul uman sau uleiuri noi pentru uz industrial, prin modificarea compozitiei acizilor graşi. De asemenea există posibilitatea sintezei unor proteine îmbunătăţite sau proteine noi. Un obiectiv al manipulării genetice l-a reprezentat şi ameliorarea conţinutului de micronutrienţi cum ar fi vitaminele A, E, C sau fierul. Exemplul cel mai concludent îl reprezintă orezul auriu “golden rice”, produs în anul 2000 şi îmbunătaţit în 2005, care sintetizează beta-caroten, un precursor al vitaminei A. Se consideră că un consum de 75 g de orez auriu pe zi ar putea să rezolve problemele grave ale copiilor din zone defavorizate de pe glob, în care deficienţa de vitamina A face numeroase victime.
De interes pentru cercetători a fost şi îmbunătaţirea unor însuşiri de calitate, cum ar fi întârzierea procesului de coacere şi extinderea perioadei de păstrare, modificarea fermității fructelor sau a procesului de maturare prin controlul nivelului etilenei, ameliorarea calităților gustative, prevenirea brunificării enzimatice sau modificarea culorii florilor.
In ultimii ani interesul în domeniul manipulărilor genetice s-a orientat spre producerea proteinelor recombinate în plante. Pot fi astfel produse în plante proteine cu utilizări industriale sau proteine farmaceutice – vaccinuri, anticorpi şi alte proteine terapeutice. Sinteza unor molecule terapeutice sau vaccinuri în plante prezintă o serie de avantaje şi anume modul de producere este uşor şi rapid, pot fi păstrate la temperatura mediului ambiant şi totodată sunt eliminate riscurile contaminărilor virale sau bacteriene asociate vaccinurilor produse în tesuturi animale sau umane (Badea, 2005).

6.5 EVALUAREA GENETICĂ LA PLANTE
DE LA GENĂ LA GENOM

In ultima vreme se acordă tot mai multă atenţie resurselor genetice vegetale, atât din punctul de vedere al evaluării, cât şi al conservării, deoarece reprezintă sursa de hrană pentru o populaţie în creştere şi totodată stau la baza unui management sustenabil al mediului.
Evaluarea diversităţii şi caracterizarea resurselor genetice vegetale (PGR) au o largă aplicabilitate în multe domenii, cum ar fi ameliorarea plantelor, studiul filogenetic, conservarea speciilor pe cale de dispariţie sau autenticitatea alimentelor.
Astfel amelioratorii au posibilitatea de a îmbunătăţi cultivarele existente cu caractere de interes cum ar fi producţia, rezistenţa la boli şi dăunători, toleranţa la secetă, salinitate, temperaturi scăzute sau crescute.
Înţelegerea relaţiilor genetice dintre plante, bazată pe legătura filogenetică prezintă un mare interes atât pentru geneticieni, cât şi pentru biologi şi amelioratori. Datele care definesc distanţele genetice dintre grupurile taxonomice, prezentate sub forma unui complex de asemănări şi deosebiri, stau la baza generării arborilor filogenetici şi la stabilirea căilor de evoluţie a plantelor superioare.
Caracterizarea genetică a speciilor din flora spontană permite inventarierea lor şi încadrarea într-o anumită categorie taxonomică. Pot fi astfel identificate populaţii unice, care justifică măsuri de conservare, în timp ce în alte cazuri analizele moleculare pot să sugereze că populaţia nu este suficient diferenţiată pentru a necesita o protecţie specială.
Cunoașterea background-ului genetic al speciilor stă la baza evaluării autenticităţii alimentelor, produselor farmaceutice, condimentelor etc. Astfel pot fi identificate produsele falsificate sau cele care conţin specii toxice, alergene etc.

6.5.1. CARACTERIZAREA GENOTIPURILOR CU AJUTORUL MARKERILOR

Evaluarea genetică a diferitelor organisme s-a efectuat în trecut numai cu ajutorul markerilor morfologici (genetici fenotipici), care au deci un efect evident asupra fenotipului. Mendel a utilizat aceşti markeri încă din secolul al XIX-lea. Mai târziu, markerii genetici fenotipici la Drosophila au condus la stabilirea teoriei linkage-ului genetic. Dar, astfel de markeri au un polimorfism scăzut, sunt în general dominanţi, pot să interfereze cu alte caractere şi pot fi influenţaţi de mediu.
Limitările markerilor pe bază de fenotip au condus la dezvoltarea altor tipuri care au fost denumiţi markeri moleculari.
Primii markeri moleculari utilizaţi au fost markerii biochimici şi anume izoenzimele. Dar izoenzimele pot să evidenţieze polimorfismul la un număr redus de loci şi nu sunt prezente sau active în toate organele având o specificitate de organ. De aceea, în timp importanţa lor a scăzut tot mai mult.
În prezent se utilizează markerii care evidenţiază polimorfismul la nivel de ADN, deoarece îndeplinesc toate condiţiile cerute de un marker ideal. Deci, un marker molecular ADN indică situsuri neutre de variaţie la nivelul secvenţei de ADN – modificări chiar de o singură bază azotată sau ale numărului de secvenţe de ADN repetitiv, care nu au efect asupra fenotipului.
Dezvoltarea tot mai accentuată a tehnicilor de analiză au permis secvenţierea anumitor regiuni cu o specificitate foarte ridicată din genom, sau chiar secvenţierea în totalitate a genomului cloroplastic sau nuclear.

CATEGORII DE MARKERI MOLECULARI UTILIZATI ÎN EVALUAREA GENETICĂ
Markerii moleculari ADN prezintă nenumărate avantaje comparativ cu markerii convenţionali, deoarece sunt stabili şi pot fi identificaţi în orice tip de ţesut, fără să aibă vreo importanţă stadiul de dezvoltare. Totodată nu pot fi confundaţi cu efectele factorilor de stres, de mediu sau efectele epistatice. Markerii ADN sunt foarte numeroşi şi nu perturbă în nici un fel fiziologia organismului.
Markerii moleculari „ideali” ar trebui să îndeplinească o serie de condiţii cum ar fi: să fie polimorfici, multialelici, codominanţi (să permită distingerea între homozigoţi şi heterozigoţi în populaţiile diploide), nonepistazici (genotipul lor să poată fi identificat oricare ar fi genotipul altor loci), să nu fie influenţaţi de condiţiile de mediu, să fie disponibili în număr mare, să aibă o reproductibilitate înaltă şi să permită o evaluare rapidă şi un schimb facil al datelor între diferite laboratoare.
Fiecare tip de marker molecular are la bază una sau mai multe tehnici specifice de biologie moleculară, fiind posibilă atât analiza ADN nuclear cât şi cloroplastic sau mitocondrial.
Primul marker utilizat în analizele genetice a fost RFLP (“Restriction Fragment Length Polymorphism”), care evidenţiază polimorfismul lungimii fragmentelor de restricţie. În ultimii ani acest tip de marker a fost abandonat deoarece necesită mult timp şi totodată presupune lucrul cu sonde marcate radioactiv.
În prezent, markerii utilizați se bazează în principal de tehnica PCR, care este rapidă, necesită cantităţi mici de ADN si rezultatele sunt în general uşor de interpretat. În continuare sunt prezentate cele mai importante categorii de markeri utilizati în evaluarea genetică.

MARKERII EST („Expressed Sequence Tag”–secvenţe exprimate etichetate)
Markerii EST presupun amplificarea unei gene, a unui segment de ADN codant cu ajutorul primerilor specifici. Polimorfismul între indivizi se evidenţiază în funcţie de lungimea fragmentelor amplificate, markerii fiind codominanţi.
Pentru stabilirea secvenţei primerilor utilizaţi în reacţiile de amplificare se utilizează secvenţele EST prezente în bazele de date (http://www.ncbi.nlm.nih.gov/dbEST/).
Dacă se utilizează secvenţele 5’ EST este posibilă evidenţierea polimorfismului apărut în regiunea centrală a unei gene. Secvenţele 3’ EST, care conţin în mai mare măsură regiuni necodante pot să furnizeze markeri cu un polimorfism mai ridicat, care provine însă tot din regiunile care intră în alcătuirea genei.
Având în vedere că markerii EST permit evaluarea polimorfismului în regiunile codante din genom, posibilităţile de indentificare a polimorfismului sunt destul de reduse.

MARKERII MICROSATELIŢI – SSR („Single sequence Repeat”–secvenţe simple repetate)
Secvenţele simple repetate, care sunt prezente atât în ADN nuclear, cât şi în cel mitocondrial şi cloroplastic stau la baza dezvoltării mai multor categorii de markeri, care în general pun în evidenţă variaţia numărului de repetiţii. Datorită modului de transmitere uniparental, genomurile cloroplastic şi mitocondrial pot să evidenţieze amprente genetice diferite comparativ cu alelele nucleare.
În genomul nuclear microsateliţii, secvenţele simple repetate sau secvenţele repetate în tandem sunt repetiţii ale unor secvenţe foarte scurte (1-5 bp, cel mai adesea 2-3 bp) care sunt răspândite uniform în tot genomul organismelor eucariote. Cele mai des întâlnite secvenţele sunt (A)n (TC)n (TAT)n (GATA)n, numărul de unităţi repetitive având valori între 6 -7 şi câteva zeci.
La plantele superioare se estimează că există în medie un microsatelit dinucleotidic la fiecare 30-100 kb. Pe lângă distribuţia acestor secvenţe în genom, un factor important este polimorfismul extrem de ridicat al numărului de unităţi repetitive. Variaţiile în numărul unităţilor repetate se datorează alunecării catenelor din timpul replicării, unde secvenţele repetate permit cuplarea celor două catene prin eliminări sau adaugări de secvenţe.
Deci, numărul unităţilor repetitive variază de la un individ la altul. Ele nu prezintă specificitate de locus, dar regiunile care flanchează microsatelitul prezintă specificitate ridicată. Deci, o pereche de primeri care se leagă de secvenţele care mărginesc microsatelitul îl vor amplifica, iar polimorfismul va fi evidenţiat ca o variaţie între lungimile fragmentelor amplificate. Astfel, tehnica PCR va furniza markeri cu specificitate de locus, codominanţi şi înalt polimorfici.
Reproductibilitatea în cazul utilizării acestor markeri este ridicată, astfel că pot fi utilizaţi cu succes în laboratoare diferite, rezultatele obţinute fiind aceleaşi.
În continuare este prezentată evaluarea polimorfismului între doi indivizi, A şi B cu 10 markeri microsateliţi proveniţi din harta genetică Medicago truncatula. Amplificarea a fost identică pentru ambii indivizi în cazul primerilor 1, 5, 6, 8 şi 10, deci au prezentat acelaşi număr al repetiţiilor secvenţelor microsatelit (Fig. 5.21).
Având în vedere ca markerii microsateliţi sunt codominanţi, un singur fragment amplificat sugerează un individ homozigot, în timp ce două fragmente sunt corelate cu heterozigoţia.

Fig. 5.21. Analiza prin electroforeză în gel de agaroză a ADN provenit de la două plante (A şi B), amplificat cu 10 markeri microsateliţi
1,2 –A şi B, primer 1, 3,4- A şi B, primer 2, 5,6- ADN A şi B, primer 3, 7,8- ADN A şi B, primer 4, 9-10 – A şi B, primer 5, 11-12 – A şi B, primer 6, 13-14- A şi B, primer 7, 15-16- A şi B, primer 8, 17-18 – A şi B, primer 9, 19-20- A şi B, primer 10

Dar, pentru o înţelegere mai completă a evoluţiei şi filogeniei este necesar studiul celor trei genomuri diferite: nuclear, cloroplastic şi mitocondrial.

Analiza ADN cloroplastic furnizează informaţii cu privire la dinamica populaţiilor, complementare cu acelea obţinute prin studierea genomului nuclear.
Numeroase studii au arătat că microsateliţii cloroplastici care constau din secvenţe scurte cum ar fi (dA)n × (dT) n, sunt componente omniprezente şi polimorfice ale cloroplastelor.
Markerii dezvoltaţi pe baza acestor secvenţe vin să completeze informaţiile obţinute prin investigarea ADN nuclear privind diferenţierile în cadrul sau între unităţilor taxonomice.
Conservarea şi omologia secvenţelor din genomul cloroplastic face posibilă compararea relaţiilor filogenetice între specii care s-au despărţit cu sute de mii până la milioane de ani în urmă. În prezent se consideră că microsateliţii cloroplastici pot sta la baza unor investigaţii complexe care permit studierea modelului variaţiei citoplasmatice într-o largă varietate de specii.
În general ADN mitocondrial vegetal nu se utilizează pentru analize de filogenie, datorită dimensiunii mari şi ratei foarte mări a reorganizărilor. Totuşi, diversitatea haplotipului legată de rearanjamentul secvenţelor s-a dovedit utilă în studiile de diferenţiere între speciile pin şi brad. Repetiţiile mitocondriale au fost de asemenea utilizate pentru urmărirea segregării unor caractere în populaţie.

MARKERII CAPS („Cleaved Amplified Polymorphic DNA”) – secţionarea produşilor de amplificare
Aceşti markeri reprezintă o combinaţie între metodele care au la bază reacţia PCR şi cele care exploatează polimorfismul apărut la nivelul situsurilor de restricţie.
Prin urmare, secvenţele amplificate, gene sau fragmente anonime de ADN sunt secţionate cu una sau mai multe enzime de restricţie (care au situsurile de recunoaştere alcătuite din patru baze).
Evaluarea numărului şi dimensiunilor fragmentelor rezultate în urma secţionării permite identificarea polimorfismului situsului de restricţie. Deci markerii CAPS sunt dominanţi, cu specificitate de locus.

MARKERII SSCP („Single Strand Conformation Profile”) – profilul conformaţiei monocatenare
Markerii SSCP identifică diferenţele de conformaţie existente în interiorul fragmentelor de ADN.
Dacă moleculele de ADN sunt denaturate şi apoi răcite rapid, monocatenele nu au timp să se asocieze între ele, dar formează o structură secundară stabilă prin reasocierea la nivelul zonelor cu secvenţe complementare.
Diferenţele de secvenţă pot să genereze astfel modificări de conformaţie care sunt decelate prin migrarea în condiţii nondenaturante în geluri de poliacrilamidă.
Se estimează că aproape 100% dintre diferenţele de secvenţă sunt astfel decelabile în fragmente mai mici de 20 pb, dar această proporţie se diminuează o dată cu creşterea lungimii fragmentului.
Chiar şi la un individ homozigot se evidenţiază în general două benzi, deoarece moleculele de ADN monocatenar au conformaţii secundare puţin diferite.
Tehnica de evidenţiere a conformaţiei fragmentelor denaturate (SSCP), este rapidă, simplă şi sensibilă, cu aplicaţii în detectarea unor mutaţii, inclusiv substituţii de o singură nucleotidă, inserţii şi deleţii apărute în interiorul unor fragmente amplificate PCR.
SSCP se aseamănă cu tehnica RFLP, deoarece permite distingerea variantelor alelice ale caracterelor genetice moştenite, dar spre deosebire de RFLP permite detectarea polimorfismului ADN şi a mutaţiilor în mai multe poziţii din genom.
Tehnica SSCP este de interes pentru că nu necesită nici secţionarea, precum CAPS, nici condiţii speciale de electroforeză ca în cazul markerilor DGGE şi are multiple aplicaţii în analiza genelor, în special pentru detecţia mutaţiilor punctiforme.

MARKERII DGGE („Denaturing Gradient Gel Electrophoresis”) – Electroforeza în Gel cu Gradient de Denaturare
Markerii DGGE identifică diferenţele de stabilitate existente în interiorul fragmentelor de ADN.
Diferenţele de secvenţă pot să genereze diferenţe locale de stabilitate a moleculelor de ADN dublu catenar vis-a vis de agenţii de denaturare (uree-formamidă) sau temperatură.
După ce a avut loc reacţia PCR, fragmentele amplificate sunt analizate prin electroforeză în gel de poliacrilamidă.
Compoziţia gelului şi/sau condiţiile de migrare sunt astfel stabilite încât, în timpul migrării molecula să parcurgă un gradient de denaturare (fie o temperatură din ce în ce mai ridicată fie o cantitate din ce în ce mai mare de uree-formamidă).
Fragmentele de ADN vor migra conform cu starea lor dublu catenară apoi vor întâlni condiţii care vor denatura regiunile mai puţin stabile ale moleculelor formând o structură ramificată care migrează foarte puţin.
În cele mai multe cazuri o diferenţă de o singură bază în regiunea mai puţin stabilă generează o diferenţă de temperatură a procesului de denaturare, prin urmare o diferenţă de poziţie a benzii în gel.
Pe de altă parte pot fi identificaţi şi indivizii heterozigoţi. Este suficient ca după ultimul ciclu PCR să se realizeze o etapă de denaturare apoi renaturare care va forma heteroduplexuri. La o temperatură scăzută acestea vor da naştere la benzi care migrează mai încet, care sunt uşor de reperat.
Chiar dacă o substituţie nu este detectabilă în cazul homozigoţilor, ea va fi pusă în evidenţă de heterozigoţi.
Din punct de vedere practic tehnica DGGE este mai pretenţioasă decât SSCP, iar gradientul de temperatură sau de agent denaturant trebuie să fie ales în funcţie de fragmentul studiat.

MARKERI CARE SE BAZEAZĂ PE AMPLIFICAREA ARBITRARĂ

MARKERII MAAP „Multiple Arbitrary Amplicon Profiling” – Profilul Produsului De Amplificare Arbitrară Multiplă
Amplificarea arbitrară a moleculelor de ADN genomic permite evidenţierea polimorfismului produs de rearanjamentele sau deleţiile care au loc la nivelul secvenţelor care reprezintă situsurile de legare pentru primerii arbitrari.
În cadrul acestei categorii, cea mai mare importanţă o prezintă markerii RAPD (“Random Amplified Polymorphic DNA”), care presupun utilizarea unor primeri cu o lungime de 10 oligonucleotide, cu o secvenţă arbitrară. Primerul se va lega de fiecare dată când va întâlni o secvenţă de ADN complementară, iar amplificarea va avea loc dacă situsurile de legare pentru primeri pe cele două catene se găsesc la o distanţă de cel mult trei kilobaze şi sunt în opoziţie unul cu celălalt. Dacă unul din aceste două situsuri este absent la un individ, amplificarea nu va avea loc şi va fi observat un polimorfism al absenţei sau prezenţei situsului.
In continuare este prezentată evaluarea polimorfismului la 7 indivizi, cu ajutorul unui primer RAPD cu o secvenţă întâmplătoare (OPW 19- 5’ CCATTCCCCA3’) (Fig. 5.22).

Fig. 5.22. Analiza prin electroforeză în gel de agaroză a ADN provenit de la şapte indivizi, amplificat cu un marker RAPD
MM- marker molecular, 1-7 – amprenta moleculară a indivizilor analizaţi

Se pot observa diferenţele care apar între amprentele indivizilor analizaţi, cu menţiunea că nu sunt cunoscuţi locii la nivelul cărora apar aceste modificări. De aceea markerii RAPD sunt consideraţi a fi dominanţi, deci nu permit diferenţierea homozigoţilor de heterozigoţi.
Utilizarea markerilor RAPD prezintă o serie de avantaje si anume:
au o secvenţă arbitrară şi nu necesită informaţii prealabile cu privire la genomul care urmează a fi analizat; au o natură universală, deoarece pot fi utilizaţi la un număr mare de specii. Datorită acestor caracteristici utilizarea markerilor RAPD presupune costuri scăzute.
Dar, nu se obţin informaţii despre identitatea produşilor de amplificare, deoarece fragmentele analizate sunt rezultatul unei amplificări întâmplătoare. De asemenea apar probleme cu reproductibilitatea rezultatelor, care depinde de calitatea ADN, componentele amestecului PCR şi condiţiile de amplificare. Pot fi obţinute rezultate reproductibile dacă se respectă întocmai condiţiile standardizate. Având în vedere că are loc amplificarea mai multor loci din genom, nefiind posibilă decelarea între indivizii hetero şi homozigoţi, markerii sunt dominanţi.

MARKERI ISSR („Inter Simple Sequence Repeats”) amplificarea regiunilor dintre secvenţele simple repetate
Tehnica ISSR permite evaluarea polimorfismului existent între regiunile microsatelit, alcătuite din secvenţe simple, repetate. A fost astfel dezvoltată o metodă alternativă de investigare, eficientă care nu necesită studii prealabile de secvenţializare la fel ca în cazul markerilor SSR.
Tehnica ISSR se bazează pe reacţia PCR, care implică amplificarea unui segment de ADN, prezent la o distanţă amplificabilă între două regiuni microsatelit, orientate în direcţii opuse.
Primerii utilizaţi în această tehnică au în general lungimi de 16-25 de nucleotide, având ca regiuni ţintă loci multipli din genom, în special amplasaţi în secvenţele microsatelit.
Repetiţiile de tip microsatelit utilizate ca primeri pot fi di, tri, tetra sau penta-nucleotide, neancoraţi, sau de cele mai multe ori sunt ancoraţi la capătul 3’ sau 5’ cu 1 – 4 baze degenerate extinse în regiunile care flanchează regiunea microsatelit.
Deşi în general ISSR se comportă ca markeri dominanţi, ceea ce reprezintă un dezavantaj; au totuşi o largă utilizare în cartarea genetică şi studiile de genetică a populaţiilor deoarece necesită cantităţi mici de ADN se bazează pe reacţia PCR şi nu necesită studii prealabile de secvenţializare, la fel ca markerii SSR. Totodată metoda poate fi automatizată, furnizând un număr mare de markeri reproductibili.
In continuare este prezentată evaluarea polimorfismului la 18 indivizi, cu ajutorul unui primer ISSR cu o secvenţă complementară cu o secvenţă microsatelit şi anume UBC 811, cu secvenţa (GA)8C ) (Fig. 5.23).

Fig. 5.23. Analiza prin electroforeză în gel de agaroză a ADN provenit de la 18 indivizi, amplificat cu un marker ISSR
MM- marker molecular, 1-18 – amprenta moleculară a indivizilor analizaţi

Se pot observa diferenţele care apar între amprentele indivizilor analizaţi, cu menţiunea că nici in acest caz nu sunt cunoscuţi locii la nivelul cărora apar aceste modificări.

MARKERII AFLP Amplified Fragment Length Polymorphism (polimorfismul lungimii fragmentelor de restricţie amplificate)
Metoda evaluării polimorfismului lungimii fragmentelor amplificate combină avantajele utilizării tehnicii RFLP (polimorfismul lungimii fragmentelor de restricţie) cu flexibilitatea metodelor bazate pe PCR
Aceasta metodă se bazează pe o amplificare selectivă a fragmentelor de restricţie formate în urma secţionării ADN genomic cu enzime de restricţie. Deci, ADN genomic este secționat cu două enzime de restricție diferite, de obicei Mse I şi Eco RI. Mse I recunoaşte secvenţa 5′-TTAA-3′ şi secţionează după primul 5′-T, în timp ce Eco RI recunoaşte secvenţa 5′-GAATTC-3′ şi secţionează după 5′-G. Enzimele Mse I şi Eco R I generează fragmente cu capete coezive 5’ (5′-TA-3′ şi 5′-AATT-3′), diferite între ele şi necomplementare.
Pentru a fi posibilă o reacţie PCR fără a avea informaţii prealabile cu privire la secvenţa fragmentelor amplificate, la extremităţile fragmentelor de restricţie se leagă fragmente ADN scurte (19-22 nucleotide), bicatenare, complementare cu cele două tipuri de capete coezive, denumite „adaptori”. Astfel, toate fragmentele formate vor avea secvenţe identice la extremităţi.
Urmează apoi o reacție de amplificare selectivă, cu primeri complementari cu secvențele adaptorilor, la care s-a adaugat una sau două nucleotide pentru selecție. Este generat un număr foarte mare de sevențe de amplificare care pot fi analizate prin electroforeză în gel de poliacrilamidă sau prin electroforeză capilară.
Din punct de vedere genetic aceste tehnici nu sunt utilizate ca sursă de markeri cu specificitate de locus, furnizând în general markeri dominanţi.
Tehnica AFLP generează o cantitate foarte mare de informaţii cu privire la amprentele moleculare ale indivizilor, dar dezvoltarea din ultima vreme a tehnicilor de analiză, automatizării şi bioinformaticii au permis o bună exploatare a acestora.
Din considerentele menţionate mai sus metoda AFLP este aplicată cu succes atât în laboratoarele de genetică moleculară vegetală şi animală dar şi în laboratoarele de medicină legală.

EVALUAREA VARIABILITĂŢII GENETICE CU AJUTORUL MARKERILOR MOLECULARI

Informaţiile obţinute în urma analizei comparative cu diferite tipuri de markeri moleculari sunt interpretate statistic, în funcţie de comportarea dominantă sau codominanta a acestora.
În cazul markerilor dominanţi sunt analizate fragmentele vizualizate pentru fiecare individ, notate în ordinea dimensiunilor (locus1-…n) după care se realizează scorul acestora notându-se cu 1 prezența benzii la un anumit locus, iar cu 0 absența.
În cazul markerilor codominanţi sunt de asemenea analizate fragmentele vizualizate pentru fiecare individ, după care se realizează scorul sub forma (1,0) în funcţie de prezenţa sau absenţa fiecărei alele la un anumit locus.
Toate informațiile obţinute sunt apoi introduse într-o matrice binară care este interpretată statistic. Se poate stabili astfel gradul de înrudire, prin întocmirea unei dendrograme şi tot odată indicele de similaritate.

6.5.2. CARACTERIZAREA GENOTIPURILOR PRIN METODA CODURILOR DE BARE ADN

Încă din anul 2003, a fost propus "Codul de bare ADN" sau “barcoding” ca o modalitate de a identifica speciile. Acesta este similar cu Codul universal al produselor – UPC (“Universal Product Code”), care permite scanarea produselor în supermarket.
Pentru stabilirea codului de bare ADN se utilizează o secvență scurtă ADN, amplasată într-o zonă standard a genomului, care are o specificitate de specie foarte ridicată.
În general, identificarea taxonomică se face cu ajutorul caracteristicilor morfologice, cum ar fi forma, dimensiunea sau culoarea. Dar, chiar dacă metodologia este standardizată, numai un taxonomist cu multă experiență poate face o identificare corectă. În plus, dacă un specimen este deteriorat sau este într-un stadiu imatur de dezvoltare, chiar și specialiștii ar putea fi în imposibilitatea de a face identificări.
Codul de bare ADN rezolvă toate aceste probleme, deoarece poate fi stabilit cu ușurintă și precizie prin aplicarea unor tehnici de biologie moleculară.
În cazul speciilor animale regiunea genică utilizată pentru stabilirea codului de bare standard este un fragment cu lungimea de 648bp, din gena oxidaza 1 specifică citocromului c din ADN mitocondrial – CO1 (“cytochrome c oxidase 1 gene”). Această genă şi-a dovedit eficienţa în identificarea tuturor speciilor animale, dar nu poate fi utilizată la plante. Se consideră că ADN mitocondrial vegetal a avut o rată mică a mutaţiilor de-a lungul evoluţiei, astfel încât nu a fost posibilă identificarea unor regiuni specifice speciilor vegetale.
Totuși, stabilirea "Codulului de bare ADN" la plante a atras atenția taxonomiștilor în mod special, pentru că are foarte multe aplicații practice cum ar fi: apărarea drepturilor amelioratorilor și a drepturilor de proprietate intelectuală; permite distingerea anumitor specii care au fost clasificate inţial în cadrul aceleiaşi specii; contribuie la siguranța alimentară și autenticitatea etichetării alimentelor prin confirmarea identității speciilor vegetale; poate fi utilizat în criminalistică, pentru a lega anumite probe vegetale de locul unor infracțiuni.
În cazul speciilor vegetale se consideră că ADN cloroplastic poate îndeplini toate condițiile necesare stabilirii unor coduri de bare ADN cu specificitate și precizie ridicate. Până în prezent au fost realizate nenumărate studii, dar nici unul nu a permis identificarea unor fragmente (loci) general valabile care să perimtă distingerea exactă a speciilor. Atunci când se determină o secvență pentru un specimen necunoscut, aceasta se compară cu toate codurile de bare ADN identificate până la acel moment, prezente în bazele de date. Pentru secvențele nou identificate care nu se aliniază cu nici o secvența deja cunoscută se atribuie un nou cod de bare, fiind necesară caracterizarea amănunțită din punct de vedere morfologic.
Consorțiul CBOL “Barcode of Life-Plant Working Group” a evaluat șapte regiuni cloroplastice și a recomandat utilizarea unei combinații între doi loci matK + rbcL ( mat K- gena maturaza K și rbc L – gena ribuloz-bifosfat carboxilaza); gena rbcL conferă universalitatea, iar matK rezoluția înaltă, dar totuşi eficacitatea acestei combinații este de 72% deoarece nu permite diferențierea speciilor înrudite. De curând s-a propus secvențierea întregului genom cloroplatic, dar nici una dintre aceste proceduri nu a fost unanim acceptată.
În practică, pentru stabilirea codurilor de bare ADN se mai utilizează cu succes regiunea intergenică non-codantă trnH-psbA. Prezenţa unor secvenţe înalt conservate de o parte şi cealaltă a regiunii intergenice permite utilizarea unor primeri care pot amplifica ADN de la aproape toate angiospermele. Totuşi, alinierea acestor secvenţe trnH-psbA poate fi ambiguă datorită unei evoluţii moleculare complicate, variaţiilor considerabile în lungime şi ratei înalte de inserţii şi deleţii.
În plus faţă de secvenţele cloroplastice, consorţiul “China Plant BOL Group” a propus utilizarea regiunilor interne transcrise din alcătuirea ADN ribozomal nuclear (ITS2) „internal transcribed spacer 2” deoarece se cunosc regiuni conservate care permit design-ul primerilor, fragmentele pot fi amplificate cu uşurinţă şi variabilitatea lor este suficient de mare pentru a permite chiar diferenţierea speciilor înrudite.
În paralel cu stabilirea codurilor de bare cu ajutorul unor loci singulari cercetările au continuat în domeniul secvenţierii ADN cloroplastic. Pe măsură ce tehnicile de secvenţiere s-au dezvoltat, a crescut şi numărul speciilor pentru care ADN cloroplastic a fost secvenţiat în totalitate, chiar dacă nu existau secvenţe de referinţă pentru aliniere.
În ultima perioadă numărul secvenţelor din bazele de date provenite de la loci singulari sau de la întregul genom cloroplastic a crescut continuu, existând astfel foarte multe informaţii referitoare la o multitudine de specii.
Deci, dacă există o bază de date amplă cu un număr mare de secvenţe ale genomurilor cloroplastice (ADNcp) şi una care include primerii pentru fiecare grup de plante, derivaţi din exploatarea secvenţelor genomurilor este posibilă aplicarea pe scară largă a procesului de stabilire a codurilor de bare ADN.
Speciile cunoscute pot fi deosebite prin utilizarea informaţiilor din bazele de date care cuprind secvenţele primerilor. Pentru speciile necunoscute procedura cuprinde două etape: prima dată speciile sunt încadrate într-o familie sau gen cu ajutorul primerilor care amplifică secvenţe singulare (ex. rbcL); în a doua etapă sunt alese anumite secvenţe din baza de date ADNcp cu ajutorul cărora se realizează diferenţierea la nivel de specie.

6.5.3. CARACTERIZAREA GENOTIPURILOR PRIN SECVENŢIEREA GENOMULUI

Moleculele de ADN au fost secvenţiate pentru prima dată în anul 1977. Primul organism viu al cărui genom a fost secvenţializat complet a fost virusul Haemophilus influenzae, în 1995. În 1996 a fost secvenţializat primul genom eucariot – Saccharomyces cerevisiae, iar în 1998 a fost secvenţializat genomul unui eucariot multicelular Caenorhabditis elegans.
În cazul plantelor superioare procesul de secvenţiere a început cu genomurile organismelor model, care pot furniza informaţii valoroase pentru cercetările care au ca obiect alte specii cu genom mai complex. În plus au făcut obiectul studiilor de secvenţiere speciile de mare interes pentru hrana populaţiei, cum ar fi orezul.
Completarea secvenţei genomului la Arabidopsis thaliana (AGI, 2000) a reprezentat un pas important în cercetarea din domeniul biologiei vegetale. Astfel, s-a furnizat prima descriere detaliată a secvenţei unei plante superioare şi s-au evidenţiat unele procese noi implicate în creşterea şi dezvoltarea plantelor. Disponibilitatea secvenţei genomului la Arabidopsis a permis lărgirea şi accelerarea unor cercetări ulterioare în genetică vegetală.
În anul 2002 a fost secvenţiat genomul pentru două subspecii de orez, pentru că această specie este recunoscută ca având un genom de dimensiuni reduse şi în plus constituie hrana principală pentru un procent foarte mare din populaţia lumii.
Genomul Ostreococcus tauri a fost secvenţializat în 2006, deoarece este un organism eucariot simplu, iar genomul Physcomitrella patens a fost de interes deoarece reprezintă un organism cu importaţă în studiile de evoluţie a plantelor. Populus trichocarpa este un arbore model, cu utilizări comerciale importante, care a fost studiat comparativ cu Arabidopsis. Au mai fost secvenţiate orezul, porumbul şi viţa de vie care o importanţă comercială.
Până în anul 2009 au fost secvenţiate 10 genomuri vegetale (Tabel 6.1).

Tabel 6.1. Dimensiunea genomului şi numărul de gene la speciile vegetale al căror genom a fost secvenţializat ( 2009)

Specie
Dimensiunea genomului
Anul completării

Arabidopsis thaliana
Muştarul sălbatic
organism model
135 Mb
2000

Oryza sativa ssp indica
Orez
organism model
420 Mb
2002

Oryza sativa ssp japonica
Orez
466 Mb
2002

Populus trichocarpa
Plop
510 Mb
2006

Vitis vinifera
Viţa de vie
490 Mb
2007

Lotus japonicus 
Leguminoasă model
470 Mb
2008

Zea mays ssp mays
Porumb
2800 Mb
2008

Carica papaya 
Papaya
372Mb
2008

Cucumis sativus
Castravete
350MB
2009

Sorghum bicolor
Sorg
730Mb
2009


Începând cu anul 2010, când tehnicile de secvenţiere au cunoscut o dezvoltare deosebită, numărul de specii analizate a crescut exponenţial. Astfel în anul 2010 au mai fost secvenţiate 7 genomuri, printre care ricinul, soia şi mărul. În următorii ani au mai fost secvenţiate 68 de genomuri ale plantelor superioare, numărul total ajungând la 85 (https://en.wikipedia. org/wiki/ List_of_sequenced_plant_genomes).
Cunoaşterea unui număr atât de mare de secveţe ale genomurilor vegetale reprezintă un ajutor deosebit în studiile de biologie moleculară şi genomică, deoarece furnizează informaţii valoroase pentru identificarea genelor, stabilirea amprentelor genetice sau a filiaţiei.

6.6 EVALUAREA GENETICĂ LA OM

6.6.1. SECVENŢIEREA GENOMULUI UMAN

Cel mai ambiţios proiect de secvenţiere a genomului uman a fost iniţiat în 1990 în SUA, în cadrul Institutul Naţional de Sănătate şi Departamentul de Energie, având denumirea de Proiectul de cartare a genomului uman ( „The Human Genome Project –HGP”) şi s-a finalizat în anul 2003.
Scopul propus al acestui proiect a fost de a secvenţializa genomul uman până în anul 2005. Prin colaborarea cu alte programe naţionale de cercetare din Canada, China, Franţa, Germany, Japonia si Anglia si cu ajutorul unor companii comerciale (Celera), succesul proiectului a depăşit aşteptările.
Sub auspiciile proiectului HGP la mijlocul anilor 90 a fost dezvoltată o hartă genetică şi una fizică a genomului uman. Aceste realizări au permis orientarea eforturilor spre identificarea genelor care produc numeroase maladii prin clonarea poziţională.
Până în 1996 genomul drojdiei şi al bacteriilor a fost secvenţializat, astfel că atenţia s-a îndreptat spre incercarea de secvenţierea celor 3,2 x 109 baze din genomul uman.
Strategia aplicată a fost secţionarea genomului uman în fragmente de 100 – 200 kb care au fost apoi clonate în vectori BAC (Bacterial Artificial Chromosome). Cele 20 000 de clone BAC au fost ordonate şi cartate înainte ca ele să fie secţionate în fragmente mici de 2 kb, pentru realizarea subclonelor, care au fost secvenţiate.
Analiza secvenţelor subclonelor a permis stabilirea înlănţuirii acestora în clona BAC de origine. Apoi, secvenţele clonelor BAC au fost ordonate, astfel încât să se stabilească poziţia lor iniţială pe cromozomi. Toate aceste procese de ordonare au permis asamblarea secvenţei întregului genom, care a fost publicată în revista Nature, în 2001, în aceiaşi săptămână în care o companie privată – Celera, a publicat secvenţa ei proprie în revista Science.
Ultima estimare a numărului de gene codante din genomul uman, pe baza cercetărilor finalizate în anul 2006, este în jur de 25.000 gene, similar cu multe alte organisme mai simple. De aceea s-a considerat că, complexitatea genomului uman se datorează proceselor de reglare a genelor şi de producere a unui set elaborat de produşi proteici şi nu complexităţii genomului.

O dată cu dezvoltarea echipamentelor şi tehnologiilor de secvenţiere capacitatea de analiză a crescut exponenţial. Astfel, dacă în anul 2005 era posibilă secvenţierea a 1,3 genomuri umane pe an cu un aparat, 10 ani mai târziu acest număr a crescut la 18000.
Succesul acestei secvenţializări marchează un progres major în biologia umană, care aduce un beneficiu enorm în termenii înţelegerii sensibilităţii oamenilor la boli şi dezvoltarea unor noi tratamente genetice.
Aceste posibilităţi de secvenţiere permit identificarea oricărei mutaţii cunoscute, dar totuşi baza genetică pentru foarte multe boli a rămas necunoscută.
De aceea scopul cercetărilor din întreaga lume este genomica funcţională şi stabilirea funcţiilor pentru noile secvenţe ADN determinate.
.
6.6.2. AMPRENTAREA UMANĂ, ANALIZE CRIMINALISTICE

În realizarea unui profil ADN individual se folosesc o serie de tehnici care să permită determinarea similitudinilor dintre probe.
Prima metodă folosită în acest sens a fost tehnica RFLP, care ajută la identificarea polimorfismului cu ajutorul enzimelor de restricţie şi permite vizualizarea mai multor loci în acelaşi timp. Acestă tehnică este laborioasă, necesită cantităţi mari de ADN nedegradat şi nu permite identificarea alelelor individuale.
De aceea, s-au dezvoltat tot mai mult procedurile bazate pe tehnica PCR, care permit obţinerea de informaţii valoroase cu un grad de precizie foarte ridicat, pornind de la cantităţi reduse de ADN, sau chiar degradate.
Metoda PCR poate fi uşor adaptată pentru a analiza minisateliţii hipervariabili – VNTR ("variable number of tandem repeats")(capitolul 2.3.3.2.). De exemplu, în SUA, serviciul FBI a standardizat un set de13 analize VNTR pentru a stabili amprenta ADN şi a organizat baza de date CODIS (http://www.fbi.gov/hq/lab/html/codis1.htm) pentru investigaţii criminalistice.
De asemenea, sunt disponibile seturi de kituri comerciale pentru analize cu markeri care evidenţiază polimorfismul unei singure nucleotide SNP (“Single Nucleotide Polymorphism”). Aceste analize presupun amplificarea PCR a unor regiuni specifice cu variaţii cunoscute şi mai apoi, hibridizarea acestora pe “chip”-uri microarray.

ANALIZELE SECVENŢELOR MINISATELIT
Metodele cele mai utilizate în prezent sunt cele care se bazează pe investigarea regiunilor minisatelit, înalt polimorfice. În cazul indivizilor care nu sunt înrudiţi, numărul acestor repetiţii diferă şi de aceea pot fi folosite pentru identificare.
Aceşti loci minisateliţi pot fi identificaţi cu primeri specifici, amplificaţi cu ajutorul PCR, separaţi şi vizualizaţi cu ajutorul electoforezei în geluri de agaroză sau mai recent, electroforeza capilară.
Pentru a creşte gradul de precizie al testului efectuat, se analizează un număr de 13 regiuni miniosatelit, ceea ce exclude apariţia unei erori. De exemplu, probabilitatea ca profilul ADN a doi indivizi, obţinut prin această metodă să fie acelaşi este de 1 la un trilion.
În cazul în care se efectuează un test de paternitate se analizează comparativ profilul ADN al mamei, al copilului şi al potenţialilor taţi. Dacă testele sunt criminalistice, se analizează în paralel amprentele ADN ale victimei, ale probei prelevate de la locul faptei şi ale posibililor suspecţi. Se analizează şi ADN prelevat de la victimă pentru a fi siguri că ADN din probă nu a fost contaminat cu ADN de la victimă.
Pentru exemplificare se prezintă în continuare analiza cu un set de primeri care amplifică o regiune microsatelit, iar fragmentele amplificate sunt analizate prin electroforeză (Fig. 6.21 ).

Fig. 6.21. Profilul ADN, utilizat pentru identificarea indivizilor în cazul efectuării testelor de paternitate şi a investigaţiilor criminalistice
În imaginea prezentată, amprenta ADN a copilului (C) este moştenită fie de la mamă (M) fie de la F1, demonstrând ca acesta este tatăl. În amprenta copilului nu sunt prezente fragmente provenind de la F2, ceea ce îl exclude ca fiind potenţial genitor.
În cazul analizelor criminalistice se evidenţiază fără nici un dubiu că amprenta ADN obţinută din proba de analizat provine de la suspectul 1.
O altă tehnică folosită pentru a obţine un profil ADN este AFLP – Amplified Fragment Length Polymorphism (polimorfismul lungimii fragmentelor de restricţie amplificate) (capitolul 6.2.2.2), care a fost dezvoltată la începutul anilor 1990. Evidenţierea diferenţelor dintre alele se bazează pe polimorfismul VNTR, detectat prin amplificări PCR specifice ale ADN. Produşii de amplificare se separă prin electroforeză în gel de poliacrilamidă, ceea ce ar putea conduce la interpretări eronate. De aceea analizele au fost automatizate, mărindu-le gradul de precizie şi eliminând subiectivitatea operatorului.
În situaţiile în care ADN nuclear este prea degradat pentru a fi folosit în analiza PCR a minisateliţilor, se recurge le investigarea ADN mitocondrial (ADNmt). Această strategie este posibilă deoarece într-o celulă numărul de copii al ADNmt depăşeşte de câteva ori ADN nuclear. Criminaliştii amplifică şi secvenţializează două regiuni ale ADNmt, identificând mai apoi diferenţele la nivel de nucleotide. Deoarece ADNmt este moştenit pe cale maternă, poate fi folosit ca referinţă ADN provenit de la rudele materne. O diferenţă de două sau mai multe nucleotide este considerată o excludere.
Acest tip de analize se foloseşte în determinarea identităţii unor persoane dispărute atunci când rudele materne sunt cunoscute. ADNmt poate fi obţinut din fire de păr, oase sau dinţi.

BAZE DE DATE ADN
În prezent există câteva baze de date ADN uman în toată lumea. Unele dintre ele sunt private, dar majoritatea sunt proprietate guvernamentală. Toate aceste baze de date pot fi utilizate pentru compararea amprentelor ADN obţinute din probele prelevate de la locul comiterii unei infracţiuni.
Dovezile pe bază de ADN pot fi falsificate în primul rând prin plasarea la locul infracţiunii de probe false de ADN. Mai mult, procedurile criminalistice care se folosec in prezent nu pot distinge între ADN natural şi cel artificial (obţinut prin amplificare PCR ).

Similar Posts