Žmogaus genomas

ŽMOGAUS GENOLAPIAI

1996 m. biotechnologijos kompanija “Myriad Genetics” (Salt Lake City, Utah, JAV) pirmą kartą pabandė užpatentuoti BRCA1 geną. Ir tai jiems pavyko! Šiandien daugelis šalių, t. p. ir ES derasi su šia kompanija dėl leidimo tirti sergančiųjų krūties vėžiu BRCA1 geną. Ką gi padarė “Myriad Genetics”? Jos specialistai nustatė, kad BRCA1 genas yra 17-toje žmogaus chromosomoje, apytikriai ilgojo peties viduryje. Vėliau jie šią chromosomos sritį išskyrė ir klonavo. Jie aprašė BRCA1 geną, t.y. nustatė jo kontrolinės dalies ypatybes ir egzoninę // introninę sandarą. Ir pagaliau jie sekvenavo geną, t.y. nustatė jo nukleotidų seką. Kartu su daugeliu kitų mokslininkų ištyrė sergančiuosius krūties vėžiu ir identifikavo tuos geno nukleotidų sekos pakitimus, kurie lėmė ligą, t. y. nustatė dažniausias mutacijas, lemiančias moters krūties vėžį. Ir galiausiai pateikė optimalias genetinio testavimo krūties vėžiui schemas. Taigi kokie šio darbo esminiai etapai?

Pirmiausia reikia nustatyti genomo vietą, kurioje yra ieškomas genas, t. y. atlikti genetinį kartografavimą. Šis darbas nelengvas. Šiandien žinome, kad žmogaus genomą (haploidinį chromosomų rinkinį) ssudaro apie 3,2 milijardo nukleotidų porų, o geno koduojančią dalį sudaro tik apie 3000 n.p. Taigi uždavinys – rasti adatą šieno kupetoje, t. y. nustatyti konkrečią geno buvimo vietą konkrečioje žmogaus chromosomoje.

GENETINIS KARTOGRAFAVIMAS

Genų kartografavimas dažniausiai pradedamas nuo krosingoverio ir genetinių mmainų tarp homologinių chromosomų mejozėje padarinių statistinės analizės. Tokie tyrimai, kuriuos 1913 m. pradėjo T. Morgano mokykla, tebevyksta iki šiol. Pirmieji, nustatę dviejų žmogaus genų išsidėstymą vienas kito atžvilgiu, buvo Julia Bell ir J.B.S. Haldane. Jie nustatė, kad daltonizmo (spalvinio aklumo) genas yra žmogaus X chromosomoje už kelių genolapio vienetų nuo hemofilijos geno (Bell, Haldane, 1937). Dėl krosingoverio ir genetinių mainų susidaro rekombinantinės chromosomos ir rekombinantiniai individai (rekombinantai). Genetinės sankibos ir rekombinantinės analizės pagrindu sudaromi genetiniai genolapiai (jie skiriasi nuo fizinių genolapių).

Tarkime, kad du nealeliniai genai yra toje pačioje chromosomoje netoli vienas kito, dominantiniai tų genų aleliai (D ir E) yra vienoje homologinėje chromosomoje (paveldėtoje iš tėvo), o recesyviniai jų aleliai (d ir e) yra kitoje homologinėje chromosomoje, paveldėtoje iš mmotinos. Tokio asmens genotipas gali būti užrašytas taip:

D d

E e

(čia linijos žymi homologinių chromosomų porą).

Tokį genotipą galima užrašyti ir taip: DE / de. Per mejozę homologinės chromosomos atsiskiria viena nuo kitos ir patenka į skirtingas gametas. 50% tokių gametų turi DE chromosomą ir 50% – de chromosomą.

Tačiau kas atsitiks, jei tiriamieji genai chromosomoje bus vis toliau ir toliau vienas nuo kito, t.y.

D E

d e

arba

D E

d e

arba

D E ?

d e

Kuo genai chromosomoje toliau vienas nuo kito, tuo didesnė tikimybė, kad mejozėje tarp homologinių chromosomų įvys krosingoveris ir genetiniai mainai. TTokiu atveju susidarys dvi gametos su tėviniais genų rinkiniais chromosomose ir dvi gametos su rekombinantinėmis chromosomomis, t.y. D e arba d E. Taigi apskritai susidarys keturių tipų gametos:

D E ir d e, kuriose chromosomos yra kaip ir tėvų (nerekombinantinės ganetos),

D e ir d E, kuriose chromosomos yra rekombinantinės (rekombinantinės gametos).

Tradicinio genetinio kartografavimo pagrindinis principas yra tai, kad kuo toliau chromosomoje yra vienas genas nuo kito, tuo didesnė krosingoverio ir genetinių mainų tikimybė, taigi susidaro didesnė dalis rekombinantinių gametų. Ankstyvuosiuose darbuose buvo įrodyta, kad tarp rekombinacijos dažnio ir atstumo tarp genų yra tiksli priklausomybė:

X rekombinacijos % = X genolapio vienetų.

Taigi 1% rekombinacijos dažnis yra interpretuojamas kaip vienas genolapio vienetas (1 cM). 5% = 5 vnt. ir t. t.

Genai, kuriems būdingas nedidelis rekombinacijos dažnis, t. y. tarp kurių yra nedidelis atstumas, dažniausiai iš kartos į kartą perduodami kartu ir vadinami sukibusiais. Tokie genai sudaro sankibos grupę. Pagal sankibos grupes sudarytas genolapis vadinamas sankibos genolapiu. Pačia didžiausia sankibos grupe galima laikyti visą chromosomą su daugeliu genų.

Krosingoverį, vykstantį tarp homologinių chromosomų (1 pav.), galima pamatyti per mikroskopą. Nors žmogaus ir kitų žinduolių chromosomose susidariusių chiazmų beveik neįmanoma įžvelgti, augalų, vabzdžių ir amfibijų ląstelėse šį procesą nesunku stebėti.

1 pav. Krosingoverio, vykstančio mmejozės I profazėje, schema. Čia homologinės X chromosomos parodytos viena šalia kitos, nors iš tikrųjų jos yra viena prieš kitą ir sudaro bivalentą (žr. chromosomų poros skerspjūvį viršuje)

Imkime tuos pačius genus, kuriuos tyrė ir X chromosomoje lokalizavo J. Bell ir J.B.S. Haldane (1 pav.). Čia pažymėtos dvi alelinių genų poros:

G ir g (normalus ir sutrikusį spalvinį matymą lemiantys genai)

H ir h (normalus ir hemofiliją lemiantis genai).

Paveiksle matyti, kad genetiniuose mainuose dalyvauja tik po vieną neseserinę chromatidę iš abiejų homologinių X chromosomų. Galiausiai susiformuoja keturios moteriškos lytinės ląstelės. Dvi iš jų turi tas pačias motinines chromosomas ir dvi – jau su naujais genų alelių rinkiniais, susidariusiais po genetinių mainų tarp homologinių chromosomų neseserinių chromatidžių:

g h g H G h G H .

mot rek rek mot

Vis dėlto kokie yra svarbiausi reikalavimai, norint nustatyti atstumą tarp genų?

1. Abu tėvai pagal abu tiriamuosius genus turi būti heterozigotiniai. Kitaip nepavyks nustatyti, kurie asmenys yra rekombinantiniai, o kurie ne. Heterozigotinių tėvų palikuonių genotipai gali būti dvejopi:

g G arba g G.

h H H h

nerekomb. vaikai rekomb. Vaikai

Norint teisingai įvertinti rekombinacijos dažnį, reikia žinoti fazę, t. y. kurioje chromosomoje yra konkretus geno alelis. Tik tada bus galima tiksliai nustatyti rekombinantinius palikuonis.

2. Genetikai dažniausiai bando nustatyti tik nedideliu atstumu (dažniausiai mažiau kaip 20 genolapio vienetų (cM)) vienas nuo kito išsidėsčiusius genus. Taip daroma todėl, kad ttarp toliau esančių genų gali susidaryti kelios chiazmos, ir tada rekombinacijos dažnis bus įvertintas neteisingai.

3. Maksimalus rekombinacijos dažnis yra 50%. Net jei susidarytų kelios chiazmos tarp vienas nuo kito nutolusių genų, rekombinacijos dažnis nebūtų didesnis kaip 50%. Maksimalų 50% rekombinacijos dažnį nulemia tai, kad iš keturių chromatidžių tik dvi, sudarančios bivalentą mejozėje (t. y. 50%), dalyvauja genetiniuose mainuose. Svarbu pažymėti, kad tarp dviejų genų, esančių nehomologinėse chromosomose, rekombinacijos dažnis taip pat lygus 50%. Tai lemia G. Mendelio nepriklausomo genų paveldėjimo dėsnis (gametų tipai: ¼ DE; ¼ De; ¼ dE; ¼ de). Dvi iš jų (t. y. 50%) visuomet rekombinantinės, o kitos dvi (50%) – tėvinės. Taigi iš principo nepriklausomai nuo to, ar genai yra labai toli vienas nuo kito homologinėse chromosomose, ar yra nehomologinėse chromosomose, rekombinacijos dažnis bus lygus 50%.

Pasirinkę kartografavimui du nepriklausomus genus, turime:

1) rasti šeimas, kuriose abu tėvai būtų heterozigotiniai pagal tiriamus genus;

2) turime žinoti genų fazę chromosomose ir nustatyti, kaip genai ir chromosomos buvo paveldėti šeimoje;

3) tiriami genai turi būti tokiu atstumu (< 20 cM), kurį galėtume įvertinti. Kadangi iš anksto nežinome, kaip toli vienas nuo kito jie yra, tai dažniausiai sankiba ir nenustatoma. Apskritai, bendras žmogaus chromosomų genetinis ilgis sudaro apie 3700 genolapio vienetų (cM), todėl aptikti sankibą < 20

cM nėra lengva.

Dar daugiau, dviejų genų kartografavimui reikalinga ne viena, o daugelis šeimų, pagal kurias būtų galima statistiškai patikimai įvertinti rekombinantų dalį, ir kurios patenkintų tyrimo reikalavimus.

Iš pradžių buvo tiriami ligų genų atstumai nuo genų, lemiančių kraujo grupes. Pastariesiems būdingas didelis polimorfizmas, todėl ir heterozigotinius asmenis buvo lengviau rasti. Tačiau kraujo grupių skaičius ribotas, todėl jas lemiančių genų kaimynystėje gali būti tik ribotas kitų genų skaičius. Tokie genų sankibos tyrimai buvo išsemti jau apie 1970 metus

Naujas žingsnis kartogrfuojant genus buvo DDNR žymenų atradimas apie 1980 metus. DNR žymenys – tai tam tikros nukleotidų sekos konkrečioje genomo vietoje, kurias galima nustatyti molekuliniais metodais. Vieni iš tokių žymenų grupių yra variabilus tandeminių pasikartojimų skaičius arba VTPS (angl. variable number of tandem repeats, VNTR). Tai dažniausiai 15–35 nukleotidų ilgio daug kartų paeiliui pasikartojančios nukleotidų sekos, pvz., 16 nukleotidų seka AGAGGTGGGCAGGTGG, esanti kiekvieno iš mūsų genome ir būtent nekoduojančiose genomo dalyse. Ji gali pasikartoti keliolika kartų. Pasikartojimų skaičius yra griežtai paveldimas, todėl kiekvieną asmenį ggalima charakterizuoti pagal jo VTPS, t. y. užrašyti jo genotipą, pvz., 16//14.

Kita DNR žymenų grupė yra trumpi tandeminiai pasikartojimai arba TTP (angl. short tandem repeats, STR). Tai trumpos (dažniausiai 2–5 nukleotidų) sekos, paeiliui pasikartojančios 20–30 kartų. Pagal jas taip galima uužrašyti konkretaus asmens genotipą, pvz., 21//22.

Pirmieji DNR žymenys buvo restrikcijos fragmentų ilgio polimorfizmai arba RFIP (angl. restriction fragment length polymorphism, RFLP). Šį polimorfizmo tipą nulemia vieno nukleotido pakaitos restrikcijos endonukleazės (restriktazės) atpažinimo vietoje. Jei restriktazė randa savo atpažinimo vietą (t. y. tam tikrą nukleotidų seką), ji kerpa DNR grandinę. Jei toje vietoje yra įvykusi mutacija ir pakeistas bent vienas nukleotidas, pakinta restriktazės atpažinimo vieta, ir ši nebekerpa DNR grandinės. Kiekvieno asmens genotipas gali būti įvertintas pagal konkrečios restriktazės konkrečios kirpimo vietos buvimą (+) arba nebuvimą (-), t. y. +//+, +//-, -/-.

Dar vienas neseniai atrastas DNR polimorfizmo tipas yra vieno nukleotido polimorfizmas arba VNP (angl. single nucleotide polymorphism, SNP). Šis polimorfizmas žmogaus genome labai dažnas. Pagal jį taip pat galima genotipiškai įįvertinti konkretų asmenį konkrečioje genomo vietoje, t. y. jį pažymėti kaip + arba – pagal konkretų nukleotidą. VNP, kaip ir kitus DNR polimorfizmus, lemia mutacinis procesas, tik šiuo atveju turime įvairias nukleotidų pakaitas. Žmogaus genome nustatytos daugelio VNP, RFIP, TTP, VTPS vietos, ir šiuos DNR žymenis galima panaudoti kaip konkrečius požymius (genetinius žymenis) kartografuojant genus. Belieka surasti šeimas, kuriose tėvai būtų heterozigotiniai pagal analizuojamus požymius, kad būtų galima įvertinti rekombinacijos pastarųjų atžvilgiu dažnį (2 pav.).

2 pav. Nerekombinantiniai (NR) ir rekombinantiniai ((R) individai nealelinių A ir B žymenų atžvilgiu trijų kartų genealogijoje. A1, A2 – A žymens aleliai; B1 ir B2 –B žymens aleliai. Pilkai pažymėtas alelių derinys, kurio kilmę (iš tėvo II1 paveldėta chromosoma) galima nustatyti

Sudarant šiuolaikinius žmogaus genolapius naudojamos referentinės CEPH šeimos. Tai didelės ir turinčios plačias genealogijas mormonų šeimos, gyvenančios JAV Jutos valstijoje. Kiekvieną CEPH šeimą sudaro trys kartos: keturi seneliai, du tėvai ir ne mažiau kaip šeši vaikai. Tokioje šeimoje galima tiksliai nustatyti DNR žymenų fazę, nustatyti, kaip genai, esantys konkrečioje chromosomoje, buvo perduoti per kartas, ir, galiausiai, kurie asmenys konkrečių žymenų poros atžvilgiu yra rekombinantai, o kurie – ne. CEPH šeimų narių ląstelės buvo imortalizuotos, t. y. sukurtos permanentinės ląstelių linijos, palaikomos Žmogaus polimorfizmo tyrimų centre Paryžiuje. Šios ląstelių linijos šiandien naudojamos kaip referentinė medžiaga, pagal kurią galima pasitikrinti gautus rezultatus.

Žmonių šeimos dažniausiai esti labai nedidelės, todėl dažniausiai labai sunku tiksliai įvertinti rekombinacijos dažnį. Tenka remtis statistiniais įverčiais. LOD įvertis yra dviejų tikimybių santykio dešimtainis logaritmas. Iš pradžių nustatomas dviejų tikimybių santykis Zx:

Zx = rezultato tikimybė, kai  = x (yra sankiba) ,

rezultato tikimybė, kai  = 0,5 (nėra sankibos)

kur  yra rekombinacijos dažnis.

Tada apskaičiuojamas šio santykio dešimtainis logaritmas:

LOD=x = log10Zx.

Laikoma, kad tarp tiriamų požymių yra sankiba, kai LLOD įvertis yra 3.

Šiuo metu LOD įverčiui apskaičiuoti gali būti panaudota informacija apie 5264 DNR mikropalydovinius (TTP) žymenis. Iš jų dažniausias yra nuoseklus AC (kitoje DNR grandinėje – TG) dinukleotidų pasikartojimas. Žinoma tiksli 2335 mikropalydovinių žymenų vieta žmogaus genetiniame genolapyje. Ir ne tik konkreti vieta, bet ir nukleotidų sekos aplink šiuos žymenis. Todėl galima parinkti ir susintetinti atitinkamus pradmenis PGR reakcijai ir pagal susidariusių PGR produktų ilgį nustatyti konkretų polimorfizmą (t. y. žymens sekos pasikartojimų skaičių), o tuo pačiu ir genotipuoti konkretų asmenį.

DNR žymenys panaudojami tik kaip pagalbinė priemonė (kaip orientyras) konkrečių ligų genams kartografuoti. Pirmoji liga, kurios genas buvo kartografuotas pasitelkiant DNR žymenis, buvo Hantingtono liga (1983 m.). James Gusella iš Harvardo universiteto su kolegomis ištyrė dideles šeimas, kuriose buvo sergančiųjų HL ir taip nustatė RFIP paveldėjimą konkrečiose šeimose. Jie surado asmenis, heterozigotinius pagal ligos geną ir RFIP:

H h

R1 R2

Šiose šeimose buvo nustatyti rekombinantai:

H h

R2 R1

Taip, panaudojant RFIP tyrimą, HL genas buvo susietas su konkrečiu RFIP, esančiu maždaug 4 cM (genolapio vienetų) atstumu nuo 4-tos chromosomos trumpojo peties telomeros. Vėliau pavyko atrasti DNR žymenis, kurie buvo tik per 1–2 cM (į abi puses) nuo HL geno. Šie žymenys pasitarnavo klonuojant HL geną (jie apribojo DNR sritį, kurioje buvo HL genas).

Grįžtant pprie jau minėto BRCA1geno, reikia pasakyti, kad pirmuosius šio geno kartografavimo rezultatus 1990 metais paskelbė grupė Mary-Claire King vadovaujamų mokslininkų iš Kalifornijos universiteto Berklyje, JAV. Krūties vėžys geno kartografuotojams sudarė daugybę problemų. Daugelyje šeimų buvo tik po vieną sergantį asmenį. Kita vertus, daugelis moterų gali turėti vėžį lemiantį geną, bet nesirgti. Nepaisant visų problemų, M.C. King su bendradarbiais pavyko įrodyti, kad BRCA1 genas yra 17-tos chromosomos q21 ruože maždaug 10 genolapio vienetų (cM) nuo tam tikro VTPS. Pastarajam žymeniui būdingi daugelis alelinių variantų. Buvo rasti aštuoni aleliniai šio žymens variantai: nuo A iki H. Visos sergančiosios krūties vėžiu turėjo E alelį, o moterys, kurios neturėjo E alelio, krūties vėžiu nesirgo (žr. 3 pav.).

Vėliau kiti tyrėjai šį kritinį intervalą susiaurino iki 4 cM, dar vėliau – iki 2 cM ir galiausiai iki 0,6 cM, t. y. buvo rasti žymenys, kurie ribojo BRCA1 geną iš abiejų pusių labai trumpame intervale.

Čia svarbu pažymėti, kad nėra tikslaus atitikimo tarp genetinio genolapio atstumų ir fizinių atstumų, jei juos matuosime bazių poromis arba nanometrais.

1 np = 0,34 nm

Bendras žmogaus genomo genetinis ilgis yra apie 3700 genolapio vienetų, taigi vienam genolapio vienetui (1cM) vidutiniškai tenka apie 800 000 np:

3109 np/ 3700 cM  800 000 np/cM.

3 pav.

Šeimos, kurioje yra sergančiųjų šeiminiu krūties vėžiu (raudoni simboliai), genealogija. Po genealogijos narių simboliais pažymėti genotipai pagal BRCA1 geno VTPS žymens A–H alelius.

FIZINIAI GENOLAPIAI

Vienas iš būdų chromosomoms pavaizduoti yra genetinis jų genolapis, kuriame viena chromosoma pažymėta brūkšniu, o skersinėmis linijomis ar taškais pažymimas atskirų genų ar DNR žymenų išsidėstymas vienas kito atžvilgiu toje chromosomoje. Tai gana abstraktus vaizdas. Kitas chromosomų vaizdavimo būdas yra fiziniai jų genolapiai, kuriuose yra pateikiam linijinė chromosomos struktūra kaip atskirų nukleotidų seka. Tai pats smulkiausias fizinis ggenolapis. Pats grubiausias (stambiausias) – tai chromosomų ruožuotumas arba papildomi citologiniai žymenys, matomi per optinį mikroskopą (pvz., duplikacijos ar kiti matomi chromosomų struktūros persitvarkymai). Tarpinio tipo fizinis genolapis – tai klonuotos DNR fragmentai, išdėstyti eile, atitinkančia tikrąjį DNR sekų išsidėstymą tikroje chromosomoje. Dažnai tarpinio tipo DNR fragmentų dydis yra artimas vidutiniam geno dydžiui (ilgiui). Atskirų genų grupių ilgių pavyzdžiai pateikti 1 lentelėje.

1 lentelė. Kai kurių žmogaus genų dydis ir struktūra

Genai Bendras ilgis (np) Egzoninės dalies ilgis (np) Intronų skaičius

Maži genai

tRNR genai 200 200 0

Apolipoproteino E genas 3600 1200 3

Vidutinio iilgio genai

I tipo kolageno (-1 grandinės) genas 18 000 5000 50

MTL receptoriaus genas 45 000 5500 17

Dideli genai

Fenilalaninhidroksilazės genas (fenilketonurija) 90 000 2400 12

BRCA1 100 000 5600 24

F VIII (hemofilija A) 186 000 9000 26

CFTR (cistinė fibrozė) 250 000 6500 26

Milžiniški genai

Distrofino genas (Diušeno raumenų distrofija) >2 400 000 16 000 >60

Svarbu pažymėti, kad tiksliame fiziniame kartografavime analizuojami DNR fragmentai yra kkur kas mažesni (trumpesni) nei intervalai tarp atskirų DNR žymenų genetiniuose genolapiuose. Tiksliausias fizinis genolapis – tai sekvenuotas DNR fragmentas, t. y. nustatyta ATGC nukleotidų seka DNR grandinėje. Sekvenuoti ištisai visą ištisą chromosomą praktiškai neįmanoma: maksimalus sekvenuojamo fragmento ilgis yra apie 500 nukleotidų. Todėl sekvenavimui tenka klonuoti atskirus chromosomos fragmentus BAC, YAC, PAC arba kituose vektoriuose, perklonuoti vektoriuose su mažesniais DNR intarpais ir tik tada juos sekvenuoti. O jau vėliau išdėlioti tuos 500 np DNR fragmentus ta tvarka, kuria jie yra išsidėstę tikroje chromosomoje. Čia į pagalbą pasitelkiami galingiausi kompiuteriai, kurie ir išdėlioja minėtus fragmentus reikiama tvarka. Taip gaunamos ištisų atskirų chromosomų DNR sekos.

Citogenetiniai tyrimai

Fizinis kartografavimas prasidėjo, kai genetikai sugebėjo priskirti atskirus genus konkrečioms chromosomoms. Iki 1967 metų nei vienas ggenas dar nebuvo priskirtas autosomai (skirtingai nuo X chromosomos), o dabar tokių genų jau tūkstančiai. Šis darbas prasidėjo, kai Mary Weiss ir Howard Green Niujorko universiteto Medicinos mokykloje priskyrė 17-tai chromosomai timidinkinazės geną. Šio geno koduojamas fermentas reikalingas DNR sintezei. Jie panaudojo keistoką technologiją – somatinių ląstelių hibridizaciją. Laboratorijoje atskirai kultivuojamos žmogaus ir pelės somatinės ląstelės. Buvo pabandyta jas sulieti ir gauti hibridinę ląstelę (Ephrussi, Weiss 1969). Žmogaus ir pelės audinių kultūrų ląstelės ilgam buvo paliktos daugintis vienoje Petri lėkštelėje. PPo kurio laiko spontaniškai susidarė hibridinės žmogaus–pelės somatinės ląstelės. Tokie įvykiai labai reti, tačiau šį procesą galima tūkstančius kartų pagreitinti į mitybinę terpę įpylus polietilenglikolio arba inaktyvuoto Sendai viruso. Abiejų ląstelių tipų visos chromosomos susirenka viename hibridinės ląstelės branduolyje, kuris gali sistemingai dalytis mitozėje. Suprantama, kad hibridinėje ląstelėje vyksta abiejų rūšių chromosomose esančių genų raiška, ypač tų genų, kurių produktai būtini DNR sintezei. Besidalijančios hibridinės ląstelės palaipsniui praranda žmogaus chromosomas. Kodėl taip yra – neaišku. Pats chromosomų praradimo procesas yra atsitiktinis. Jis tęsiasi, kol hibridinės ląstelės branduolyje belieka kelios ar tik viena iš žmogaus chromosomų. Šis procesas vyksta tuo pačiu metu skirtingose ląstelėse, ir taip galiausiai susiformuoja daugybė stabilių ląstelių klonų, turinčių skirtingas žmogaus chromosomas. Mažėjant ląstelėje chromosomų skaičiui, mažėja ir hibridinės ląstelės genomo koduojamų baltymų įvairovė. Nustačius, kuri žmogaus chromosoma išliko hibridinėje ląstelėje, belieka palyginti pelės ir hibridinės ląstelės genomų koduojamų baltymų įvairovę. Hibridinės ląstelės baltymai, nebūdingi pelės ląstelei, leidžia teigti, kad juos koduojantys genai yra būtent žmogaus chromosomoje.

Šį metodą ypač ištobulino Frank Ruddle ir jo bendradarbiai (1974) iš Jeilio universiteto, JAV. Jie tyrinėjo fermentą peptidazę C 26 ląstelių klonuose ir nustatė, kad šį fermentą visuomet produkuoja hibridinės ląstelės, turinčios 1-mą žmogaus chromosomą ir niekuomet – jos neturinčios. Aišku, ššis metodas turi daugybę trūkumų, nes tik nežymi baltymų dalis yra ekspresuojama tokio tipo ląstelėse. Nežiūrint to, atskiroms žmogaus chromosomoms pavyko priskirti nemažai genų. Vėliau metodas buvo ištobulintas. Kartu buvo pasinaudota ankstesniais rezultatais. Nustačius, kurią žmogaus chromosomą turi hibridinių ląstelių klonas, išskiriama būtent tos chromosomos DNR. Ši DNR veikiant atitinkama restriktaze sukarpoma į fragmentus, gauti DNR fragmentai elektroforezės gelyje būdu suskirstomi pagal dydį. Dvigrandės DNR fragmentų grandinės atskiriamos (DNR denatūruojama), perkeliamos iš gelio ant neiloninio filtro ir hibridizuojamos su žymėtais žinomos DNR zondais. Viengrandė zondo DNR komplementarumo principu gali hibridizuotis tik su atitinkamais viengrandės DNR fragmentais ant filtro. Belieka pagal zondo žymės signalą surasti, kuriame iš daugelio DNR fragmentų ir daugelio klonų yra mus dominanti DNR seka.

J. Gusella su bendradarbiais, priskirdami HL geną 4-tai chromosomai, pasinaudojo būtent šiuo metodu. Jie atrado RFIP vietą maždaug už 4 cM nuo ligos geno. Pagamintas genetinis zondas, kuris hibridizuojasi būtent su šia RFIP sritimi, buvo pavadintas G8. Jie ištyrė 18 skirtingų žmogaus–pelės hibridinių ląstelių linijų ieškodami, kurioje iš jų yra DNR seka, komplementari G8 genetiniam zondui. Zondai hibridizavosi tik su DNR, išskirta iš hibridinių ląstelių, kurios turėjo 4-tą žmogaus chromosomą.

Kitas savitas ir svarbus fizinio kartografavimo būdas yra fluorescensinės in situ hibridizacijos metodas (FISH). Šio mmetodo pradžia tapo Joseph Gall ir Mary Lou Pardue iš Jeilio universiteto 1969 metais atlikti tyrimai.

Iš pradžių paruošiamas standartinis metafazinių chromosomų preparatas. Toks preparatas paveikiamas fermentais, kurie suardo chromosomų RNR ir baltymus. Lieka nesuardyta chromosomų DNR, kuri tiesiai ant preparato stiklo (in situ) denatūruojama grandinėms atskirti. Toks stiklas su denatūruota chromosomų DNR perkeliamas į tirpalą, kuriame yra specifinės žinomos DNR sekos fragmento ar geno fragmento zondas (taip pat viengrandis). Zondas pažymėtas chemiškai prijungtu fluorochromu, t. y. molekule, kuri, apšviesta ultravioletine šviesa, skleidžia tam tikro bangos ilgio šviesą. Įvairūs fluorochromai chemikalai šviečia skirtingomis spalvomis. Toje vietoje, kur įvyko DNR zondo hibridizacija su chromosomos DNR, per specialų mikroskopą matyti fluorochormo švytėjimas. Taigi šviečiantis taškas žymi chromosomos vietą, kurioje yra ieškoma DNR seka. Taip galima nustatyti atskirų DNR sekų, unikalių genų sekų buvimo vietas konkrečiose chromosomose. Kita vertus, turint specifinį DNR zondą tam tikrai žmogaus chromosomai, galima nustatyti šių chromosomų skaičių interfaziniame branduolyje, t. y. nebereikia analizuoti metafazinių chromosomų.

DNR segmentų eiliškumo nustatymas

Tikslesnis fizinio kartografavimo metodas yra didelių iš dalies persidengiančių DNR fragmentų klonavimas vektoriuose ir šių fragmentų eiliškumo chromosomoje nustatymas. Tokie fragmentai gali būti tarp dviejų restriktazės kirpimo vietų arba dviejų kitų DNR žymenų, kurių atstumas vieno nuo kito buvo nustatytas atliekant sankibos

analizę arba kurių fizinė padėtis chromosomoje buvo nustatyta FISH metodu.

Persidengiančių klonų rinkinys, apimantis genominės DNR sritį (t. y. gretimų klonuotų segmentų rinkinys; angl. contiguous set of cloned segments) vadinamas kontiga (angl. contig) arba gretiniu.

Gretinys – mat. kokių nors elementų junginys, kuris nuo kito skiriasi bent vienu elementu ar elementų tvarka.

Didžiausia problema analizuojant ir sekvenuojant žmogaus genomą yra jo dydis arba net atskiros chromosomos dydis (vidutiniškai 120 Mb). Tai tiesioginiam sekvenavimui neįveikiami dydžiai! Netgi mažiausia žmogaus chromosoma (21-ta chromosoma – aapie 39 Mb) yra per didelė tiesioginei analizei. Kaip jau buvo minėta, didžiausias DNR fragmentas, kurį galima sekvenuoti, yra 500 np. Taigi vienos žmogaus chromosomos sekvenavimui prireiktų apie 240 000 tokių fragmentų. Tačiau ir to nepakaktų, nes, norint nustatyti tų fragmentų eiliškumą, reikia, kad jie persidengtų. Todėl, tiriant žmogaus genomą, buvo pasirinktas hierarchinis fragmentų tyrimo metodas: iš pradžių chromosomos susmulkinamos į labai didelius DNR fragmentus, šie toliau smulkinami (sukarpomi) į vidutinio dydžio fragmentus ir galiausiai kiekvienas iš pastarųjų – į ssmulkius (~500 np) fragmentus, tinkančius DNR sekvenavimui. Šis smulkinimo procesas gali būti atliktas įvairiai. Vieno iš būdų schema pateikta 4 pav.

4 pav. Nuo metafazinės chromosomos ruožo iki DNR nukleotidų sekos. A, B – genetiniai žymenys

Tarkime, tyrinėtoją domina 1–2 MMb ilgio DNR fragmentas, esantis tarp sankibos žymenų A ir B. Galima sukurti tokių fragmentų biblioteką, klonuojant juos YAC vektoriuose. YAC’ai yra dirbtinės mielių chromosos (angl. yeast artificial chromosome). Jos turi keturis elementus, būdingus tikrai eukariotinei chromosomai: 1) telomerą kiekviename gale, 2) centromerą mitozinės verpstės siūlams prijungti, 3) DNR replikacijos pradžios tašką, 4) pakankamo dydžio DNR, į kurią galima įterpti didelius – apie 500 kb ir net didesnius – svetimos DNR fragmentus. Kiti svarbūs klonavimo vektoriai yra dirbtinės bakterijų chromosomos arba BAC’ai (ang. bacterial artificial chromosome). Šie vektoriai stabilesni už YAC’us. Juose galima klonuoti apie 150 kb ilgio svetimos DNR fragmentus. Virusų bakteriofagų dirbtinėse chromosomose PAC’uose (ang. phage artificial chromosome) galima klonuoti yra apie 100 kb ilgio svetimos DNR fragmentus. MMažesniems DNR fragmentams – apie 40 kb – klonuoti naudojamos kosmidės. Į jas dažniausiai perklonuojami susmulkinti YAC’uose arba BAC’uose klonuoti dideli DNR fragmentai.

Gretiniui (contig) suformuoti dažniausiai naudojamos restriktazės. Parinkus tokias sąlygas, kai jos didelį DNR fragmentą sukarpo nevisiškai, gaunamas rinkinys iš dalies persidengiančių mažesnių DNR fragmentų, kurie klonuojami, o vėliau nustatomas tų klonų eiliškumas į juos įterptų DNR fragmentų atžvilgiu. Kad būtų galima tai atlikti, persidengiantys klonai turi būti “paženklinti”, t. y. turėti bendrų žymenų, kuriuos nesunku nustatyti PGR būdu. TTokie žymenys dažniausiai esti žymėtų sekų vietos arba ŽSV (angl. sequence tagget sites, STS). ŽSV sukurti pakanka nustatyti nedidelių (apie 20 np) pasirinkto klono fragmentų nukleotidų sekas maždaug 200 np atsumu, pagal jas susintetinti oligonukleotidinius pradmenis ir PGR būdu pagausinti visą jų ribojamą 200 np fragmentą. Toliau tokio žymens PGR būdu ieškoma kituose dideliuose (500 kb ir didesniuose) klonuotuose fragmentuose, ir pagal jo buvimą (t. y. susintetinamas PGR produktas panaudojus tą pačią pradmenų porą) atrenkami atitinkami persidengiantys klonai. Parinkus kitą ŽSV kitoje didelio DNR fragmento vietoje, surandami su ta dalimi persidengiantys klonai, kol galiausiai “surikiuojamas” visas gretinys, o vėliau – ir keli gretiniai vienas kito atžvilgiu. Žmogaus genome nustatyta kelios dešimtys tūkstančių tokių ŽSV (STS) vietų, ir pagal konkrečius DNR žymenis galima nustatyti, kuriai chromosomai ar net jos segmentui priklauso tiriamas DNR fragmentas. Vidutinis atstumas tarp ŽSV yra apie 200 000 nukleotidų. Tikimasi, kad žmogaus ŽSV skaičius netrukus bus padidintas taip, kad atstumas tarp jų neviršytų 100 000 nukleotidų.

Nukleotidų sekos nustatymas

Nustačius didelių DNR fragmentų, klonuotų YAC, BAC ir PAC vektoriuose, gretinius, jau galima nustatinėti konkretaus klono nukleotidų seką, prieš tai klonuotą DNR fragmentą susmulkinus į 300–500 nukleotidų ilgio fragmentus. Taip buvo gauta didžiulė daugybė DNR fragmentų nukleotidų sekų. Čia ypač ssvarbi bioinformatika ir skaičiavimo technika, nes tik jos pagalba įmanoma gautą informaciją sukaupti, išsaugoti, paskirstyti naudotojams ir analizuoti. Informacijos kiekiai milžiniški, todėl ji dažniausiai saugoma tik kompiuterizuota.

Kas gi buvo sužinota sekvenavus žmogaus DNR? Pasirodė, kad net 97 žmogaus DNR yra nekoduojanti. Tai introninės geno dalys, tarpgeninė DNR ir t. t. Taigi ekspresuojamos DNR dalis yra labai nedidelė, tačiau būtent ją ypač svarbu pirmiausia aptikti ir ištirti ieškant žmogaus genų. Šią DNR dalį atspindi iRNR ar nuo jos susintetinta kDNR. Pastarojoje bus tik geno egzoninė DNR. Šios kDNR molekulės buvo intensyviai tyrinėjamos pagal iRNR, išskirtą iš daugybės žmogaus audinių (J. C. Venter). Net ir kDNR molekulę, jau nebeturinčią nekoduojančių nukleotidų sekų, būtų labai sunku visą sekvenuoti ištisai, nes ji gali būti labai didelė. Todėl mokslininkai sugalvojo, kaip paženklinti įvairius kDNR tipus. Iš kDNR klonų buvo sekvenuota tik po keletą šimtų nukleotidų. Šios sekvenuotos kDNR dalys (segmentai) buvo pavadintos ekspresuotų sekų žymekliais arba ESŽ (angl. expressed sequence tags, ESTs). ESŽ yra genų, kurių raiška vyksta konkrečiame audinyje, žymenys, pagal kuriuos vėliau galima aptikti norimą geną ir priskirti jį vienai ar kitai chromosomai arba jos daliai. Žmogaus genome nustatyta apie keliasdešimt tūkstančių tokių ESŽ. Tai labai veiksmingas genų fizinio kartografavimo metodas. Šių EESŽ skaičius duoda nuorodą į ekspresuojamų genų skaičių (30 000).

Genų, kurių koduojami baltymai sintetinami įvairiuose audiniuose, skaičius labai skiriasi:

1. Smegenys – 3195 ()

2. Leukocitai – 2164 ()

3. Sėklidės – 1232

4. Širdis – 1195

5. Kiaušidės – 504

6. Eritrocitai – 8 () ir t.t. (Adams et al., 1995).

KAIP NUSTATOMI LIGŲ GENAI?

Nemažai genų buvo priskirti tam tikroms chromosomoms ir klonuoti dar iki naujausių fizinio genomo kartografavimo metodų sukūrimo. Tai buvo padaryta taikant funkcinio klonavimo metodą. Šio metodo pagrindas – informacija apie pirminę baltymo struktūrą (aminorūgščių seką), pagal kurią rekonstruojama geno pirminė struktūra. Tokio klonavimo pavyzdys yra globino genų ir spalvinio matymo genų klonavimas.

Nuo 1950 metų buvo žinoma, kad pjautuvinė anemija yra susijusi su viena aminorūgšties pakaita -globino molekulėje. Vėliau buvo suprasta, kaip yra pakitęs baltymas sergant - ir  talasemijomis. Vadovaujantis informacija apie baltymą buvo išskirta iRNR, o vėliau susintetinta kDNR. Pagal kDNR buvo pagaminti genetiniai zondai, kurie leido atskirti - ir  globino genus, juos izoliuoti ir klonuoti. Nustatyta, kad žmogaus -globino genai yra 16-toje chromosomoje, o -globino – 11-toje chromosomoje.

Kai nieko nėra žinoma apie ligos geno koduojamą produktą (baltymą), genui kartografuoti galima pasinaudoti kitu metodu – poziciniu klonavimu. Iš pradžių, pasinaudojant genetiniais žymenimis ir/arba FISH, atliekama sankibos analizė ir nustatoma apytikslė geno vieta

žmogaus genome. Tada konstruojamas klonų gretinys (contig) arba keli gretiniai, kurie apimtų DNR sekas srityje, kurioje, sankibos duomenimis, yra ligos genas. Visi gretinių klonai paeiliui tiriami nustatant jų eiliškumą: “žingsniuojama per chromosomą” (angl. chromosome walking). Kartais nuosekliai “žingsniuoti” nepavyksta dėl didelių pasikartojančių sekų intarpų. Tokius intarpus tenka “peršokti” (angl. chromosome jumping), t. y. peršokti nuo vieno klono prie kito nesiribojančio klono. Taip buvo klonuotas žmogaus cistinės fibrozės genas (CFTR). Vėliau pagal geno struktūrą ir genetinį kodą buvo numatyta baltymo struktūra iir galiausiai surastas ir pats baltymas bei nustatyta jo funkcija.

Kai kurie pozicinio klonavimo metodu identifikuoti žmogaus paveldimų ligų genai pateikti 2 lentelėje.

2 lentelė. Pozicinio klonavimo metodu identifikuoti žmogaus paveldimų ligų genai

Geno nustatymo metai Liga Chromosoma, kurioje nustatytas ligą lemiantis genas

1986 Lėtinė granuliomatozė X

Diušeno raumenų distrofija X

Retinoblastomos 13

1989 Cistinė fibrozė 7

1990 Wilms auglys 11

Neurofibromatozė NF1 17

1991 Lūžiosios X sindromas X

Šeiminė poliposis coli 5

1992 Miotoninė distrofija 19

1993 Hantingtono liga 4

Neurofibromatozė NF2 22

Vilsono liga 13

Adrenoleukodistrofija X

1994 Paveldimas krūties vėžys (BRCA1) 17

Policistinė inkstų liga 16

Achondroplazija 4 <

1995 Paveldimas krūties vėžys (BRCA2) 13

Bloom sindromas 15

Ataxia telangiectasia 11

Akių albinizmas X

1996 Friedrich ataksija 9

Tam tikras pozicinio klonavimo taikymo kartografuojant žmogaus genų būdas yra vadinamasis geno kandidato metodas. Šiuo atveju nustatoma tam tikro ligos fenotipo sankiba su konkrečiu chromosomos regionu, kkuriame jau anksčiau buvo surastas kokį nors baltymą koduojantis genas. Belieka vieną ar kelis genus, esančius tame chromosomos regione, susieti su tiriamos ligos fenotipu, t. y. nustatyti, kad konkretaus baltymo pakitimai dėl jį koduojančio geno mutacijų lemia tiriamos ligos fenotipą. Šiuo atveju ieškoma tiriamojo geno mutacijų ir jas bandoma susieti su ligos fenotipu. Būtent taip buvo surastas Marfano sindromą, Alzheimerio ligą, Šarko-Mari-Tūto ligą lemiantys genai.

Kaip surasti geną nukleotidų sekoje?

Tarkime, klonavome didelį DNR fragmentą, vėliau jį sekvenavome ir jau turime kelių milijonų nukleotidų seką (ATGC..). Kaip nustatyti, kur joje yra genas? Kur yra jo pradžia, pabaiga, egzonai, intronai ir kitos specifinės nukleotidų sekos? Iš kokių požymių galima spręsti, kad būtent čia yra genas?

Pirmiausia galima patikrinti, kaip dažnai toje nukleotidų sekoje pasitaiko sstop kodonai. Dažniausiai tipinio geno tipiniai egzonai yra apie 200 nukleotidų ilgio ir, žinoma, jie neturi stop kodono (kai žmogus sveikas). Kita vertus, jei nukleotidai sekoje išsidėstę atsitiktinai (tai būdinga nekoduojančiai DNR: introninėms geno dalims, tarpgeninei DNR), maždaug kas dvidešimtas nukleotidų trejetas esti atsitiktinis stop kodonas. Palyginti ilgas DNR fragmentas, kuriame nėra stop kodonų, vadinamas atviru skaitymo rėmeliu arba ASR (angl. open reading frame, ORF). Akivaizdu, kad kiekvieną DNR atkarpą reikia perskaityti bent tris kartus pasislenkant per vieną raidę – ppagal visus tris nukleotidų trejetų skaitymo rėmelius, – kad įsitikintume, kuriuo atveju atsitiktinių stop kodonų nėra.

Be abejo, yra daugelis kitų metodų, leidžiančių nukleotidų sekoje įtarti esant geną. Trumpai aptarsime tris iš jų.

1. Zooblotingas. Daugeliui organizmų rūšių būdingi panašios struktūros ir funkcijos genai. Vienas iš pavyzdžių – žmogaus, beždžionių, galvijų, pelių, paukščių žuvų globiną koduojantis genas. Žmogaus krūties vėžio geno BRCA1 DNR hibridizuojasi ir su kitų žinduolių (pelės, žiurkės, triušio, avies ir kiaulės) DNR. Hibridizuojant naujai nustatyto žmogaus geno DNR sekas su žinomais kitų rūšių (gyvūnų) genais, galima identifikuoti tų genų analogus žmogaus genome.

2. CpG salelės. Dėl dar nenustatytų priežasčių maždaug 50 žinomų genų promotoriai yra DNR srityse, kuriose yra žymiai daugiau CpG dinukleotidų. Taigi, aptikus tokių CpG salelių nustatytose DNR sekose, galima įtarti, kad ten prasideda genas, ir taip rasti visą geną. Šios salelės labiau būdingos bendriniams (housekeeping) genams, pvz., tokiems, kurie koduoja ląstelės energetikai būtinus baltymus ir kt. Šias saleles galima atpažinti naudojant restrikcijos fermentus, kurie atpažįsta CpG turinčias nukleotidų sekas (pvz., SacII atpažįsta seką CCGCGG).

3. Egzono įterpimas (angl. exon trapping). Žinoma, kad eukariotų genuose tam tikros nukleotidų sekos žymi introno pradžią ir pabaigą (5 pav.). Intronas, esantis tarp dviejų egzonų (prasminių geno dalių), gali būti labai ilgas. Bręstant nuo ggeno nurašytai RNR, intronai iškerpami, o gretimų egzonų galai sujungiami į daug trumpesnę iRNR molekulę.

5 pav. Egzoninė-introninė geno struktūra. Intronai pašalinami bręstant iRNR (sukirpimas)

Norint nustatyti, ar tiriamajame DNR fragmente yra egzonas, jį galima “įstatyti” raiškos vektoriuje į introną tarp dviejų egzonų ir, atlikus susintetintos RNR elektroforezę, įvertinti iRNR molekulės ilgį. Jei tiriamajame DNR fragmente yra egzonas su atitinkamomis egzono ir introno ribų atpažinimo sekomis, ląstelės RNR sukirpimo sistema jas atpažins, ir į iRNR bus įjungtas svetimos DNR egzonas, padidindamas iRNR ilgį (6 pav., A). Jei tiriamajame DNR fragmente nėra egzono su atitinkamomis egzono ir introno ribų atpažinimo sekomis, visas įterptas svetimos DNR fragmentas sukirpimo metu bus pašalintas su intronu tarp pirmojo ir antrojo egzonų, taigi iRNR ilgis nepasikeis (6 pav., B).

6 pav. Egzono įterpimo schema. A, įterptame DNR fragmente yra egzonas ir atitinkamos atpažinimo sekos. B, įterptame DNR fragmente nėra egzono(ų).

ŽMOGAUS GENOMO SEKOS ANALIZĖS REZULTATAI

Nors žmogaus genomas dar negalutinai sekvenuotas, jau galima jį charakterizuoti, t. y. apytikriai įvertinti dydį, baltymus koduojančią genomo dalį, pasikartojančių DNR sekų dalį genome, CpG salelių išsidėstymą, genetinio ir fizinio genolapio atitikimo mastą ir t.t. Pagrindinius duomenis apie žmogaus genomą gavo Tarptautinis žmogaus genomo konsorciumas ir biotechnologinė kompanija “Celera” (3 lentelė).

Genomas dabar analizuojamas bioinformatikos ppriemonėmis. Sukauptos įvairios duomenų bazės, kurios leidžia nagrinėti ir įvertinti:

– GC pasiskirstymą genome,

– Baigtinį transpozicinių elementų skaičių,

– Padvigubėjusius chromosomų blokus,

– Sintenines žmogaus, pelės ir kitų stuburinių genomų sritis.

Dažniausiai naudojama RefSeq duomenų bazė.

3 lentelė. Žmogaus genomo statistika

Genomo charakteristika Skaitinė reikšmė

1. Genomo dydis 3289 Mb

2. Chromosomų dydžiai:

didžiausia – 1-ma chromosoma 279 Mb

mažiausia – 21-ma chromosoma 45 Mb

X chromosoma 163 Mb

Y chromosoma 51 Mb

3. CpG salelių skaičius 28 890

4. Baltymus koduojančio genomo dalis 1,5%

5. Nustatytų genų skaičius 26 500

6. Visų genų skaičius 31 000

7. Vidutinis genų tankis 9–14 genų/Mb

8. Vidutinis geno dydis 27 kb (genominė DNR)

9. Didžiausias genas (genominė DNR): DMD 2,4 Mb

10. Vidutinis geno nuorašo dydis 1340 bp

11. Didžiausias geno nuorašas: titino geno 80,8 kb

12. Vidutinis geno egzonų skaičius 8,8

13. Vidutinis introno dydis 3365 np

14. Vidutinis vidinio egzono dydis 145 np

15. Vidutinė koduojančioji geno dalis 5%

16. Genomo dalis, kurią sudaro pasikartojantys elementai 44,8%

17. Rekombinacijos dažnis (cM/Mb):

vyrų 0,88

moterų 1,55

abiejų lyčių vidurkis 1,22

Papildomi literatūros šaltiniai:

T. Strachan, A.P. Read. Human Molecular Genetics

● 2nd edition. Oxford, UK: BIOS Scientific Publishers Ltd; 1999.

URL: http://www.ncbi.nlm.nih.gov/books/bv.fcgi?call=bv.View..ShowTOC&rid=hmg.TOC&depth=1

– Chapter 10. Physical and transcript mapping

– Chapter 11. Genetic mapping of mendelian characters

● 3rd edition. 2004, Garland Science:

– Chapter 8. Genome projects and model organisms

– Chapter 13. Genetic mapping of Mendelian characters