Evolutsiooni loengud

36,37

 

 

 

FÜLOGENEESI REKONSTRUEERIMINE II

evolbio loengud 97-36

Võimalike puude arv

 

On lihtne näha, et kolme OTU puhul saab konstrueerida kolm erinevat juurega puud (a,b,c), kuid vaid ühe juureta puu (d):

A 	B	 C	 A	 C	 B	 B	 C	 A	 A	 B

 

 

 

									C

 

a				 b 			c		 d 

 

Bifurkatsiooniliste juurega puude arv (NR) on n OTU jaoks väljendatav lihtsa valemiga:

            (2n - 3)!
NR = ----------------- 
          2n-2 (n - 2) ! 

Juureta puude arv (alates n = 3 ja edasi) on võrdne juurega puude arv ühe võrra väiksema n väärtuse juures. Et illustreerida raskusi, mis tekivad fülogeneetiliste stsenaariumide lahendamisel, on tabelis toodud puude arvu kasv sõltuvalt OTUde arvust kuni 10 taksonini.

 

 

	OTUde arv		 juurega puid 			juureta puid
	2 				1	 		 	1
	3 				3 				1
	4 			       15 				3
	5 			      105			       15
	6 			      954 			      105
	7			    10395 			      954
	8 			   135135			    10395
	9 			  2027025			   135135
	10 			 34495425 			  2027125

 

Siit on ka näha, et igale juureta puule võib vastata mitu juurega puud, kuid suvalisele juurega puule vastab vaid üks juureta puu. Juurega puus on sama OTUde arvu juures enam infot.

Fülogeneetilise puu konstrueerimisel on tavaliselt esimese etapina võimalik saada juureta puu ja siis sellele juur leida. Millist puud valida? Valitakse niisugune puu, mis eeldab minimaalse arvu evolutsioonilisi sündmusi (säästuprintsiip, parsimoonia). Siit tuleneb üks tähtis põhimõte: n objekti puhul võrreldavate omaduste koguarv ei ole iseenesest veel oluline suurus - oluline on see, kas on erinevusi minimaalselt vajalike evolutsiooniliste sündmuste koguarvus kahe erineva topoloogiaga puu vahel. Näitena lihtne puu neljast objektist: inimene, simpans, mustikas ja ritsikas. Nelja objektiga hulk võimaldab konstrueerida 3 juureta puud:

inimene		 mustikas 	inimene 	ritsikas 		inimene 	mustikas

 

 

ritsikas 		simpans 	mustikas 	simpans 	simpans 		ritsikas
		(a)			 			(b)								 ©

Millist neist valida? Võtame mingi tunnuste hulga, mille võrdlemisel näiteks selgub, et nii inimene, kui ka simpans sarnanevad 100 tunnuse osas, mis puuduvad ritsikal ja mustikal. Kui me võrdleme puid a, b ja c, siis näeme, et kui eelistada topoloogiaid a või b, peaksime me eeldama, et need 100 tunnust on inimesel ja simpansil arenenud välja teineteisest sõltumatult, samas kui © juures oleksid need tunnused arenenud välja vaid korra - enne inimese ja simpansi lahknemist. Seega, a ja b puhul oleks meil tegemist kokku minimaalselt 200 evolutsioonilise sammuga, samas kui c puhul oleks neid minimaalselt 100. Seega, säästuprintsiip lubab meil eelistada topoloogiat, kus inimese ja simpansi vaheline tee on lühim. Sõna “minimaalselt” on rõhutatud - miski ei väida, et samme ei võinud olla tegelikult 10000 - meid aga huvitab lihtsaim.

Ja veel - © eelistamiseni võime arvutuslikult jõuda mitmel eri viisil. Me võime opereerida kõigi uuritavate tunnustega (olgu neid näiteks 2000) ja siis leida, et suhteline erinevus on 2100/2200 vms. Teiseks - me võime eelnevalt visata arvutusest välja kohe kõik need tunnused, mis on ritsikale, mustikale, inimesele ja simpansile ühised ja võrrelda siis arvusid 100 ja 200. Siinkohal paistab vahe tühine, kuid keerulistel juhtudel on see viimane tihtipeale ilmekam.

Säästuprintsiip on lihtne ja loogiline põhimõte: evolutsioonilised muutused on ju üsna vähetõenäosed sündmused ja pikemad (paralleelsed ja sõltumatud) teed sama tulemuse saavutamiseks on kiirelt suurenevas tempos üha vähema tõenäosusega. Ja teisalt - kugu geneetika alusmüüriks on teadmine sellest, et järeltulijad on vanematega sarnased. Siiski on vajalikud paar märkust. Kui meil on tegemist ülaltoodud näitega, siis on pilt selge. Kui aga redusteerida ülesanne palju abstraktsemale kujule (nagu see tavaliselt ongi) ja vaadata tunnusena näiteks kahel erineval liigil (isendil) toimunud A muutumist G’ks mingi geeni mingis positsioonis, siis tuleb selle informatiivsuse hindamiseks teada juba märksa rohkemat - peab omama ettekujutust molekulaarse evolutsiooni kiirusest selles geenis, geeni selles osas jne. Kui on tegemist koodoni kolmanda positsiooniga ammu lahknenud liikide esindajate puhul, siis pole midagi ebatõenäost oletuses, et tegemist on paralleelse sündmusega.

Liikide kauguse (sarnasuse) mõiste on aga fülogeneesis määratletud nii, et liik paigutatakse kokku (grupeeritakse) selle liigiga, kellega ta jagab suurima arvu ühiseid tunnuseid. Vaatamata sellele on kauguste statistikale (distance statistics) rajatud meetodid laialt kasutuses, sest paljudel juhtudel on nad lihtsamad ja neis olev info “ei lähe kaduma” - st. kasutatakse ära enam infot.

Muidugi oleks kena, kui säästuprintsiibi ja distantsi alusel saadud fülogeneetilised puud langeksid kokku. Lahknevuse (vastuolu) puhul eelistatakse tavaliselt parsimoonset puud, sest parsimoonia on teoreetiliselt korrektsemal alusel. Viimastel aastatel on ilmunud ridamisi töid, kus on konkreetset fülogeneetilist ülesannet lahendatud paralleelselt mitme meetodiga, samuti spetsiaalseid töid, kus kas otseste eksperimanetaalsete andmete või simulatsioonidega on võrreldud eri meetoditega saadud puid ja tuletatud heuristilisi reegleid, millal kasutada seda ehk teist fülogeneetilise puu tuletamise meetodit.

Reaalsete ülesannete lahendamisel kasutatakse vastuolulisi tulemusi üsna sageli. Osalt on põhjus ka selles, et enamus “lihtsaid” probleeme on juba lahendatud: allesjäänud küsimused ongi oma olemuselt keerulised. Tüüpiliseks on olukord, kus osa tunnustest toetab üht, teine osa teist puud. Küsimus on selles, milliste reeglite alusel kõrvaldada uuringuist need jagatud tunnused, mis on ebasusaldatavad.

Suurim osa klassikalisest fülogeneetiliset tööst on tehtud morfoloogiliste tunnuste võrdlemisel. Siin on oluline eelistada homoloogiat analoogiale (teha vahet homo- ja analoogia vahel). Siinses kontekstis nimetame:

homoloogseks niisugust tunnust, mida kaks või enam liiki jagavad oma ühise esivanemaga;

analoogseks niisugust tunnust, mida jagavad kaks ehk enam liiki, kuid need liigid ei jaga seda oma ühise esivanemaga.

Homoloogiate leidmine on kas triviaalne, ehk siis üpris suurt uurimist nõudev tegevus. Nii näiteks on mammaalide kuulmeluud homoloogsed kalade lõpuste luudega - ilmselt mitte just ilmselge pinnalise vaatluse tasemel. Samas - analoogia võib viia kergesti eksiteele. Kui asetada kõrvuti hunt, kukkurhunt ja känguru ning pidada lisaks silmas, et kaks esimest on röövloomad, siis on kindlasti vaja teada bioloogiat, et aktsepteerida, et känguru ja kukkurhunt on omavahel fülogeneetiliselt palju lähedasemad, kui seda on omavahel kaks hunti.

Ongi nii, et meil ei ole probleeme vaalaskala eristamisel kalast ja nahkhiire ja linnu vahel vahet tegemises - me teame, milliseid tunnuseid pidada analoogiateks, milliseid homoloogiateks. Tegelike probleemide lahendamisel on raskusi küllaga. Homoloogiate puhul tehakse vahet veel tulenenud homoloogia (derived homology) ja eellashomoloogia (ancestral homology) vahel. Neist esimene viitab hiljutisele ühisele eellasele, teine väga ammusele. Viimane võib fülogeneetilistes rekonstruktsioonides olla üsna kasutu. Kalad ja loomad on selgroogsed - selle teadmisega on midagi peale hakata - samas aga tõsiasi, et mõlemad on eukarüoodid, annab vaid kõige laiema ja vähegi detailsemas uuringus kasutu teadmise.

Summas: feneetilised tunnused (feneetiline sarnasus) on seega vaid uurimistöö algus, kõige esimese (ja mitte ainus) vaatluse tulemus. Feneetiline sarnasus - ja seda tuleb rõhutada - on absoluutselt ebapiisav selleks, et rekonstrueerida fülogeneesi. Eelashomoloogia kriitikata kasutamine viib samuti põhimõttelistele vigadele. Niisuguse vea klassikaliseks näiteks on krokodillide, sisalike ja lindude puu joonistamine: krokodillid ja sisalikud muidugi omavad ühiseid esivanemaid, kuid kui uurida nende anatoomiat (ja tänapäeval ka geene) ning fossiilset materjali suure hoolikusega, sis selgub, et krokodillide ja lindude ühine esivanem (see liin) eraldus sisalikkude poole viivast liinist ammu enne, kui lahknesid lindude ja krokodillide harud (joonis).

sisalik krokodill lind sisalik krokodill lind

Seega - füüsiline sarnasus ja (kaugemad) ühised esivanemad põhjustasid siin eksliku arvamuse. Kui kasutada tänapäevast kladistlikku keelepruuki (mida tuleb pidada muidugi soovitavaks), siis kõlab seletus nii: linnud ja krokodillid moodustavad monofüleetilise rühma = neil on ühine esivanem, kes lisaks nimetatutele ei ole ühegi teise taksoni esivanemaks. Tulenenud homoloogilised tunnused peavad andma alati sama topoloogiaga puu.

Juure leidmine

Nagu ülalpool näha, on fülogeneetilise puu konstrueerimise spetsiaalseks probleemiks puu juure leidmine. Siin kasutatakse mitmesuguseid võtteid. Osa neist baseeruvad korrektsel evolutsioonilisel teadmisel, osa aga on "pöidlareegli" kokkulepped.

Välisgrupp on termin, mis tähistab vabalt valitud liiki (taksonit), kes kindlasti paikneb uuritavatest liikidest evolutsiooniliselt väljaspool: võttes eelmise joonise, oleks välisgrupiks näiteks mammaalid. Välisgrupiks neile on aga ka näiteks amööb. Et aga välisgrupp oleks operatsionaalselt kasulik, siis mida lähemal asub ta uuritavatele objektidele, seda parem. Nii näiteks on inimese puhul evolutsiooniliselt lähimateks tänapäeval elavateks liikideks gorilla ja simpans ja sama silmas pidades sobib välisgrupiks orangutang. Primaatide välisgrupiks sobib mõni Vana Maailma pärdik, katarhiinidele platürhiinid jne. Samas - mitte alati ei ole võimalik leida optimaalset välisgruppi. Eriti liigisiseste alajaotuste puhul. Inimrasside puu konstrueerimisel on simpansi kasutatud tüüpilise välisgrupina, kuid ta on kaugel ideaalist, sest Homo sapiens sapiens kui liik on vast 150 000 aastat vana, samas kui lahknemine simpansist toimus 5-7 MAT. Küll aga sobib simpans välisgrupiks seal, kus me vaatame hominiidide (liin, mis sisaldab meie esivanemaid peale lahknemiskohta Aafrika inimahvidest) evolutsiooni tervikuna.

Välisgrupi kasutamine annab tihtipeale võimaluse eristada hiljutisi homoloogiaid eellashomoloogiatest. Vaadates vivipaarseid ja ovipaarseid liike, võib tekkida küsimus sellest, kumb neist (vivipaarsus või ovipaarsus) on eellashomoloogia. Kas nende ühine eelllane oli ovipaarne või vivipaarne? Kui objektideks on hiir, känguru, vares, kilpkonn ja krokodill, siis võttes välisgrupiks kala (samuti vertebraat), võime julgemini oletada, et ovipaarsus oli enne ja viviparsus tekkis vaid liinis, mis viis känguru ja hiireni - ja mitte vastupidi.

Tagasi peatüki algusesse

 

FÜLOGENEESI REKONSTRUEERIMINE III

Makromolekulid kui info allikad fülogeneetilistele

konstruktidele ja rekonstruktsioonidele

evolbio loengud 97-37

Viimased kümmekond aastat on kiiresti arenenud molekulaarsete tunnuste kasutamine fülogeneetilistes rekonstruktsioonideks. Võib koguni öelda, et geenide ja valkude primaarstruktuuri andmestik on muutunud absoluutselt domineerivaks. Eelkõige just andmestik geenide tasemel, sest valkude primaarstruktuuri selgitamine on valdavalt tuletis geeni struktuurist - teades geneetilist koodi (ja splaissingu reegleid seal, kus on tegemist intronitega).

Mis siis tingis sellise pöörde? Palju asjaolusid. Esiteks muidugi meetodite kättesaadavus, õigemini nende avastamine (loomine): geenide sekveneerimine, kloneerimine ja amplifitseerimine.

Kuidas suhtuvad omavahel klassikalised morfoloogilised meetodid ja molekulaarsed? Mingil metatasemel ei ole vahet, kuid prakrtilised erinevused on arvukad ja üsna suured.

Esiteks - primaarstruktuurist tulenevate vahetult kvantitatiivselt hinnatavate tunnuste koguarv on väga palju suurem, kui suvaline morfoloogiliste tunnuste hulk. Vahe on “astronoomiline”: tavalises morfoloogilises võrdluses opereeritakse tosina-paari tunnusega ja harva on neid üle saja. Samas on “keskmise” geeni pikkuseks tuhandeid nukleotiide ja iga neist võib potensiaalselt olla neljas erinevas seisus: A, T, G ehk C. Või siis kogunisti puududa.

Teisalt aga:

Molekulaarsete tunnuste kasutamisel fülogeneetiliseks rekonstruktsiooniks on paljud põhimõtted erinevad: nii näiteks morfoloogia puhul oluline homoloogia/analoogia eritlemise printsiip on üsna vähese väärtusega. Samuti ei ole primaarstruktuuri erinevustest tavaliselt võimalik lugeda välja sõnumit loodusliku valiku mõju kohta: igatahes on see veelgi raskem, kui morfoloogiliste tunnuste vaatlemisel. Võib ju mõnel juhul sedastada, et mingi muudatus aminohappelises järjestuses muutis ensüümi aktiivsemaks, termostabiilsemaks vms. - ja seostada siis see teadmine adaptatsiooni ja valikuga. Kuid igatahes praegusel ajal on niisugune süvalähenemine valdavalt võimatu. Enamgi veel - molekulaarsete tunnuste kasutamise teoreetilised alused soovitavad mitmel puhul eelisobjektideks hoopiski niisuguseid geene, millele loodusliku valiku mõju peaks olema minimaalne.

Ja veel - molekulaarse andmestiku juures võib igat muudatust käsitleda palju suurema õigustusega elementaarse sõltumatu evolutsioonilise muudatusena (NB - geneetiline rekombinatsioon), kui seda tohib (on võimalik) teha morfoloogia puhul.

Kokkuvõttes - molekulaarne andmestik pakub kolossaalse hulga empiirilist andmestikku, mis oma elementaarkujul on võrreldav ja üldistatav üle kogu elusa looduse. Me ei saa kvantitatiivselt võrreldavates terminites kirjeldada osade vertebraatide kopsu ning lülijagsete jala evolutsiooni - samas pole aga mingit raskust võrrelda nende taksonite transport-RNA geenide evolutsiooni.

Parsimooniale ja (geneetilisele) kaugusele baseeruvad meetodid on eriti detailselt arendatud välja just molekulaarse andmestiku jaoks. Ja nende arendamine üha kestab, sest nõuded meetoditele ja algoritmidele, mida saab kasutada kiiretel arvutitel, kasvavad samuti suure kiirusega. Seda mitmel põhjusel, kuid juhtivaks on siin väljaselgitatud nukleotiidsete järjestuste hulga - potensiaalse toormaterjali - pidev kiire kasv.

Nüüdseks ulatub originaalliteratuur molekulaarsete meetodite kasutamisest fülogeneesi ja süstemaatika huvides paljude tuhandete publikatsioonideni. Enamgi veel - ka “tavalised” molekulaarbioloogilised tööd, eriti just uute geenide järjestusi kirjeldavad, sisaldavad viimasel paaril aastal pea alati selle uue geeni fülogeneetilise koha identifikatsiooni.

Selle loengukursuse raames on võimalik peatuda vaid kõige üldisematel põhimõtetel ja terminitel.

Ei tohi ajada segamini molekulaarsete andmete kasutamist fülogeneesi uurimiseks ja (neutraalset) molekulaarset evolutsiooni kui kontseptsiooni (hüpoteesi, teooriat). Tegemist on erinevatel tasapindadel olevate mõistetega. Ühisosa, kui nii üleüldse võib väljenduda, on selles, et suurema osa neutralistliku teooria andmestikust pärineb geenide järjestuste võrdlemisest - samast empiirikast, mis toidab ka fülogeneetiliste rekonstruktsioonide koostamist.

Molekulaarsete andmete kasutamine fülogeneetilisteks rekonstruktsioonideks baseerub ja on võimalik vaid molekulaarse kella olemasolu kontekstis. Molekulaarse kella kontseptsioon oma tavatähenduses väidab, et makromolekulide järjestus muutub evolutsioonilises ajaskaalas lineaarselt. MKK ei väida, et kõik makromolekulid muutuvad ühesuguse kiirusega. Tuleb aga veel lisada, et lineaarsus ei ole iseenesest mingi absoluutne nõue - oluline on hoopis selle kiiruse teadmine. Et aga ebalineaarsusi, eriti veel suisa edasi-tagasi kõikumisi on üsna raske näha, siis on lineaarsus tavaliselt piisavaks lähenduseks seni, kuni pole näidatud ebalineaarsus. Märkusena olgu lisatud, et kella aeglustumist / kiirenemist

Tagasi peatüki algusesse