SELEKCE
Typy selekce
• Positive
• Balancing
• Background
Positive selection
• Výhodná varianta
• Rychlé šíření
• Společný předek nedávno
• → selective sweep
neutral positive
Selective sweep,
hitchhiking
Detekce selekce
• Korelace s prostředím, kliny,
problematické, hlavně extrémní případy
• Proporce funkčních změn
(HKA, Ka/Ks - McDonald-Kreitman test)
• Srovnání rozdílů populací,
FST, srovnání s neutrálními markery
• Snížená diverzita
(Tajima’s D a jiné testy)
• Haplotypové bloky a
vazebná nerovnováha
Kandidátní geny
korelace prostředí x fenotyp x genotyp
pytlouš
Chaetodipus intermedius
Hoekstra, Nachman et al.
• Tmavé a světlé zbarvení
• Odpovídá barvě prostředí (tmavé zbarvení na lávě)
• Arizona
• Korelace zbarvení s prostředím i na malé škále
• mtDNA nekoreluje se zbarvením
• Sekvenování kandidátních genů (známých z inbredních myší)
• melanocortin-1 receptor MC1R
• Záměna 4 aminokyselin
• Jednoduchá dědičnost alel a zbarvení
• Nové Mexiko
• Jiné mutace
• Nekorelují se zbarvením→ jiné geny
• Rapidní konvergentní evoluce
Peromyscus polionotus Mc1r a AgoutiSteiner et al. 2007, 2009
Agouti
zásadní i změna exprese
Interakce Mc1r a Agouti• Jen u části světlých populací
• U pobřeží Atlantiku jiné
mechanismy
MC1R u člověka, mamuta, jeskynních teter a dalších
• U člověka zrzavé vlasy a neschopnost se opálit
• Zbarvení krav, koňů a psů
• Výskyt dvou odlišných variant u mamutů
Storz et al. 2007
Peromyscus maniculatus
α-globin a nadmořská výška
Koljušky Eda lokus and lateral plates
U sladkovodních opakované „vytažení“ jedné alely a rozšíření pomocí selective sweep
Koljušky Chan et al. 2010
Redukce pánve a exprese PitX1
asi nezávislé delece v regulační oblasti
Tetra Astyanax mexicanus
• Oca2
• Albinismus
• Různé delece i regulace
exprese
• → konvergence
Ka/Ks
• Poměr nesynonymních (Ka) a synonymních (Ks) mutací
• Alignment sekvencí stejného genu u více druhů → rozdíly (mutace) → jen některé mutace změní aminokyselinu
• Korekce (rozdílné metody, MEGA, PAML)jen 25 % možných záměn nezmění aminokyselinuněkteré typy mutací častějšízpětné a konvergentní mutace (hlavně u více odlišných sekvencí)
• Většinou Ka/Ks << 1, selekce eliminuje změny, „purifying selection“protein se nemění
• Ka/Ks >> 1 „positive selection“, MHC, reprodukční proteiny
• Různé části proteinu mohou být pod různou selekcí (ABS u MHC)
Srovnání ortologních genů myši a potkana
Reprodukční proteiny
• Skladování a využití
gamet po kopulaci
Kontakt gamet
Fertilizace
• Často rapidní adaptivní evoluce
(nejrychlejší hned po MHC)
SEMG2 u primátůDorus et al. 2004
• Semenogelin, kovalentní vazba → koagulace, rozštípání proteasou kallikrein 3 → uvolnění spermií ze sraženiny
• ω = dN/dS
• Koreluje s počtem sexuálních partnerů, velikostí testes, mírou koagulace
Komplex genů (transmembránových receptorů) odpovědných za aktivaci
adaptivní složky imunitního sytému.
MHC = main histocompatibility complex
Třída I Třída II
Oblast rozeznávající antigen
ENDOGENNÍ
ANTIGENY
VŠECHNY
JADERNÉ
BUŇKY
ANTIGEN
PRESENTUJÍCÍ
BUŇKY
= dendritické buňky,
makrofágy,
B-lymfocyty..
EXOGENNÍ
ANTIGENY
Maintenance of allelic polymorphism
natural selection?
• Disease based mechanisms (host-parasite interactions)
– overdominance hypothesis (=heterozygote advantage) heterozygotes resist a broader array of pathogens than homozygotes
– negative frequency dependent selection hypothesis (=rare allele advantage) – cycling of fitness values of different genotypes in both hosts and pathogens
• Reproductive mechanisms(sexual selection)může být i jen jako vyvarování se inbreedingu
Identification of MHC alleles
• often duplicated and highly heterozygous direct sequencing of
PCR products is not possible
1. PCR of a MHC fragment
2. cloning into the vector
3. sequencing of a number of clones
4. Screening - SSCP
SSCP: single stranded conformational polymorphism
Allele 1
FAM... CGCTTCAGG ...
... GCGAAGTCC ...HEX
Allele 2
FAM... CGCTTAAGG ...
... GCGAATTCC ...HEX
SSCP: single stranded conformational polymorphism
Alternativa
• NGS
• Přesná detekce
• Odhalení více (i vzácných) alel
Promerová et al. 2011
Gallinago mediabekasina větší
Ekblom et al. 2004
• Druhý exon „classIIB genes“ nejpolymorfnějšíčást proteinu odpovědného za vazbu antigenu
• Separace alel → sekvenování
• 119 jedinců, 27 alelU jedince až tři různé alely→ recentní duplikace genu
• ♀♀ nepreferují ♂♂ s odlišným MHCani počet alel nebo heterozygotnost nerozhoduje
• ♂♂ s určitými alelami MHC častěji spárovaní
Gasterosteus aculeatusMilinski et al.
• Recentně duplikované MHC
(class IIB genes)
• Většina jedinců má průměrný počet
alel
• Jedinci s průměrným počtem alel
nejméně parazitování
• ♀♀ preferují ♂♂ tak, aby
optimalizovali počet alel, „spočítají“
vlastní alely a dle vlastního počtu volí
optimálního ♂
Limitace kandidátních genů
• Hit or miss
• Regulace exprese
• Epistáze
• Vliv více genů
Další přístupy
• QTL (vhodné spíše pro laboratorní chovy)
• Celogenomové analýzy
• Transkripce
• Proteiny
(Skoro) celé genomy
• SNPs
• Vybraná místa v genomu, kde je variabilita
• Záměny v jednom nukleotidu
• Ascertainment bias (zkreslení, výběr na základě variability omezeného vzorku)
• Člověk: milióny SNPs z různých populací ve veřejných databázích (HapMap 3 milióny, Perlegen 1.6 miliónu)
Kompletní sekvence genomů
• Zatím většinou jeden genom na druh
→ mezidruhová srovnání pomocí dN/dS
• Člověk – the 1000 genome project
Detekce selekce
u (celo)genomových dat
• Sliding window
• Problém s průkazností
– Populačně genetický model a simulace(nutno znát demografickou historii!)
– Empirická distribuce
– Odchylky od genomového půměru
– druhy s vysokým Ne → větší prostor pro selekci
Drosophila– značná část genomu pod selekcí
Detekce selekce (ze sekvencí)
• Různé metody → různé výsledky
– Artefakty metod (různá kvalita dat)
– Ascertainment bias (platí u SNPs, vybrány markery polymorfní v jedné
populaci → jinde může být jiná situace)
– Různá škála
(dávná či nedávná minulost)
Mezidruhová srovnání
– Phylogenetic shadowingsrovnání divergence daného úseku s divergencí v průměrupuryfying selection → menší divergence
– dN/dS (Ka/Ks)specielní případ: mezidruhová divergence versus vnitrodruhový polymorfismustesty: MK (jeden gen) a HKA (více genů)
• Silná selekce v dávné minulosti, před miliónem let a více
nesynonymní synonymní
FOXP2 Enard et al. 2002
• Schopnost artikulovat
• Nesynonymní versus synonymní mutace
Srovnání 6ti savčích genomůKosiol et al. 2008
Eusocialita u včel a příbuzných (Woodard et al. 2011)
Geny se zrychlenou evolucí
Pyrosekvenování
transkriptomů
• Populační data
• → Změna spektra mutací
frekvence vzácných alel, Tajima’s D , positive versus balancing selection
testů je spousta, např. Fu and Li’s F, Fay and Wu’s H
před 200 tisíci lety a méně
Tajima’s D
• Positive → více vzácných alel
• Balancing → více středně četných
1 segregující místo
párová srovnání:
3x rozdíl, 3x shoda
1 segregující místo
párová srovnání:
4x rozdíl, 2x shoda
Tajima’s D
• Srovnání hodnot dvou odhadů genetické diverzity, θw a π
• π - nukleotidová diverzita, vychází z párových srovnání
• Θw - vychází z počtu segregujících míst
• Test založený na statistice D = (π - θw)/Var(D)
• Pro neutrální sekvence: θw = π. D = 0.
• Při nadbytku vzácných alel θw > π. D < 0. (pozitivní selekce či populační expanze)
• Při nadbytku středně četných alel π > θw. D > 0.(balancing selekce či bottleneck)
Chápani a malpy
Geny pro barevné vidění
L-M opsiny
Balancing selection
CLSPN
• Selective sweep
→ Lokální redukce variability
Populační data
Lokus 3
prodělal selective sweep
• Díky vazbě (LD) lze sledovat selekci i pomocí markerů
(např. mikrosatelitové lokusy) v blízkosti selektovaného genu
• Lokálně selektované varianty (stopy lokální adaptace) vykazují větší
rozdíly mezi populacemi
• Využití FST
Srovnání s neutrálními markeryFST outliers
• Salmo salar (Landry & Bernatchez 2001) Mikrosatelity a MHC (class IIB gene)
• Vyšší párové FST pro MHC
• (Celo)genomová data
• Diferenciace populací, FST
selekce → vyšší FST
outliers
(empirický odhad)
před 80 tisíci lety a méně
• Populační data
• Vazebná nerovnováha (haplotypové bloky)
méně než 30 000 let
LD (bloky)
• Populační data
• Admixture mapping
– výhodné oblasti překonávají snadněji hranice populací
Portoričané – často africké HLA (MHC)
méně než 500 let
Admixture mapping
Africký,
evropský,
americký původ
Příklady positivní selekce (Vitti et al. 2012)
C21orf34
Pickrell et al. 2009
Putative uncharacterized protein
Exprese
• Sledování jednotlivých genů
• Celogenomové metody (celý transkriptom)
– Microarrays
– 454 a jiné „next generation“ techniky
• Nutnost izolace RNA – často problém
• Přepis na stabilnější cDNA
Real-time PCR
• Kvantifikace DNA při amplifikaci
• Většinou srovnání s jiným genem
• I pro parazitémie či koncentrace templátů
Sledování exprese genů
microarrays
• Sledování exprese mnoha (tisíce)
genů najednou
• Založeno na hybridizaci
• Sleduje se rozdíl vůči kontrole
oligo x cDNA microarrays
• Oligo microarraysSyntetizované proby, lepší výsledky, jen u organismů se známým genomem
• cDNA microarraysvyužití ESTs (mRNA je přepsána zpět na DNA)
• EST = expressed sequence tagsosekvenovaná část cDNA, jasně označí o jaký gen se jedná(review Bouck & Vision 2007, Mol. Ecol.)
Populus
trichocarpa x deltoides
a Malacosoma disstria bourovec
Ralph et al. 2006
• cDNA microarray
• 15496 genů > ¾ genomu
• Po 24 hodinách 1191 genů up-regulated537 down-regulated
• Obrana: endochitinázy, inhibitory proteáz
• Signální funkce
• Transport, metabolismus, regulace transkripce
Coregonus
svalyjátra
Energetický
metobolismus
Syntéza
proteinů
Kontrakce svalů
Nástup sekvenačních technik
• Next generation sequencing
• Sekvenování celých transkriptomů
• Zjištění exprese i mutací najednou
• Lze dobře i u nemodelových organismů
Transkriptom štěniceBai et al. 2011
• Rezistence k insekticidům
potvrzení přes Real Time PCR
• Wolbachia
Studium proteinů
Proteiny
• Chromatografie
• Elektroforézy
• Hmotnostní spektrometrie
• Protilátky
MALDI
Coregonus lavaretus a salinitaPapakostas et al. 2012
• Ryby z různých salinit množeny za různých podmínek
• Identifikace proteinů pomocí hmotnostní spektrometrie