SELEKCE - Univerzita Karlova · 2016. 4. 27. · Detekce selekce • Korelace s prostředím,...

Post on 15-Dec-2020

0 views 0 download

transcript

SELEKCE

Typy selekce

• Positive

• Balancing

• Background

Positive selection

• Výhodná varianta

• Rychlé šíření

• Společný předek nedávno

• → selective sweep

neutral positive

Selective sweep,

hitchhiking

Detekce selekce

• Korelace s prostředím, kliny,

problematické, hlavně extrémní případy

• Proporce funkčních změn

(HKA, Ka/Ks - McDonald-Kreitman test)

• Srovnání rozdílů populací,

FST, srovnání s neutrálními markery

• Snížená diverzita

(Tajima’s D a jiné testy)

• Haplotypové bloky a

vazebná nerovnováha

Kandidátní geny

korelace prostředí x fenotyp x genotyp

pytlouš

Chaetodipus intermedius

Hoekstra, Nachman et al.

• Tmavé a světlé zbarvení

• Odpovídá barvě prostředí (tmavé zbarvení na lávě)

• Arizona

• Korelace zbarvení s prostředím i na malé škále

• mtDNA nekoreluje se zbarvením

• Sekvenování kandidátních genů (známých z inbredních myší)

• melanocortin-1 receptor MC1R

• Záměna 4 aminokyselin

• Jednoduchá dědičnost alel a zbarvení

• Nové Mexiko

• Jiné mutace

• Nekorelují se zbarvením→ jiné geny

• Rapidní konvergentní evoluce

Peromyscus polionotus Mc1r a AgoutiSteiner et al. 2007, 2009

Agouti

zásadní i změna exprese

Interakce Mc1r a Agouti• Jen u části světlých populací

• U pobřeží Atlantiku jiné

mechanismy

MC1R u člověka, mamuta, jeskynních teter a dalších

• U člověka zrzavé vlasy a neschopnost se opálit

• Zbarvení krav, koňů a psů

• Výskyt dvou odlišných variant u mamutů

Storz et al. 2007

Peromyscus maniculatus

α-globin a nadmořská výška

Koljušky Eda lokus and lateral plates

U sladkovodních opakované „vytažení“ jedné alely a rozšíření pomocí selective sweep

Koljušky Chan et al. 2010

Redukce pánve a exprese PitX1

asi nezávislé delece v regulační oblasti

Tetra Astyanax mexicanus

• Oca2

• Albinismus

• Různé delece i regulace

exprese

• → konvergence

Ka/Ks

• Poměr nesynonymních (Ka) a synonymních (Ks) mutací

• Alignment sekvencí stejného genu u více druhů → rozdíly (mutace) → jen některé mutace změní aminokyselinu

• Korekce (rozdílné metody, MEGA, PAML)jen 25 % možných záměn nezmění aminokyselinuněkteré typy mutací častějšízpětné a konvergentní mutace (hlavně u více odlišných sekvencí)

• Většinou Ka/Ks << 1, selekce eliminuje změny, „purifying selection“protein se nemění

• Ka/Ks >> 1 „positive selection“, MHC, reprodukční proteiny

• Různé části proteinu mohou být pod různou selekcí (ABS u MHC)

Srovnání ortologních genů myši a potkana

Reprodukční proteiny

• Skladování a využití

gamet po kopulaci

Kontakt gamet

Fertilizace

• Často rapidní adaptivní evoluce

(nejrychlejší hned po MHC)

SEMG2 u primátůDorus et al. 2004

• Semenogelin, kovalentní vazba → koagulace, rozštípání proteasou kallikrein 3 → uvolnění spermií ze sraženiny

• ω = dN/dS

• Koreluje s počtem sexuálních partnerů, velikostí testes, mírou koagulace

Komplex genů (transmembránových receptorů) odpovědných za aktivaci

adaptivní složky imunitního sytému.

MHC = main histocompatibility complex

Třída I Třída II

Oblast rozeznávající antigen

ENDOGENNÍ

ANTIGENY

VŠECHNY

JADERNÉ

BUŇKY

ANTIGEN

PRESENTUJÍCÍ

BUŇKY

= dendritické buňky,

makrofágy,

B-lymfocyty..

EXOGENNÍ

ANTIGENY

Maintenance of allelic polymorphism

natural selection?

• Disease based mechanisms (host-parasite interactions)

– overdominance hypothesis (=heterozygote advantage) heterozygotes resist a broader array of pathogens than homozygotes

– negative frequency dependent selection hypothesis (=rare allele advantage) – cycling of fitness values of different genotypes in both hosts and pathogens

• Reproductive mechanisms(sexual selection)může být i jen jako vyvarování se inbreedingu

Identification of MHC alleles

• often duplicated and highly heterozygous direct sequencing of

PCR products is not possible

1. PCR of a MHC fragment

2. cloning into the vector

3. sequencing of a number of clones

4. Screening - SSCP

SSCP: single stranded conformational polymorphism

Allele 1

FAM... CGCTTCAGG ...

... GCGAAGTCC ...HEX

Allele 2

FAM... CGCTTAAGG ...

... GCGAATTCC ...HEX

SSCP: single stranded conformational polymorphism

Alternativa

• NGS

• Přesná detekce

• Odhalení více (i vzácných) alel

Promerová et al. 2011

Gallinago mediabekasina větší

Ekblom et al. 2004

• Druhý exon „classIIB genes“ nejpolymorfnějšíčást proteinu odpovědného za vazbu antigenu

• Separace alel → sekvenování

• 119 jedinců, 27 alelU jedince až tři různé alely→ recentní duplikace genu

• ♀♀ nepreferují ♂♂ s odlišným MHCani počet alel nebo heterozygotnost nerozhoduje

• ♂♂ s určitými alelami MHC častěji spárovaní

Gasterosteus aculeatusMilinski et al.

• Recentně duplikované MHC

(class IIB genes)

• Většina jedinců má průměrný počet

alel

• Jedinci s průměrným počtem alel

nejméně parazitování

• ♀♀ preferují ♂♂ tak, aby

optimalizovali počet alel, „spočítají“

vlastní alely a dle vlastního počtu volí

optimálního ♂

Limitace kandidátních genů

• Hit or miss

• Regulace exprese

• Epistáze

• Vliv více genů

Další přístupy

• QTL (vhodné spíše pro laboratorní chovy)

• Celogenomové analýzy

• Transkripce

• Proteiny

(Skoro) celé genomy

• SNPs

• Vybraná místa v genomu, kde je variabilita

• Záměny v jednom nukleotidu

• Ascertainment bias (zkreslení, výběr na základě variability omezeného vzorku)

• Člověk: milióny SNPs z různých populací ve veřejných databázích (HapMap 3 milióny, Perlegen 1.6 miliónu)

Kompletní sekvence genomů

• Zatím většinou jeden genom na druh

→ mezidruhová srovnání pomocí dN/dS

• Člověk – the 1000 genome project

Detekce selekce

u (celo)genomových dat

• Sliding window

• Problém s průkazností

– Populačně genetický model a simulace(nutno znát demografickou historii!)

– Empirická distribuce

– Odchylky od genomového půměru

– druhy s vysokým Ne → větší prostor pro selekci

Drosophila– značná část genomu pod selekcí

Detekce selekce (ze sekvencí)

• Různé metody → různé výsledky

– Artefakty metod (různá kvalita dat)

– Ascertainment bias (platí u SNPs, vybrány markery polymorfní v jedné

populaci → jinde může být jiná situace)

– Různá škála

(dávná či nedávná minulost)

Mezidruhová srovnání

– Phylogenetic shadowingsrovnání divergence daného úseku s divergencí v průměrupuryfying selection → menší divergence

– dN/dS (Ka/Ks)specielní případ: mezidruhová divergence versus vnitrodruhový polymorfismustesty: MK (jeden gen) a HKA (více genů)

• Silná selekce v dávné minulosti, před miliónem let a více

nesynonymní synonymní

FOXP2 Enard et al. 2002

• Schopnost artikulovat

• Nesynonymní versus synonymní mutace

Srovnání 6ti savčích genomůKosiol et al. 2008

Eusocialita u včel a příbuzných (Woodard et al. 2011)

Geny se zrychlenou evolucí

Pyrosekvenování

transkriptomů

• Populační data

• → Změna spektra mutací

frekvence vzácných alel, Tajima’s D , positive versus balancing selection

testů je spousta, např. Fu and Li’s F, Fay and Wu’s H

před 200 tisíci lety a méně

Tajima’s D

• Positive → více vzácných alel

• Balancing → více středně četných

1 segregující místo

párová srovnání:

3x rozdíl, 3x shoda

1 segregující místo

párová srovnání:

4x rozdíl, 2x shoda

Tajima’s D

• Srovnání hodnot dvou odhadů genetické diverzity, θw a π

• π - nukleotidová diverzita, vychází z párových srovnání

• Θw - vychází z počtu segregujících míst

• Test založený na statistice D = (π - θw)/Var(D)

• Pro neutrální sekvence: θw = π. D = 0.

• Při nadbytku vzácných alel θw > π. D < 0. (pozitivní selekce či populační expanze)

• Při nadbytku středně četných alel π > θw. D > 0.(balancing selekce či bottleneck)

Chápani a malpy

Geny pro barevné vidění

L-M opsiny

Balancing selection

CLSPN

• Selective sweep

→ Lokální redukce variability

Populační data

Lokus 3

prodělal selective sweep

• Díky vazbě (LD) lze sledovat selekci i pomocí markerů

(např. mikrosatelitové lokusy) v blízkosti selektovaného genu

• Lokálně selektované varianty (stopy lokální adaptace) vykazují větší

rozdíly mezi populacemi

• Využití FST

Srovnání s neutrálními markeryFST outliers

• Salmo salar (Landry & Bernatchez 2001) Mikrosatelity a MHC (class IIB gene)

• Vyšší párové FST pro MHC

• (Celo)genomová data

• Diferenciace populací, FST

selekce → vyšší FST

outliers

(empirický odhad)

před 80 tisíci lety a méně

• Populační data

• Vazebná nerovnováha (haplotypové bloky)

méně než 30 000 let

LD (bloky)

• Populační data

• Admixture mapping

– výhodné oblasti překonávají snadněji hranice populací

Portoričané – často africké HLA (MHC)

méně než 500 let

Admixture mapping

Africký,

evropský,

americký původ

Příklady positivní selekce (Vitti et al. 2012)

C21orf34

Pickrell et al. 2009

Putative uncharacterized protein

Exprese

• Sledování jednotlivých genů

• Celogenomové metody (celý transkriptom)

– Microarrays

– 454 a jiné „next generation“ techniky

• Nutnost izolace RNA – často problém

• Přepis na stabilnější cDNA

Real-time PCR

• Kvantifikace DNA při amplifikaci

• Většinou srovnání s jiným genem

• I pro parazitémie či koncentrace templátů

Sledování exprese genů

microarrays

• Sledování exprese mnoha (tisíce)

genů najednou

• Založeno na hybridizaci

• Sleduje se rozdíl vůči kontrole

oligo x cDNA microarrays

• Oligo microarraysSyntetizované proby, lepší výsledky, jen u organismů se známým genomem

• cDNA microarraysvyužití ESTs (mRNA je přepsána zpět na DNA)

• EST = expressed sequence tagsosekvenovaná část cDNA, jasně označí o jaký gen se jedná(review Bouck & Vision 2007, Mol. Ecol.)

Populus

trichocarpa x deltoides

a Malacosoma disstria bourovec

Ralph et al. 2006

• cDNA microarray

• 15496 genů > ¾ genomu

• Po 24 hodinách 1191 genů up-regulated537 down-regulated

• Obrana: endochitinázy, inhibitory proteáz

• Signální funkce

• Transport, metabolismus, regulace transkripce

Coregonus

svalyjátra

Energetický

metobolismus

Syntéza

proteinů

Kontrakce svalů

Nástup sekvenačních technik

• Next generation sequencing

• Sekvenování celých transkriptomů

• Zjištění exprese i mutací najednou

• Lze dobře i u nemodelových organismů

Transkriptom štěniceBai et al. 2011

• Rezistence k insekticidům

potvrzení přes Real Time PCR

• Wolbachia

Studium proteinů

Proteiny

• Chromatografie

• Elektroforézy

• Hmotnostní spektrometrie

• Protilátky

MALDI

Coregonus lavaretus a salinitaPapakostas et al. 2012

• Ryby z různých salinit množeny za různých podmínek

• Identifikace proteinů pomocí hmotnostní spektrometrie