+ All Categories
Home > Documents > HGP CZE 2010 web - che1.lf1.cuni.czche1.lf1.cuni.cz/html/HGP_CZE_2010_web.pdf · Srovn ánígenomu...

HGP CZE 2010 web - che1.lf1.cuni.czche1.lf1.cuni.cz/html/HGP_CZE_2010_web.pdf · Srovn ánígenomu...

Date post: 02-Mar-2019
Category:
Upload: trinhdan
View: 217 times
Download: 0 times
Share this document with a friend
27
1 Sekvenov Sekvenov á á n n í í genom genom ů ů Human Human Genome Genome Project: Project: historie, výsledky a d historie, výsledky a dů sledky sledky MUDr. Jan Pl MUDr. Jan Plá ten tení k, PhD. k, PhD. (Prosinec 2010) Po Počá tky tky sekvenov sekvenování 1965: 1965: přečtena tena sekvence sekvence tRNA tRNA kvasinky kvasinky (80 (80 bp bp) 1977: 1977: vynalezena vynalezena Sangerova Sangerova a a Maxam Maxam & & Gilbertova Gilbertova metoda metoda 1981: 1981: sekvence sekvence lidsk lidské mitochondri mitochondriáln lní DNA (16,5 DNA (16,5 kbp kbp) 1983: sekvence bakteriof 1983: sekvence bakteriofága T7 (40 ga T7 (40 kbp kbp) 1984: Virus 1984: Virus Epsteina Epsteina a a Barrov Barrové (170 (170 kbp kbp)
Transcript

1

SekvenovSekvenováánníí genomgenomůů

HumanHuman GenomeGenome Project: Project:

historie, výsledky a dhistorie, výsledky a důůsledkysledky

MUDr. Jan PlMUDr. Jan Pláátenteníík, PhD.k, PhD.

(Prosinec 2010)

PoPoččáátkytky sekvenovsekvenováánníí•• 1965: 1965: ppřřeeččtenatena sekvencesekvence tRNAtRNA kvasinkykvasinky

(80 (80 bpbp))

•• 1977: 1977: vynalezenavynalezena SangerovaSangerova a a MaxamMaxam & & GilbertovaGilbertova metodametoda

•• 1981: 1981: sekvencesekvence lidsklidskéé mitochondrimitochondriáálnlnííDNA (16,5 DNA (16,5 kbpkbp))

•• 1983: sekvence bakteriof1983: sekvence bakteriofáága T7 (40 ga T7 (40 kbpkbp))

•• 1984: Virus 1984: Virus EpsteinaEpsteina a a BarrovBarrovéé (170 (170 kbpkbp))

2

Homo sapiensHomo sapiens•• 19851985--1990: 1990: diskusediskuse o o sekvenovsekvenováánníí

lidsklidskééhoho genomugenomu–– ““nebezpenebezpeččnnéé”” -- ““nesmyslnnesmyslnéé”” -- ““nemonemožžnnéé””

•• 19881988--1990: 1990: ZaloZaložženen HUMAN GENOME HUMAN GENOME PROJECTPROJECT•• MezinMezináárodnrodníí spoluprspolupráácece:: HUGO (Human HUGO (Human

Genome Organisation)Genome Organisation)•• CCíílele::

–– genetickgenetickáá mapamapa lidsklidskééhoho genomugenomu–– fyzickfyzickáá mapamapa: marker : marker kakažždýchdých 100 100 kbpkbp–– sekvenovsekvenováánníí modelovýchmodelových organismorganismůů (E. coli, S. (E. coli, S.

cerevisiaecerevisiae, C. , C. eleganselegans, Drosophila, , Drosophila, mymyšš))–– objevitobjevit vvššechnyechny lidsklidskéé genygeny ((ppřředpokledpokl. 60. 60--80 80 tistisíícc))–– sekvenovsekvenováánníí celcelééhoho lidsklidskééhoho genomugenomu (4000 (4000 MbpMbp) do ) do

r. 2005r. 2005

DalDalšíší genomygenomy

•• ččervenecervenec 19951995: : HaemophilusHaemophilus influenzaeinfluenzae(1,8 (1,8 MbpMbp)) ... ... PrvnPrvníí genomgenom neznezáávislevisle žžijijííccííhoho organismuorganismu

•• řřííjenjen 1996:1996: SaccharomycesSaccharomyces cerevisiaecerevisiae(12 (12 MbpMbp)) ... ... PrvnPrvníí EukaryotaEukaryota

•• prosinecprosinec 1998: 1998: CaenorhabditisCaenorhabditis eleganselegans(100 (100 MbpMbp)) ... ... PrvnPrvníí MetazoaMetazoa

3

kvkvěětenten 1998:1998:

•• Craig VenterCraig Venter zaklzaklááddáá soukromousoukromoubiotechnologickoubiotechnologickou spolespoleččnostnost CELERA CELERA GENOMICS, Inc.GENOMICS, Inc. a a vyhlavyhlaššujeuje zzáámměěrrsekvenovatsekvenovat celýcelý lidskýlidský genomgenom zaza 3 3 rokyroky a a 300 mil. USD 300 mil. USD metodoumetodou wholewhole--genome genome

shotgunshotgun

•• V V ttéé dobdoběě výsledekvýsledek prpráácece HGP: HGP: sekvenovsekvenováánono ccacca 4 % 4 % lidsklidskééhoho genomugenomu. .

bbřřezenezen 2000:2000:

•• Celera Genomics Celera Genomics & & akadakademiemiččttííspolupracovnspolupracovníícici publikujpublikujíí draft draft genomugenomuDrosophilaDrosophila melanogastermelanogaster (cca 2/3 z 180 (cca 2/3 z 180 MbpMbp))

•• ... ... wholewhole--genomegenome shotgunshotgun lze poulze použžíít i pro velkt i pro velkéégenomygenomy

•• ... ... Lidský ... ... Lidský genomgenom: z: záávod mezi vod mezi HumanHumanGenomeGenome Project a Celera Project a Celera GenomicsGenomics

4

úúnor 2001:nor 2001:

•• International Human Genome International Human Genome Sequencing Consortium Sequencing Consortium publikujepublikujedraft draft lidsklidskééhoho genomugenomu v v ččasopisuasopisuNature 15.2.2001.Nature 15.2.2001.

•• Celera Genomics, Inc. Celera Genomics, Inc. publikujepublikuje svousvousekvencisekvenci lidsklidskééhoho genomugenomu v v ččasopisuasopisu Science 16.2.2001. Science 16.2.2001.

International Human Genome Sequencing International Human Genome Sequencing Consortium (Human Genome Project, HGP)Consortium (Human Genome Project, HGP)

•• OtevOtevřřenoeno spoluprspolupráácici z z kakažžddéé zemzeměě nana svsvěěttěě

•• 20 20 laboratolaboratořříí z USA, z USA, VelkVelkéé BritBritáánienie, , JaponskaJaponska, , FrancieFrancie, , NNěěmeckamecka a a ČČíínyny

•• AsiAsi 2800 2800 lidlidíí, , vedoucvedoucíí: Francis Collins, NIH: Francis Collins, NIH

•• FinancovFinancováánníí z z veveřřejnýchejných zdrojzdrojůů

•• MetodaMetoda: : cloneclone--byby--cloneclone

•• VýsledkyVýsledky: : kakažžddáá sekvencesekvence do 24 do 24 hodinhodin nanaInternet, Internet, ppřříístupstup zdarmazdarma, , ststáálláá aktualizaceaktualizace. .

•• Draft (Nature 15.2.2001): 90 % Draft (Nature 15.2.2001): 90 % euchromatinueuchromatinu (2,95 (2,95 GbpGbp, , celýcelý genomgenom 3,2 3,2 GbpGbp). 25 % ). 25 % definitivndefinitivníí. .

•• DefinitivnDefinitivníí verzeverze: 14.4. 2003 (50 let : 14.4. 2003 (50 let odod objevuobjevu DNA DNA double helix). double helix).

5

CloneClone--byby--cloneclonegenomovgenomováá DNADNA

fragmentyfragmenty ccacca 150 000 150 000 bpbp

klonovklonováánníí v BAC (v BAC (bacterial artificial chromosomebacterial artificial chromosome))

ururččeneníí pozicepozice klonklonůů v v genomugenomu nana zzáákladkladěě fyzickfyzickééhoho mapovmapováánníí(STS (STS -- sequence tagged sitesequence tagged site, , fingerprintfingerprint -- ššttěěpenpeníí restriktrestriktáázamizami))

digescedigesce kakažžddééhoho klonuklonu nana krkráátktkéé fragmentyfragmenty ccacca 500 500 bpbp

sekvenovsekvenováánníí

sestavensestaveníí celceléé sekvencesekvence kakažžddééhoho klonuklonu pomocpomocíí popoččíítataččee

Celera Genomics, Inc.Celera Genomics, Inc.•• SoukromSoukromáá biotechnologickbiotechnologickáá spolespoleččnostnost, ,

Rockville, Maryland, USA. Rockville, Maryland, USA. PrezidentPrezident Craig Venter.Craig Venter.

•• InvesticeInvestice do do automatizaceautomatizace a a popoččíítataččovovééhohozpracovzpracováánníí datdat, , ppáárr desdesíítektek zamzaměěstnancstnancůů

•• MetodaMetoda: : wholewhole--genome shotgungenome shotgun + ale + ale taktakéévyuvyužžititíí zvezveřřejnejněěnýchných datdat z HGP.z HGP.

•• PublikacePublikace v Science 16.2.2001: v Science 16.2.2001: sekvencesekvenceeuchromatinueuchromatinu (2,91 (2,91 GbpGbp) )

•• VýsledkyVýsledky: : hrubhrubáá data data zpzpřříístupnstupněěnana nana www www strstráánknkááchch firmyfirmy, , daldalšíší aktualizaceaktualizace a a anotaceanotace ale ale výluvýluččnněě pro pro komerkomerččnníí úúččelyely. .

6

WholeWhole--genome shotgungenome shotgun

genomovgenomováá DNADNA

fragmentyfragmenty 2, 10, 50 2, 10, 50 kbpkbp

klonovklonováánníí v v plasmidechplasmidech E.coliE.coli

sekvenovsekvenováánníí

sofistikovansofistikovanéé popoččíítataččovovéé metodymetody k k sestavensestaveníí celceléé sekvencesekvence

PokrokPokrok v v sekvenovsekvenováánníí

1985: 500 1985: 500 bpbp //laboratolaboratořř a dena den

ststáálele SangerovaSangerova dideoxynukleotidovdideoxynukleotidováá metodametoda, , aleale

-- mmíístosto gelugelu kapilkapiláárnrníí elektroforesaelektroforesa

-- mmíístosto radioaktivityradioaktivity fluorescencefluorescence

-- úúplnplnáá automatizaceautomatizace a a robotizacerobotizace

-- computer powercomputer power

2000: 175 000 2000: 175 000 bpbp /den (Celera)/den (Celera)

1000 1000 bpbp/sec. (HGP)/sec. (HGP)

7

SekvenovSekvenováánníí genomgenomůů pokrapokraččujeuje......•• LidskýLidský genomgenom nynnyníí:: dokondokonččenen (99 % (99 %

euchromatinueuchromatinu))

•• FuguFugu rubripesrubripes:: draft draft genomugenomu v v srpnusrpnu 20022002

•• MyMyšš::•• Celera Genomics: draft v Celera Genomics: draft v ččervnu 2001ervnu 2001•• Mouse Genome Mouse Genome SequencingSequencing ConsortiumConsortium: : NatureNature, ,

prosinec 2002 prosinec 2002

•• LaboratornLaboratorníí potkanpotkan:: draft v draft v bbřřeznueznu 20042004

•• ŠŠimpanz:impanz: zzáářříí 20052005

•• …… a mnoho da mnoho dalalšíšíchch genomgenomůů:: malmaláárierie((ppůůvodcevodce Plasmodium Plasmodium falciparumfalciparum a a ppřřenaenaššeeččAnopheles Anopheles gambiaegambiae), ), zebrafishzebrafish, , rýrýžžee, , pespes, , krkráávava, ,

ovceovce, , praseprase, , kukuřřee, , vvččelaela, mamut, mamut ad.ad.

VeVeřřejnejněě ppřříístupnstupnéé databdatabááze ze DNA/RNA sekvencDNA/RNA sekvencíí

• GenBank, National Center for Biotechnology Information (NCBI), Bethesda, Maryland, USA

• EMBL-Bank, EMBL's European Bioinformatics Institute, Hinxton, UK

• DNA Data Bank of Japan, National Institute of Genetics, Mishima, Japan

ObsahObsah vvššechech ttřříí databdatabáázzíí v v srpnusrpnu 2005 2005 ppřřekroekroččilil100 000 100 000 000000 000000 ppáárrůů basbasíí (100 (100 GbGb) ) ... z ... z gengenůů/genom/genomůů 165 000 165 000 rrůůznýchzných druhdruhůůorganismorganismůů

8

VýzkumVýzkum v v ““postgenomovpostgenomovéé”” ééřřee•• NovNovéé ppřříístupystupy keke studiustudiu gengenůů a a proteinproteinůů::

•• GENOMIKA GENOMIKA ...... analýzaanalýza celcelééhoho genomugenomu a a jehojeho

expreseexprese

•• PROTEOMIKA PROTEOMIKA ...... analýzaanalýza celcelééhoho proteomuproteomu, , tjtj. .

vvššechech proteinproteinůů tktkáánněě nebonebo organismuorganismu

•• BIOINFORMATIKA BIOINFORMATIKA ...... zpracovzpracováánníí, , analýzaanalýza a a

interpretaceinterpretace velkýchvelkých souborsouborůů datdat (NK a AMK (NK a AMK

sekvencsekvencíí, gene arrays, 3D , gene arrays, 3D strukturystruktury proteinproteinůů atdatd. .

ExperimentyExperimenty in in silicosilico

•• Rychlý vývoj nových technologiRychlý vývoj nových technologiíí::

•• PPřř.. DNA DNA MicroarrayMicroarray –– momožžnost studovat expresi nost studovat expresi tistisííccůů gengenůů najednounajednou

DNA Microarray (DNA Microarray (““ DNA chipDNA chip””))

9

SekvenovSekvenováánníí lidsklidskééhoho genomugenomu::VýsledkyVýsledky

Lidský Lidský genomgenom

HaploidnHaploidníí genomgenom: 3 miliardy p: 3 miliardy páárrůů bazbazíírozdrozděělenlenéé do 23 chromosomdo 23 chromosomůů

•• 1 metr DNA p1 metr DNA přři max. roztai max. roztažženeníí

•• 750 750 MbMb (1 CD)(1 CD)

•• 2 mili2 milióóny ny normostrannormostran A4A4

Obr.: Bolzer et al. 2005, PLoS Biol. 3(5): e157 DOI: 10.1371/journal.pbio.0030157

(50 (50 úúhozhozůů//řřáádek, 30 dek, 30 řřáádkdkůů/strana)/strana)

10

KlasifikaceKlasifikace eukaryotickeukaryotickéé genomovgenomovéé DNA:DNA:

•• podlepodle ““sbalenostisbalenosti””::•• euchromatineuchromatin•• heterochromatinheterochromatin

•• podlepodle opakovopakováánníí::•• vysocevysoce repetitivnrepetitivníí•• ststřřednedněě repetitivnrepetitivníí•• nerepetitivnnerepetitivníí

•• podlepodle funkcefunkce::•• strukturnstrukturníí ((centromerycentromery, , telomerytelomery))

•• kkóódujdujííccíí (protein (protein nebonebo RNA)RNA)•• neknekóódujdujííccíí

–– regularegulaččnníí oblastioblasti

–– spacer, spacer, ““junk DNAjunk DNA””, , ““selfish DNAselfish DNA””

ExperimentyExperimenty s s denaturacdenaturacíí & & reasociacreasociacíí DNADNA::

•• RychlRychláá reasociacereasociace (10(10--15%): 15%): •• simplesimple--sequence DNA: sequence DNA:

•• heterochromatin v heterochromatin v okolokolíí telomertelomer a a centromerycentromery

•• satelitysatelity, , minisatelityminisatelity..

•• StStřřednedněě rychlrychláá reasociacereasociace (25(25-- 40%): 40%): •• intermediateintermediate--repeat DNA (repeat DNA (mobilnmobilníí elementyelementy, ,

tratrannspospozzonyony))•• tandemovtandemověě zmnozmnožženenéé genygeny pro pro rRNArRNA, , histonyhistony

•• PomalPomaláá reasociacereasociace (50(50-- 60%):60%):•• singlesingle--copy DNAcopy DNA

•• genygeny•• ostatnostatníí neklasifikovanneklasifikovanáá spacer DNA spacer DNA

11

KlasifikaceKlasifikace eukaryeukaryooticktickéé genomovgenomovéé DNA:DNA:

•• GenyGeny kkóódujdujííccíí proteinyproteiny

•• TandemovTandemověě zmnozmnožženenéé genygeny kkóódujdujííccíírRNArRNA, , tRNAtRNA a a histonyhistony

•• RepetitivnRepetitivníí DNA DNA

•• NeklasifikovanNeklasifikovanáá spacerspacer DNADNA

KlasifikaceKlasifikace eukaryeukaryooticktickéé genomovgenomovéé DNA:DNA:

•• GenyGeny kkóódujdujííccíí proteinyproteiny

•• asiasi 25 %25 % genomugenomu, z , z tohotoho ale ale jenjen 5 % 5 % (1,4 % (1,4 % genomugenomu) ) ppřřipadipadáá nana exonyexony

•• TandemovTandemověě zmnozmnožženenéé genygeny kkóódujdujííccíírRNArRNA, , tRNAtRNA a a histonyhistony

•• RepetitivnRepetitivníí DNA DNA

•• NeklasifikovanNeklasifikovanáá spacerspacer DNADNA

12

RozmRozmííststěěnníí gengenůů v v genomugenomu nenneníí rovnomrovnoměěrnrnéé

•• VelkVelkéé rozdrozdíílyly mezimezi chromosomychromosomy::

•• chromosomchromosom 1: 2968 1: 2968 gengenůů

•• chromosomchromosom Y: 231 Y: 231 gengenůů

•• oblastioblasti bohatbohatéé nana genygeny ((““mměěstasta””) )

-- vvíícece C a GC a G

•• oblastioblasti chudchudéé nana genygeny ((““poupouššttěě””) )

-- vvíícece A a TA a T

•• CpGCpG ostrostrůůvkyvky -- ““baribariéérara mezimezi mměěstysty a a

poupouššttěěmimi”” ... ... regulaceregulace genovgenovéé aktivityaktivity

•• SolitSolitáárnrníí gengen: : •• v v celceléémm genomugenomu v v jedinjedinéé kopiikopii ((asiasi polovinapolovina

gengenůů))

•• GenovGenováá rodinarodina::•• skupinaskupina gengenůů evoluevoluččnněě pochpocháázejzejííccíí z z jedinjedinééhoho

genugenu, v , v evolucievoluci postupnpostupnáá diverzifikacediverzifikacesekvencesekvence a a funkcefunkce

•• PseudogenPseudogen::•• gengen kterýkterý zmutovalzmutoval natoliknatolik žžee nemnemůžůžee býtbýt

ppřřepisovepisováánn (v (v celceléémm genomugenomu > 20 000 !) > 20 000 !)

•• ZpracovanýZpracovaný ((““processedprocessed””) ) pseudogenpseudogen::•• pseudogenpseudogen vzniklývzniklý zpzpěětnýmtným ppřřepisemepisem mRNA a mRNA a

integracintegracíí do do genomugenomu

13

PoPoččetet gengenůů v v lidsklidskéémm genomugenomu

20 000 20 000 20 000 20 000 20 000 20 000 20 000 20 000 -------- 25 00025 00025 00025 00025 00025 00025 00025 000MnohemMnohem mméénněě nenežž se se ččekaloekalo!!

... ... neodpovneodpovííddáá komplexitkomplexitěě organismuorganismu::

SacchSacch. . cerevisiaecerevisiae 6 000 6 000 gengenůů

C. C. eleganselegans 18 000 18 000 gengenůů

Drosophila Drosophila 13 000 13 000 gengenůů

Arabidopsis thalianaArabidopsis thaliana 26 000 26 000 gengenůů

14

SrovnSrovnáánníí genomugenomu ččlovlověěka/myka/myššii s s genomygenomyninižžšíšíchch organismorganismůů ((C.elegansC.elegans, Drosophila):, Drosophila):

•• menmenšíší hustotahustota gengenůů, , deldelšíší intronyintrony

Obr: Obr: LodishLodish, H. et al.: Molecular Cell Biology (5th ed.), , H. et al.: Molecular Cell Biology (5th ed.), W.H.FreemanW.H.Freeman, New York 2004. , New York 2004.

JakJak se se hledajhledajíí genygeny v v genomechgenomech::

•• BakterieBakterie, , kvasinkykvasinky::•• open reading frames (open reading frames (ORFsORFs))

•• VyVyššíšší organismyorganismy::•• hybridizace/srovnhybridizace/srovnáánníí s s cDNAcDNA nebonebo EST EST

(expressed sequence tag = (expressed sequence tag = ččáástst cDNAcDNA))

•• podobnostpodobnost se se znznáámýmimými genygeny

•• hledhledáánníí rozpoznrozpoznáávacvacííchch sekvencsekvencíí pro pro mmíístastasestsestřřihuihu

•• podobnostpodobnost s s genomygenomy jinýchjiných organismorganismůů

15

•• jenjen asiasi 7 % 7 % proteinovýchproteinových domdoméénn zcelazcelanovnovýchých u u obratlovcobratlovcůů, ale, ale•• expanse expanse proteinovýchproteinových rodinrodin

•• slosložžititěějjšíší architekturaarchitektura proteinproteinůů, , novnovéékombinacekombinace domdoméénn a a vvíícece domdoméénn/ protein/ protein

•• vvíícece proteinproteinůů z z jednohojednoho gengenůů -- alternativnalternativníísestsestřřihih aažž v 60 % v 60 %

SrovnSrovnáánníí genomugenomu ččlovlověěka/myka/myššii s s genomygenomyninižžšíšíchch organismorganismůů ((C.elegansC.elegans, Drosophila):, Drosophila):

•• expanse expanse gengenůů //novnovéé genygeny se se vztahemvztahem k:k:

•• srsráážženeníí krvekrve

•• zzíískanskanáá ((specifickspecifickáá) ) imunitaimunita

•• nervovýnervový systsystéémm

•• intraintra-- a a intercelulinterceluláárnrníí komunikacekomunikace

•• kontrolakontrola genovgenovéé expreseexprese

•• programovprogramováá bunbuněčěčnnáá smrtsmrt ((apoptosaapoptosa))

16

KlasifikaceKlasifikace eukaryotickeukaryotickéé genomovgenomovéé DNA:DNA:

•• GenyGeny kkóódujdujííccíí proteinyproteiny

•• TandemovTandemověě zmnozmnožženenéé genygeny kkóódujdujííccíírRNArRNA, , tRNAtRNA a a histonyhistony•• lzelze ttééžž řřaditadit mezimezi ststřřednedněě repetitivnrepetitivníí DNADNA

•• vvíícece stejných kopistejných kopiíí gengenůů za sebou, za za sebou, za úúččelem elem vvěěttšíší produktivity transkripceproduktivity transkripce

•• geny pro geny pro ribosomribosomáálnlníí RNA u RNA u eukaryoteukaryotůů: : >100 >100 kopikopiíí

•• RepetitivnRepetitivníí DNADNA

•• NeklasifikovanNeklasifikovanáá spacerspacer DNADNA

KlasifikaceKlasifikace eukaryeukaryooticktickéé genomovgenomovéé DNA:DNA:

•• GenyGeny kkóódujdujííccíí proteinyproteiny•• TandemovTandemověě zmnozmnožženenéé genygeny kkóódujdujííccíí

rRNArRNA, , tRNAtRNA a a histonyhistony•• RepetitivnRepetitivníí DNADNA

•• simplesimple--sequence DNA:sequence DNA: vysocevysoce repetitivnrepetitivníí, 3% z , 3% z euchromatinueuchromatinu ((minisatelityminisatelity) + ve) + vešškerý kerý heterochromatinheterochromatin ((centromerycentromery, , telomerytelomery, 8 % , 8 % genomugenomu, st, stáále le nesekvenovnesekvenováánn))

•• interspersedinterspersed repeatsrepeats (st(střřednedněě repetitivnrepetitivníí DNA) DNA) = mobiln= mobilníí elementy elementy ((transpozonytranspozony),), 45 % z 45 % z euchromatinueuchromatinu

•• NeklasifikovanNeklasifikovanáá spacerspacer DNADNA

17

MobilnMobilníí elementyelementy ((transpozonytranspozony):):

Obr: Obr: LodishLodish, H. et al.: Molecular Cell Biology (5th ed.), , H. et al.: Molecular Cell Biology (5th ed.), W.H.FreemanW.H.Freeman, New York 2004. , New York 2004.

MobilnMobilníí ((parazitickparazitickéé) ) elementyelementy v v savsavččíímm genomugenomu::•• LINEsLINEs (long(long--interspersed repeats), interspersed repeats),

•• 66--8 kb, 8 kb, ppřř. L1, . L1, kkóódujdujíí 2 2 proteinyproteiny ( 1 ( 1 jeje reversnreversníítranskripttranskriptáázaza))

•• SINEsSINEs (short(short--interspersed repeats), interspersed repeats), •• 100100--300 300 bpbp, , ppřř. . AluAlu, , neknekóódujdujíí nicnic, , mnomnožženeníí zzáávisvisíí nana

LINEsLINEs, , ppůůvodvod: z : z malýchmalých neknekóódujdujííccííchch bunbuněčěčnýchných RNARNA

•• VirovVirovéé retrotranspozonyretrotranspozony•• 66--11 kb (11 kb (nebonebo kratkratšíší), ), retroviryretroviry bez genu pro bez genu pro

proteinový obal (proteinový obal (envenv))

•• DNA DNA transpozonytranspozony•• 22--3 kb (3 kb (nebonebo kratkratšíší), ), kkóódujdujíí transposasutransposasu, cut , cut & paste & paste

nebonebo copy & paste v copy & paste v genomugenomu bezbez ppřřepisuepisu do RNAdo RNA

18

Census Census parazitickýchparazitických elementelementůů v v lidsklidskéémm genomugenomu::LINEsLINEs: : 850 000x 850 000x 21 % 21 % genomugenomu

SINEsSINEs: : 1 500 000x 1 500 000x 13 % 13 % genomugenomu

RetrovirusRetrovirus--like: like: 450 000x450 000x 8 % 8 % genomugenomu

DNA DNA transpozonytranspozony: : 300 000x 300 000x 3 % 3 % genomugenomu

•• V V celceléémm genomugenomu jenjen malýmalý popoččetet aktivnaktivnííchch LINEsLINEs a a endogennendogennííchch retrovirretrovirůů. .

•• VVššee ostatnostatníí: : starstaréé, , mutovanmutovanéé a a neaktivnneaktivníí ““molekulmolekuláárnrníífossiliefossilie””..

•• V V genomugenomu mymyššii aktivnaktivnííchch transpozontranspozonůů mnohemmnohem vvíícece(...(...propročč?). ?).

VýznamVýznam transpozontranspozonůů v v lidsklidskéémm genomugenomu

•• NamnoNamnožženeníí ttěěchtochto elementelementůů v v genomugenomu: : vevevvíícece vlnvlnááchch ddáávnovno v v evolucievoluci, , momožžnnáá jeješšttěěppřředed radiacradiacíí savcsavcůů nana zazaččáátkutku ttřřetihoretihor

•• ZodpovZodpovíídajdajíí zaza ččáástst spontspontáánnnnííchch mutacmutacíí(1:600 (1:600 u u ččlovlověěka)ka)

•• Pro Pro jedincejedince jeje aktivitaaktivita transpozontranspozonůůnegativnnegativníí ((momožžnnáá inaktivaceinaktivace gengenůů))•• ... ... transposicetransposice L1 (L1 (LINEsLINEs) ) dokumentovdokumentováánana jakojako

vzvzáácncnáá ppřřííččinaina genetickýchgenetických chorobchorob u u ččlovlověěkaka

19

•• Ale pro Ale pro vývojvývoj druhudruhu zzřřejmejměě pozitivnpozitivníí•• RepetitivnRepetitivníí elementyelementy -->> vvíícece rekombinacrekombinacíí --> > urychlenurychleníí

evoluceevoluce

•• ZpZpěětnýtný ppřřepisepis mRNA mRNA -- ““processed processed pseudogenespseudogenes”” ((nněěkdykdy

vzniknevznikne funkfunkččnníí gen)gen)

•• AluAlu ((SINEsSINEs) ) -- vyvyššíšší výskytvýskyt v v oblastechoblastech bohatýchbohatých nana genygeny, , momožžnnáá kkóódujdujíí RNA RNA molekulumolekulu s s funkcfunkcíí v v bubuňňcece ........AluAlu

sekvencesekvence podobnpodobnáá RNA RNA zeze SRP (signal recognition particle) SRP (signal recognition particle)

Obr: Obr: LodishLodish, H. et al.: Molecular Cell Biology (5th ed.), , H. et al.: Molecular Cell Biology (5th ed.), W.H.FreemanW.H.Freeman, New York 2004. , New York 2004.

KlasifikaceKlasifikace eukaryeukaryooticktickéé genomovgenomovéé DNA:DNA:

•• GenyGeny kkóódujdujííccíí proteinyproteiny

•• TandemovTandemověě zmnozmnožženenéé genygeny kkóódujdujííccíírRNArRNA, , tRNAtRNA a a histonyhistony

•• RepetitivnRepetitivníí DNADNA

•• NeklasifikovanNeklasifikovanáá spacerspacer DNA:DNA:•• nerepetitivnnerepetitivníí, , neknekóódujdujííccíí, , ccacca ččtvrtinatvrtina genomugenomu. .

ZZřřejmejměě mrtvmrtvéé transpozonytranspozony taktak mutovanmutovanéé žžeenejsounejsou popoččíítataččemem rozpoznrozpoznáányny

Naprostá většina naší DNA vzniklareversní transkripcí retrotranspozonů

20

Single Nucleotide Polymorphism (SNP)Single Nucleotide Polymorphism (SNP)

SNP se vyskytuje cca 1x na 1000 SNP se vyskytuje cca 1x na 1000 bpbp v v

sekvencsekvencíích ch dvoudvou nepnepřřííbuzných buzných lidskýchlidských

bytostbytostíí (0,1 % (0,1 % genomugenomu))

Asi 10 miliAsi 10 milióónnůů SNP s výskytem SNP s výskytem >1%>1%

KKóódujdujííccíí/nek/nekóódujdujííccíí

Strukturu proteinu mStrukturu proteinu měěnníí/nem/neměěnníí

A G A G T T C T G C T C G

A G G G T T C T G C G CG

LidskLidskáá genetickgenetickáá variavariabilitabilita

•• Dva nepDva nepřřííbuznbuzníí lidlidéé majmajíí 9999,,5% 5% genomugenomuidentickidentickéé•• Single Nucleotide Polymorphism: 0Single Nucleotide Polymorphism: 0,,1%1%•• Copy number variation (Copy number variation (inserinsercece, dele, delecece, ,

dupliduplikacekace): 0): 0,,4% 4% •• EpigenetiEpigenetikaka ((metylametylacece))•• VariaVariacece popoččtu tandemových repetictu tandemových repetic

((……““DNA fingerprintingDNA fingerprinting““))

21

SekvenovSekvenováánníí lidsklidskééhoho genomugenomu::DDůůsledkysledky

PPřříínosnos sekvenovsekvenováánníí genomgenomůů

•• MilnMilnííkk v v historiihistorii lidstvalidstva

•• UsnadnUsnadněěnníí výzkumuvýzkumu molekulmolekuláárnrníí podstatypodstatychorobchorob•• ““virtuvirtuáálnlníí klonovklonováánníí”” in in silicosilico mmíístosto zdlouhavzdlouhavééhoho

pozipoziččnnííhoho klonovklonováánníí a a sekvenovsekvenováánníí

•• MolekulMolekuláárnrníí medicmedicíínana•• dg. dg. nana úúrovnirovni gengenůů, , ččasnasnáá detekcedetekce predispozicepredispozice k k

ururččitýmitým chorobchorobáámm

•• genovgenováá terapieterapie

•• momožžnostnost stanovenstanoveníí individuindividuáálnlníí senzitivitysenzitivity k k

rizikovýmrizikovým faktorfaktorůůmm v v prostprostřřededíí ((radiaceradiace, , mutagenymutageny) )

22

PPřříínosnos sekvenovsekvenováánníí genomgenomůů

•• NovNovéé ccíílele pro pro farmakoterapiifarmakoterapii•• vvššechnyechny dosuddosud znznáámméé lléékyky -- interakceinterakce jenjen asiasi s s

500 500 proteinovýmiproteinovými molekulamimolekulami !!!!!!

•• FarmakogenomikaFarmakogenomika•• jakjak individuindividuáálnlníí genetickgenetickáá informaceinformace ovlivovlivňňujeuje

reakcireakci nana llééččbubu ... ... momožžnostnost ““terapieterapie uuššititéé nana mmííruru””

pro pro kakažžddééhoho pacientapacienta

•• StudiumStudium evoluceevoluce a a migracemigrace lidsklidskééhoho druhudruhu

•• Co Co vlastnvlastněě genomgenom kkóódujeduje ((““nature vs. nature vs. nurturenurture””) a ) a jakjakéé SNPsSNPs zodpovzodpovíídajdajíí zaza rozdrozdíílylymezimezi lidmilidmi

PPřříínos nos sekvenovsekvenováánníí genomgenomůů::Kde jsme teKde jsme teďď??

•• PPřřekotný vývoj technologiekotný vývoj technologiíí pro pro dostupndostupnéé sekvenovsekvenováánnííindividuindividuáálnlníích ch genomgenomůů

•• Výzkum a poVýzkum a poččáátky vyutky využžititíí SNPSNP

23

SeSekvenovkvenováánníí se musse musíí ststáát jet ješšttěě rychlejrychlejšíší a lacina laciněějjšíšíaby mohlo být vyuaby mohlo být využžíívvááno v bno v běžěžnnéé zdravotnzdravotníí ppééččii......

•• J. Craig Venter Science Foundation, 2003:J. Craig Venter Science Foundation, 2003:•• $ 500$ 500 000 Genomic Technology Prize000 Genomic Technology Prize ...... pro vynpro vynáálezce lezce

novnovéé technologie technologie sekvenovsekvenováánníí schopnschopnéé ppřřeeččííst savst savččíí genomgenom<$ 1000<$ 1000

•• X X PrizePrize FoundationFoundation, 2006:, 2006:$ 10$ 10 000000 000000 ArchonArchon X X PrizePrize forfor GenomicsGenomics propro

““prvnprvníí tým který postavtým který postavíí zazařříízenzeníí a a úúspspěěššnněě poupoužžije ije k k sekvenovsekvenováánníí 100 lidských 100 lidských genomgenomůů za dobu 10 dnza dobu 10 dníínebo kratnebo kratšíší, s p, s přřesnostesnostíí maximmaximáálnlněě jednjednéé chyby na chyby na kakažždých 100 000 dých 100 000 sekvenovanýchsekvenovaných bazbazíí, tak aby , tak aby výslednvýslednéé sekvence pokrývaly nejmsekvence pokrývaly nejméénněě 98% 98% genomugenomu, a s n, a s nááklady ne vklady ne vííce nece nežž $10 000$10 000 na jeden na jeden genomgenom..””

SekvenSekvenáátorytory druhdruhéé generace:generace:NapNapřř. firma . firma IlluminaIllumina Co., XII/2008:Co., XII/2008:•• GenomeGenome AnalyzerAnalyzer ((IlluminaIllumina IncInc.) ud.) uděělláá za 3 za 3

dny to, co by ABI 3730xl (poudny to, co by ABI 3730xl (použžitý Celera itý Celera GenomicsGenomics) trvalo 60 let) trvalo 60 let……

•• NNááklady na klady na sekvenovsekvenováánníí jednoho lidskjednoho lidskéého ho genomugenomu:: 4040--50 000 50 000 $ ($ (v roce 2010 v roce 2010 <20<20 000 $)000 $)

První sekvenované individuální lidské genomy:

2007: Craig Venter, James Watson – oba genomy

zpřístupněny na internetu

(od té doby několik dalších)

24

SekvenSekvenáátorytory druhdruhéé generace:generace:NapNapřř. firma . firma IlluminaIllumina Co., XII/2008:Co., XII/2008:•• GenomeGenome AnalyzerAnalyzer ((IlluminaIllumina IncInc.) ud.) uděělláá za 3 za 3

dny to, co by ABI 3730xl (poudny to, co by ABI 3730xl (použžitý Celera itý Celera GenomicsGenomics) trvalo 60 let) trvalo 60 let……

•• NNááklady na klady na sekvenovsekvenováánníí jednoho lidskjednoho lidskéého ho genomugenomu:: 4040--50 000 50 000 $ ($ (v roce 2010 v roce 2010 <20<20 000 $)000 $)

ZZáávody ve vývoji vody ve vývoji sekvenovsekvenováánníí genomugenomu<1000 $ <1000 $ ::

•• Illumina, Pacific Biosciences, Complete Illumina, Pacific Biosciences, Complete Genomics, Genomics, HelicosHelicos Biosciences, IBM a Biosciences, IBM a nněěkolikkolik daldalšíších usilujch usilujíí o to sto to stáát se prvnt se prvníím m výrobcem dostupnvýrobcem dostupnéého osobnho osobníího ho sekvensekvenáátorutoru…… momožžnnáá bběěhemhem 5 5 letlet??

PPřříínos nos sekvenovsekvenováánníí genomgenomůů::Kde jsme teKde jsme teďď??

•• PPřřekotný vývoj technologiekotný vývoj technologiíí pro pro dostupndostupnéé sekvenovsekvenováánnííindividuindividuáálnlníích ch genomgenomůů

•• Výzkum a poVýzkum a poččáátky vyutky využžititíí SNPSNP

25

International International HapMapHapMap ProjectProject•• DalDalšíší mezinmezináárodnrodníí spoluprspoluprááce 2002ce 2002--20092009•• SekvenovSekvenováánníí DNA od 270 lidDNA od 270 lidíí ze ze ččtytyřř

rrůůzných populaczných populacíí (USA, Nigerie, (USA, Nigerie, Japonsko, Japonsko, ČČíína)na)

•• S cS cíílem najlem najíítt•• VVššechny významnechny významnéé lidsklidskéé SNP (asi 10 000 SNP (asi 10 000 000000))•• Jejich stabilnJejich stabilníí kombinace (kombinace (haplotypyhaplotypy))•• Jeden Jeden „„tagtag SNPSNP““ typický pro katypický pro kažždý dý haplotyphaplotyp

•• Data veData veřřejnejněě ppřříístupnstupnáá k dalk dalšíšímu výzkumu mu výzkumu a vyua využžititíí

PersonalPersonal/Re/Reccreareationaltional GenomiGenomicscs

•• AnalAnalýzaýza osobnosobnííchch SNPsSNPs ((ppůůvod pvod přředkedkůů, , vrozenvrozenéé vlohyvlohy, , nnááchylnost k chylnost k chorobchorobáámm……))

•• V souV souččasnosti 4 firmyasnosti 4 firmy: :

•• Personal Genome ProjectPersonal Genome Project

•• deCODEdeCODE MEME

•• NavigenicsNavigenics

•• 23andME23andME

26

23andME23andME•• Vzorek sliny zaslaný DHL, Vzorek sliny zaslaný DHL, genotypizacegenotypizace

580 000 580 000 SNPsSNPs

•• AncestryAncestry::•• PaternalPaternal (Y chromosome (Y chromosome haplogrouphaplogroup))

•• MaternalMaternal ((mitochondrialmitochondrial DNA DNA haplogrouphaplogroup))

•• FindingFinding relativesrelatives, , globalglobal similaritysimilarity searchsearch

•• HealthHealth::•• DiseaseDisease risk: 92 (25 risk: 92 (25 highhigh confidenceconfidence))

•• CarrierCarrier status: 24status: 24

•• Response to Response to drugsdrugs: 18 (8 : 18 (8 highhigh confidenceconfidence))

•• TraitsTraits: 44 (13 : 44 (13 highhigh confidenceconfidence))

EtickEtickéé, , legislativnlegislativníí a a socisociáálnlníí ototáázkyzky

•• Gene privacy: Gene privacy: •• kdokdo mmáá prpráávovo znznáátt nněčěčíí genetickougenetickou informaciinformaci a a

jakjak jjíí smsmíí poupoužžíítt, , obavaobava z z diskriminacediskriminace

zamzaměěstnavatelemstnavatelem, , zdravotnzdravotníí pojipojiššťťovnouovnou......

•• Gene testingGene testing•• Gene therapyGene therapy•• BehavioralBehavioral genetics: genetics:

•• vztahvztah gengenůů k k lidsklidskéémumu chovchováánníí, , momožžnýný vývojvývoj kekegenetickgenetickéémumu determinismudeterminismu a a ztrztrááttěě odpovodpověědnostidnosti

zaza vlastnvlastníí chovchováánníí

•• GM GM potravinypotraviny•• Gene patenting:Gene patenting:

•• odhadem asi odhadem asi ppěětinatina lidskýchlidských gengenůů nebo jejich nebo jejich

fragmentfragmentůů jeje patentovpatentováánana, , vvěěttššinouinou

biotechnologickýmibiotechnologickými firmamifirmami... ...

27

References:References:Nature 2001: 409 (6822, 15.2.2001); pp. 813Nature 2001: 409 (6822, 15.2.2001); pp. 813--958958

Science 2001: 291 (5507, 16.2.2001); pp.1177Science 2001: 291 (5507, 16.2.2001); pp.1177--13511351

LodishLodish, H. et al.: Molecular Cell Biology (5th ed.), , H. et al.: Molecular Cell Biology (5th ed.), W.H.FreemanW.H.Freeman, New York 2004 (, New York 2004 (““DarnellDarnell””).).

AlbertsAlberts, B. , B. etet alal.: .: EssentialEssential Cell Biology, Cell Biology, GarlandGarlandPublishingPublishing, , IncInc., ., NewNew York 1998York 1998

LectureLecture by dr. M. by dr. M. LeblLebl: : NextNext generationgeneration DNA DNA sequencingsequencing (1.LF UK, 1.12.2008) (1.LF UK, 1.12.2008)

http://http://www.ncbi.nlm.nih.govwww.ncbi.nlm.nih.govhttp://http://genomicsgenomics..energyenergy..govgovhttp://en.http://en.wikipediawikipedia..orgorghttp://http://hapmaphapmap..ncbincbi..nlmnlm..nihnih..govgovhttpshttps://www.23andme.://www.23andme.comcomand internet in general…

Fig. “Human and DNA Shadow”: Courtesy of U.S. Department of Energy's Joint Genome Institute, Walnut Creek, CA, http://www.jgi.doe.gov.


Recommended