+ All Categories
Home > Documents > HGP 2006 web - che1.lf1.cuni.czche1.lf1.cuni.cz/html/HGP_2006.pdf · Srovnání genomu...

HGP 2006 web - che1.lf1.cuni.czche1.lf1.cuni.cz/html/HGP_2006.pdf · Srovnání genomu...

Date post: 02-Mar-2019
Category:
Upload: phambao
View: 219 times
Download: 0 times
Share this document with a friend
22
1 Sekvenování genomů Sekvenování genomů Human Genome Project Human Genome Project : : historie, výsledky a důsledky historie, výsledky a důsledky MUDr. Jan Pláteník, PhD. MUDr. Jan Pláteník, PhD. (prosinec 2006) Počátky sekvenování Počátky sekvenování 1965: přečtena sekvence tRNA kvasinky 1965: přečtena sekvence tRNA kvasinky (80 bp) (80 bp) 1977: vynalezena Sangerova a Maxam 1977: vynalezena Sangerova a Maxam & & Gilbertova metoda Gilbertova metoda 1981: 1981: sekvence sekvence lidsk lidsk é é mitochondriální mitochondriální DNA (16,5 DNA (16,5 kbp kbp) 1983: sekvence bakteriofága T7 (40 1983: sekvence bakteriofága T7 (40 kbp kbp) 1984: Virus 1984: Virus Epsteina Epsteina a a Barrové Barrové (170 (170 kbp kbp)
Transcript
Page 1: HGP 2006 web - che1.lf1.cuni.czche1.lf1.cuni.cz/html/HGP_2006.pdf · Srovnání genomu člověka/myši s genomy nižších organismů (C.elegans, Drosophila):

1

Sekvenování genomůSekvenování genomů

Human Genome ProjectHuman Genome Project: :

historie, výsledky a důsledkyhistorie, výsledky a důsledky

MUDr. Jan Pláteník, PhD.MUDr. Jan Pláteník, PhD.

(prosinec 2006)

Počátky sekvenováníPočátky sekvenování•• 1965: přečtena sekvence tRNA kvasinky 1965: přečtena sekvence tRNA kvasinky

(80 bp)(80 bp)

•• 1977: vynalezena Sangerova a Maxam 1977: vynalezena Sangerova a Maxam & & Gilbertova metodaGilbertova metoda

•• 1981: 1981: sekvence sekvence lidsklidské é mitochondriální mitochondriální DNA (16,5 DNA (16,5 kbpkbp))

•• 1983: sekvence bakteriofága T7 (40 1983: sekvence bakteriofága T7 (40 kbpkbp))

•• 1984: Virus 1984: Virus Epsteina Epsteina a a Barrové Barrové (170 (170 kbpkbp))

Page 2: HGP 2006 web - che1.lf1.cuni.czche1.lf1.cuni.cz/html/HGP_2006.pdf · Srovnání genomu člověka/myši s genomy nižších organismů (C.elegans, Drosophila):

2

Homo sapiensHomo sapiens•• 19851985--1990: diskuse o sekvenování 1990: diskuse o sekvenování

lidského genomulidského genomu–– ““nebezpečné” nebezpečné” -- “nesmyslné” “nesmyslné” -- “nemožn锓nemožné”

•• 19881988--1990: Založen 1990: Založen HUMAN GENOME HUMAN GENOME PROJECTPROJECT•• Mezinárodní spolupráce:Mezinárodní spolupráce: HUGO (Human HUGO (Human

Genome Organisation)Genome Organisation)•• Cíle:Cíle:

–– genetická mapa lidského genomugenetická mapa lidského genomu–– fyzická mapa: marker každých 100 kbp fyzická mapa: marker každých 100 kbp –– sekvenování modelových organismů (E. coli, S. sekvenování modelových organismů (E. coli, S.

cerevisiae, C. elegans, Drosophila, myš)cerevisiae, C. elegans, Drosophila, myš)–– objevit všechny lidské geny objevit všechny lidské geny ((předpokl. 60předpokl. 60--80 tisíc)80 tisíc)–– sekvenování celého lidského genomu (4000 Mbp) do sekvenování celého lidského genomu (4000 Mbp) do

r. 2005r. 2005

Další genomyDalší genomy

•• červenec 1995červenec 1995: : Haemophilus influenzaeHaemophilus influenzae(1,8 Mbp)(1,8 Mbp) ... První genom nezávisle žijícího organismu... První genom nezávisle žijícího organismu

•• říjen 1996:říjen 1996: Saccharomyces cerevisiaeSaccharomyces cerevisiae(12 Mbp)(12 Mbp) ... První Eukaryota... První Eukaryota

•• prosinec 1998: prosinec 1998: Caenorhabditis elegansCaenorhabditis elegans(100 Mbp)(100 Mbp) ... První Metazoa... První Metazoa

Page 3: HGP 2006 web - che1.lf1.cuni.czche1.lf1.cuni.cz/html/HGP_2006.pdf · Srovnání genomu člověka/myši s genomy nižších organismů (C.elegans, Drosophila):

3

květen 1998:květen 1998:•• Craig VenterCraig Venter zakládá soukromou zakládá soukromou

biotechnologickou společnost biotechnologickou společnost CELERA CELERA GENOMICS, Inc.GENOMICS, Inc. a vyhlašuje záměr a vyhlašuje záměr sekvenovat celý lidský genom za 3 roky a sekvenovat celý lidský genom za 3 roky a 300 mil. USD metodou 300 mil. USD metodou wholewhole--genome genome shotgunshotgun

•• V té době výsledek práce HGP: V té době výsledek práce HGP: sekvenováno cca 4 % lidského genomu. sekvenováno cca 4 % lidského genomu.

březen 2000:březen 2000:

•• Celera Genomics Celera Genomics & & akadakad. . spolupracovníci spolupracovníci publikujpublikují draft í draft genomu genomu Drosophila melanogasterDrosophila melanogaster (cca 2/3 z 180 (cca 2/3 z 180 MbpMbp))

•• ... ... wholewhole--genome shotgungenome shotgun lze použít i pro velké lze použít i pro velké genomygenomy

•• ... ... Lidský ... ... Lidský genomgenom: závod mezi : závod mezi Human Human Genome Project Genome Project a Celera a Celera GenomicsGenomics

Page 4: HGP 2006 web - che1.lf1.cuni.czche1.lf1.cuni.cz/html/HGP_2006.pdf · Srovnání genomu člověka/myši s genomy nižších organismů (C.elegans, Drosophila):

4

úúnor 2001:nor 2001:

•• International Human Genome International Human Genome Sequencing Consortium publikuje Sequencing Consortium publikuje draft lidského genomu v časopisu draft lidského genomu v časopisu Nature 15.2.2001.Nature 15.2.2001.

•• Celera Genomics, Inc. publikuje svou Celera Genomics, Inc. publikuje svou sekvenci lidského genomu v sekvenci lidského genomu v časopisu Science 16.2.2001. časopisu Science 16.2.2001.

Pokrok v sekvenováníPokrok v sekvenování

1985: 500 bp 1985: 500 bp //laboratoř a denlaboratoř a den

stále Sangerova dideoxynukleotidová stále Sangerova dideoxynukleotidová metoda, alemetoda, ale

-- místo gelu kapilární elektroforesamísto gelu kapilární elektroforesa-- místo radioaktivity fluorescencemísto radioaktivity fluorescence-- úplná automatizace a robotizaceúplná automatizace a robotizace-- computer powercomputer power

2000: 175 000 bp /den (Celera)2000: 175 000 bp /den (Celera)

1000 bp/sec. (HGP)1000 bp/sec. (HGP)

Page 5: HGP 2006 web - che1.lf1.cuni.czche1.lf1.cuni.cz/html/HGP_2006.pdf · Srovnání genomu člověka/myši s genomy nižších organismů (C.elegans, Drosophila):

5

International Human Genome Sequencing International Human Genome Sequencing Consortium (Human Genome Project, HGP)Consortium (Human Genome Project, HGP)

•• Otevřeno spolupráci z každéOtevřeno spolupráci z každé zemězemě nana světěsvětě•• 20 laboratoří z USA, Velké Británie, Japonska, 20 laboratoří z USA, Velké Británie, Japonska,

Francie, Německa a ČínyFrancie, Německa a Číny•• Asi 2800 lidí, vedoucí: Francis Collins, NIHAsi 2800 lidí, vedoucí: Francis Collins, NIH•• Financování z veřejných zdrojůFinancování z veřejných zdrojů•• Metoda: Metoda: cloneclone--byby--cloneclone•• Výsledky: každá sekvence do 24 hodin na Výsledky: každá sekvence do 24 hodin na

Internet, přístup zdarma, stálá aktualizace. Internet, přístup zdarma, stálá aktualizace. •• Draft (Nature 15.2.2001): 90 % euchromatinu (2,95 Draft (Nature 15.2.2001): 90 % euchromatinu (2,95

Gbp, celý genom 3,2 Gbp). 25 % definitivní. Gbp, celý genom 3,2 Gbp). 25 % definitivní.

•• “Definitivní“Definitivní” ” verze: 14.4. 2003 (50 let od objevu verze: 14.4. 2003 (50 let od objevu DNA double helix). DNA double helix).

Celera Genomics, Inc.Celera Genomics, Inc.•• Soukromá biotechnologická společnost, Soukromá biotechnologická společnost,

Rockville, Maryland, USA. Prezident Craig Venter.Rockville, Maryland, USA. Prezident Craig Venter.

•• Investice do automatizace a počítačového Investice do automatizace a počítačového zpracování dat, pár desítek zaměstnancůzpracování dat, pár desítek zaměstnanců

•• Metoda: Metoda: wholewhole--genome shotgungenome shotgun + ale tak+ ale také é využití zveřejněných dat z HGP.využití zveřejněných dat z HGP.

•• Publikace v Science 16.2.2001: sekvence Publikace v Science 16.2.2001: sekvence euchromatinu (2,91 Gbp) euchromatinu (2,91 Gbp)

•• Výsledky: hrubá data zpřístupněna na www Výsledky: hrubá data zpřístupněna na www stránkách firmy, další aktualizace a anotace ale stránkách firmy, další aktualizace a anotace ale výlučně pro komerční účely. výlučně pro komerční účely.

Page 6: HGP 2006 web - che1.lf1.cuni.czche1.lf1.cuni.cz/html/HGP_2006.pdf · Srovnání genomu člověka/myši s genomy nižších organismů (C.elegans, Drosophila):

6

CloneClone--byby--cloneclonegenomová DNAgenomová DNA

fragmenty cca 150 000 bpfragmenty cca 150 000 bp

klonování v BAC (klonování v BAC (bacterial artificial chromosomebacterial artificial chromosome))

určení pozice klonů v genomu na základě fyzického mapování určení pozice klonů v genomu na základě fyzického mapování (STS (STS -- sequence tagged sitesequence tagged site, , fingerprintfingerprint -- štěpení restriktázami)štěpení restriktázami)

digesce každého klonu na krátké fragmenty cca 500 bpdigesce každého klonu na krátké fragmenty cca 500 bp

sekvenovánísekvenování

sestavení celé sekvence každého klonu pomocí počítačesestavení celé sekvence každého klonu pomocí počítače

WholeWhole--genome shotgungenome shotgun

genomová DNAgenomová DNA

fragmenty 2, 10, 50 kbpfragmenty 2, 10, 50 kbp

klonování v plasmidech E.coliklonování v plasmidech E.coli

sekvenovánísekvenování

sofistikované počítačové metody k sestavení celé sekvencesofistikované počítačové metody k sestavení celé sekvence

Page 7: HGP 2006 web - che1.lf1.cuni.czche1.lf1.cuni.cz/html/HGP_2006.pdf · Srovnání genomu člověka/myši s genomy nižších organismů (C.elegans, Drosophila):

7

Sekvenování genomů pokračuje...Sekvenování genomů pokračuje...•• Lidský genom nyníLidský genom nyní:: dokončen (99 % euchromatinudokončen (99 % euchromatinu))•• Fugu rubripes:Fugu rubripes: draft genomu v srpnu 2002draft genomu v srpnu 2002•• MyšMyš::

•• Celera Genomics: draft v Celera Genomics: draft v červnu 2001červnu 2001•• Mouse Genome Sequencing ConsortiumMouse Genome Sequencing Consortium: : NatureNature, ,

prosinec 2002 prosinec 2002 •• Laboratorní potkan:Laboratorní potkan: draft v březnu 2004draft v březnu 2004•• Další genomyDalší genomy:: malárie (původce Plasmodium malárie (původce Plasmodium

falciparum a přenašeč Anopheles gambiae), falciparum a přenašeč Anopheles gambiae), zebrafishzebrafish, , rýžerýže, , pespes, , krávakráva, , ovceovce, , praseprase, , kuřekuře, , šimpanzšimpanz, , včela ad. včela ad.

VeVeřejně řejně přístupnépřístupné databáze databáze DNA/RNA sekvencíDNA/RNA sekvencí

• GenBank, National Center for Biotechnology Information (NCBI), Bethesda, Maryland, USA

• EMBL-Bank, EMBL's European Bioinformatics Institute, Hinxton, UK

• DNA Data Bank of Japan, National Institute of Genetics, Mishima, Japan

Obsah všech tří databází v srpnu 2005 překročil Obsah všech tří databází v srpnu 2005 překročil 100 000 000 000 párů basí (100 Gb) 100 000 000 000 párů basí (100 Gb) ... z genů... z genů//genomů 165 000 různých organismůgenomů 165 000 různých organismů

Page 8: HGP 2006 web - che1.lf1.cuni.czche1.lf1.cuni.cz/html/HGP_2006.pdf · Srovnání genomu člověka/myši s genomy nižších organismů (C.elegans, Drosophila):

8

Sekvenování lidského genomu:Sekvenování lidského genomu:VýsledkyVýsledky

Klasifikace eukaryotické genomové DNA:Klasifikace eukaryotické genomové DNA:

•• podle podle ““sbalenosti”:sbalenosti”:•• euchromatineuchromatin•• heterochromatinheterochromatin

•• podle opakování:podle opakování:•• vysoce repetitivnívysoce repetitivní•• středně repetitivnístředně repetitivní•• nerepetitivnínerepetitivní

•• podle funkce:podle funkce:•• strukturní strukturní ((centromery, telomery)centromery, telomery)•• kódující (protein nebo RNA)kódující (protein nebo RNA)•• nekódujícínekódující

–– regulační oblastiregulační oblasti–– spacer, “junk DNA”, “selfish DNA” spacer, “junk DNA”, “selfish DNA”

Page 9: HGP 2006 web - che1.lf1.cuni.czche1.lf1.cuni.cz/html/HGP_2006.pdf · Srovnání genomu člověka/myši s genomy nižších organismů (C.elegans, Drosophila):

9

Experimenty s denaturacíExperimenty s denaturací & & reasociacreasociací DNAí DNA::

•• Rychlá reasociace (10Rychlá reasociace (10--15%): 15%): •• simplesimple--sequence DNA: sequence DNA:

•• heterochromatin v okolí telomer a heterochromatin v okolí telomer a centromerycentromery

•• satelity, minisatelity.satelity, minisatelity.•• Středně rychlá reasociace (25Středně rychlá reasociace (25-- 40%): 40%):

•• intermediateintermediate--repeat DNA (mobilní elementy, repeat DNA (mobilní elementy, tratrannsposony)sposony)

•• tandemově zmnožené geny pro rRNA, histonytandemově zmnožené geny pro rRNA, histony•• Pomalá reasociace (50Pomalá reasociace (50-- 60%):60%):

•• singlesingle--copy DNAcopy DNA•• genygeny•• ostatníostatní neklasifikovaná spacer DNA neklasifikovaná spacer DNA

Struktura lidského genomu na Struktura lidského genomu na základě sekvenovánízákladě sekvenování•• 3,2 Gb 3,2 Gb ((gigabase) celkem gigabase) celkem [3,08 [3,08 GbGb]]•• 2,95 Gb euchromatin 2,95 Gb euchromatin [2,88 Gb][2,88 Gb]

•• 90 % sekvenováno 90 % sekvenováno [99%][99%]

•• 3 % 3 % simplesimple--sequencesequence DNADNA

•• 45 % transposony45 % transposony

•• 5 % duplikace velkých úseků DNA5 % duplikace velkých úseků DNA

•• 28 % je přepisováno do RNA28 % je přepisováno do RNA

•• jen jen 1,11,1--1,4 %1,4 % (5 % z transkribované) DNA (5 % z transkribované) DNA skutečně kóduje protein. skutečně kóduje protein.

(draft, jen žlutá čísla dle hotové sekvence)

Page 10: HGP 2006 web - che1.lf1.cuni.czche1.lf1.cuni.cz/html/HGP_2006.pdf · Srovnání genomu člověka/myši s genomy nižších organismů (C.elegans, Drosophila):

10

Klasifikace eukaryKlasifikace eukaryooticktické é genomové genomové DNA:DNA:

•• Geny kódující proteiny Geny kódující proteiny •• Tandemově zmnožené geny kódující Tandemově zmnožené geny kódující

rRNArRNA, , tRNA a histonytRNA a histony•• Repetitivní DNA Repetitivní DNA •• Neklasifikovaná Neklasifikovaná spacerspacer DNADNA

Klasifikace eukaryKlasifikace eukaryooticktické é genomové genomové DNA:DNA:

•• Geny Geny kkódujícíódující proteinyproteiny•• ((asiasi čtvrtina genomu, z toho ale jen 5 % čtvrtina genomu, z toho ale jen 5 %

připadá na exony)připadá na exony)•• Tandemově zmnožené geny kódující Tandemově zmnožené geny kódující

rRNArRNA, , tRNA a histonytRNA a histony•• Repetitivní DNA Repetitivní DNA •• Neklasifikovaná Neklasifikovaná spacerspacer DNADNA

Page 11: HGP 2006 web - che1.lf1.cuni.czche1.lf1.cuni.cz/html/HGP_2006.pdf · Srovnání genomu člověka/myši s genomy nižších organismů (C.elegans, Drosophila):

11

Rozmístění genů v genomu není rovnoměrnéRozmístění genů v genomu není rovnoměrné

•• Velké rozdíly mezi chromosomy:Velké rozdíly mezi chromosomy:•• chromosom 1: 2968 genůchromosom 1: 2968 genů•• chromosom Y: 231 genů chromosom Y: 231 genů

•• oblasti bohaté na geny (“města”) oblasti bohaté na geny (“města”) -- více C a Gvíce C a G

•• oblasti chudé na geny (“pouště”) oblasti chudé na geny (“pouště”) -- více A a Tvíce A a T

•• CpG ostrůvky CpG ostrůvky -- “bariéra mezi městy a “bariéra mezi městy a pouštěmi” ... regulace genové aktivity pouštěmi” ... regulace genové aktivity

•• Solitární gen: Solitární gen: •• v celém genomu v jediné kopii (asi polovina v celém genomu v jediné kopii (asi polovina

genůgenů))

•• Genová rodinaGenová rodina::•• skupina genů evolučně pocházející z jediného skupina genů evolučně pocházející z jediného

genu, v evoluci postupná diverzifikace genu, v evoluci postupná diverzifikace sekvence a funkcesekvence a funkce

•• Pseudogen:Pseudogen:•• gen který zmutoval natolik že nemůže být gen který zmutoval natolik že nemůže být

přepisován (v celém genomu přepisován (v celém genomu > 20 000 !) > 20 000 !)

•• Zpracovaný (“processed”) pseudogenZpracovaný (“processed”) pseudogen::•• pseudogen vzniklý zpětným přepisem mRNA a pseudogen vzniklý zpětným přepisem mRNA a

integrací do genomuintegrací do genomu

Page 12: HGP 2006 web - che1.lf1.cuni.czche1.lf1.cuni.cz/html/HGP_2006.pdf · Srovnání genomu člověka/myši s genomy nižších organismů (C.elegans, Drosophila):

12

Počet genů v lidském genomuPočet genů v lidském genomu20 000 20 000 -- 25 00025 000

Mnohem méně než se čekalo!Mnohem méně než se čekalo!

... neodpovídá komplexitě organismu:... neodpovídá komplexitě organismu:Sacch. cerevisiaeSacch. cerevisiae 6 000 genů6 000 genůC. elegansC. elegans 18 000 genů18 000 genůDrosophila Drosophila 13 000 genů13 000 genůArabidopsis thalianaArabidopsis thaliana 26 000 genů26 000 genů

Jak se hledají geny v genomech:Jak se hledají geny v genomech:

•• Bakterie, kvasinky:Bakterie, kvasinky:•• open reading frames (ORFs)open reading frames (ORFs)

•• Vyšší organismy:Vyšší organismy:•• hybridizacehybridizace//srovnání s cDNA nebo EST srovnání s cDNA nebo EST

(expressed sequence tag = část cDNA)(expressed sequence tag = část cDNA)•• podobnost se známými genypodobnost se známými geny•• hledání rozpoznávacích sekvencí pro místa hledání rozpoznávacích sekvencí pro místa

sestřihusestřihu•• podobnost s genomy jiných organismůpodobnost s genomy jiných organismů

Page 13: HGP 2006 web - che1.lf1.cuni.czche1.lf1.cuni.cz/html/HGP_2006.pdf · Srovnání genomu člověka/myši s genomy nižších organismů (C.elegans, Drosophila):

13

Srovnání genomuSrovnání genomu člověkačlověka//myši s genomy myši s genomy nižších organismů (C.elegans, Drosophila):nižších organismů (C.elegans, Drosophila):

•• menší hustota genů, delší intronymenší hustota genů, delší introny•• jen asi 7 % proteinových domén zcela jen asi 7 % proteinových domén zcela

nové u obratlovců, alenové u obratlovců, ale•• expanse proteinových rodinexpanse proteinových rodin•• složitější architektura proteinůsložitější architektura proteinů, , nové nové

kombinace domén a více domén/ proteinkombinace domén a více domén/ protein•• více proteinů z jednoho genů více proteinů z jednoho genů -- alternativní alternativní

sestřihsestřih až v 60 % až v 60 %

Srovnání genomuSrovnání genomu člověkačlověka//myši s genomy myši s genomy nižších organismů (C.elegans, Drosophila):nižších organismů (C.elegans, Drosophila):

•• expanse genů /nové geny se vztahem k:expanse genů /nové geny se vztahem k:•• srážení krvesrážení krve•• získaná získaná ((specifická) imunitaspecifická) imunita•• nervový systémnervový systém•• intraintra-- a intercelulární komunikacea intercelulární komunikace•• kontrola genové expresekontrola genové exprese•• programová buněčná smrt (apoptosa)programová buněčná smrt (apoptosa)

Page 14: HGP 2006 web - che1.lf1.cuni.czche1.lf1.cuni.cz/html/HGP_2006.pdf · Srovnání genomu člověka/myši s genomy nižších organismů (C.elegans, Drosophila):

14

Klasifikace eukaryotickKlasifikace eukaryotickéé genomové genomové DNA:DNA:

•• Geny kódující proteiny Geny kódující proteiny •• Tandemově zmnožené geny kódující Tandemově zmnožené geny kódující

rRNArRNA, , tRNA a histonytRNA a histony•• lze též řadit mezi středně repetitivní DNAlze též řadit mezi středně repetitivní DNA•• vvíceíce stejných kopií genů za sebou, za účelem stejných kopií genů za sebou, za účelem

větší produktivity transkripcevětší produktivity transkripce•• geny pro geny pro ribosomální ribosomální RNA u RNA u eukaryotůeukaryotů: : >100 >100

kopikopií í •• Repetitivní DNARepetitivní DNA•• Neklasifikovaná Neklasifikovaná spacerspacer DNADNA

Klasifikace eukaryKlasifikace eukaryooticktické é genomové genomové DNA:DNA:

•• Geny kódující proteiny Geny kódující proteiny •• Tandemově zmnožené geny kódující Tandemově zmnožené geny kódující

rRNArRNA, , tRNA a histonytRNA a histony•• Repetitivní DNARepetitivní DNA

•• simplesimple--sequence DNA:sequence DNA: vysoce repetitivnvysoce repetitivní, 3% z í, 3% z euchromatinu euchromatinu ((minisatelityminisatelity) + veškerý ) + veškerý heterochromatin heterochromatin ((centromerycentromery, , telomerytelomery))

•• interspersed repeatsinterspersed repeats (středně (středně repetitivní repetitivní DNA) DNA) = mobilní elementy = mobilní elementy ((transpozonytranspozony),), 45 % z 45 % z euchromatinueuchromatinu

•• Neklasifikovaná Neklasifikovaná spacerspacer DNADNA

Page 15: HGP 2006 web - che1.lf1.cuni.czche1.lf1.cuni.cz/html/HGP_2006.pdf · Srovnání genomu člověka/myši s genomy nižších organismů (C.elegans, Drosophila):

15

Mobilní Mobilní ((paraziticképarazitické) ) elementy v elementy v savčím genomu:savčím genomu:•• LINEs (longLINEs (long--interspersed repeats), interspersed repeats),

•• 66--8 kb, př. L1, kódují 2 proteiny ( 1 je reversní 8 kb, př. L1, kódují 2 proteiny ( 1 je reversní transkriptáza)transkriptáza)

•• SINEs (shortSINEs (short--interspersed repeats), interspersed repeats), •• 100100--300 bp, př. Alu, nekódují nic, množení závisí na 300 bp, př. Alu, nekódují nic, množení závisí na

LINEs, původ: z malých nekódujících buněčných RNALINEs, původ: z malých nekódujících buněčných RNA

•• Virové retrotranspozony Virové retrotranspozony •• 66--11 kb (nebo krat11 kb (nebo kratšíší), ), retroviry retroviry bez genu pro bez genu pro

proteinový obal (proteinový obal (envenv))

•• DNA transpozonyDNA transpozony•• 22--3 kb (nebo kratší), kódují transposasu, cut 3 kb (nebo kratší), kódují transposasu, cut & paste& paste

nebonebo copy & paste vcopy & paste v genomu bez genomu bez ppřepisuřepisu do RNAdo RNA

Census parazitických elementů v Census parazitických elementů v lidském genomu:lidském genomu:LINEs: LINEs: 850 000x 850 000x 21 % genomu21 % genomuSINEs: SINEs: 1 500 000x 1 500 000x 13 % genomu13 % genomuRetrovirusRetrovirus--like: like: 450 000x450 000x 8 % genomu8 % genomuDNA transpozony: DNA transpozony: 300 000x 300 000x 3 % genomu3 % genomu

•• V V celém genomu jen malý počet aktivních LINEs a celém genomu jen malý počet aktivních LINEs a SINEs, možná i endogenních retrovirůSINEs, možná i endogenních retrovirů. .

•• Vše ostatníVše ostatní: : staréstaré, , mutované a neaktivní “molekulární mutované a neaktivní “molekulární fossilie”.fossilie”.

•• V genomu myši aktivních transpozonů mnohem více V genomu myši aktivních transpozonů mnohem více (...proč?). (...proč?).

Page 16: HGP 2006 web - che1.lf1.cuni.czche1.lf1.cuni.cz/html/HGP_2006.pdf · Srovnání genomu člověka/myši s genomy nižších organismů (C.elegans, Drosophila):

16

Význam transpozonů v lidském genomuVýznam transpozonů v lidském genomu

•• Namnožení těchto elementů v genomuNamnožení těchto elementů v genomu: : ve ve více vlnách dávno v evolucivíce vlnách dávno v evoluci, , možná ještě možná ještě před radiací savců na začátku třetihorpřed radiací savců na začátku třetihor

•• Zodpovídají za část spontánních mutací Zodpovídají za část spontánních mutací (1:600 (1:600 u člověka)u člověka)

•• Pro jedince je aktivita transpozonů Pro jedince je aktivita transpozonů negativní (možná inaktivace genů)negativní (možná inaktivace genů)•• ... transposice L1 (LINEs... transposice L1 (LINEs) ) dokumentována jako dokumentována jako

vzácná příčina genetických chorob u člověkavzácná příčina genetických chorob u člověka

•• Ale pro vývoj druhu zřejmě pozitivníAle pro vývoj druhu zřejmě pozitivní•• Repetitivní elementy Repetitivní elementy -->> více rekombinací více rekombinací --> >

urychlení evoluceurychlení evoluce

•• Zpětný přepis mRNA Zpětný přepis mRNA -- “processed “processed pseudogenes” (někdy vznikne funkční genpseudogenes” (někdy vznikne funkční gen))

•• Alu (SINEs) Alu (SINEs) -- vyšší výskyt v oblastech bohatých vyšší výskyt v oblastech bohatých na genyna geny, , možná kódují RNA molekulu s funkcí v možná kódují RNA molekulu s funkcí v buňce buňce ....Alu sekvence podobná RNA ze SRP (signal recognition ....Alu sekvence podobná RNA ze SRP (signal recognition particle) particle)

Page 17: HGP 2006 web - che1.lf1.cuni.czche1.lf1.cuni.cz/html/HGP_2006.pdf · Srovnání genomu člověka/myši s genomy nižších organismů (C.elegans, Drosophila):

17

Klasifikace eukaryKlasifikace eukaryooticktické é genomové genomové DNA:DNA:

•• Geny kódující proteiny Geny kódující proteiny •• Tandemově zmnožené geny kódující Tandemově zmnožené geny kódující

rRNArRNA, , tRNA a histonytRNA a histony•• Repetitivní DNARepetitivní DNA•• Neklasifikovaná Neklasifikovaná spacerspacer DNA:DNA:

•• nerepetitivní, nekódujícínerepetitivní, nekódující, , cca čtvrtina genomu. cca čtvrtina genomu. Zřejmě mrtvé transpozony tak mutované že Zřejmě mrtvé transpozony tak mutované že nejsou počítačem rozpoznánynejsou počítačem rozpoznány

Naprostá většina naší DNA vznikla reversní transkripcí retrotranspozonů

Single Nucleotide Polymorphism (SNP)Single Nucleotide Polymorphism (SNP)

Sekvence jakýchkoliv dvou lidských bytostí se liší v Sekvence jakýchkoliv dvou lidských bytostí se liší v jedné bázi na 1jedné bázi na 10000 bp, tj. pouze v 0,1 % genomu!!!00 bp, tj. pouze v 0,1 % genomu!!!

... ... i tak ale až i tak ale až cca 10 miliónů SNPs celkemcca 10 miliónů SNPs celkemkódující/nekódujícíkódující/nekódujícístrukturu proteinu měnístrukturu proteinu mění//neměnínemění

A G A G T T C T G C T C G

A G G G T T C T G C G CG

Page 18: HGP 2006 web - che1.lf1.cuni.czche1.lf1.cuni.cz/html/HGP_2006.pdf · Srovnání genomu člověka/myši s genomy nižších organismů (C.elegans, Drosophila):

18

International HapMap ProjectInternational HapMap Project•• DalDalší ší mezinárodní spolupráce mezinárodní spolupráce

sekvenačních sekvenačních centercenter•• Sekvenování Sekvenování DNA od 270 lidí ze čtyř DNA od 270 lidí ze čtyř

různých populací (USA, Nigerie, různých populací (USA, Nigerie, Japonsko, Čína) s cílem sestavit katalog Japonsko, Čína) s cílem sestavit katalog SNPs SNPs ((očekávočekáv. . >3000000 SNPs>3000000 SNPs)) a jejich a jejich stabilních kombinací (stabilních kombinací (haplotypůhaplotypů))

•• … první verze … první verze database database již již k dispozici pro k dispozici pro studium vztahu SNPs k patogenezi chorob studium vztahu SNPs k patogenezi chorob apod.apod.

Sekvenování lidského genomu:Sekvenování lidského genomu:DůsledkyDůsledky

Page 19: HGP 2006 web - che1.lf1.cuni.czche1.lf1.cuni.cz/html/HGP_2006.pdf · Srovnání genomu člověka/myši s genomy nižších organismů (C.elegans, Drosophila):

19

Přínos sekvenování genomPřínos sekvenování genomůů

•• Milník v historii lidstvaMilník v historii lidstva

•• Usnadnění výzkumu molekulární podstaty Usnadnění výzkumu molekulární podstaty chorobchorob•• “virtuální klonování” in silico místo zdlouhavého “virtuální klonování” in silico místo zdlouhavého

pozičního klonování a sekvenovánípozičního klonování a sekvenování

•• Molekulární medicínaMolekulární medicína•• dg. na úrovni genůdg. na úrovni genů, , časná detekce predispozice k časná detekce predispozice k

určitým chorobámurčitým chorobám•• genová terapiegenová terapie•• možnost stanovení individuální senzitivity k možnost stanovení individuální senzitivity k

rizikovým faktorům v prostředí (radiacerizikovým faktorům v prostředí (radiace, , mutageny) mutageny)

Přínos sekvenování genomůPřínos sekvenování genomů

•• Nové cíle pro farmakoterapiiNové cíle pro farmakoterapii•• všechny dosud známé léky všechny dosud známé léky -- interakce jen asi s 500 interakce jen asi s 500

proteinovými molekulami !!!proteinovými molekulami !!!

•• Farmakogenomika Farmakogenomika •• jak individuální genetická informace ovlivňuje reakci jak individuální genetická informace ovlivňuje reakci

na léčbu ... možnost na léčbu ... možnost ““terapie ušité na terapie ušité na míru” pro míru” pro každého pacienta každého pacienta

•• Studium evoluce a migrace lidského druhuStudium evoluce a migrace lidského druhu

•• Co vlastně genom kóduje (“nature vs. Co vlastně genom kóduje (“nature vs. nurture”) a jaké SNPs zodpovídají za rozdíly nurture”) a jaké SNPs zodpovídají za rozdíly mezi lidmimezi lidmi

Page 20: HGP 2006 web - che1.lf1.cuni.czche1.lf1.cuni.cz/html/HGP_2006.pdf · Srovnání genomu člověka/myši s genomy nižších organismů (C.elegans, Drosophila):

20

Výzkum v “postgenomové” éřeVýzkum v “postgenomové” éře•• NovéNové přístupy ke studiu genů a proteinů:přístupy ke studiu genů a proteinů:

•• GENOMICSGENOMICS ... ... analýza celého genomu a jeho analýza celého genomu a jeho expreseexprese

•• PROTEOMICSPROTEOMICS ... analýza celého proteomu... analýza celého proteomu, , tjtj. . všech proteinů tkáně nebo organismuvšech proteinů tkáně nebo organismu

•• BIOINFORMATICSBIOINFORMATICS ... zpracování... zpracování, , analýza a analýza a interpretace velkých souborů dat (NK a AMK interpretace velkých souborů dat (NK a AMK sekvencí, gene arrays, 3D struktury proteinů atdsekvencí, gene arrays, 3D struktury proteinů atd. . Experimenty Experimenty in silicoin silico

•• Překotný vývoj nových technologií:Překotný vývoj nových technologií:•• např. např. DNA MicroarrayDNA Microarray -- možnost studovat expresi možnost studovat expresi

tisíců genů najednoutisíců genů najednou

DNA Microarray (“ DNA chip”)DNA Microarray (“ DNA chip”)

Page 21: HGP 2006 web - che1.lf1.cuni.czche1.lf1.cuni.cz/html/HGP_2006.pdf · Srovnání genomu člověka/myši s genomy nižších organismů (C.elegans, Drosophila):

21

Sekvenování musí být rychlejší a lacinější aby se Sekvenování musí být rychlejší a lacinější aby se mohlo stát součástí běžné lékařské péče...mohlo stát součástí běžné lékařské péče...

•• J. Craig Venter Science FoundationJ. Craig Venter Science Foundation, 2003, 2003::•• $ 500 000 Genomic Technology Prize$ 500 000 Genomic Technology Prize ......tomu kdo tomu kdo

vynalezne technologii, která by umožnila sekvenovat savčí vynalezne technologii, která by umožnila sekvenovat savčí genomy za <$ 1000 genomy za <$ 1000

•• X X Prize FoundationPrize Foundation, 2006:, 2006:•• $ 10 000 $ 10 000 000000 Archon Archon X X Prize Prize for for Genomics Genomics

…tomu kdo zmapuje 100 lidských …tomu kdo zmapuje 100 lidských genomů genomů za 10 dní…za 10 dní…

•• National Human Genome Research Institute:National Human Genome Research Institute:•• granty na vgranty na vývojývoj nových technologií nových technologií sekvenování sekvenování

……savčí genom savčí genom <$100 000, <$1000<$100 000, <$1000

Etické, legislativní a sociální otázkyEtické, legislativní a sociální otázky

•• Gene privacy: Gene privacy: •• kdo má právo znát něčí genetickou informaci a kdo má právo znát něčí genetickou informaci a

jak jí smí použít, obava z diskriminace jak jí smí použít, obava z diskriminace zaměstnavatelemzaměstnavatelem, , zdravotní pojišťovnou...zdravotní pojišťovnou...

•• Gene testingGene testing•• Gene therapyGene therapy•• Behavioral genetics: Behavioral genetics:

•• vztah genů k lidskému chování, možný vývoj ke vztah genů k lidskému chování, možný vývoj ke genetickému determinismu a ztrátě odpovědnosti genetickému determinismu a ztrátě odpovědnosti za vlastní chování za vlastní chování

•• GM potravinyGM potraviny•• Gene patenting:Gene patenting:

•• celá pětina lidských genů je patentovánacelá pětina lidských genů je patentována, , většinou biotechnologickými firmami... většinou biotechnologickými firmami...

Page 22: HGP 2006 web - che1.lf1.cuni.czche1.lf1.cuni.cz/html/HGP_2006.pdf · Srovnání genomu člověka/myši s genomy nižších organismů (C.elegans, Drosophila):

22

Použitá literatura /Kde lze hledat další Použitá literatura /Kde lze hledat další informace:informace:

Lodish, H. et al.: Molecular Cell Biology (5th ed.), Lodish, H. et al.: Molecular Cell Biology (5th ed.), W.H.Freeman, New York 2004 (“Darnell”). W.H.Freeman, New York 2004 (“Darnell”).

Nature 2001: 409 (6822, 15.2.2001Nature 2001: 409 (6822, 15.2.2001)); pp. 813; pp. 813--958958Science 2001: 291 (5507, 16.2.2001Science 2001: 291 (5507, 16.2.2001)); pp.1177; pp.1177--13511351

http://www.ncbihttp://www.ncbi..nlmnlm..nihnih..govgov

http://www.ornlhttp://www.ornl..govgov//hgmishgmisa internet vůbec ...a internet vůbec ...

Fig. “Human and DNA Shadow”: Courtesy of U.S. Department of Energy's Joint Genome Institute, Walnut Creek, CA, http://www.jgi.doe.gov.


Recommended