Filoson bakom Bayesiansk statistik med tillämpningarinom hjärnavbildning och budgivningar på eBay
Bertil Wegmann
STIMA, IDA, Linköpings universitet
October 5, 2017
Bertil Wegmann, STIMA, IDA, LiU Bayesiansk statistik October 5, 2017 1 / 21
Thomas Bayes, 1702 - 1761
Engelsk matematiker, statistiker och presbyteriansk präst
Thomas Bayes formulerade ett specikt fall av en sats som år 1763
generaliserades och publicerades av Richard Price. Namnet på satsen
blev Bayes sats.
Bayes sats blev därmed en av de fundamentala satserna inom
sannolikhetslära.
Bayes sats uppdaterar nuvarande apriori kunskap om en okänd
kvantitet med information från data till kunskap aposteriori.
Bertil Wegmann, STIMA, IDA, LiU Bayesiansk statistik October 5, 2017 2 / 21
Monty Hall-problemet
Spelteoretiskt problem som bygger på sannolikheter om okända
kvantiteter. Problemet har fått sitt namn från tv-prolen Monty Hall,
som var programledare för spelet Let's make a deal.
Bakom tre stängda dörrar nns 1 bil och 2 getter. Spelaren väljer en
dörr, utan att öppna den.
Bertil Wegmann, STIMA, IDA, LiU Bayesiansk statistik October 5, 2017 3 / 21
Monty Hall-problemet
Presentatören (Monty Hall), som vet var de 2 getterna och bilen
nns, öppnar en av de två resterande dörrarna där det nns 1 get.
Presentatören frågar spelaren om denne vill byta valet av dörr. Ska
spelaren göra det?
Bertil Wegmann, STIMA, IDA, LiU Bayesiansk statistik October 5, 2017 4 / 21
Monty Hall-problemet
Svaret är JA! Spelaren har fördel av att byta dörr!
Bertil Wegmann, STIMA, IDA, LiU Bayesiansk statistik October 5, 2017 5 / 21
Monty Hall-problemet med Bayes sats
Antag att spelaren först väljer en av dörrarna, säg dörr 1.
Deniera händelserna
D = presentatören väljer att öppna en dörr som har en get, säg dörr 3.
Bi = Bilen nns bakom dörr i, där i = 1, 2.
Lösning med Bayes sats för händelser:
P (B1|D) =P (D |B1)P (B1)
P (D)=
1
2· 13
1
2
=1
3
P (B2|D) =P (D |B2)P (B2)
P (D)=
1 · 13
1
2
=2
3
Alltså, bäst att byta från dörr 1 till dörr 2!
Bertil Wegmann, STIMA, IDA, LiU Bayesiansk statistik October 5, 2017 6 / 21
Bayes sats
Bayes sats för händelser B och D:
P(B |D) =P(D |B)P(B)
P(D).
Ersätt händelsen B med den okända kvantiteten (parametern) θ.
Ersätt händelsen D med data x1, x2, . . . , xn för n stycken antalet
observationer.
Bayes sats för en okänd kvantitet θ:
p(θ|x1, ...xn) =p(x1, ..., xn|θ)p(θ)
p(x1, ..., xn)∝ p(x1, ..., xn|θ)p(θ)
⇐⇒
Sannolikhet aposteriori för θ ges av
Sannolikhet för data givet θ * Sannolikhet apriori för θ
Bertil Wegmann, STIMA, IDA, LiU Bayesiansk statistik October 5, 2017 7 / 21
Bayesiansk vs frekventistisk statistik
Frekventistisk statistik använder endast data som information till
statistisk slutledning:
Frekventist : DATA
Bayesiansk statistik adderar extra (prior) information till statistisk
slutledning om en okänd kvantitet med hjälp av Bayes sats:
Bayesian : PRIOR +DATA POSTERIOR
I Bayesiansk statistik är sannolikhet subjektiv.
Frekventister tolkar sannolikhet som den relativa frekvensen av en
given händelse i ett stort antal liknande försök.
Bertil Wegmann, STIMA, IDA, LiU Bayesiansk statistik October 5, 2017 8 / 21
Exempel: uppskattning av θ =andelen askor av typ A
På ett stort lager vill man uppskatta θ = andelen askor av typ A.
I ett litet urval av totalt 100 askor från 10 miljoner askor
observerade man 60 askor av typ A. Frekventisten uppskattar då θ till
60 %.
Kjell har jobbat i lagret i 20 år. Han tror sig ha bra koll på den okända
kvantiteten θ.
Kjell förväntar sig att 55 % av askorna är av typ A med en
standardavvikelse på 0.05.
Bayesianen använder priorinformationen från Kjell och uppdaterar
Kjells prior m.h.a. data från urvalet till Kjells posterioruppfattning
om θ.
Bertil Wegmann, STIMA, IDA, LiU Bayesiansk statistik October 5, 2017 9 / 21
Exempel: uppskattning av θ =andelen askor av typ A
Prior (grön) till Posterior (röd) uppdatering (Likelihood (blå) =
funktion av θ givet data)
Bertil Wegmann, STIMA, IDA, LiU Bayesiansk statistik October 5, 2017 10 / 21
Exempel: uppskattning av θ =andelen askor av typ A
Urval med 600 askor av typ A utav totalt 1000 askor.
Prior (grön) till Posterior (röd) uppdatering (Likelihood (blå) =
funktion av θ givet data)
Bertil Wegmann, STIMA, IDA, LiU Bayesiansk statistik October 5, 2017 11 / 21
Ifrågasättande av prior för okänd kvantitet θ
Frekventist: 'Om priorn är subjektiv, så är statistisk slutledning
subjektiv. Det kan inte vara rätt.'
Bayesian: 'Vi har alla olika apriorikunskap och det enda ärliga är en
subjektiv prior'.
Bayesian: 'Den objektiva delen av statistisk slutledning är
uppdateringen från priorn till posteriorn, som alltid görs med Bayes
sats'.
Bayesian: 'En prior kan göras minimalt informativ' (Objektiv).
Bayesian: 'Icke-Bayesiansk slutledning är också subjektiv. Val av
sannolikhetsmodell, val av statistiska test, etc är alla subjektiva val'.
Bertil Wegmann, STIMA, IDA, LiU Bayesiansk statistik October 5, 2017 12 / 21
Prognoser av auktionspriser på eBay
eBay är en websajt för internetauktioner.
Budgivning under begränsad tid (1 dag - 1 vecka).
Andra-pris auktion. Vinnaren betalar det näst högsta budet.
Mål: prognos av slutpriset i en auktion.
Bertil Wegmann, STIMA, IDA, LiU Bayesiansk statistik October 5, 2017 13 / 21
Prognoser av auktionspriser på eBay
Data:
Alla bud i ett stort antal auktioner
Förklarande variabler, t ex objektets skick, säljarens eBay-betyg,
säljarens försäljningsvolym, utropspris etc.
Prior: Icke-informativ prior angående hur dom förklarande variablerna
påverkar budgivarnas värderingar.
Svårigheter vid statistisk modellering:
Budgivare är smarta och vet att andra budgivare också är smarta.
Spelteori. Nash-jämvikt. 'A Beautiful Mind'
Bud 6= Värdering
Vi vet inte hur många budgivare som kommer att deltaga. Vi
observerar inte det högsta budet.
Bertil Wegmann, STIMA, IDA, LiU Bayesiansk statistik October 5, 2017 14 / 21
Prognos av ett samlarmynts auktionspris
Utropspris = $6. Expertvärdering: $9.5.
Sannolikhet för inga bud = 1.4%. Sannolikhet att pris slutar på
utropspris = 6.7%.
Minst 2 bud → prognosfördelning över priset. Faktiskt pris: $13
6 8 10 12 14 16 18
Pris
Fördelning - minst 2 bud
Faktiskt pris
Expertvärdering
Utropspris
Bertil Wegmann, STIMA, IDA, LiU Bayesiansk statistik October 5, 2017 15 / 21
Vilket utropspris är optimalt för säljaren?
0 0.2 0.4 0.6 0.8 1 1.214
15
16
17
18
19
20
21
22
Utropspris / Expertvärdering
Bertil Wegmann, STIMA, IDA, LiU Bayesiansk statistik October 5, 2017 16 / 21
Diusion Tensor Imaging (DTI)
En 3D tensor (ellipsoid) kan skattas för den huvudsakliga
vätskediusionen i varje voxel i hjärnan, vilket ger den huvudsakliga
riktningen för nervbrena i varje voxel.
I dag används DTI i huvudsak till hjärnavbildning inom forskning och
till kliniska tillämpningar.
Bertil Wegmann, STIMA, IDA, LiU Bayesiansk statistik October 5, 2017 17 / 21
Mätningar i DTI
Mätsignalen i DTI är ett mått på diusionsprocessen av
vattenmolekyler i hjärnan.
I DTI studeras hjärnan i vila utan något stimuli.
I DTI mäts signalen i varje voxel ertalet gånger utifrån olika val av
diusionsriktningar samt genom att variera pulsens styrka i
magnetfältet och varaktigheten av diusionen innan mätning
(b-faktor).
Bertil Wegmann, STIMA, IDA, LiU Bayesiansk statistik October 5, 2017 18 / 21
Diusionstensormodellen
En tensormodell med en 3D-tensor för diusionen i varje voxel kan
denieras för den ideala brusfria signalen Si för mätning i som
Si = S0 exp(−bigT
i Dgi
), D =
dxx dxy dxzdxy dyy dyzdxz dyz dzz
där S0 är signalen utan diusionsgradient, bi är b-faktorn,gi = (gix , giy , giz ) är gradientvektorn och D är diusionstensorn.
Log-Cholesky representation av tensorn garanterar att D är positiv
denit. Diusionstensorn D kan skrivas som D (ω) = ΩT Ω med
Ω =
eω1 ω4 ω6
0 eω2 ω5
0 0 eω3
.
Bertil Wegmann, STIMA, IDA, LiU Bayesiansk statistik October 5, 2017 19 / 21
Bayes sats ger fördelningen av tensorn
Icke-informativ prior används för parametrarna i tensorn. Detta
innebär att vi apriori modellerar tensorn som en sfär, dvs diusionen är
lika stor i alla riktningar.
Bayes sats ger en posterior för respektive parameter i tensorn, vilket
innebär en fördelning för tensorn i varje voxel.
Bertil Wegmann, STIMA, IDA, LiU Bayesiansk statistik October 5, 2017 20 / 21
Tack för visat intresse!
Bertil Wegmann, STIMA, IDA, LiU Bayesiansk statistik October 5, 2017 21 / 21