Náhodné (statistické) chyby přímých měření
- nemají žádnou pravidelnost
- nelze zjistit přesnou příčinu odchylek, původ chyb je v náhodě
- k určení chyb používáme počtu pravděpodobnosti a statistických metod
(tj. zjišťujeme, která z možných naměřených hodnot je více a která je méně
pravděpodobná)
Dva základní problémy:
1) Jakým způsobem ze souboru naměřených hodnot zjistit výsledek měření, který
se nejvíce blíží správné (tj. skutečné) hodnotě měřené veličiny?
2) Jakým způsobem charakterizovat odchylku výsledku měření od správné
hodnoty, tj. jak určit velikost náhodné chyby?
Náhodná veličina (n. v.)
Na soubory naměřených hodnot pohlížíme jako na soubory náhodných
veličin, které se řídí statistickými zákony a výsledcích lze vyslovit pouze
pravděpodobnostní výroky.
N. v. může být buď spojitá nebo nespojitá.
Příklad
Měření délky: 13,3 cm; 13,2 cm; 13,1 cm; 13,2 cm; 13,0 cm.
Jednotlivé naměřené délky považuje za náhodné (spojité) veličiny (délka může
nabývat libovolné hodnoty).
0 100 200 300 400 500 600 700 800 900 10000,000
0,001
0,002
0,003
0,004
hu
sto
ta p
ravdě
po
do
bn
osti
hodnota
Náhodnou veličinu lze charakterizovat
pravděpodobností, s jakou nabývá svých
hodnot.
Počet případů příznivýchPravděpodobnost
Počet případů možných
Jakých hodnot může pravděpodobnost daného jevu nabývat?
Klasická definice pravděpodobnosti
Příklad
Jaká je pravděpodobnost, že při hodu hrací kostkou padne číslo 6?
Statistická definice pravděpodobnosti
n krát opakujeme daný experiment
m krát zaznamenáme „úspěch“ (příznivý případ).
Pravděpodobnost limn
m
n
Příklad
Hodíme desetkrát hrací kostkou. Padnou tato čísla:
5, 4, 1, 6, 5, 4, 2, 6, 3, 4
Odhadněte pravděpodobnost toho, že padne číslo 6.
Spojité a nespojité náhodné veličiny
pravděpodobnost
hodnota 0 100 200 300 400 500 600 700 800 900 1000
0,000
0,001
0,002
0,003
0,004
hu
sto
ta p
ravd
ěp
od
ob
no
sti
hodnota
Nespojitá náhodná veličina
Může nabývat jen konečně mnoha nebo spočetně mnoha
hodnot.
Jedná se často o hodnoty celočíselné (např. počet impulzů,
počet částic,…) získaných čítáním.
Předem zadané hodnoty x nabývá s pravděpodobností P(x).
Měříme opakovaně n krát za shodných podmínek stejnou veličinu.
Danou hodnotu x naměříme m krát.
Číslu m říkáme „četnost“ měřené hodnoty x.
Tento graf nazýváme histogram
Při měření intenzity pozadí ionizujícího záření byly naměřeny následující hodnoty:
číslo
měření
intenzita
(imp/10s)
1 3
2 4
3 2
4 3
5 4
6 2
7 4
8 2
9 3
10 2
Nakreslete histogram: graf četnosti intenzity
jako funkce měřené hodnoty
četnost
intenzita (imp/10s)
1 2 3 4 5 0
1
2
3
4
5
takto kreslíme četnost hodnoty 2
Relativní četnost je definována jako m
n
limn
m
n
Za jakých podmínek bude relativní četnost rovna pravděpodobnosti
naměření dané hodnoty?
Pravděpodobnost je definována jako
pravděpodobnost
hodnota
Graf závislosti pravděpodobnosti na naměřené hodnotě nazýváme
rozdělení diskrétní náhodné proměnné.
Pravděpodobnost naměření hodnoty xi budeme značit
ixP
všechna ix
i
PJaká je hodnota výrazu:
Doposud jsme se věnovali diskrétní náhodné proměnné. To je taková
proměnná, která nabývá jen určitých hodnot.
(Př.: výsledek hodu kostkou, posloupnost čísel při tahu sportky apod.)
Fyzikální veličiny však obvykle mohou nabývat libovolné hodnoty.
Náhodná proměnná spojená s takovou fyzikální veličinou bude tzv.
spojitá (spojitá n. v.).
Spojitá náhodná veličina může nabývat hodnot, které se od sebe
libovolně málo liší, ale žádné dvě nejsou stejné.
Toto je však pouze teorie. Ve skutečnosti je každá měřená hodnota
diskrétní – diskretizaci provádí měřící přístroj.
Tento digitální voltmetr naměří hodnoty 1,295,
1,296 nebo 1,297 ale nic mezi tím.
Formalismus popisu spojitých a diskrétních náhodných proměnných
(veličin) je ale odlišný.
Jaká je pravděpodobnost, že naměříme hodnotu frekvence
elektromagnetického záření 2,128574443445098853567899653GHz?
Přesně!
Přestože se ve skutečnosti se spojitými náhodnými proměnnými
(veličinami) při měření v praxi nesetkáme, používají se spojitá
rozdělení častěji – lépe se s nimi počítá s využitím aparátu
matematické analýzy.
pravděpodobnost
hodnota 0 100 200 300 400 500 600 700 800 900 1000
0,000
0,001
0,002
0,003
0,004
hu
sto
ta p
ravd
ěp
od
ob
no
sti
hodnota
Pravděpodobnost naměření určité konkrétní hodnoty
spojité náhodné proměnné nemá smysl, je vždy rovna nule.
Smysl má pouze pravděpodobnost naměření hodnoty
v určitém intervalu.
Definujeme tzv. hustotu pravděpodobnosti
( )dP
p xdx
Analogie – hustota (hmotnosti) a hustota pravděpodobnosti
hustota (hmotnosti) m
V
průměrná hustota nehomogenního „kusu“ látky o hmotnosti m a
objemu V
Pokud se hustota tělesa mění místo od místa (těleso není
homogenní), má smysl definovat „lokální“ hustotu:
dm
dV
Hustota v bodě = hmotnost nekonečně malého kousku děleno objemem
tohoto kousku.
( )dP
p xdx
analogicky definujeme hustotu pravděpodobnosti
Známe-li střední hustotu, můžeme hmotnost tělesa spočítat takto:
m V
Známe-li lokální hustotu, hmotnost tělesa se spočítá takto:
V
m dV
Pravděpodobnosti naměření hodnoty x z intervalu (x1, x2) se spočítá jako:
2
1
1 2( , ) ( )
x
x
P x x p x dx 0 100 200 300 400 500 600 700 800 900 1000
0,000
0,001
0,002
0,003
0,004
hu
sto
ta p
ravd
ěp
od
ob
no
sti
hodnota
Čemu je roven výraz:
( ) ?p x dx
0 100 200 300 400 500 600 700 800 900 10000,000
0,001
0,002
0,003
0,004
hu
sto
ta p
ravd
ěp
od
ob
no
sti
hodnota
0 50 100 150 200 250 300 350 400
p(x)
x
Úkol:
Seřaďte podle velikosti od nejmenšího po největší
1) pravděpodobnost naměření hodnoty v intervalu (50,100)
2) pravděpodobnost naměření hodnoty v intervalu (100,150)
3) pravděpodobnost naměření hodnoty v intervalu (250,300)
2
1
1 2( , ) ( )
x
x
P x x p x dx
Základními parametry rozdělení jsou:
střední hodnota
1i
n
x i
i
P x
( )D
x p x dx
n – počet všech možností D – definiční obor
diskrétní rozdělení spojité rozdělení
rozptyl (disperze) 2
1
( )i
n
x i
i
D P x
2( ) ( )
D
D x p x dx
Úkol:
Které rozdělení má větší střední hodnotu (černé nebo červené)?
0 200 400 600 800 1000
0,000
0,001
0,002
0,003
0,004
0,005
0,006
hu
sto
ta p
ravd
ěp
od
ob
no
sti
hodnota
( )D
x p x dx
Úkol:
Které rozdělení má větší disperzi (černé nebo červené)?
0 200 400 600 800 1000
0,000
0,001
0,002
0,003
0,004
0,005
0,006
hu
sto
ta p
ravd
ěp
od
ob
no
sti
hodnota
2( ) ( )D
D x p x dx
Proč je červené rozdělení nižší než černé?
Střední hodnota určuje polohu rozdělení na ose x a disperze jeho šířku.
Disperze však nemá vhodnou jednotku.
D
2
1
( )i
n
x i
i
D P x
2( ) ( )D
D x p x dx
Proto definujeme tzv. směrodatnou odchylku σ vztahem:
0 200 400 600 800 1000
0,000
0,001
0,002
0,003
0,004
0,005
0,006
hu
sto
ta p
ravd
ěp
od
ob
no
sti
hodnota
Hledáme velikost intervalu pro zvolenou hodnotu
pravděpodobnosti, přičemž předpokládáme, že máme
naměřeno nekonečně mnoho hodnot.
Interval, jemuž přísluší pravděpodobnost P, nazýváme
P-procentní interval spolehlivosti (také konfidenční
interval).
(μ – kσ, μ – kσ) , kde k ˃ 0.
Intervaly spolehlivosti
Normální (Gaussovo) rozdělení
2
2
( )
21
( )2
x
p x e
střední hodnota: µ
disperze: D=σ2
σ je směrodatná odchylka
Je nejčastější používaný model rozdělení náhodné veličiny.
Používá se pro náhodné jevy, které vznikly složením vlivů, které
jsou nezávislé, je jich velký počet a každý z těchto vlivů
ovlivňuje skutečnou hodnotu n. v. jen malým příspěvkem.
Přímo měřené fyzikální veličiny zpravidla těmto předpokladům
vyhovují (u přesných měření je třeba nejdříve vyšetřit, jakým
rozdělením pravděpodobnosti lze n. v. popsat).
2
1
1 2( , ) ( )
x
x
P x x p x dx 0 100 200 300 400 500 600 700 800 900 1000
0,000
0,001
0,002
0,003
0,004
hu
sto
ta p
ravdě
po
do
bn
osti
hodnota
µ = 500 σ = 100
0 100 200 300 400 500 600 700 800 900 10000,000
0,001
0,002
0,003
0,004
hu
sto
ta p
ravdě
po
do
bn
osti
hodnota
0 100 200 300 400 500 600 700 800 900 10000,000
0,001
0,002
0,003
0,004
hu
sto
ta p
ravdě
po
do
bn
osti
hodnota
µ = 300 σ = 100
0 100 200 300 400 500 600 700 800 900 10000,0000
0,0005
0,0010
0,0015
0,0020
0,0025
hu
sto
ta p
ravd
ěp
od
ob
no
sti
hodnota
µ = 500 σ = 200
Jak souvisí µ a σ s tvarem a plohou křivky?
0 100 200 300 400 500 600 700 800 900 10000,000
0,001
0,002
0,003
0,004
hu
sto
ta p
ravd
ěp
od
ob
no
sti
hodnota
µ - σ µ + σ µ
inflexní bod
Inflexní bod je bod na křivce, ve kterém křivka mění křivost z konkávní (kladná
křivost) na konvexní (záporná křivost) nebo obráceně.
0 100 200 300 400 500 600 700 800 900 10000,000
0,001
0,002
0,003
0,004h
usto
ta p
ravd
ěp
od
ob
no
sti
hodnota
µ - σ µ + σ µ
inflexní bod
µ = 500 σ = 100
2
2
( )
21
( ) 0,682
x
p x dx e dx
Měříme-li veličinu, která se řídí normálním rozdělením se střední hodnotou µ a
směrodatnou odchylkou σ, je pravděpodobnost toho, že při dalším měření
naměříme hodnotu z intervalu (µ - σ, µ + σ) rovna 68%.
0 100 200 300 400 500 600 700 800 900 10000,000
0,001
0,002
0,003
0,004
hu
sto
ta p
ravd
ěp
od
ob
no
sti
hodnota
µ - σ µ + σ µ
inflexní bod
Úkol:
Odhadněte, jaká je pravděpodobnost naměření hodnoty z intervalu
(µ - 3σ, µ + 3σ).
Pravděpodobnost naměření hodnoty v intervalu (µ - 3σ, µ + 3σ)
(tzv. 3σ – interval)
je rovna 99,7 %.
Tuto chybu definujeme jako krajní (mezní) chybu.
Jedná se o interval spolehlivosti (μ – kσ, μ – kσ), kde k = 3.σ .
Dále definujeme tzv. pravděpodobnou chybu pro P = 0,5 (= 50 %)
k = 2/3 a interval spolehlivosti je (µ - 2/3 σ, µ + 2/3 σ).
Pravděpodobnost naměření hodnoty v intervalu (µ - 2/3σ, µ + 2/3σ) je
rovna 50 % (tento interval vymezuje právě polovinu obsahu plochy pod
normální křivkou).
Při běžných měřeních často stačí pracovat s tímto intervalem.
(hodnota chyba) jednotkyx
Měříme náhodnou veličinu x a chceme určit odhad její střední hodnoty a
chyby, tedy výraz:
Opakujeme n – krát měření za stejných podmínek, odhad střední hodnoty
získáme jako:
1
1 n
i
i
x xn
aritmetický průměr
a odhad směrodatné odchylky (chyby)
jednoho měření 2
1
( )
1
n
i
ix
x x
sn
( )xx x s
Odhady střední hodnoty a směrodatné odchylky pro
konečný počet měření
Při měření intenzity pozadí ionizujícího záření byly naměřeny následující hodnoty:
číslo
měření
Intenzita
1 3,0
2 4,0
3 3,0
4 3,0
5 4,0
Vypočtěte odhad střední hodnoty a směrodatné
odchylky.
Příklad
2
1
( )
1
n
i
ix
x x
sn
Při měření intenzity pozadí ionizujícího záření byly naměřeny následující hodnoty:
číslo
měření
intenzita
(imp/10s)
1 3
2 4
3 3
4 3
5 4
Vypočtěte odhad střední hodnoty a směrodatné
odchylky.
Příklad
Řešení
Vlastnosti aritmetického průměru
Při malém počtu měření se spojitá n. v. neřídí normálním rozdělením, ale tzv.
Studentovým neboli t-rozdělením
Směrodatná odchylka při malém počtu měření
Křivka je plošší (tím více, čím
nižší je N) → pro dosažení stejné
psti P výskytu naměřené hodnoty
v nějakém intervalu symetrickém
kolem μ je třeba u t-rozdělení
zvolit interval (μ – kσ, μ + kσ)
širší.
Kritéria pro vyloučení hrubých chyb měření
Připomeňme si:
Pravděpodobnost naměření hodnoty v intervalu (µ - 3σ, µ + 3σ) je
rovna (tzv. 3σ – interval) je 99,7 % (= jistota) → krajní (mezní) chyba
Směrodatná odchylka jednoho měření však není pro celý soubor N
měření dostačující. Pokud bychom znovu provedli N měření, dospěli
bychom k jiné hodnotě arit. průměru (i když je střední hodnota μ stejná).
1
1 n
i
i
x xn
2
1
( )
( 1)
n
i
ix
x x
sn n
( )xx x s
Posuvným měřidlem byly naměřeny tyto
hodnoty délky: 3,12 cm; 3,00 cm; 3,06
cm. Předpokládejte, že měřené hodnoty
jsou zatíženy jen náhodnými chybami.
Vypočtěte odhad střední hodnoty a
směrodatnou odchylku jednoho
měření a aritmetického průměru.
Určete interval spolehlivosti pro
P= 0,995 a P = 0,5. Vypočtěte relativní
chyby.
Cvičení 1. Určení střední hodnoty a chyby při malém počtu měření
V tabulce jsou zaznamenány
naměřené hodnoty hmotnosti.
Předpokládejte, že měřené hodnoty
jsou zatíženy jen náhodnými chybami.
Vypočtěte odhad střední hodnoty a
směrodatnou odchylku jednoho
měření a aritmetického průměru.
Určete interval spolehlivosti pro
P = 0,999, P = 0,995 a P = 0,5.
Vypočtěte relativní chyby.
Cvičení 2. Určení střední hodnoty a chyby při malém počtu měření
Cvičení 3. Určení střední hodnoty a chyby při malém počtu měření
- použití přísnějšího kritéria pro vyloučení hrubých chyb
V tabulce jsou zaznamenány naměřené hodnoty hmotnosti. Předpokládejte, že
měřené hodnoty jsou zatíženy jen náhodnými chybami.
Vypočtěte odhad střední hodnoty a směrodatnou odchylku jednoho měření a
aritmetického průměru. Pro vyloučení hrubých chyb užijte t-kritérium.
Cvičení 3. Určení střední hodnoty a chyby při malém počtu měření
- použití přísnějšího kritéria pro vyloučení hrubých chyb
V tabulce jsou zaznamenány naměřené
hodnoty průměru drátu (průměr drátu byl
měřen na deseti různých místech, vždy ve
dvou navzájem kolmých směrech).
Předpokládejte, že měřené hodnoty jsou
zatíženy jen náhodnými chybami), měření bylo
provedeno mikrometrem.
Vypočtěte odhad střední hodnoty a
směrodatnou odchylku jednoho měření a
aritmetického průměru.
Určete interval spolehlivosti pro P = 0,997 a
P = 0,5. Vypočtěte relativní chyby.
Cvičení 4. Určení střední hodnoty a chyby při dostatečném počtu měření