1
Softwarová podpora při řešení projektů
s aplikací statistických metod
Ing. Jan Král
CQR při ISQ Praha
Ing. Josef Křepela
CQR při Ústavu strojírenské technologie Strojní fakulty ČVUT
Praha
2
Uplatňování statistických metod při analýze výrobního
procesu a při návrhu statistické regulace:
• definovat proces (znaky jakosti, mezní hodnoty)
• uvažovat všechny možné zdroje variability a
eliminovat ty, u kterých je to možné;
• zvolit měřící systém a stanovit jeho opakovatelnost,
reprodukovatelnost a způsobilost ;
• zpracovat výčet možných situací které mohou
zhoršovat jakost na výstupu procesu a instrukcí
k jejich eliminování pro obsluhu;
3
• stanovit plán pro sběr základních dat (velikost
podskupin, kontrolní intervaly, způsob záznamu
zabezpečit jejich správnost atd.);
• realizovat korektní sběr dat;
• zálohovat primární data a zvolit vhodné metody
zpracování dat a softwarovou podporu;
• detekovat vymezitelné příčiny variability a
usilovat
o jejich odstranění (pokud to jde);
• ověřit předpoklady nutné pro aplikaci vybraných
statistických metod (normalita, stabilita procesu
atd.);
4
• vyhodnocení náhodné – neodstranitelné
variability a stanovit způsobilost a výkonnost
sledovaného znaku jakosti;
• navrhnout vhodný způsob sledování procesu pro
další období.
5
Nejčastější prohřešky v praxi:
• nevhodný způsob měření;
• nedostatečná analýza možných vymezitelných
příčin variability;
• cílená, nebo nevědomá úprava napozorovaných
dat;
• nesprávná volba metody zpracování dat,
nerespektování stanovených předpokladů;
• žádná, nebo nedostatečná softwarová podpora;
• nesprávné využívání softwaru.
6
Důvody pro zpracování projektů analýzy procesu s podporou Microsoft Excel
• nedostatek finančních prostředků pro koupi
sofistikovaného softwaru podporujícího analýzu
procesu a SPC;
• ověření možností a potřeby provádět analýzu
procesu, argumenty pro koupi vhodného
softwaru;
• Microsoft Excel, který je běžně užíván zahrnuje
značnou škálu statistických funkcí a nástrojů,
postačujících pro počáteční studie.
7
Šablony pro analýzu dat
Pro úvodní analýzu procesu, vyhodnocení předpokladů pro stanovení způsobilosti a výkonnosti procesu a uplatnění statistické regulace byly vypracovány šablony zahrnující pět pracovních listů.
Zásadně do žlutě zabarvených buněk je možno vkládat a měnit hodnoty. Zeleně zabarvené buňky obsahují vzorce a zobrazují výsledky. Tyto nesmí být měněny.
8
1) List „Data“
Záznam napozorovaných dat a výpočet základních výběrových charakteristik podskupin
x bar, Me, s, s2, R .
Na listě je možno činit poznámky o případných změnách a zásazích v procesu. Data i poznámky je možno na příkaz vytisknout.
9
Napozorované hodnoty v podskupinách Výběrové charakteristiky podskupin
j x1 x2 x3 x4 x5 x6 x7 x8 x9 x10 x bar Me s s2 R
1 19,993 19,995 19,997 19,995 19,999 19,99580 19,99500 0,00228 0,00001 0,00600
2 20,006 20,010 20,010 20,022 20,002 20,01000 20,01000 0,00748 0,00006 0,02000
3 19,958 19,982 19,973 19,985 19,979 19,97540 19,97900 0,01069 0,00011 0,02700
4 19,996 20,006 19,988 20,002 20,001 19,99860 20,00100 0,00691 0,00005 0,01800
5 19,995 19,998 20,002 20,003 19,998 19,99920 19,99800 0,00327 0,00001 0,00800
6 20,009 20,006 20,012 20,007 20,012 20,00920 20,00900 0,00277 0,00001 0,00600
7 20,001 20,006 20,006 19,995 20,006 20,00280 20,00600 0,00487 0,00002 0,01100
8 20,004 20,002 20,006 19,991 20,005 20,00160 20,00400 0,00611 0,00004 0,01500
9 19,986 19,984 20,010 20,001 20,005 19,99720 20,00100 0,01161 0,00013 0,02600
10 19,991 20,011 20,006 19,980 20,009 19,99940 20,00600 0,01339 0,00018 0,03100
11 19,996 19,996 20,001 20,003 19,996 19,99840 19,99600 0,00336 0,00001 0,00700
12 20,002 20,018 20,006 19,987 19,995 20,00160 20,00200 0,01167 0,00014 0,03100
13 20,019 19,981 20,005 19,990 20,007 20,00040 20,00500 0,01496 0,00022 0,03800
14 20,046 20,039 20,028 20,030 20,021 20,03280 20,03000 0,00978 0,00010 0,02500
15 19,996 20,003 20,005 19,997 20,008 20,00180 20,00300 0,00517 0,00003 0,01200
16 20,008 19,985 20,005 19,989 20,002 19,99780 20,00200 0,01018 0,00010 0,02300
17 20,005 20,018 20,007 19,994 20,028 20,01040 20,00700 0,01301 0,00017 0,03400
18 20,010 20,013 19,977 19,999 20,004 20,00060 20,00400 0,01426 0,00020 0,03600
19 19,998 19,995 20,013 19,995 20,012 20,00260 19,99800 0,00913 0,00008 0,01800
20 20,011 20,026 20,017 19,989 20,015 20,01160 20,01500 0,01378 0,00019 0,03700
21 20,019 20,004 20,026 20,004 19,995 20,00960 20,00400 0,01258 0,00016 0,03100
22 20,018 20,013 19,998 20,000 20,011 20,00800 20,01100 0,00863 0,00007 0,02000
23 20,018 20,005 20,024 19,982 20,003 20,00640 20,00500 0,01623 0,00026 0,04200
24 20,000 20,007 20,003 20,001 20,000 20,00220 20,00100 0,00295 0,00001 0,00700
25 19,996 20,004 20,009 20,000 19,999 20,00160 20,00000 0,00503 0,00003 0,01300
26 19,999 20,007 19,993 20,017 19,990 20,00120 19,99900 0,01096 0,00012 0,02700
27 20,000 20,001 20,003 19,998 20,001 20,00060 20,00100 0,00182 0,00000 0,00500
28 20,039 20,006 20,019 20,018 20,035 20,02340 20,01900 0,01350 0,00018 0,03300
29 19,998 20,005 20,007 20,002 20,008 20,00400 20,00500 0,00406 0,00002 0,01000
30 20,013 19,983 19,987 20,021 19,999 20,00060 19,99900 0,01633 0,00027 0,03800
31 20,025 20,035 20,055 20,043 20,046 20,04080 20,04300 0,01137 0,00013 0,03000
32 20,025 20,023 19,985 19,989 20,022 20,00880 20,02200 0,01998 0,00040 0,04000
33 19,999 20,009 19,982 20,000 20,016 20,00120 20,00000 0,01279 0,00016 0,03400
34 20,018 20,020 20,002 20,012 20,024 20,01520 20,01800 0,00856 0,00007 0,02200
35 19,993 20,007 20,007 19,997 19,996 20,00000 19,99700 0,00656 0,00004 0,01400
36 20,015 20,012 20,005 20,019 20,006 20,01140 20,01200 0,00594 0,00004 0,01400
10
2) List „Výpočet regulačních diagramů“
• Shewhartových, v souladu s ČSN ISO 8258 když základní hodnoty nejsou dány („přirozené“ regulační meze).
• Shewhartových, v souladu s ČSN ISO 8258 když základní hodnoty jsou dány („technické“ regulační meze).
• Rozšířené regulační meze vycházející z celkové směrodatné odchylky tot.
• Rozšířené regulační meze vycházející ze směrodatné odchylky výběrových průměrů podskupin x bar.
• Rozšířené regulační meze vycházející z rozšíření regulačního pole o v souladu s přístupem firmy Ford a dalších automobilových firem.
11
USL = 20,04
PRAVDA nj rozsah podskupiny 5 LSL = 19,96 0,0040
PRAVDA k počet podskupin 100 = 0,0030
PRAVDA x bar bar = 20,004532 Pp = Ppk = 1,33 0,0028
PRAVDA Me bar = 20,005460
PRAVDA R bar = 0,020520 X0 = 20
PRAVDA s bar = 0,008354 0 = 0,010025
s2 bar = 0,000094
s tot = 0,012554 max = 20,055
s xbar 0,009120 min = 19,955
Fixní měřítko osy Y grafů PRAVDA
Graf polohy: Maximum: 20,050Minimum: 19,960Dělení osy: 0,010
Graf měnlivosti: Maximum: 0,025Minimum: 0,000Dělení osy: 0,005
Vypočtené statistiky pro RD:
Regulační diagramy pro výběrové průměry a směrodatné odchylky :
Meze
X
eM
R
s2s
tots
Xs
Přirozené
Technické
Rozšířené Stot
Rozšířené Sx bar
Rozšířené delta
Zóny A,B,C
Skrytá data nesmazat!
Regulační diagram se automaticky překresluje pro
počítačem navrženou y-stupnici. Při zaškrtnutí nedochází k přepočtu a
překreslení je možno provést pro zadané hodnoty.
Zaškrtnutím je možno zvolit typy regulačních
mezí.
Zaškrtnutím je možno zobrazit zóny pro testy
nenáhodných seskupení.
Zadání USL a LSL je nezbytné pro výpočet
„technických“ regulačních mezí..
12
Výpočet regulačních mezí je proveden automaticky.
A) Základní hodnoty nejsou stanoveny (přirozené regulační meze):
Statistika CL UCL LCL
x bar x bar bar x bar bar + A2* R bar 20,016 x bar bar - A2*R bar 19,993
x bar bar x bar bar + A3*s bar 20,0165 x bar bar - A3 * s bar 19,9926
R R bar R bar * D4 0,043 R bar * D3 0,000
s s bar s bar * B4 0,01745 s bar * B3 0,000
Me Me bar Me bar + A4 * R bar 20,020 Me bar - A4 * R bar 19,991
B) Základní hodnoty jsou stanoveny (technické regulační meze):
Statistika CL TUCL TLCL
x bar X0 X0 + A 0 20,013 X0 - A 0 19,987
s 0*C4
0 *B6 0,020
0 *B5 0,000
R 0*d2
0 *D2 0,049
0 *D1 0,000
C) Rozšířené regulační meze pro výběrové průměry, s využitím s tot:
Statistika CL UCL LCL
x bar x bar bar x bar bar + A3*s tot *C4 20,021 x bar bar - A3 * s tot * C4 19,988
x bar x bar bar x bar bar + 3*s x bar 20,032 x bar bar - 3*s x bar 19,977
D) Rozšířené regulační meze pro výběrové průměry, s využitím :
Statistika CL UCL LCL
x bar x bar bar xbarbar+A3*sbar+/2 20,016 xbarbar - A3*sbar - /2 19,993
Vzorce a výpočet regulačních diagramů při kontrole měřením:
13
LSL TLCL RLCL2 RLCL RLCL LCL CL UCL RUCL RUCL RUCL2 TUCL USL
19,960 19,987 19,977 19,993 19,9877 19,9926 20,0045 20,0165 20,0214 20,0165 20,0319 20,0135 20,040
Výběrové průměry
19,960
19,970
19,980
19,990
20,000
20,010
20,020
20,030
20,040
20,050
0 10 20 30 40 50 60 70 80 90 100
Zakreslený regulační diagram pro výběrové průměry se zvolenými (zaškrtnutými) regulačními mezemi a vyznačenými zónami.
Regulační meze:
„Přirozené“
„Technické“
„Rozšířené sTot“
„Rozšířené sx bar“
„Rozšířené o “
14
CL LCL UCL
0,00835 0,0000 0,01745
Výběrové směrodatné odchylky
0,000
0,005
0,010
0,015
0,020
0,025
0 10 20 30 40 50 60 70 80 90 100
Zakreslený regulační diagram pro výběrové směrodatné odchylky s „přirozenými“ regulačními mezemi a vyznačenými zónami.
15
3) List „Způsobilost“
• Pro ukazatele způsobilosti Cp, CpU, CpL a Cpk se počítají
odhady; konfidenční intervaly pro zvolenou konfidenční úroveň; statistické pokryvné intervaly.
Tyto ukazatele vycházejí z „krátkodobé“ variability uvnitř podskupin. Předpokládá se normální rozdělení studovaného znaku jakosti a statisticky zvládnutý proces („v užším slova smyslu“) – v čase se nemění ani střední hodnota, ani variabilita.
Např. ve výrazu
se odhaduje jako
6
LSLUSLCp
.)xx(n
1
k
1s
k
1i
n
1j
2jij
16
• Pro ukazatele výkonnosti Pp, PpU, PpL a Ppk se počítají
odhady; konfidenční intervaly pro zvolenou konfidenční úroveň; statistické pokryvné intervaly
Tyto ukazatele vycházejí z „dlouhodobé“ variability v procesu, tj. jak variability uvnitř podskupin, tak mezi podskupinami. Předpokládá se normální rozdělení studovaného znaku jakosti a statisticky zvládnutý proces („v širším slova smyslu“) – v čase se nemění variabilita, ale střední hodnota se může měnit známým způsobem a je neodstranitelná.
Např. ve výrazu
se tot odhaduje jako
totp 6
LSLUSLP
.)xx(kn
1s
kn
1i
2totitot
17
nj rozsah podskupiny 5
k počet podskupin 100
x bar bar = 20,004532
R bar = 0,020520
s bar = 0,008354
s2 bar = 0,000094
s tot = 0,012554
způsobilosti a výkonnosti
Výpočet ukazatelů způsobilosti a výkonnosti
Výběrové charakteristiky pro výpočet ukazatelů
Výběrové průměry
19,940
19,960
19,980
20,000
20,020
20,040
20,060
0 10 20 30 40
Výběrové směrodatné odchylky
0,000
0,005
0,010
0,015
0,020
0,025
0 10 20 30 40
XeMR
s2s
tots
Z dat v listu „Data“ se přenesou základní statistiky:
a provedou se následující výpočty:
18
Volba typu způsobilosti:
Způsobilost: R bar / d2 0,0088
odhad způsobilosti: 0,0088877 s bar / C4 0,0088877
odm. s2 bar 0,0097
Počet podskupin k = 100 2
Rozsah podskupin nj = 5Počet stupňů volnosti n = 400
Dána USL = 20,04
Dána LSL = 19,96
odhad Cpx = 1,500
Konfidenční interval:
konfidenční úroveň 1-2a = 0,95koeficient dolní k(n,a) = 0,930701
koeficient horní k(n,1-a) = 1,069235
1,396 < Cp < 1,604
odhad CxpU = 1,330
pU = 3,2941E-05
odhad CxpL = 1,670
pL = 2,71409E-07
odhad Cxpk = 1,330
Konfidenční interval:
koeficient dolní m(n,a) = 0,930705
koeficient horní m(n,1-a) = 1,069295
1,238 < Cpk < 1,422
R bar / d2s bar / C4odm. s2 bar
19
Výkonnost:
odhad Pxp = 1,062
Konfidenční interval:počet st. volnosti n = 499
konfidenční úroveň 1-2a = 0,95koeficient dolní k(n,a) = 0,937953
koeficient horní k(n,1 a) = 1,061996
0,996 < Pp < 1,128
odhad PxpU = 0,942
pU = 0,002362646
odhad PxpL = 1,182
pL = 0,000194692
odhad Pxpk = 0,942
Konfidenční interval:
koeficient dolní m(n,a) = 0,937958
koeficient horní m(n,1 a) = 1,062042
0,883 < Ppk < 1,000
20
Statistické pokryvné intervaly: n = 400Cp
pravděpodobnost 1-2a = 0,95dán ukazatel Cp = 1,33koeficient dolní l(n,a) = 0,935248
koeficient horní l(n,1 a) = 1,074459
1,244 < Cxp < 1,429
Cpk
pravděpodobnost 1-2a = 0,99dán ukazatel Cpk = 1,00koeficient dolní n(n,a) = 0,916532
koeficient horní n(n,1 a) = 1,100194
0,917 < Cxpk < 1,100
Pp
pravděpodobnost 1-2a = 0,95dán ukazatel Pp = 1,33koeficient dolní l(n,a) = 0,935248
koeficient horní l(n,1 a) = 1,074459
1,244 < Pxp < 1,429
Ppk
pravděpodobnost 1-2a = 0,90dán ukazatel Ppk = 1,67koeficient dolní n(n,a) = 0,945042
koeficient horní n(n,1 a) = 1,061745
1,578 < Pxpk < 1,773
Pro ukazatele C je n = k(n-1).
Pro ukazatele P je n = kn-1.
21
4) List „Normalita“
• Provádí se Kolmogorovův test dobré shody s normálním rozdělením na hladině významnosti a = 0,05;
• Zakresluje se histogram z napozorovaných hodnot s proloženou křivkou normálního rozdělení.
Pro zakreslení histogramu se automaticky vypočítají meze třídních intervalů. Je ale možno zvolit jak šířku třídních intervalů, tak horní mez prvního třídního intervalu.
22
počet = 500x bar tot = 20,005s tot = 0,0126Max = 20,055Min = 19,955Rozpětí = 0,100Teor.počet int. = 23,00Šířka třídy = 0,0043
Max. ABS, dif. 0,063992054Krit. hod. = 0,060821049
Závěr:
500,0000
Fixovat PRAVDAŠířka třídy 0,0050Počet mezi kat. 3h. mez.1.int. 19,9500
Normalitu zamítnout
Kolmogorovův test dobré shody s normálním rozdělením
0
20
40
60
80
100
120
19,9475 19,9625 19,9775 19,9925 20,0075 20,0225 20,0375 20,0525
23
5) List „Stabilita“
• Ověřuje se hypotéza, že všechny podskupiny pocházejí ze základních souborů se stejnou střední hodnotou pomocí ANOVA.
• Ověřuje se hypotéza, že všechny podskupiny pocházejí ze základních souborů se stejným rozptylem pomocí Bartlettova testu.
24
Test středních hodnot100
celkový průměr = 20,0045celková sm. odch. = 0,01255
SS mezi výběry = 0,0400
počet st. vol. mezi výběry (f1) = 99
MS mezi výběry = 0,00
SS všechny výběry = 0,0329
počet st. vol. všechny výběry (f2) = 400
MS všechny výběry = 0,000082
SS celkem = 0,0729
počet st. vol. celkem = 499
testová statistika F = 4,905
Zvolená hl. významnosti a = 0,05a krit. F = 1,28422
(tj. 1-a kvantil F)
Hypotéza o rovnosti středních hodnot se zamítáP-hodnota = 3,05E-30
souborů se stejnou střední hodnotou a stejným rozptylemOvěření hypotézy: Všechny podskupiny pocházejí ze základních
25
Test rozptylů (Bartlettův test)fi = 4
log(fi) = 0,602060
s2 = 0,000087
log(s2) = -4,062419
suma [log(SSDi) - log(fi)] = -415,3903717
[suma [log(SSDi) - log(fi)]] / počet(E:E) = -4,372530
log(s2) - [suma [log(SSDi) - log(fi)]] / počet(E:E) = 0,310111
c = 1,084211
testová stat. X2 = 250,269
f = 94zvolená hladina významnosti a = 0,05
a krit. X2 = 117,632
(tj. 1-a kvantil X2)
Hypotéza o rovnosi rozptylů se zamítáP-hodnota = 3,89E-16
26
Literatura Kotz S., Johnson N. L.: Process Capability Indices. Chapman and Hall 1993
Michálek J.: Procesy s rozšířenými regulačními mezemiResearch Report No. 1986 ÚTIA AVČR srpen 2000
Michálek J., Křepela J.: Koeficienty způsobilosti a výkonnosti v případě rozšířených regulačních mezí. Research Report No. 2009, ÚTIA AVČR, leden 2001
Michálek J., Křepela J.: Regulační diagramy s rozšířenými regulačními mezemi. Statistické dny v Brně, CQR, červen 2006
ČSN ISO 8258:1994 Shewhartovy regulační diagramy
Daimler Chrysler Corporation, Ford Motor Company a General Motors Corporation: Statistická regulace procesů (SPC), přeložil Michálek J., ČSJ Praha 2006
27