1
Potlačování šumu pomocí DCTMartin Chládek – Richard Starý
2
Zadání
• Použití DCT při potlačování stacionárního šumuv nestacionárním signálu. implementace algoritmu dle [1]
• Diskutujte: rozdíly ve vlastnostech DFT a DCT dosaženou úroveň potlačení šumu při použití DFT a DCT rozdíl oproti spektrálnímu odečítání
• Doporučená literatura: [1] Soon, I. Y., Koh, S. N., Yeo, Ch. K. Noisy speech enhancement using discrete cosine transform. Speech Communication, vol. 24, strany 249 – 257, 1998.
3
DCT – vlastnosti a použitíRichard Starý
4
DCT – definice
• reálná transformace
• ortonormální báze: {1, cos (k/2N)}, k = 1, .., N – 2.
5
DCT versus DFT
DFT DCT
6
DCT – kompresní vlastnosti
7
DCT – kompresní vlastnosti
8
DCT – kompresní vlastnosti
DCT:
• velmi malá korelace mezi koeficienty (podobná KLT)
• výpočetně jednoduchá
=> využití při kompresi signálů
=> standardy JPEG, MPEG a další
9
DCT – fázové spektrum a šum• Fáze řečového signálu je významná
• již změna fáze /8 činí řeč „elektronickou“• standardní metody korigují pouze amplitudové spektrum
DCT DFT
=> DCT odolnější vůči zkreslení fázového spektra=> DCT teoreticky umožňuje vyšší maximální
zlepšení SNR (cca + 2 dB)
=> DCT je odolnější vůči zkreslení fázového spektra=> DCT teoreticky umožňuje vyšší maximální
zlepšení SNR než DFT (cca o 2 dB)
10
DCT – přehled
• reálná transformace
• existují efektivní metody výpočtu DCT
• dobré kompresní vlastnosti
• odolnost fázového spektra proti šumu
11
DCT – potlačování šumuMartin Chládek
12
Algoritmus zpracování• zpracování algoritmem OLA (Overlap and Add)• předpoklady
• řeč je v jednotlivých segmentech stacionární• šum je aditivní a stacionární
• každý segment je filtrován• spektrální odečítání• Wienerův filtr
T T-1filtrace
segmentace ( + násobení oknem)
rekonstrukce
T = transformace (DCT, DFT)
13
Filtrace
• adaptivní filtr = vyhlazený odhad spektra šumu
• spektrální odečítání
• Wienerův filtr
filtrace, H(k)
)(ˆ)(,0max)(ˆ kNkXkS
)()()( kNkSkX )(ˆ kS
)(ˆ kN
N̂
)()(ˆ kXkS
2
2
2
)(
)(ˆ)(
kX
kSkH
222
)(ˆ)(,0max)(ˆ kNkXkS
14
SNR kritéria
•
• s(t) … původní signál• n(t) … zbytkový šum po filtraci• odhad P[n(t)]
• odečítáním výkonů (signál a šum nekorelované)• odečítáním v čase
SEGSNR• započítává jen segmenty s řečí• SEGSNR = průměr SNR nepřekrývajících se
segmentů• více odpovídá poslechovým testům
)]([
)]([log10
tnP
tsPSNR
)()(ˆ)(ˆ tststn
15
Parametry algoritmu
• OLA• okno 256 vzorků, Hammingovo váhovací
okno• překryv 50 %
• SNR• všechna udávaná SNR jsou SEGSNR• délka okna 128 vzorků
• transformace• DCT a FFT implementované v Matlabu
16
Výsledky (1)
Time
Fre
quen
cy
SA114992.CS0
0 2000 4000 6000 8000 10000 12000 14000 16000 180000
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
-10 -5 0 5 10 15 20-5
0
5
10Spektralni odecitani, SA114992.CS0, nc1.bin
SNR [dB]
S
NR
[dB
]
FFT
DCT
-10 -5 0 5 10 15 20-2
0
2
4
6
8Wieneruv filtr, SA114992.CS0, nc1.bin
SNR [dB]
S
NR
[dB
]
FFT
DCT
0 1 2 3 4 5 6 7 8
x 104
0
100
200
300
400
500
600
700
800
900
1000nc1.bin
17
Výsledky (2)
-10 -5 0 5 10 15 200
5
10
15Spektralni odecitani, SA114992.CS0, white.bin
SNR [dB]
S
NR
[dB
]
FFT
DCT
-10 -5 0 5 10 15 202
4
6
8
10Wieneruv filtr, SA114992.CS0, white.bin
SNR [dB]
S
NR
[dB
]
FFT
DCT
Time
Fre
quen
cy
SA114992.CS0
0 2000 4000 6000 8000 10000 12000 14000 16000 180000
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5
x 104
0
50
100
150
200
250
300
350white.bin
18
Závěr
• Wienerova filtrace=> výhodnější je použití DFT
• Spektrální odečítání=> pro vyšší vstupní SNR je lepší DCT
(především pro nízkofrekvenční šum)
DCT• není obecně lepší než DFT• výhodná alternativa k DFT pro speciální případy
19
Použitá literatura
[1]
Soon, I. Y., Koh, S. N., Yeo, Ch. K. Noisy speech enhancement using discrete cosine transform. Speech Communication, vol. 24, strany 249 – 257, 1998.
[2]
Hasan, Md. K., Salahuddin S., Khan, M. R. Reducing signal-bias from MAD estimated noise level for DCT speech enhancement, Signal Processing, vol. 84, strany 151 – 162, 2004.
[3]
Madisetti, V. K., Williams, D. B. Digital signal processing – Handbook, CRC Press, 1690 stran, 1999.