Download - Potlačování šumu pomocí DCT

Transcript

Potlačování šumu pomocí DCTMartin Chládek – Richard Starý

Zadání

• Použití DCT při potlačování stacionárního šumuv nestacionárním signálu. implementace algoritmu dle [1]

• Diskutujte: rozdíly ve vlastnostech DFT a DCT dosaženou úroveň potlačení šumu při použití DFT a DCT rozdíl oproti spektrálnímu odečítání

• Doporučená literatura: [1] Soon, I. Y., Koh, S. N., Yeo, Ch. K. Noisy speech enhancement using discrete cosine transform. Speech Communication, vol. 24, strany 249 – 257, 1998.

DCT – vlastnosti a použitíRichard Starý

DCT – definice

• reálná transformace

• ortonormální báze: {1, cos (k/2N)}, k = 1, .., N – 2.

DCT versus DFT

DFT DCT

DCT – kompresní vlastnosti

DCT – kompresní vlastnosti

DCT – kompresní vlastnosti

DCT:

• velmi malá korelace mezi koeficienty (podobná KLT)

• výpočetně jednoduchá

=> využití při kompresi signálů

=> standardy JPEG, MPEG a další

DCT – fázové spektrum a šum• Fáze řečového signálu je významná

• již změna fáze /8 činí řeč „elektronickou“• standardní metody korigují pouze amplitudové spektrum

DCT DFT

=> DCT odolnější vůči zkreslení fázového spektra=> DCT teoreticky umožňuje vyšší maximální

zlepšení SNR (cca + 2 dB)

=> DCT je odolnější vůči zkreslení fázového spektra=> DCT teoreticky umožňuje vyšší maximální

zlepšení SNR než DFT (cca o 2 dB)

DCT – přehled

• reálná transformace

• existují efektivní metody výpočtu DCT

• dobré kompresní vlastnosti

• odolnost fázového spektra proti šumu

DCT – potlačování šumuMartin Chládek

Algoritmus zpracování• zpracování algoritmem OLA (Overlap and Add)• předpoklady

• řeč je v jednotlivých segmentech stacionární• šum je aditivní a stacionární

• každý segment je filtrován• spektrální odečítání• Wienerův filtr

T T-1filtrace

segmentace ( + násobení oknem)

rekonstrukce

T = transformace (DCT, DFT)

Filtrace

• adaptivní filtr = vyhlazený odhad spektra šumu

• spektrální odečítání

• Wienerův filtr

filtrace, H(k)

)(ˆ)(,0max)(ˆ kNkXkS

)()()( kNkSkX )(ˆ kS

)(ˆ kN

N̂

)()(ˆ kXkS

)(

)(ˆ)(

kSkH

222

)(ˆ)(,0max)(ˆ kNkXkS

SNR kritéria

•

• s(t) … původní signál• n(t) … zbytkový šum po filtraci• odhad P[n(t)]

• odečítáním výkonů (signál a šum nekorelované)• odečítáním v čase

SEGSNR• započítává jen segmenty s řečí• SEGSNR = průměr SNR nepřekrývajících se

segmentů• více odpovídá poslechovým testům

)]([

)]([log10

tnP

tsPSNR

)()(ˆ)(ˆ tststn

Parametry algoritmu

• OLA• okno 256 vzorků, Hammingovo váhovací

okno• překryv 50 %

• SNR• všechna udávaná SNR jsou SEGSNR• délka okna 128 vzorků

• transformace• DCT a FFT implementované v Matlabu

Výsledky (1)

Time

Fre

quen

SA114992.CS0

0 2000 4000 6000 8000 10000 12000 14000 16000 180000

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

-10 -5 0 5 10 15 20-5

10Spektralni odecitani, SA114992.CS0, nc1.bin

SNR [dB]

[dB

]

FFT

DCT

-10 -5 0 5 10 15 20-2

8Wieneruv filtr, SA114992.CS0, nc1.bin

SNR [dB]

[dB

]

FFT

DCT

0 1 2 3 4 5 6 7 8

x 104

100

200

300

400

500

600

700

800

900

1000nc1.bin

Výsledky (2)

-10 -5 0 5 10 15 200

15Spektralni odecitani, SA114992.CS0, white.bin

SNR [dB]

[dB

]

FFT

DCT

-10 -5 0 5 10 15 202

10Wieneruv filtr, SA114992.CS0, white.bin

SNR [dB]

[dB

]

FFT

DCT

Time

Fre

quen

SA114992.CS0

0 2000 4000 6000 8000 10000 12000 14000 16000 180000

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5

x 104

100

150

200

250

300

350white.bin

Závěr

• Wienerova filtrace=> výhodnější je použití DFT

• Spektrální odečítání=> pro vyšší vstupní SNR je lepší DCT

(především pro nízkofrekvenční šum)

DCT• není obecně lepší než DFT• výhodná alternativa k DFT pro speciální případy

Použitá literatura

[1]

Soon, I. Y., Koh, S. N., Yeo, Ch. K. Noisy speech enhancement using discrete cosine transform. Speech Communication, vol. 24, strany 249 – 257, 1998.

[2]

Hasan, Md. K., Salahuddin S., Khan, M. R. Reducing signal-bias from MAD estimated noise level for DCT speech enhancement, Signal Processing, vol. 84, strany 151 – 162, 2004.

[3]

Madisetti, V. K., Williams, D. B. Digital signal processing – Handbook, CRC Press, 1690 stran, 1999.