NEWTON Technologies, a.s.

Post on 21-Mar-2016

31 views 2 download

description

„Přepis mluveného slova do textové podoby“ Program NewtonDictate. NEWTON Technologies, a.s. Ing. Petr Herian www.diktovani.cz petr.herian @diktovani .cz. NEWTON Media. NEWTON Media - Největší komerční archív plných textů v ČR - PowerPoint PPT Presentation

transcript

NEWTON Technologies, a.s.

„Přepis mluveného slova do textové podoby“

Program NewtonDictate

Ing. Petr Herian www.diktovani.cz petr.herian@diktovani.cz

NEWTON Media - Největší komerční archív plných textů v ČR

• Unikátní patentovaný systém zpracování dat, (světová konference FIBEP 2008 v Praze)

• Multimediální archiv pro vydavatele a vysílatele (Mafra, Ringier, TV Nova, ČRo, PSP,…)

V Newtonu Média řešíme úlohu

• Měsíčně zpracováváme 8000 hodin záznamu, 600 hodin doslovně přepisujeme• Okamžitá úspora času (30-75%)

•Spolupráce s Technickou univerzitou v Liberci (od roku 2005):

• Propojení vývojových týmů, sdílení výsledků a zkušeností, zpětná vazba• Spolufinancování vývoje technologie Voice to Text (V2T)• Samostatné nadstavbové moduly, nové aplikace, servis, komunikace s klienty

NEWTON NEWTON MediaMedia

Produkty vývoje zavedené do Produkty vývoje zavedené do praxepraxe

MyVoice a MyDictate NewtonDictate – diktovací program

ATT – přepis a titulkování TV AudioSearch - vyhledávání v archivech

Praktická ukázka programu

NewtonDictate

NewtonDictate 2.4NewtonDictate 2.4

Základní funkce programuZákladní funkce programu

Program NewtonDictate pracuje jako textový editor (např. Program NewtonDictate pracuje jako textový editor (např. Word)Word)

a současně také jako digitální záznamníka současně také jako digitální záznamník

Program řeč nahrává, automaticky přepisuje, přičemž kteroukoliv část přepisu si lze kdykoliv přehrát a v případě potřeby snadno opravit.Diktuje se interpunkce, program automaticky formátuje čísla, symboly a používané zkratky.Program můžete jednoduše naučit nová slova, celé věty,...Program můžete naučit rozpoznávat Váš hlas (nadiktovat 120 předepsaných vět)

Diktovat lze do libovolného místa v textu, text i audio záznam lze libovolně kopírovat, mazat přesouvat. Program nadiktovaný záznam průběžně ukládá.

Diktovat můžete také do libovolného programu, diktuje se na pozici kurzoru. Program umí přepisovat audio nahrávky z diktafonů

Jak dosahovat nejlepších výsledků

při diktováni aneb boj o každé procento

Komunikace řečí - pro člověka přirozená věc, Komunikace řečí - pro člověka přirozená věc, pro počítač velmi komplikovaná úlohapro počítač velmi komplikovaná úloha

Systém pro rozpoznávání hlasu se stále učíSystém pro rozpoznávání hlasu se stále učí

1. HLAS - Variabilita hlasového projevu, každý člověk mluví 1. HLAS - Variabilita hlasového projevu, každý člověk mluví jinak jinak

(výška hlasu, podoba hlásek, intonace, výslovnost, volba slov, momentální stav, prostředí ...)

2. SLOVNÍK - Rozsáhlost slovní zásoby2. SLOVNÍK - Rozsáhlost slovní zásoby (Angličtina 50 tis. slov, Čeština (Angličtina 50 tis. slov, Čeština > 1 milion)> 1 milion)Systém rozpoznává jednotlivá slova, mnoho stejně znějících slov („byly“, „bily“, „Billy“ …),

250 000 příjmení v ČR, místopisné názvy apod.V současnosti systém rozpozná 500.000 slov, slovo které není ve slovníku systém nikdy

nepřepíše

Hlavní problémy rozpoznávání řečiHlavní problémy rozpoznávání řeči

3. KONTEXT - Volba nejpravděpodobnější sekvence po 3. KONTEXT - Volba nejpravděpodobnější sekvence po sobě jdoucích slov (odlišná témata)sobě jdoucích slov (odlišná témata)

chybí oddělovače (pauzy) mezi slovy, dochází ke koartikulaci, asimilaci,

Hlavní problémy rozpoznávání řečiHlavní problémy rozpoznávání řeči

Text: Až se vrátíš, zavolej jako včera na linku pět šest sedm.Text bez mezer: ažsevrátíšzavolejjakovčeranalinkupětšestsedmFoneticky: ašsevrátížzavolejakofčeranalinkupěčesedum

4. PROSTŘEDÍ - Vliv prostředí a přenosové cesty – 4. PROSTŘEDÍ - Vliv prostředí a přenosové cesty – degradace signáludegradace signáluhluk okolí, vlastnosti přenosové linky (mikrofon/diktafon), další mluvící osoby, ruchy, šumy…

Princip rozpoznávání řečiPrincip rozpoznávání řeči

Co bylo řečeno a v jakých časových okamžicích?| - | zavolá | - | premiéra | předseda | - |

| - | za | vola | premiéra | předsedá | - |

|-| zvolá | prima | éra | před | sebou | - |

| - | zavolej | premiéra | předsedo | - |

| - | zavolá | - | premiér | a | předseda | - |

Při rozpoznávání spojité řeči není apriori známo:- Kolik slov bylo řečeno?- Jaká sekvence slov byla řečena?- Byla všechna vyřčená slova ze slovníku?- Byla to skutečně jenom řeč nebo i další zvuky a hluky?- V jakých časových okamžicích začínala jednotlivá slova?

ZkušenostiZkušenosti

Zkušenosti s programem

• Program na každého reaguje jinak, ale obecný právní text přepíše bez větších chyb.

• Pokud tomu tak není je někde problém (mikrofon, charakteristika hlasu, nastavení (muž/žena), slovník)

• Nelze program jen zapnout a mluvit (existují vyjímky), je potřeba nalézt správný způsob diktování (intonace, plynulost,...) .

• Naučit se ideální způsob diktování trvalo zkušeným soudcům a advokátům několik hodin. Tato časová investice se však velmi rychle vrátila v úspoře času.

• Některá slova (věty) program nemá šanci rozpoznat

• Nejčastější chyba - my čekáme co program napíše, program čeká co řekneme

• Pro první seznámení doporučujeme přečíst známý text (nedívat se na monitor)

BudoucnostBudoucnost

Systém pro rozpoznávání hlasu se stále učíSystém pro rozpoznávání hlasu se stále učíNa vylepšení programu nepřetržitě Na vylepšení programu nepřetržitě

pracujemepracujeme

• Vaše zpětná vazba je pro nás velmi důležitá, své náměty přípomínky zasílejte na mail info@diktovani.cz.

• Každé další rozpoznané procento šetří čas. (stále vylepšujeme, HLAS, SLOVNÍK, VAZBY SLOV)

• Anonymizované texty zvýší úspěšnost rozpoznávání (místopisné názvy, často používané formulace, apod.)

• Úspěšnost rozpoznávání zvýší také doslovně přepsané audio nahrávky

REFERENCEREFERENCEMinisterstvo spravedlnosti - projekt pro všechny soudy a státní zastupitelství v ČR (přes 1.600 licencí)Inspekce životního prostředí – celostátní projekt pro všechny inspektoráty inspekceČeská národní banka - implementace systému přepisovacího pracovištěNEWTON Media, a.s. - projekt přepisu rozhlasového a televizního vysílání, titulkování TV

Ministerstvo vnitra Česká zemědělská univerzita1. a 3. Lékařská fakulta Univerzita Karlova Masarykova univerzita v BrněVšeobecná fakultní nemocnice v Praze EU-Media - EURActiv.cz IKEM - Institut Klinické a Experimentální Medicíny Poliklinika BudějovickáOblastní nemocnice Mladá Boleslav, a.s. Poliklinika Prosek Masarykova nemocnice v Ústí nad Labem Revmatologický ústavMammacentrum, Praha MEDICON, a.s.Nemocnice Prachatice, a.s ACHK - Ambulantní centrum pro choroby hlavy a krku, s.r.o.Gymnázium, ZŠ a MŠ pro sluchově postižené, Praha Metropolitní univerzita PrahaManlomka, s.r.o., chráněná dílna

Ing. Petr Herian                                             Ing. Magdaléna Nekolná

Děkuji za pozornost

www.diktovani.cz