+ All Categories
Home > Documents > NEWTON Technologies, a.s.

NEWTON Technologies, a.s.

Date post: 21-Mar-2016
Category:
Upload: tova
View: 31 times
Download: 2 times
Share this document with a friend
Description:
„Přepis mluveného slova do textové podoby“ Program NewtonDictate. NEWTON Technologies, a.s. Ing. Petr Herian www.diktovani.cz petr.herian @diktovani .cz. NEWTON Media. NEWTON Media - Největší komerční archív plných textů v ČR - PowerPoint PPT Presentation
14
NEWTON Technologies, a.s. „Přepis mluveného slova do textové podoby“ Program NewtonDictate Ing. Petr Herian www.diktovani.cz [email protected]
Transcript
Page 1: NEWTON Technologies, a.s.

NEWTON Technologies, a.s.

„Přepis mluveného slova do textové podoby“

Program NewtonDictate

Ing. Petr Herian www.diktovani.cz [email protected]

Page 2: NEWTON Technologies, a.s.

NEWTON Media - Největší komerční archív plných textů v ČR

• Unikátní patentovaný systém zpracování dat, (světová konference FIBEP 2008 v Praze)

• Multimediální archiv pro vydavatele a vysílatele (Mafra, Ringier, TV Nova, ČRo, PSP,…)

V Newtonu Média řešíme úlohu

• Měsíčně zpracováváme 8000 hodin záznamu, 600 hodin doslovně přepisujeme• Okamžitá úspora času (30-75%)

•Spolupráce s Technickou univerzitou v Liberci (od roku 2005):

• Propojení vývojových týmů, sdílení výsledků a zkušeností, zpětná vazba• Spolufinancování vývoje technologie Voice to Text (V2T)• Samostatné nadstavbové moduly, nové aplikace, servis, komunikace s klienty

NEWTON NEWTON MediaMedia

Page 3: NEWTON Technologies, a.s.

Produkty vývoje zavedené do Produkty vývoje zavedené do praxepraxe

MyVoice a MyDictate NewtonDictate – diktovací program

ATT – přepis a titulkování TV AudioSearch - vyhledávání v archivech

Page 4: NEWTON Technologies, a.s.

Praktická ukázka programu

NewtonDictate

Page 5: NEWTON Technologies, a.s.

NewtonDictate 2.4NewtonDictate 2.4

Page 6: NEWTON Technologies, a.s.

Základní funkce programuZákladní funkce programu

Program NewtonDictate pracuje jako textový editor (např. Program NewtonDictate pracuje jako textový editor (např. Word)Word)

a současně také jako digitální záznamníka současně také jako digitální záznamník

Program řeč nahrává, automaticky přepisuje, přičemž kteroukoliv část přepisu si lze kdykoliv přehrát a v případě potřeby snadno opravit.Diktuje se interpunkce, program automaticky formátuje čísla, symboly a používané zkratky.Program můžete jednoduše naučit nová slova, celé věty,...Program můžete naučit rozpoznávat Váš hlas (nadiktovat 120 předepsaných vět)

Diktovat lze do libovolného místa v textu, text i audio záznam lze libovolně kopírovat, mazat přesouvat. Program nadiktovaný záznam průběžně ukládá.

Diktovat můžete také do libovolného programu, diktuje se na pozici kurzoru. Program umí přepisovat audio nahrávky z diktafonů

Page 7: NEWTON Technologies, a.s.

Jak dosahovat nejlepších výsledků

při diktováni aneb boj o každé procento

Page 8: NEWTON Technologies, a.s.

Komunikace řečí - pro člověka přirozená věc, Komunikace řečí - pro člověka přirozená věc, pro počítač velmi komplikovaná úlohapro počítač velmi komplikovaná úloha

Systém pro rozpoznávání hlasu se stále učíSystém pro rozpoznávání hlasu se stále učí

1. HLAS - Variabilita hlasového projevu, každý člověk mluví 1. HLAS - Variabilita hlasového projevu, každý člověk mluví jinak jinak

(výška hlasu, podoba hlásek, intonace, výslovnost, volba slov, momentální stav, prostředí ...)

2. SLOVNÍK - Rozsáhlost slovní zásoby2. SLOVNÍK - Rozsáhlost slovní zásoby (Angličtina 50 tis. slov, Čeština (Angličtina 50 tis. slov, Čeština > 1 milion)> 1 milion)Systém rozpoznává jednotlivá slova, mnoho stejně znějících slov („byly“, „bily“, „Billy“ …),

250 000 příjmení v ČR, místopisné názvy apod.V současnosti systém rozpozná 500.000 slov, slovo které není ve slovníku systém nikdy

nepřepíše

Hlavní problémy rozpoznávání řečiHlavní problémy rozpoznávání řeči

Page 9: NEWTON Technologies, a.s.

3. KONTEXT - Volba nejpravděpodobnější sekvence po 3. KONTEXT - Volba nejpravděpodobnější sekvence po sobě jdoucích slov (odlišná témata)sobě jdoucích slov (odlišná témata)

chybí oddělovače (pauzy) mezi slovy, dochází ke koartikulaci, asimilaci,

Hlavní problémy rozpoznávání řečiHlavní problémy rozpoznávání řeči

Text: Až se vrátíš, zavolej jako včera na linku pět šest sedm.Text bez mezer: ažsevrátíšzavolejjakovčeranalinkupětšestsedmFoneticky: ašsevrátížzavolejakofčeranalinkupěčesedum

4. PROSTŘEDÍ - Vliv prostředí a přenosové cesty – 4. PROSTŘEDÍ - Vliv prostředí a přenosové cesty – degradace signáludegradace signáluhluk okolí, vlastnosti přenosové linky (mikrofon/diktafon), další mluvící osoby, ruchy, šumy…

Page 10: NEWTON Technologies, a.s.

Princip rozpoznávání řečiPrincip rozpoznávání řeči

Co bylo řečeno a v jakých časových okamžicích?| - | zavolá | - | premiéra | předseda | - |

| - | za | vola | premiéra | předsedá | - |

|-| zvolá | prima | éra | před | sebou | - |

| - | zavolej | premiéra | předsedo | - |

| - | zavolá | - | premiér | a | předseda | - |

Při rozpoznávání spojité řeči není apriori známo:- Kolik slov bylo řečeno?- Jaká sekvence slov byla řečena?- Byla všechna vyřčená slova ze slovníku?- Byla to skutečně jenom řeč nebo i další zvuky a hluky?- V jakých časových okamžicích začínala jednotlivá slova?

Page 11: NEWTON Technologies, a.s.

ZkušenostiZkušenosti

Zkušenosti s programem

• Program na každého reaguje jinak, ale obecný právní text přepíše bez větších chyb.

• Pokud tomu tak není je někde problém (mikrofon, charakteristika hlasu, nastavení (muž/žena), slovník)

• Nelze program jen zapnout a mluvit (existují vyjímky), je potřeba nalézt správný způsob diktování (intonace, plynulost,...) .

• Naučit se ideální způsob diktování trvalo zkušeným soudcům a advokátům několik hodin. Tato časová investice se však velmi rychle vrátila v úspoře času.

• Některá slova (věty) program nemá šanci rozpoznat

• Nejčastější chyba - my čekáme co program napíše, program čeká co řekneme

• Pro první seznámení doporučujeme přečíst známý text (nedívat se na monitor)

Page 12: NEWTON Technologies, a.s.

BudoucnostBudoucnost

Systém pro rozpoznávání hlasu se stále učíSystém pro rozpoznávání hlasu se stále učíNa vylepšení programu nepřetržitě Na vylepšení programu nepřetržitě

pracujemepracujeme

• Vaše zpětná vazba je pro nás velmi důležitá, své náměty přípomínky zasílejte na mail [email protected].

• Každé další rozpoznané procento šetří čas. (stále vylepšujeme, HLAS, SLOVNÍK, VAZBY SLOV)

• Anonymizované texty zvýší úspěšnost rozpoznávání (místopisné názvy, často používané formulace, apod.)

• Úspěšnost rozpoznávání zvýší také doslovně přepsané audio nahrávky

Page 13: NEWTON Technologies, a.s.

REFERENCEREFERENCEMinisterstvo spravedlnosti - projekt pro všechny soudy a státní zastupitelství v ČR (přes 1.600 licencí)Inspekce životního prostředí – celostátní projekt pro všechny inspektoráty inspekceČeská národní banka - implementace systému přepisovacího pracovištěNEWTON Media, a.s. - projekt přepisu rozhlasového a televizního vysílání, titulkování TV

Ministerstvo vnitra Česká zemědělská univerzita1. a 3. Lékařská fakulta Univerzita Karlova Masarykova univerzita v BrněVšeobecná fakultní nemocnice v Praze EU-Media - EURActiv.cz IKEM - Institut Klinické a Experimentální Medicíny Poliklinika BudějovickáOblastní nemocnice Mladá Boleslav, a.s. Poliklinika Prosek Masarykova nemocnice v Ústí nad Labem Revmatologický ústavMammacentrum, Praha MEDICON, a.s.Nemocnice Prachatice, a.s ACHK - Ambulantní centrum pro choroby hlavy a krku, s.r.o.Gymnázium, ZŠ a MŠ pro sluchově postižené, Praha Metropolitní univerzita PrahaManlomka, s.r.o., chráněná dílna

Page 14: NEWTON Technologies, a.s.

Ing. Petr Herian                                             Ing. Magdaléna Nekolná

Děkuji za pozornost

www.diktovani.cz


Recommended