Plzeňští vědci sklízí úspěchy, jejich technologie zpřístupňují svědectví o holocaustu

Autoři | Foto Fakulta aplikovaných věd Západočeské univerzity v Plzni

Evropské ocenění Steven Krauwer Award míří do Plzně, konkrétně k vědcům z Fakulty aplikovaných věd Západočeské univerzity v Plzni (FAV ZČU). Vyvinuly totiž systém, který dokáže automaticky přepisovat vzpomínky pamětníků a následně vyhledat obsah v rozsáhlých zvukových archivech. Jejich technologie usnadňují práci historikům i široké veřejnost. Mimo jiné jde také o svědectví o holocaustu.

Systémy rozpoznávání řeči, na nichž tým z katedry kybernetiky a výzkumného centra NTIS pracuje, se postupně zlepšily z původní chybovosti 40 procent na zhruba 10 procent. Kromě přesnějšího přepisu vyvinuli odborníci i vyhledávání, které zvládne nalézt slovo v různých tvarech, foneticky podobné výrazy i obsahově související pasáže. „V nejnovější verzi funguje takzvané sémantické vyhledávání, které dokáže najít úseky relevantní k dotazu, i když se v nahrávce konkrétní slovo vůbec nevysloví,“ vysvětlil Jan Švec z FAV ZČU.

Výzkumný tým vyvinul také algoritmus pro automatické generování otázek diskutovaných v nahrávkách. Ty se v uživatelském rozhraní zobrazují přehledně a umožňují přímý přístup k příslušným pasážím rozhovorů. Technologie podle odborníků najdou uplatnění nejen při zpřístupňování historických archivů, ale i v oblastech, jako jsou podcasty, zpravodajství nebo práce s naskenovanými dokumenty.

Nahrávky shromáždila nadace založená Stevenem Spielbergem

Práci na vývoji pokročilých technologií odstartovala účast plzeňských odborníků v projektu MALACH už v roce 2005. Nejen čeští výzkumníci, ale i další mezinárodní týmy se v rámci tohoto projektu snažili vyvinout efektivní metody rozpoznávání řeči a vyhledávání informací. Cílem bylo vytvořit nástroj, který by pomohl odborným i laickým uživatelům zorientovat se v ohromném množství nahrávek, jež shromáždili terénní pracovníci nadace založené Stevenem Spielbergem po dokončení jeho slavného filmu Schindlerův seznam. 

Odborníci z FAV tenkrát vyvíjeli především systémy pro automatický přepis nahrávek ve slovanských jazycích a maďarštině. „V době ukončení projektu jsme nedošli k uspokojivému výsledku. Měli jsme k dispozici 115 tisíc hodin nahrávek ve 32 jazycích, přičemž přibližně půlka výpovědí byla v angličtině. A aby se situace ještě více zkomplikovala, u drtivé většiny mluvčích nebyla angličtina jejich rodným jazykem, čili jsme se museli nějak vyrovnat s různou výslovností či přízvukem,” řekl Pavel Ircing z FAV ZČU.

Za tuto dlouhodobou práci převzali Pavel Ircing a Jan Švec ve Vídni na výroční konferenci evropské infrastruktury CLARIN ocenění Steven Krauwer Award. „Cenu jsme sice dostali my dva, ale za výsledky stojí široký tým spolupracovníků z katedry kybernetiky a výzkumného centra NTIS. Zvláštní poděkování patří Josefu Psutkovi, Martinu Bulínovi a Janu Lehečkovi,“ dodal Ircing.

Hodnocení článku

Chceš nám něco sdělit?Napiš nám

Napiš do redakce

Pošli nám tip na článek, reakci na daný článek nebo jakoukoliv zpětnou vazbu.

* Soubor není povinné přikládat.
Napište první písmeno abecedy.

Štítky ocenění, plzeňští vědci, archivy, přepis řeči, rozpoznání jazyka, historie, historiké archivy, holocaust

Přihlášení uživatele

Přihlásit se pomocí GoogleZaložením účtu souhlasím s obchodními podmínkami, etickým
kodexem
a rozumím zpracování osobních údajů dle poučení.

Zapomenuté heslo

Na zadanou e-mailovou adresu bude zaslán e-mail s odkazem na změnu hesla.