Dnes, 12:30
Evropské ocenění Steven Krauwer Award míří do Plzně, konkrétně k vědcům z Fakulty aplikovaných věd Západočeské univerzity v Plzni (FAV ZČU). Vyvinuly totiž systém, který dokáže automaticky přepisovat vzpomínky pamětníků a následně vyhledat obsah v rozsáhlých zvukových archivech. Jejich technologie usnadňují práci historikům i široké veřejnost. Mimo jiné jde také o svědectví o holocaustu.
Systémy rozpoznávání řeči, na nichž tým z katedry kybernetiky a výzkumného centra NTIS pracuje, se postupně zlepšily z původní chybovosti 40 procent na zhruba 10 procent. Kromě přesnějšího přepisu vyvinuli odborníci i vyhledávání, které zvládne nalézt slovo v různých tvarech, foneticky podobné výrazy i obsahově související pasáže. „V nejnovější verzi funguje takzvané sémantické vyhledávání, které dokáže najít úseky relevantní k dotazu, i když se v nahrávce konkrétní slovo vůbec nevysloví,“ vysvětlil Jan Švec z FAV ZČU.
Výzkumný tým vyvinul také algoritmus pro automatické generování otázek diskutovaných v nahrávkách. Ty se v uživatelském rozhraní zobrazují přehledně a umožňují přímý přístup k příslušným pasážím rozhovorů. Technologie podle odborníků najdou uplatnění nejen při zpřístupňování historických archivů, ale i v oblastech, jako jsou podcasty, zpravodajství nebo práce s naskenovanými dokumenty.
Práci na vývoji pokročilých technologií odstartovala účast plzeňských odborníků v projektu MALACH už v roce 2005. Nejen čeští výzkumníci, ale i další mezinárodní týmy se v rámci tohoto projektu snažili vyvinout efektivní metody rozpoznávání řeči a vyhledávání informací. Cílem bylo vytvořit nástroj, který by pomohl odborným i laickým uživatelům zorientovat se v ohromném množství nahrávek, jež shromáždili terénní pracovníci nadace založené Stevenem Spielbergem po dokončení jeho slavného filmu Schindlerův seznam.
Odborníci z FAV tenkrát vyvíjeli především systémy pro automatický přepis nahrávek ve slovanských jazycích a maďarštině. „V době ukončení projektu jsme nedošli k uspokojivému výsledku. Měli jsme k dispozici 115 tisíc hodin nahrávek ve 32 jazycích, přičemž přibližně půlka výpovědí byla v angličtině. A aby se situace ještě více zkomplikovala, u drtivé většiny mluvčích nebyla angličtina jejich rodným jazykem, čili jsme se museli nějak vyrovnat s různou výslovností či přízvukem,” řekl Pavel Ircing z FAV ZČU.
Za tuto dlouhodobou práci převzali Pavel Ircing a Jan Švec ve Vídni na výroční konferenci evropské infrastruktury CLARIN ocenění Steven Krauwer Award. „Cenu jsme sice dostali my dva, ale za výsledky stojí široký tým spolupracovníků z katedry kybernetiky a výzkumného centra NTIS. Zvláštní poděkování patří Josefu Psutkovi, Martinu Bulínovi a Janu Lehečkovi,“ dodal Ircing.
Chceš nám něco sdělit?Napiš nám