Počasí dnes8 °C, zítra9 °C
Pondělí 25. listopadu 2024  |  Svátek má Kateřina
Bez reklam

Vědci z plzeňské ZČU vytvořili webovou databázi jazykové poradny za pomoci umělé inteligence

Odborníci z Fakulty aplikovaných věd ZČU vytvořili webovou databázi jazykové poradny Ústavu pro jazyk český (ÚJČ) Akademie věd ČR (AV ČR). Na tu se totiž každý den obrací s dotazy kolem tří desítek lidí z celé republiky. Experti z univerzity s využitím umělé inteligence telefonické dotazy zpracovali a vytvořili webový portál, kde jsou dostupné a přehledně strukturované.

Jak se správně píše název nemoci covid-19? Jaký je původ slova brusle? Nebo kterou jazykovou příručku kdy použít? Takovými a mnoha jinými dotazy se jazyková poradna zabývá denně. Ústav pro jazyk český oslovil odborníky z Fakulty aplikovaných věd (FAV) Západočeské univerzity v Plzni a díky jejich společnému projektu nebudou lidé v mnoha případech muset telefonovat, aby se dozvěděli odpovědi na jejich dotazy.

„Webová databáze dotazů položených jazykové poradně byla vyvinuta proto, aby si v nich běžný uživatel jazyka mohl najít odpovědi na časté i méně obvyklé dotazy, ale také na otázky týkající se úplně nových jazykových jevů. Jazykovědcům pak databáze pomáhá dotazový materiál systematicky zpracovávat, třídit a prohledávat pro badatelské účely,“ popisuje smysl databáze, dostupné na adrese dotazy.ujc.cas.cz, ředitel ÚJČ Martin Prošek.

Na jazykovou poradnu se obracejí ti, kdo s jazykem pracují ve své profesi, jako jsou učitelé nebo novináři, kteří zároveň svým psaným i ústním vyjadřováním ovlivňují velkou část společnosti. Radu vyhledávají ale také studenti, rodiče školních dětí a ostatní uživatelé jazyka, a to třeba proto, že nemají k dispozici kodifikační příručky, špatně se v nich orientují nebo v nich daný jev ještě nalézt ani nemohou, protože zatím kodifikován nebyl. Webová aplikace jazykové poradny, která v současnosti obsahuje více než 28 800 přepisů nahrávek, jim může poradit, aniž by museli telefonovat. Odborná veřejnost ocení, že dotazy se dají strukturovaně vyhledávat a třídit, takže je lze využít pro badatelské účely.

Jak celý systém funguje? 

Z Fakulty aplikovaných věd na webové databázi spolupracovali odborníci z katedry kybernetiky, katedry informatiky a výpočetní techniky a z výzkumného centra NTIS. Kybernetici zpracovali zvuková data z telefonních hovorů za roky 2016–2019 a zároveň zajistili, aby proces, založený na využívání umělé inteligence, fungoval automaticky.

„Náš systém má pomoci lingvistům tím, že telefonní hovor automaticky přepíše a zčásti ho i systematizuje,“ přibližuje vedoucí fakultního týmu Luděk Müller. „Pracovali jsme i s nahrávkami pořízenými před započetím projektu, na těch jsme ale hlavně učili systém otázky třídit,“ doplňuje Petr Salajka z centra NTIS, který pracoval na integraci jednotlivých prvků systému.

A jak to všechno funguje? Jakmile pracovník jazykové poradny hovor přijme, spustí se nahrávání a současně se na počítači objeví aplikace určená pro poznámky, které později slouží pro podrobnou anotaci. Každý den po skončení provozu poradny pak systém všechny nahrávky automaticky převede na text a systematizuje je.

Pokročilou anotaci už provedou sami lingvisté z ÚJČ. Za databází, která jim umožní dotaz podrobně anotovat a uživatelům si ho vyhledat, stojí experti z katedry informatiky a výpočetní techniky FAV. „Naším cílem bylo vytvořit systém, který umožní otázky a odpovědi velmi detailně strukturovat s využitím mnoha atributů,“ říká člen týmu Michal Nykl. Jednotlivé otázky a odpovědi tak lze kategorizovat do podrobného stromového grafu. Díky tomu získá každý dotaz všechny gramatické charakteristiky, které se ho týkají. Ty jsou důležité pro podrobné vyhledávání v dotazech, statistiky a další práci s dotazy.

Na otázku, proč podrobnou anotaci nemůže provést umělá inteligence, odpovídá kybernetik Zbyněk Zajíc: „I několik tisíc dotazů, které v průběhu projektu lingvisté podrobně klasifikovali, jsou při takto detailní klasifikaci jen jako kapka v moři. Zdaleka nestačí na to, aby umělá inteligence získala o našem jazyku takové poznatky, aby mohla zastoupit jazykovědce.“

Jazykovědcům z ÚJČ systém mimo jiné pomáhá odpovídat na stejné dotazy jednotným způsobem, poskytuje jim přehled o problematických jazykových jevech a v souvislosti s tím i materiál užitečný pro tvorbu učebnic. Vidí také, jakým vývojem určitý jazykový jev prochází.

Ohodnoť článek

Foto ZČU

Štítky ZČU, jazyková poradna, Ústav pro jazyk český, univerzita, webová databáze, databáze, umělá inteligence, Ústav pro jazyk český Akademie věd České republiky, Fakulta aplikovaných věd, Západočeská univerzita v Plzni, projekt, Akademie věd České republiky, Če

Komentáře

Pro přidání příspěvku se musíte nejdříve přihlásit / registrovat / přihlásit přes Facebook.

Vědci z plzeňské ZČU vytvořili webovou databázi jazykové poradny za pomoci umělé inteligence  |  Vzdělání  |  Zprávy  |  Plzeňská Drbna - zprávy z Plzně a okolí

Můj profil Bez reklam

Přihlášení uživatele

Přihlásit se pomocí GoogleZaložením účtu souhlasím s obchodními podmínkami, etickým
kodexem
a rozumím zpracování osobních údajů dle poučení.

Zapomenuté heslo

Na zadanou e-mailovou adresu bude zaslán e-mail s odkazem na změnu hesla.