Anotace
Seminář nabízí odpověď na otázku „co s tím budeš dělat“, seznamuje studenty se současnými trendy v aplikované lingvistice (včetně praktických ukázek). Náplň semináře nevyžaduje vstupní znalosti z oboru informatiky.
Sylabus
1. Lingvistické aplikace – úvod do problematiky
- modelování přirozeného jazyka včera, dnes (a zítra)
- základní přístupy, nástroje, data
- textová analytika
- přehledová kategorizace aplikací
2. Speech Recognition – rozpoznávání mluvené řeči:
- dialogové systémy: speaker dependent / speaker independent
- ELIZA a příbuzné, talking heads, avatars
- ukázka: Senior Companion – česky hovořící humanoid Petra
- telematics (navigace etc.)
- realtime voice writing (court writing etc.) a syntéza řeči (text-to-speech)
- ukázka: počítač pro nevidomé (př. Eureka)
- spoken language archives
- objasnění principu a návštěva Centra vizuální historie MALACH
(http://ufal.mff.cuni.cz/cvhm/about-us.html)
3. Language Recognition – rozpoznávání jazyka:
- jazykové korektory (editační vzdálenost atd.)
- n-gramové modely a jejich využití:
- rozpoznávání konkrétních jazyků
- rozpoznávání spamu
- strojový překlad
- word-based, phrase-based
- statistický, pravidlový, hybridní přístup
- korpusy, treebanky + searching tools
- ukázka: srovnání překladačů
4. Information Retrieval – získávání informací:
- internetové vyhledávače
- sentiment analysis
- ukázka: automatická extrakce subjektivní informace v češtině: nástroje, rozhraní
- analýza diskurzu
- automatická sumarizace
- rozpoznávání pojmenovaných entit
- question-answering
5. Forenzní lingvistika a stylometrie:
- detekce kyberšikany a trollingu
- automatická administrace internetových diskusí
- apod.
+ případně neurolingvistické a psycholingvistické aplikace, metody forenzní lingvistiky, aplikace v rámci second language acquisition etc.
Cíl předmětu
Cílem kurzu je obeznámení studentů s možnostmi využití lingvistických znalostí v praxi.