Současné řešení anotace koreference na tektogramatické rovině využívá skutečnosti, že každý uzel každého tektogramatického stromu má identifikátor (hodnota atributu id
), který je jedinečný v celém PDT. Jestliže chápeme koreferenci jako odkaz z jednoho uzlu na jiný uzel, pak stačí do vybraného atributu (typu odkaz) u koreferujícího uzlu uložit identifikátor koreferovaného uzlu. Specifické podtypy koreference jsou zachyceny hodnotou dalšího atributu (výčtového typu).
K zachycení koreference jsou u každého uzlu tektogramatického stromu zavedeny tři atributy:
coref_gram.rf
Atribut coref_gram.rf
slouží k zachycení gramatické koreference. Viz 8.1 - "Hodnoty atributu coref_gram.rf
".
Tabulka 8.1. Hodnoty atributu coref_gram.rf
seznam, jehož každý prvek je PML odkaz |
identifikátory uzlů zpravidla téhož tektogramatického stromu, k nimž je daný uzel ve vztahu gramatické koreference |
Gramatickou koreferenci lze vždy zachytit jako odkaz z jednoho uzlu na jiný uzel.
coref_text.rf
Atribut coref_text.rf
slouží k zachycení textové koreference v případech explicitního koreferovaného členu (viz 8.3.1.1 - "Explicitní koreferovaný člen"). Viz 8.2 - "Hodnoty atributu coref_text.rf
".
coref_special
Atribut coref_special
slouží k zachycení zvláštních typů textové koreference, kdy koreferovaným členem není konkrétní uzel či podstrom tektogramatického stromu. Jde o případy exoforického odkazování (viz 8.3.1.3 - "Exofora") a odkazování k segmentu (viz 8.3.1.2 - "Odkazování k segmentu"). Hodnoty tohoto atributu jsou uvedeny v tabulce 8.3 - "Hodnoty atributu coref_special
".
Uzel, který reprezentuje koreferující člen, má vyplněný vždy pouze jeden z těchto atributů.
Podle možností odkazovat k různým částem tektogramatického stromu se setkáváme s následujícími případy odkazování:
odkazování k listu stromu.
V atributu coref_gram.rf
nebo coref_text.rf
je uveden identifikátor cílového listu stromu.
Srov.:
Vlasta šla do divadla, kde na ni čekal Marek.
Koreferovaným členem uzlu reprezentujícího osobní zájmeno ona bude list stromu reprezentující jméno Vlasta.
odkazování ke kořeni podstromu.
V atributu coref_gram.rf
nebo coref_text.rf
je uveden identifikátor kořene nějakého podstromu.
Pro koreferenční vztah směřující k uzlu, který v tektogramatickém stromě není listem, implicitně předpokládáme, že koreferovaným členem je nikoli tento jediný uzel, ale celý podstrom, který kromě daného uzlu obsahuje i všechny jeho potomky. Srov.:
Můj o dva roky mladší bratr, kterého ještě neznáš, přijde zítra
Koreferovaným členem vztažného zájmena který je celý podstrom můj o dva roky mladší bratr, nikoli jen výraz bratr.
!!! Nelze vyloučit existenci případů, kdy je možné za koreferovaný člen považovat právě jen výraz reprezentovaný kořenem příslušného podstromu, ale ne už jeho potomky (nebo kořen a část jeho potomků, ale ne všechny). V navrženém anotačním schématu tuto možnost zatím nereflektujeme.
Speciálním případem odkazování ke kořeni podstromu je odkazování k celé větě. V takovém případě označujeme za koreferovaný člen kořen věty, nikoli technický kořen tektogramatického stromu.
odkazování k více uzlům tektogramatického stromu.
V atributu coref_gram.rf
nebo coref_text.rf
je uvedeno více identifikátorů.
Koreferující člen může odkazovat i k více než jednomu výrazu (podstromu). V takovém případě odkazujeme jednotlivě ke všem výrazům (v příslušném atributu jsou uloženy identifikátory všech cílových uzlů). Od koreferujícího členu vede více koreferenčních vztahů. Srov.:
Marie vzala Vlastu do divadla, kde na ně čekal Marek.
Koreferovaným členem osobního zájmena ony jsou dva uzly pro výrazy Marie a Vlasta, ke kterým je nutno odkázat jednotlivě.
Jde o prozatímní řešení, viz i 8.5.2.2 - "Odkazování u hypotaktické koordinace typu "tatínek s maminkou"".
odkazování k většímu úseku textu.
V atributu coref_special
je uvedena hodnota segm
.
Koreferovaným členem je větší úsek textu, který blíže nespecifikujeme. Více viz 8.3.1.2 - "Odkazování k segmentu".
odkazování mimo text.
V atributu coref_special
je uvedena hodnota exoph
.
Koreferovaným členem je blíže nespecifikovaná mimotextová skutečnost. Více viz 8.3.1.3 - "Exofora".
Koreferenční vztah může být (a často tomu tak je) i mezi uzly, které nejsou lexikálně vyjádřeny v povrchové podobě věty, tedy mezi nově vytvořenými uzly se zástupnými t-lematy (viz i 8.4 - "Přehled typů koreference se zřetelem k t-lematům koreferujících uzlů"). Jednotlivé koreferenční vztahy mezi koreferujícími uzly vytvářejí často dlouhé koreferenční řetězce, na jejichž konci stojí uzel pro plnovýznamové slovo, které již dále neodkazuje (viz 8.5.1 - "Udržování koreferenčních řetězců").