Treebank Statistics: UD_Sinhala-Appuwa: Features: Case
This feature is universal.
It occurs with 7 different values: Abl, Acc, Dat, Gen, Ins, Loc, Nom.
248 tokens (37%) have a non-empty value of Case.
199 types (49%) occur at least once with a non-empty value of Case.
169 lemmas (46%) occur at least once with a non-empty value of Case.
The feature is used with 3 part-of-speech tags: NOUN (218; 33% instances), PROPN (19; 3% instances), PRON (11; 2% instances).
NOUN
218 NOUN tokens (84% of all NOUN tokens) have a non-empty value of Case.
The most frequent other feature values with which NOUN and Case co-occurred: Gender=EMPTY (200; 92%), Animacy=EMPTY (197; 90%), Number=Sing (192; 88%), Definite=EMPTY (180; 83%).
NOUN tokens may have the following values of Case:
Abl(11; 5% of non-emptyCase): යුද්ධෙන්, ගමරාළගෙන්, ගලෙන්, පර්වතයෙන්, පරාද, පිටිපස්සෙන්, මරණෙන්, මාළිගාවෙන්, මැද්දෙන්, සටනින්Acc(39; 18% of non-emptyCase): කුමාරයාව, කොඩිය, කොඩියක්, ජය, දරුවාව, දිවි, ඇඹුල, ඉඩමකුයි, කරුනු, කැරැල්ලDat(30; 14% of non-emptyCase): පදිංචියට, කුමාරයාට, රජකමට, විදියට, හැටියට, අගමෙහෙසියට, අතට, එතෙන්ට, කුඹුරට, ගමරාළටGen(7; 3% of non-emptyCase): කුමාරයාගේ, ජනයාගේ, බිරිඳගේ, රජතුමාගේ, රජුගේ, රටIns(7; 3% of non-emptyCase): නමින්, ගෞරවයෙන්, චාරිත්රේ, පැණින්, පෙරහැරෙන්, වෙලාවකින්Loc(34; 16% of non-emptyCase): ඉදිරියේ, මාළිගාවේ, රටේ, එදා, නඟුලේ, යුද්ධේ, අතරමගදි, ඇතා, උකුලේ, ඔලුවNom(90; 41% of non-emptyCase): රජ, කුමාරයා, පටන්, රජතුමා, ඇතා, ඇමැතිවරු, කෙනෙක්, තේරුම්, දවල්, පණිවිඩකාරයාEMPTY(41): රජතුමා, රෙදි, දුව, නැන්දා, කළු, ඇමතිවරු, ඇමැතිවරු, උවදුරු, එතනා, කථාව
| Paradigm කුමාරයා | Nom | Acc | Dat | Gen |
|---|---|---|---|---|
| Animacy=Hum | කුමාරයා | කුමාරයාව | ||
| Definite=Ind|Gender=Masc | කුමාරයෙක් | |||
| Gender=Masc | කුමාරයා, කුමාරයාත්, කුමාරයායි | කුමාරයාව | කුමාරයාට | කුමාරයාගේ |
| කුමාරයා | කුමාරයාගේ |
PROPN
19 PROPN tokens (32% of all PROPN tokens) have a non-empty value of Case.
The most frequent other feature values with which PROPN and Case co-occurred: Gender=EMPTY (17; 89%), Number=Sing (16; 84%), Animacy=EMPTY (13; 68%).
PROPN tokens may have the following values of Case:
Abl(1; 5% of non-emptyCase): බැළුම්ගලෙන්Acc(2; 11% of non-emptyCase): අප්පුවා, ඇතුගලDat(5; 26% of non-emptyCase): අප්පුවාට, අප්පුවා, එතනාටLoc(3; 16% of non-emptyCase): කළුන්දෑවේ, ඇතුගල්පුරේ, ලංකාවේNom(8; 42% of non-emptyCase): ඇතුගල, කුරුණෑගල, අප්පුවා, එතනා, ඒ, බණ්ඩාර, වත්හිමි, සිරිමල්EMPTY(41): සිරිමල්, එතනා, අප්පුවා, අග්බෝ, බුවනෙකබා, වත්හිමි, වීරගල, එතනාව, කුරුණෑගල, ගලබැද්දේරාළ
| Paradigm අප්පුවා | Nom | Acc | Dat |
|---|---|---|---|
| Animacy=Hum | අප්පුවා | අප්පුවා | අප්පුවා |
| අප්පුවාට |
PRON
11 PRON tokens (41% of all PRON tokens) have a non-empty value of Case.
The most frequent other feature values with which PRON and Case co-occurred: Person=EMPTY (8; 73%), Number=Sing (6; 55%), PronType=Prs (6; 55%).
PRON tokens may have the following values of Case:
Acc(1; 9% of non-emptyCase): තමන්වDat(5; 45% of non-emptyCase): ඇයට, ඒකට, ඔවුන්ට, තමන්ට, මීටIns(1; 9% of non-emptyCase): එකNom(4; 36% of non-emptyCase): එකයි, ඒ, මං, මමEMPTY(16): ඒ, මේ, සිය, අර, එක, ඔය, ඔයා, කවුරුහරි, මං
| Paradigm එක | Nom | Dat | Ins |
|---|---|---|---|
| Number=Sing | ඒකට | එක | |
| එකයි |
Relations with Agreement in Case
The 10 most frequent relations where parent and child node agree in Case:
NOUN –[conj]–> NOUN (3; 100%),
PROPN –[appos]–> NOUN (2; 100%),
NOUN –[clf]–> NOUN (1; 100%),
NOUN –[discourse]–> PROPN (1; 100%),
NOUN –[nsubj]–> NOUN (1; 100%),
NOUN –[obl:tmod]–> NOUN (1; 100%),
PRON –[appos]–> NOUN (1; 100%),
PROPN –[compound]–> PROPN (1; 100%).