Treebank Statistics: UD_Sinhala-STB: Features: Case
This feature is universal but the values Cns are language-specific.
It occurs with 11 different values: Abl, Acc, Ben, Cns, Dat, Gen, Ill, Ine, Ins, Loc, Nom.
346 tokens (39%) have a non-empty value of Case.
276 types (55%) occur at least once with a non-empty value of Case.
243 lemmas (58%) occur at least once with a non-empty value of Case.
The feature is used with 3 part-of-speech tags: NOUN (280; 32% instances), PRON (35; 4% instances), PROPN (31; 4% instances).
NOUN
280 NOUN tokens (91% of all NOUN tokens) have a non-empty value of Case.
The most frequent other feature values with which NOUN and Case co-occurred: Animacy=EMPTY (214; 76%), Gender=Neut (181; 65%), Number=Sing (168; 60%).
NOUN tokens may have the following values of Case:
Abl(4; 1% of non-emptyCase): අතින්, ඉරානයෙන්, ඡන්දයෙන්, පිට්ටනියෙන්Acc(87; 31% of non-emptyCase): කිරීම, ජනතාව, ප්රධානයකු, රට, හැඟීමක්, අදහස, අදහසක්, අදියර, අයවැය, ආණ්ඩුවBen(1; 0% of non-emptyCase): ජනතාවටCns(4; 1% of non-emptyCase): කොමිස්වලට, ගිවිසුමට, රටට, ලංකාවටDat(11; 4% of non-emptyCase): ජනතාවට, අධිපතිවරයාට, දේශප්රේමීන්ට, නායකයකුට, පක්ෂයට, බවට, මහතාට, මෙරටට, මෙහෙයුම්වලට, සංවිධානයටGen(12; 4% of non-emptyCase): හමුදාවේ, ආසියාවේ, උපායෙහි, කරගැනීමේ, ක්රමයේ, ජාතියේ, මණ්ඩලයේ, ලෝකයේ, වන්නියේ, ශිල්පයෙහිIll(1; 0% of non-emptyCase): ආරාමවලටIne(13; 5% of non-emptyCase): අත්අඩංගුවේ, කේන්ද්රස්ථානයක, ජපානයේ, නගරයේ, ප්රදේශවල, මධ්යයේ, මෙරට, රාජ්යයක, රාජ්යයේ, ලිපියකIns(7; 3% of non-emptyCase): ක්රමය, කාලයකින්, කිරෙන්, කිහිපයකින්, පරිත්යාගයෙන්, ලේඛනයෙනි, වීමෙන්Loc(6; 2% of non-emptyCase): ආසන්නයේ, කලාපයෙකි, තත්ත්වයක, මොහොතේ, වටරවුමේ, විද්යාවේNom(134; 48% of non-emptyCase): ආර්ථික, අද, මහතා, දේශපාලන, තත්ත්වය, යුද, අය, අයථා, අයවැය, අවසන්EMPTY(28): සිදු, අහෝසි, අනිවාර්ය, ඉන්දියන්, උදා, කලකට, කිරීම, කෙළ, ගණනාවක්, ගැනීම
| Paradigm ජනතා | Nom | Acc | Dat | Ben |
|---|---|---|---|---|
| Animacy=Anim | ජනතා | |||
| Animacy=Anim|Definite=Def | ජනතාවට | |||
| Animacy=Anim|Definite=Def|Number=Sing | ජනතාව | |||
| Animacy=Anim|Number=Sing | ජනතාවට | |||
| Definite=Def|Gender=Masc|Number=Sing | ජනතාව | ජනතාව |
PRON
35 PRON tokens (80% of all PRON tokens) have a non-empty value of Case.
The most frequent other feature values with which PRON and Case co-occurred: Poss=EMPTY (35; 100%), Person=EMPTY (30; 86%), Animacy=EMPTY (28; 80%), Number=Sing (25; 71%), PronType=Dem (19; 54%).
PRON tokens may have the following values of Case:
Abl(1; 3% of non-emptyCase): ඉන්Acc(5; 14% of non-emptyCase): ඒ, එකිනෙකා, එය, ඔවුන්Dat(7; 20% of non-emptyCase): ඊට, ඔහුට, අපට, ඔවුනට, මීටLoc(3; 9% of non-emptyCase): එහිNom(19; 54% of non-emptyCase): ඔහු, එය, ඒ, ඔව්හු, කිහිපයක්, මෙයEMPTY(9): ඒ, සිය, අප, අපේ, එම, තම, මේ
| Paradigm එය | Nom | Acc | Dat | Loc | Abl |
|---|---|---|---|---|---|
| Animacy=Inan|Gender=Neut | ඊට | ||||
| Animacy=Inan|Number=Sing | එය | ||||
| Gender=Neut|Number=Sing | එය | එය | ඉන් | ||
| Number=Sing | එය | එහි |
PROPN
31 PROPN tokens (82% of all PROPN tokens) have a non-empty value of Case.
The most frequent other feature values with which PROPN and Case co-occurred: Foreign=EMPTY (29; 94%), Number=Sing (28; 90%), Animacy=EMPTY (23; 74%), Definite=EMPTY (19; 61%), Person=EMPTY (17; 55%).
PROPN tokens may have the following values of Case:
Acc(7; 23% of non-emptyCase): ඉරානය, චීනය, ටැන්සානියාව, පලස්තීනය, ලංකාව, සර්බියානු, සිංගප්පූරුවDat(1; 3% of non-emptyCase): ලංකාවටGen(1; 3% of non-emptyCase): අමෙරිකාවේNom(22; 71% of non-emptyCase): මහින්ද, යුනෙස්කෝ, රනිල්, රාජපක්ෂ, ලංකාව, ලිප්ටන්, වික්රමසිංහ, ෆොන්සේකා, ඉන්දියාව, ජුලියස්EMPTY(7): ශ්රී, කොසෝවෝ, ෂැවොලින්
| Paradigm ලංකා | Nom | Acc | Dat |
|---|---|---|---|
| Definite=Def | ලංකාව | ලංකාවට | |
| Definite=Ind | ලංකාවක් | ||
| ලංකාව |
Case seems to be lexical feature of PROPN. 95% lemmas (21) occur only with one value of Case.
Relations with Agreement in Case
The 10 most frequent relations where parent and child node agree in Case:
PROPN –[flat]–> NOUN (6; 75%),
PROPN –[flat]–> PROPN (6; 67%),
NOUN –[nsubj]–> PROPN (3; 60%),
NOUN –[compound:prt]–> NOUN (1; 100%),
NOUN –[conj]–> NOUN (1; 100%),
NOUN –[flat]–> NOUN (1; 100%),
NOUN –[obl:lmod]–> PROPN (1; 100%),
PRON –[nmod]–> NOUN (1; 100%),
PROPN –[conj]–> PROPN (1; 100%).