Treebank Statistics: UD_Albanian-STAF: Features: Case
This feature is universal.
It occurs with 5 different values: Abl, Acc, Dat, Gen, Nom.
1285 tokens (36%) have a non-empty value of Case.
705 types (58%) occur at least once with a non-empty value of Case.
561 lemmas (57%) occur at least once with a non-empty value of Case.
The feature is used with 5 part-of-speech tags: NOUN (601; 17% instances), PRON (333; 9% instances), ADJ (163; 5% instances), DET (156; 4% instances), PROPN (32; 1% instances).
NOUN
601 NOUN tokens (96% of all NOUN tokens) have a non-empty value of Case.
The most frequent other feature values with which NOUN and Case co-occurred: Number=Sing (493; 82%), Gender=Fem (354; 59%), Definite=Def (349; 58%).
NOUN tokens may have the following values of Case:
Abl(35; 6% of non-emptyCase): ditës, kohësh, dëshire, filtrash, gjendjes, gjeneralit, grash, humbjeje, humbjes, kafkësAcc(277; 46% of non-emptyCase): sytë, ditë, fillim, arsye, dorën, fund, kohën, mend, mendjen, pyetjenDat(5; 1% of non-emptyCase): njerëzve, joshjeve, njeriu, ulërimësGen(74; 12% of non-emptyCase): borës, gjendjes, vetëdijes, merimangës, njerkës, shoqërisë, Gjumit, Sirenave, aeroportit, armëveNom(210; 35% of non-emptyCase): gjenerali, Nëna, prifti, shtëpia, babai, njeri, shi, vjeshta, dermani, fillimiEMPTY(24): Mysafiri, babait, brejtja, djalë, errur, fillin, fundin, gjendje, here, ide
| Paradigm njeri | Nom | Acc | Dat | Gen |
|---|---|---|---|---|
| Definite=Def|Number=Plur | njerëzit | njerëzit | njerëzve | njerëzve |
| Definite=Ind|Number=Sing | njeri, njeriu | njeriu | ||
| Definite=Ind|Number=Plur | njerëz |
PRON
333 PRON tokens (77% of all PRON tokens) have a non-empty value of Case.
The most frequent other feature values with which PRON and Case co-occurred: Number=Sing (275; 83%), PronType=Prs (247; 74%).
PRON tokens may have the following values of Case:
Abl(15; 5% of non-emptyCase): tyre, kësaj, meje, asaj, atyre, saj, tij, tim, tjerash, tjetritAcc(143; 43% of non-emptyCase): e, i, më, atë, këtë, mua, tjetër, të, saj, tijDat(50; 15% of non-emptyCase): i, më, na, atij, gjitha, mua, ti, uGen(13; 4% of non-emptyCase): sime, asaj, cilës, im, jonë, kujt, kësaj, saj, tij, tjetritNom(112; 34% of non-emptyCase): unë, ai, kjo, ky, ajo, cilët, im, tij, ata, imeEMPTY(98): që, ç’, asgjë, diçka, e, më, ndonjë, asnjë, çdo, i
| Paradigm unë | Nom | Acc | Dat | Gen | Abl |
|---|---|---|---|---|---|
| Gender=Masc|Person=1|Poss=Yes | im, unë | ||||
| Gender=Masc|Person=1 | më | ||||
| Person=1 | unë | mua, Më | më | im | meje |
| Person=3 | meje |
ADJ
163 ADJ tokens (92% of all ADJ tokens) have a non-empty value of Case.
The most frequent other feature values with which ADJ and Case co-occurred: Degree=Pos (152; 93%), Number=Sing (132; 81%), Gender=Fem (102; 63%).
ADJ tokens may have the following values of Case:
Abl(5; 3% of non-emptyCase): fundit, jashtëzakonshme, mundshëm, okultë, porsaardhurAcc(63; 39% of non-emptyCase): bardhë, djathtë, fundit, gabuar, majtë, parë, alternative, botërore, dashtun, dinjitozeGen(12; 7% of non-emptyCase): bardhë, ardhshëm, arsyeshëm, automobilistike, dashtunës, errët, jashtëzakonshme, para, plotë, riNom(83; 51% of non-emptyCase): bukur, huaj, parë, sigurt, bardhë, fundit, papritur, qetë, re, MadhEMPTY(15): dytë, fundit, hijerëndë, imperiale, kureshtar, lodhun, relative, rrallë, saktë, shqiptari
| Paradigm bardhë | Nom | Acc | Gen |
|---|---|---|---|
| Gender=Masc|Number=Sing | bardhë | bardhë | |
| Gender=Fem|Number=Sing | bardhë | bardhë | bardhë |
| Gender=Fem|Number=Plur | bardha |
DET
156 DET tokens (52% of all DET tokens) have a non-empty value of Case.
The most frequent other feature values with which DET and Case co-occurred: Definite=EMPTY (156; 100%), PronType=Art (155; 99%), Number=Sing (125; 80%), Gender=Fem (92; 59%).
DET tokens may have the following values of Case:
Abl(6; 4% of non-emptyCase): të, sëAcc(66; 42% of non-emptyCase): të, e, iDat(1; 1% of non-emptyCase): tëGen(16; 10% of non-emptyCase): të, sëNom(67; 43% of non-emptyCase): e, i, tëEMPTY(143): një, e, të, i, së, nja, pak
| Paradigm të | Nom | Acc | Dat | Gen | Abl |
|---|---|---|---|---|---|
| Gender=Masc|Number=Sing | të | të | të | ||
| Gender=Masc|Number=Plur | të | të | të | ||
| Gender=Fem|Number=Sing | të | të | të | ||
| Gender=Fem|Number=Plur | të | të | të | të | të |
PROPN
32 PROPN tokens (82% of all PROPN tokens) have a non-empty value of Case.
The most frequent other feature values with which PROPN and Case co-occurred: Number=Sing (30; 94%), Definite=Def (24; 75%), Gender=Masc (20; 63%).
PROPN tokens may have the following values of Case:
Acc(10; 31% of non-emptyCase): Shqipëri, Berti, Ervehenë, Hadin, Lorin, Margën, Tibet, VajazanDat(2; 6% of non-emptyCase): ErnestitGen(6; 19% of non-emptyCase): Varrit, Dizit, Ernestit, Margës, Shqipërisë, VedatitNom(14; 44% of non-emptyCase): Ernesti, Linda, Vedati, Ernest, Hadi, Marga, Parku, Vedat, shtunë, xhepiEMPTY(7): Bamit, Dizi, Dizin, Ernesti, Lindën, Nerminja, Odise
| Paradigm Ernest | Nom | Dat | Gen |
|---|---|---|---|
| Definite=Def | Ernesti | Ernestit | Ernestit |
| Definite=Ind | Ernest |
Relations with Agreement in Case
The 10 most frequent relations where parent and child node agree in Case:
ADJ –[det:adj]–> DET (109; 92%),
NOUN –[amod]–> ADJ (107; 91%),
NOUN –[det:poss]–> PRON (31; 91%),
NOUN –[det]–> PRON (27; 53%),
NOUN –[conj]–> NOUN (21; 70%),
ADJ –[det]–> DET (13; 72%),
NOUN –[nmod:poss]–> PRON (6; 75%),
PRON –[det:pron]–> DET (6; 67%),
ADJ –[conj]–> ADJ (5; 100%),
ADJ –[nsubj]–> NOUN (5; 83%).