Treebank Statistics: UD_Romanian-Nonstandard: Features: Case
This feature is universal.
It occurs with 5 different values: Acc, Dat, Gen, Nom, Voc.
Some words have combined values of the feature; 2 combinations have been observed: Acc|Nom, Dat|Gen.
282338 tokens (49%) have a non-empty value of Case.
22887 types (72%) occur at least once with a non-empty value of Case.
9856 lemmas (80%) occur at least once with a non-empty value of Case.
The feature is used with 9 part-of-speech tags: NOUN (96782; 17% instances), ADP (66980; 12% instances), PRON (64433; 11% instances), DET (20988; 4% instances), PROPN (19968; 3% instances), ADJ (11253; 2% instances), VERB (1145; 0% instances), NUM (788; 0% instances), ADV (1; 0% instances).
NOUN
96782 NOUN tokens (100% of all NOUN tokens) have a non-empty value of Case.
The most frequent other feature values with which NOUN and Case co-occurred: Number=Sing (71135; 74%), Definite=Ind (52239; 54%), Gender=Fem (49597; 51%).
NOUN tokens may have the following values of Case:
Acc,Nom(87450; 90% of non-emptyCase): vodă, domnul, țara, țară, omul, om, oaste, cuvîntul, lume, oameniDat,Gen(7983; 8% of non-emptyCase): domnului, oamenilor, omului, jidovilor, împăratului, turcilor, pămîntului, trupului, popilor, lumiiVoc(1349; 1% of non-emptyCase): doamne, fraților, Învățătoriule, părinte, frate, bade, stăpîne, bădiță, cuvinte, doruleEMPTY(1): neamure
| Paradigm domn | Acc,Nom | Dat,Gen | Voc |
|---|---|---|---|
| Definite=Def|Gender=Masc|Number=Sing | domnul, domnu, domnu-, Domnulu | domnului, Domn, Domnul, Domnunlui, Domului | Doamne |
| Definite=Def|Gender=Masc|Number=Plur | domnii, domnu | domnilor | domnilor |
| Definite=Def|Gender=Fem|Number=Sing | domnii | ||
| Definite=Ind|Gender=Masc|Number=Sing | domnu, domn | Domnului | doamne |
| Definite=Ind|Gender=Masc|Number=Plur | domni, domnu |
ADP
66980 ADP tokens (100% of all ADP tokens) have a non-empty value of Case.
The most frequent other feature values with which ADP and Case co-occurred: AdpType=Prep (66980; 100%), Compound=EMPTY (57004; 85%).
ADP tokens may have the following values of Case:
Acc(66082; 99% of non-emptyCase): de, cu, la, în, pre, din, pe, ca, pentru, dupăDat(31; 0% of non-emptyCase): asupră, derept, nainte, asemenea, denainte, înainteGen(867; 1% of non-emptyCase): înaintea, asupra, împrotiva, împotriva, asupră, denaintea, dinaintea, înainte, desupra, denainteEMPTY(2): ca, pre
| Paradigm înainte | Acc | Dat | Gen |
|---|---|---|---|
| înainte, -nainte, nainte | nainte | nainte, înaintea, -nainte, -naintea, înainte | |
| Compound=Yes | înaintea |
Case seems to be lexical feature of ADP. 90% lemmas (121) occur only with one value of Case.
PRON
64433 PRON tokens (100% of all PRON tokens) have a non-empty value of Case.
The most frequent other feature values with which PRON and Case co-occurred: Person=3 (50217; 78%), PronType=Prs (45908; 71%), Gender=EMPTY (37306; 58%).
PRON tokens may have the following values of Case:
Acc(25325; 39% of non-emptyCase): să, -l, s-, el, -i, mă, l-, o, se, sAcc,Nom(20871; 32% of non-emptyCase): ce, el, carele, cine, carii, aceaia, tu, care, aceasta, careaDat(11541; 18% of non-emptyCase): -i, lor, -mi, le, mi-, lui, i-, voao, mi, -țDat,Gen(1794; 3% of non-emptyCase): lor, căruia, celora, cărora, tuturor, celor, cui, altuia, celuia, aceloraGen(2670; 4% of non-emptyCase): lui, ei, măriei, lor, măriii, o, mării, iei, svințiii, -iNom(2232; 3% of non-emptyCase): eu, ei, noi, dînșii, dînşii, dânșii, înșii, ele, iei, leEMPTY(195): însuși, eiși, nostru, meu, tău, voiși, înșivă, noastre, mineși, săi
| Paradigm el | Acc,Nom | Dat,Gen | Nom | Acc | Dat | Gen |
|---|---|---|---|---|---|---|
| Gender=Masc|Number=Sing|Person=3|PronType=Dem | lui | |||||
| Gender=Masc|Number=Sing|Person=3|PronType=Prs | el, elu, iel, l, îl, ei, Еl, Lui, Părinte | lui, ei, lor, -i | ||||
| Gender=Masc|Number=Sing|Person=3|PronType=Prs|Strength=Strong | el, elu, еl, -l, ei, l- | lui, ei, lor | ||||
| Gender=Masc|Number=Sing|Person=3|PronType=Prs|Strength=Weak | -l, l-, l, îl, i-, lu, el, -i, îlu, îi, li-, Il, o | |||||
| Gender=Masc|Number=Plur|Person=3|PronType=Dem | lui | |||||
| Gender=Masc|Number=Plur|Person=3|PronType=Prs | ei | ei, iei, îi, i, -i, I-, ii | lor, lui | |||
| Gender=Masc|Number=Plur|Person=3|PronType=Prs|Strength=Strong | ei, -i, lor, îi | |||||
| Gender=Masc|Number=Plur|Person=3|PronType=Prs|Strength=Weak | -i, i-, îi, -l, i, îl, ei, le, l, l-, le-, li | |||||
| Gender=Fem|Number=Sing|Person=3|PronType=Prs | ea, ia, -o, O, ei | ei, o, iei | ||||
| Gender=Fem|Number=Sing|Person=3|PronType=Prs|Strength=Strong | ia, ea, -o, o, ei | ei | ||||
| Gender=Fem|Number=Sing|Person=3|PronType=Prs|Strength=Weak | o, -o, o-, ia, -l, l, li- | |||||
| Gender=Fem|Number=Plur|Person=3|PronType=Prs | ele, le, iale, eale, le- | |||||
| Gender=Fem|Number=Plur|Person=3|PronType=Prs|Strength=Strong | iale, ele, le, eale, ia | |||||
| Gender=Fem|Number=Plur|Person=3|PronType=Prs|Strength=Weak | le, le-, -le, li, li-, o, -i, -li | |||||
| Number=Sing|Person=1|PronType=Prs|Strength=Strong | mie | |||||
| Number=Sing|Person=1|PronType=Prs|Strength=Weak | mă, -Mă, m- | -I | ||||
| Number=Sing|Person=2|PronType=Prs|Strength=Strong | lui | |||||
| Number=Sing|Person=2|PronType=Prs|Strength=Weak | -i, i- | |||||
| Number=Sing|Person=3|PronType=Prs | i- | îi, -i, lui | -i | |||
| Number=Sing|Person=3|PronType=Prs|Strength=Weak | -i, i-, i, îi, le-, -l, -le, le, lui, e, l-, lă | |||||
| Number=Plur|Person=1|PronType=Prs|Strength=Strong | Ia | |||||
| Number=Plur|Person=3|PronType=Prs | le-, Ei | lor, lui, Le, -le, loru, li- | ||||
| Number=Plur|Person=3|PronType=Prs|Strength=Strong | lor, ei, lui, loru | |||||
| Number=Plur|Person=3|PronType=Prs|Strength=Weak | le, le-, li, -le, li-, lă, lor, -i, -li, I-, i, l | |||||
| Person=3|PronType=Prs|Reflex=Yes|Strength=Weak | ș- | |||||
| Person=3|PronType=Prs|Strength=Weak | și- |
DET
20988 DET tokens (88% of all DET tokens) have a non-empty value of Case.
The most frequent other feature values with which DET and Case co-occurred: Number[psor]=EMPTY (19047; 91%), Poss=EMPTY (18027; 86%), Definite=EMPTY (17742; 85%), Number=Sing (16246; 77%), Gender=Fem (11427; 54%), Person=EMPTY (10800; 51%).
DET tokens may have the following values of Case:
Acc,Nom(17054; 81% of non-emptyCase): a, un, o, toată, ta, toate, tot, al, cel, ceaDat,Gen(3934; 19% of non-emptyCase): lui, celui, celor, sale, tuturor, unui, aceștii, tale, lu, aceluiEMPTY(2870): mieu, tău, său, nostru, -său, tale, voastre, sale, miei, săi
| Paradigm -ul | Acc,Nom | Dat,Gen |
|---|---|---|
| Definite=Def|Gender=Masc|Number=Sing|PronType=Art | -lea, -le | -lui |
| Definite=Def|Gender=Fem|Number=Sing|PronType=Art | -a | |
| Definite=Def|Number=Sing|PronType=Art | lui, lu, Iui | |
| Definite=Def|Number=Plur|PronType=Art | lui | |
| Gender=Fem|Number=Sing|PronType=Ind | lui | |
| Gender=Fem|Number=Plur|PronType=Dem | lui | |
| Number=Plur|PronType=Dem | lui |
PROPN
19968 PROPN tokens (99% of all PROPN tokens) have a non-empty value of Case.
The most frequent other feature values with which PROPN and Case co-occurred: Number=Sing (19121; 96%), Gender=Masc (16817; 84%), Definite=Ind (15278; 77%).
PROPN tokens may have the following values of Case:
Acc,Nom(18754; 94% of non-emptyCase): dumnezău, Iisus, Hristos, Pavel, David, Poartă, Pătru, Ioan, Mihai-, DucaDat,Gen(1018; 5% of non-emptyCase): Ducăi, Moscului, Moldovii, Moldovei, Evangheliei, Brîncovanului, Neamțului, Evanghelii, Hotinului, GalileeiVoc(196; 1% of non-emptyCase): Doamne, Gruio, Iisuse, Dumitre, Saule, Staline, Manole, Agrippo, Dumnezeule, IoaneEMPTY(167): tîrgu, târgu, greșală, Dunărea, războiu, boer, iarăș, Catargiul, Chipru, Filimon
| Paradigm Dumnezeu | Acc,Nom | Dat,Gen | Voc |
|---|---|---|---|
| Definite=Def|Number=Sing | Dumnezăul, Dumnedzăul, Dumnedzeul, Dumnezău | Dumnezăului, Dumnedzeu, Dumnedzeului | Dumnezeule, Dumnezăule |
| Definite=Def|Number=Plur | Dumnezăii | Dumnezeilor | |
| Definite=Ind|Number=Sing | dumnezău, Dumnedzău, Dumnezeu, Dumnedzeu, Dumnădzău, Dumnezăul, Dumnădzeu, Dumnedzeul, Dumnăzău | ||
| Definite=Ind|Number=Plur | Dumnezăi, Dumnezei |
ADJ
11253 ADJ tokens (96% of all ADJ tokens) have a non-empty value of Case.
The most frequent other feature values with which ADJ and Case co-occurred: Degree=Pos (11252; 100%), Definite=Ind (10441; 93%), Number=Sing (8624; 77%).
ADJ tokens may have the following values of Case:
Acc,Nom(10719; 95% of non-emptyCase): mare, bună, bun, svînta, verde, sfînt, datoriu, mic, svîntă, buneDat,Gen(286; 3% of non-emptyCase): svintei, svîntului, mari, vechi, creștinești, leșești, marelui, moschiceşti, sfinte, sfințilorVoc(248; 2% of non-emptyCase): svinte, sfinte, mișele, Mititelule, cinstite, dragă, luminate, sărmane, înălţate, PuterniceEMPTY(410): vel, vel-, mari, mici, slobozi, vechi, nemișcătoare, omenești, răi, biv-
| Paradigm sfânt | Acc,Nom | Dat,Gen | Voc |
|---|---|---|---|
| Definite=Def|Gender=Masc|Number=Sing | svîntul, sfîntul, svînta | svîntului, Sfîntului | |
| Definite=Def|Gender=Masc|Number=Plur | sfinții, svinții, svințîi | sfinților, SFINŢILOR | sfinților |
| Definite=Def|Gender=Fem | SFÎNTA, sînta | ||
| Definite=Def|Gender=Fem|Number=Sing | svînta, sfînta, sfânta, svînta- | svintei, sfintei | |
| Definite=Def|Gender=Fem|Number=Plur | sfintele, sfinteli, svintele | svintelor | |
| Definite=Ind|Gender=Masc|Number=Sing | sfînt, svînt, sfânt, Svânt, svinte, Sfîntu, svîntu | svinte, sfinte | |
| Definite=Ind|Gender=Masc|Number=Plur | sfinți, svinț, svinți | ||
| Definite=Ind|Gender=Fem|Number=Sing | svîntă, sfîntă, svinte, svînta | sfinte, svinte | |
| Definite=Ind|Gender=Fem|Number=Plur | sfinte, svinte, svinte- | sfinte, svinte |
Case seems to be lexical feature of ADJ. 91% lemmas (996) occur only with one value of Case.
VERB
1145 VERB tokens (2% of all VERB tokens) have a non-empty value of Case.
The most frequent other feature values with which VERB and Case co-occurred: Mood=EMPTY (1145; 100%), Number=Sing (1145; 100%), Person=EMPTY (1145; 100%), Tense=EMPTY (1145; 100%), VerbForm=Part (1144; 100%), Polarity=Pos (1052; 92%).
VERB tokens may have the following values of Case:
Acc,Nom(1095; 96% of non-emptyCase): scrisă, dată, făcută, adevărată, pusă, aleasă, -ndurată, ascunsă, neapărată, vestităDat,Gen(50; 4% of non-emptyCase): adevărate, arate, curate, -nnodate, aduse, arătate, uscate, încleștate, acoperite, aleaseEMPTY(73978): zise, făcut, face, da, dat, era, luat, zice, veni, avea
| Paradigm face | Acc,Nom | Dat,Gen |
|---|---|---|
| Polarity=Neg | nefăcută | |
| Polarity=Pos | făcută | făcute |
Case seems to be lexical feature of VERB. 94% lemmas (332) occur only with one value of Case.
NUM
788 NUM tokens (15% of all NUM tokens) have a non-empty value of Case.
The most frequent other feature values with which NUM and Case co-occurred: NumForm=Word (652; 83%), Gender=Fem (576; 73%), NumType=Card (576; 73%), Definite=Ind (521; 66%), Number=Plur (412; 52%).
NUM tokens may have the following values of Case:
Acc,Nom(748; 95% of non-emptyCase): doao, mii, mie, amîndoi, doo, sută, sute, giumătate, amândoi, jumătateDat,Gen(40; 5% of non-emptyCase): mii, sute, amîndurora, tustrei, unii, amânduror, tusșapte, unui, zeacelui, șeaseluiEMPTY(4385): trei, doi, 2, cinci, patru, 3, întîiu, treia, 4, 7
| Paradigm mie | Acc,Nom | Dat,Gen |
|---|---|---|
| Definite=Def|Number=Sing | mia | |
| Definite=Ind|Number=Sing | mie, mii | mii |
| Definite=Ind|Number=Plur | mii, miie | |
| Number=Plur | mii |
Case seems to be lexical feature of NUM. 90% lemmas (57) occur only with one value of Case.
ADV
1 ADV tokens (0% of all ADV tokens) have a non-empty value of Case.
The most frequent other feature values with which ADV and Case co-occurred: Polarity=EMPTY (1; 100%), PronType=Int,Rel (1; 100%).
ADV tokens may have the following values of Case:
Acc,Nom(1; 100% of non-emptyCase): cîtEMPTY(34595): nu, mai, și, cum, n-, cînd, numai, şi, tot, unde
Relations with Agreement in Case
The 10 most frequent relations where parent and child node agree in Case:
NOUN –[det]–> DET (12219; 76%),
NOUN –[amod]–> ADJ (6887; 90%),
NOUN –[conj]–> NOUN (6697; 98%),
NOUN –[nmod]–> NOUN (6645; 57%),
NOUN –[nmod]–> PROPN (3763; 78%),
PROPN –[nmod]–> NOUN (2853; 95%),
ADP –[fixed]–> ADP (2317; 100%),
NOUN –[nsubj]–> PRON (1043; 88%),
PROPN –[nmod]–> PROPN (996; 93%),
NOUN –[appos]–> NOUN (989; 94%).