home edit page issue tracker

This page pertains to UD version 2.

Treebank Statistics: UD_Old_East_Slavic-Ruthenian: Features: Gender

This feature is universal. It occurs with 3 different values: Fem, Masc, Neut.

66441 tokens (48%) have a non-empty value of Gender. 20762 types (80%) occur at least once with a non-empty value of Gender. 7669 lemmas (81%) occur at least once with a non-empty value of Gender. The feature is used with 8 part-of-speech tags: NOUN (27188; 20% instances), PROPN (9866; 7% instances), DET (9802; 7% instances), ADJ (8889; 6% instances), PRON (6116; 4% instances), VERB (3741; 3% instances), NUM (561; 0% instances), AUX (278; 0% instances).

NOUN

27188 NOUN tokens (100% of all NOUN tokens) have a non-empty value of Gender.

The most frequent other feature values with which NOUN and Gender co-occurred: Number=Sing (19125; 70%).

NOUN tokens may have the following values of Gender:

Paradigm зрайцаMascFemNeut
Case=Acc|Number=Singзра(и)ца, зра(и)цу, зра(й)цу
Case=Gen|Number=Singзра(й)цизра(й)цизра(и)ци
Case=Gen|Number=Plurзра(й)цо(в), зра(и)цо(в), зра(й)цо(въ), зра(й)цовъ
Case=Ins|Number=Singзра(и)цою
Case=Loc|Number=Plurзра(и)ца(х)
Case=Nom|Number=Singзра(и)ца, зра(й)цазра(и)ца, зра(й)ца

Gender seems to be lexical feature of NOUN. 99% lemmas (2379) occur only with one value of Gender.

PROPN

9866 PROPN tokens (100% of all PROPN tokens) have a non-empty value of Gender.

The most frequent other feature values with which PROPN and Gender co-occurred: Number=Sing (9387; 95%), NameType=Giv (5145; 52%).

PROPN tokens may have the following values of Gender:

Paradigm ВасильMascFem
Animacy=Anim|Case=AccВасилѧ, Василя, Василья, Васильѧ
Case=DatВасилю, Василью
Case=GenВасилѧ, Василья, Василиѧ, Васильѧ, Василя
Case=NomВасилеи, Васил(ь), ВасильВасил(ь)

Gender seems to be lexical feature of PROPN. 99% lemmas (2908) occur only with one value of Gender.

DET

9802 DET tokens (100% of all DET tokens) have a non-empty value of Gender.

The most frequent other feature values with which DET and Gender co-occurred: Reflex=EMPTY (8774; 90%), Number=Sing (6414; 65%), Poss=EMPTY (6044; 62%).

DET tokens may have the following values of Gender:

Paradigm нашъMascFemNeut
Animacy=Anim|Case=Acc|Number=Sing|Poss=Yes|PronType=Prsнашого, нашег(о), нашего, нашог(о), н(а)шого, нашго, нашѣг(о)
Animacy=Anim|Case=Acc|Number=Plur|Poss=Yes|PronType=Prsнаших, нашых, нашихъ
Case=Acc|Number=Sing|Poss=Yes|PronType=Prsнашъ, наш, н(а)шъ, нашь, н(а)шьнашу, нашꙋ, нашю, н(а)шу, н(а)шꙋ, нашѹ, нш̃ꙋнашо, наше, н(а)шо, н(а)ше
Case=Acc|Number=Plur|Poss=Yes|PronType=Prsнаши, нашы, шинаши, н(а)ши, нашынаши, наша, нашые
Case=Dat|Number=Sing|Poss=Yes|PronType=Prsнашому, нашомꙋ, нашему, н(а)шому, нашемꙋ, нашемоу, н(а)шомꙋ, н(а)ш(е)му, н(а)ш(о)му, нашем(у), нашемѹ, нашѣмоунашои, нашеи, нашой, н(а)шоинашому, н(а)шому, нашомꙋ, нашѣмоу
Case=Dat|Number=Plur|Poss=Yes|PronType=Prsнашим, нашимъ, нашым, н(а)шимъ, наши(м), нашымъ, н(а)шим, н(а)шым, на[шим, наши(м)ънашим, нашимъ, нашымнашим, нашымъ, нашимъ, н(а)шим, нашым
Case=Gen|Number=Sing|Poss=Yes|PronType=Prsнашого, нашог(о), нашего, нашег(о), н(а)шого, н(а)шог(о), нашѣг(о), н(а)ш(о)г(о), н(а)ш(о)го, нашєго, нашѣгонашое, нашее, н(а)шое, нашеи, н(а)шее, нашей, нашея, нашеѧ, нашоинашого, нашег(о), н(а)ш(о)го, н(а)шого, нашего, нашог(о), нашѣго
Case=Gen|Number=Sing|PronType=Demнашое
Case=Gen|Number=Plur|Poss=Yes|PronType=Prsнаших, нашых, нашихъ, нашихь, н(а)ших, наши(х), нашыхъ, на[ш]ихнаших, н(а)шихъ, нашихь, нашихънаших, нашихъ, нашых
Case=Ins|Number=Sing|Poss=Yes|PronType=Prsнашим, нашимъ, наши(м), нашым, нашымъ, н(а)шимъ, н(а)шим, н(а)шымъ, н(а)ш(и)мъ, н(а)шым, нашимь, нашомъ, нашіимъ, нш҃и(м), н҃шимнашою, нашею, н(а)шою, нашѣюнашим, нашимъ, наши(м), нашимь, нашым
Case=Ins|Number=Sing|PronType=Demнашою
Case=Ins|Number=Plur|Poss=Yes|PronType=Prsнашими, нашыми, н(а)шими, наш[ими]нашими, нашеми, нашыми, шыминашими, наши, нашыми
Case=Loc|Number=Sing|Poss=Yes|PronType=Prsнашом, нашомъ, нашем, нашемъ, нашо(м), н(а)шомъ, нашемь, нашѣмнашои, нашой, н(а)шои, нашее, нашеи, нашей, нашо(и), нашоі, нашѣинашомъ, нашом
Case=Loc|Number=Plur|Poss=Yes|PronType=Prsнаших, нашыхнаших, н(а)ших, нашихьнашых
Case=Nom|Number=Sing|Poss=Yes|PronType=Prsнашъ, наш, нашь, н(а)шъ, н(а)шьнаша, наш(а), н(а)ша, нащанаше, нашѣ, н(а)ше, н(а)шо, нашо
Case=Nom|Number=Plur|Poss=Yes|PronType=Prsнаши, нашы, н(а)ши, нш҃и, нашенашинаши, Наша

ADJ

8889 ADJ tokens (99% of all ADJ tokens) have a non-empty value of Gender.

The most frequent other feature values with which ADJ and Gender co-occurred: Variant=EMPTY (7964; 90%), NumForm=EMPTY (7897; 89%), NumType=EMPTY (7897; 89%), Degree=Pos (7759; 87%), Number=Sing (6622; 74%).

ADJ tokens may have the following values of Gender:

Paradigm полоцкийMascFemNeut
Animacy=Anim|Case=Acc|Number=Singполоцкого, полоцъкого, полоцког(о), полоцького, пол(о)цког(о)
Animacy=Anim|Case=Acc|Number=Plurполоцких, полоцкихъ, полоцъкихъ, полоцъких, полоцькихъ
Case=Acc|Number=SingПолоцкии, Полочькиполоцкую, Полочьскую, полоцъкуюПолоцъкое, полоцкое
Case=Acc|Number=Plurполоцькыи, поцькыиполоцкии, полоцкие
Case=Acc|Number=Plur|Variant=Shortполоцьки
Case=Dat|Number=Singполоцкомꙋ, полоцкому, полоцъкому, полоцъкомꙋ, пол(оцкому), полоцкомъполоцкои, ПолоцъкоиПолоцкомꙋ, Полоцкому
Case=Dat|Number=Plurполоцким, полоцкимъ, полоцъкимъ, полоцкым, полѡтцкымъ
Case=Gen|Number=Singполоцкого, полоцког(о), полоцъкого, полоцьког(о), полотского, полоцького, пол(о)цког(о), полотског(о), полотьского, полочьког(о), Полоцого, пол(о)цьког(о), полоцкаг(о), полоцкго, полоцкогѡ, полочькогополоцкое, Полоцъкое, Полоцкои, ПолоцькоеПолоцкого, Полоцког(о), Полоцъкого, Полоцького, Пол(о)цког(о), Полоцьког(о), Полоцкѡг(о)
Case=Gen|Number=Plurполоцких, полоцкых, полоцкихъ, полоцъкихъ, полоцъких, полоцькых, пол(о)цкых, полоцкыхъ, по[лоцк]ых, пол(о)цких, пол(о)цькых, пололоцких, полоцьких, полоцькыхъ, полочькиихполоцъких, полоцких, полоцъкихъ, Полоцкое, полоцкихъ
Case=Ins|Number=Singполоцким, полоцкимъ, полоцкымъ, полоцъкимъполоцкою, полоцъкоюПолоцкимъ, Полоцъкимъ
Case=Ins|Number=Plurполоцкими, полоцькими, полоцъкимиполоцъкими
Case=Loc|Number=Singполоцком, Полоцкомъ, Полоцъкомъ, Пол]оцкомъ, ПолоцъкомПолоцкоиПолоцъкомъ, Полоцкомъ, Полоцком, Полоцъком
Case=Loc|Number=Plurполоцких
Case=Loc|Number=Plur|Variant=Shortполочьскы
Case=Nom|Number=Singполоцкии, полоцъкии, полоцкыи, полоц(кии), полоцкий, полоцькыи, пол(оцкии), полоцькии, Полѡтьцкыи, полотскии, полоцкіи, полочькииполоцкаѧ, Полоцкая, Полоцькая, Полочькаѧ, Полочьскаѧ, полоцъкаѧПолоцкое, Полоцькое
Case=Nom|Number=Sing|Variant=Shortполоцъкы
Case=Nom|Number=Plurполоцкии, полоцкие, полоцькыи, полоцъкие, пол(о)цкыи, полоцкыи, полоцъкии, поцькыи, полоцкиѣ, пол(о)цкые, полоцкые, полоцъкииеполоцкии

PRON

6116 PRON tokens (67% of all PRON tokens) have a non-empty value of Gender.

The most frequent other feature values with which PRON and Gender co-occurred: Number=Sing (4877; 80%), PronType=Prs (3325; 54%), Person=3 (3322; 54%).

PRON tokens may have the following values of Gender:

Paradigm онъMascFemNeut
Case=Acc|Number=Sing|Person=3|PronType=Prsего, него, єго, ег(о), нєго, нѣго, ѥго, нег(о)
Case=Dat|Number=Sing|Person=3|PronType=Prsему, емꙋ, єму, емоу, ѥму, нему, нѣмоу, ємоу, ємѹ, му, немоу, немꙋ
Case=Dat|Number=Sing|PronType=Relемꙋ
Case=Gen|Number=Sing|Person=3|PronType=Prsего, єго, ег(о), него, нег(о), нєго, нѣго, го, е]г(о), ег[о], ниго, нѣг(о), є(г)оєго
Case=Ins|Number=Sing|Person=3|PronType=Prsним, нимъ, ни(м), ны(м)
Case=Loc|Number=Sing|Person=3|PronType=Prsнем, немъ, нє(м), нѣмего
Case=Nom|Number=Sing|Person=3|PronType=Prsѡнъ, ѡн, ѡ(н), онъ, ѡ(н)ъ, он, енъ
Case=Nom|Number=Plur|Person=3|PronType=Prsѡни

VERB

3741 VERB tokens (32% of all VERB tokens) have a non-empty value of Gender.

The most frequent other feature values with which VERB and Gender co-occurred: Mood=EMPTY (3741; 100%), Person=EMPTY (3736; 100%), Tense=Past (3671; 98%), Number=Sing (3473; 93%), VerbForm=PartRes (2713; 73%), Voice=Act (2600; 70%), Aspect=Perf (1911; 51%).

VERB tokens may have the following values of Gender:

Paradigm датиMascFemNeut
Analyt=Yes|Aspect=Perf|Case=Nom|Number=Sing|Variant=Short|VerbForm=Part|Voice=Passданадано
Analyt=Yes|Aspect=Perf|Case=Nom|Number=Plur|Variant=Short|VerbForm=Part|Voice=Passданы
Analyt=Yes|Aspect=Perf|Number=Sing|VerbForm=PartRes|Voice=Actдал, далъ
Aspect=Perf|Case=Acc|Number=Plur|VerbForm=Part|Voice=Passданые
Aspect=Perf|Case=Gen|Number=Sing|VerbForm=Part|Voice=Passданого
Aspect=Perf|Case=Gen|Number=Plur|VerbForm=Part|Voice=Passданых
Aspect=Perf|Case=Nom|Number=Sing|Variant=Short|VerbForm=Part|Voice=Passдан, данъданадано, дато
Aspect=Perf|Case=Nom|Number=Sing|VerbForm=Part|Voice=Passданыи
Aspect=Perf|Case=Nom|Number=Plur|Variant=Short|VerbForm=Part|Voice=Passданы
Aspect=Perf|Case=Nom|Number=Plur|VerbForm=Part|Voice=Passданые
Aspect=Perf|Number=Sing|VerbForm=PartRes|Voice=Actдал, далъ, да(л), дальдала, да(т)ла
Aspect=Perf|Number=Plur|VerbForm=PartRes|Voice=Actдали
Case=Nom|Number=Sing|VerbForm=Part|Voice=Passдана
Number=Sing|VerbForm=PartRes|Voice=Actда(л), далъ

NUM

561 NUM tokens (43% of all NUM tokens) have a non-empty value of Gender.

The most frequent other feature values with which NUM and Gender co-occurred: NumForm=Word (471; 84%), NumType=Card (425; 76%).

NUM tokens may have the following values of Gender:

Paradigm дваMascFemNeut
Case=Acc|NumType=Cardдва, двѣдве, двѣ, двадве, два
Case=Acc|NumType=Fracдвѣ
Case=Dat|NumType=Cardдвема, дво(м)
Case=Dat|NumType=Fracдвѣ
Case=Gen|NumType=Cardдву, дво(х), двоу, двохъ, двух, двꙋхъдвꙋ, дву, дво(х), двохъ, двух
Case=Ins|NumType=Cardдвома, двѣмадвема
Case=Loc|NumType=Cardдву, двꙋхъдвоу
Case=Nom|NumType=Cardдвадведва, две
Case=Nom|NumType=Fracдвѣ

AUX

278 AUX tokens (13% of all AUX tokens) have a non-empty value of Gender.

The most frequent other feature values with which AUX and Gender co-occurred: Mood=EMPTY (278; 100%), Person=EMPTY (278; 100%), Voice=Act (277; 100%), Number=Sing (275; 99%), Tense=Past (273; 98%), VerbForm=PartRes (273; 98%), Analyt=EMPTY (186; 67%).

AUX tokens may have the following values of Gender:

Paradigm бытиMascFemNeut
Analyt=Yes|Number=Sing|Tense=Past|VerbForm=PartRes|Voice=Actбыл, былъ, бы(л)былабыло
Case=Gen|Number=Sing|Tense=Pres|VerbForm=Part|Voice=Actбывъшого
Case=Gen|Number=Plur|Tense=Pres|VerbForm=Part|Voice=Actбудучи(х)
Case=Ins|Number=Singбывъши(м)
Case=Nom|Number=Plur|Tense=Pres|VerbForm=Part|Voice=Actбудучие, будущіи
Number=Sing|Tense=Past|VerbForm=PartRes|Voice=Actбылъ, был, бы(л)былабыло

Relations with Agreement in Gender

The 10 most frequent relations where parent and child node agree in Gender: NOUN –[det]–> DET (7625; 100%), NOUN –[amod]–> ADJ (6711; 99%), NOUN –[conj]–> NOUN (2709; 65%), PROPN –[flat:name]–> PROPN (2325; 99%), NOUN –[appos]–> PROPN (1977; 90%), NOUN –[appos]–> NOUN (1541; 76%), PROPN –[conj]–> PROPN (1190; 93%), PROPN –[appos]–> NOUN (765; 90%), VERB –[conj]–> VERB (525; 50%), ADJ –[conj]–> ADJ (473; 89%).