Treebank Statistics: UD_Czech-PDTC: Features: Voice
This feature is universal.
It occurs with 2 different values: Act, Pass.
444128 tokens (13%) have a non-empty value of Voice.
48795 types (26%) occur at least once with a non-empty value of Voice.
11646 lemmas (14%) occur at least once with a non-empty value of Voice.
The feature is used with 3 part-of-speech tags: VERB (268298; 8% instances), AUX (120218; 3% instances), ADJ (55612; 2% instances).
VERB
268298 VERB tokens (84% of all VERB tokens) have a non-empty value of Voice.
The most frequent other feature values with which VERB and Voice co-occurred: Polarity=Pos (243379; 91%), Animacy=EMPTY (226326; 84%), Aspect=Imp (159108; 59%), Number=Sing (150966; 56%), Mood=EMPTY (144235; 54%), Person=EMPTY (144234; 54%), Tense=Past (144053; 54%), VerbForm=Part (144050; 54%).
VERB tokens may have the following values of Voice:
Act(268298; 100% of non-emptyVoice): má, řekl, říká, měl, měli, měla, může, mají, uvedla, uvedlEMPTY(51644): mít, vidět, říct, získat, dělat, stát, jít, hrát, podívat, udělat
Voice seems to be lexical feature of VERB. 100% lemmas (6824) occur only with one value of Voice.
AUX
120218 AUX tokens (83% of all AUX tokens) have a non-empty value of Voice.
The most frequent other feature values with which AUX and Voice co-occurred: Aspect=Imp (120217; 100%), Polarity=Pos (111534; 93%), Gender=EMPTY (86635; 72%), Mood=Ind (86631; 72%), VerbForm=Fin (86631; 72%), Number=Sing (76747; 64%), Tense=Pres (76574; 64%).
AUX tokens may have the following values of Voice:
Act(120218; 100% of non-emptyVoice): je, jsem, jsme, byl, jsou, bylo, byla, bude, byly, neníEMPTY(24768): by, být, bych, bychom, byste, buď, bys, buďte, nebýt, budiž
ADJ
55612 ADJ tokens (15% of all ADJ tokens) have a non-empty value of Voice.
The most frequent other feature values with which ADJ and Voice co-occurred: VerbForm=Part (55612; 100%), Polarity=Pos (53739; 97%), Degree=Pos (45583; 82%), Animacy=EMPTY (33127; 60%), Number=Sing (30630; 55%).
ADJ tokens may have the following values of Voice:
Act(10138; 18% of non-emptyVoice): vedoucí, budoucí, zabývající, týkající, rostoucí, následující, rozhodující, sídlící, vynikající, vedoucíchPass(45474; 82% of non-emptyVoice): spojených, spojené, jmenován, řečeno, vyfocené, dané, uvedené, přesvědčen, připravena, připravenEMPTY(305425): další, první, nové, poslední, české, velké, dalších, cenných, obchodní, hlavní
Voice seems to be lexical feature of ADJ. 100% lemmas (4819) occur only with one value of Voice.
Relations with Agreement in Voice
The 10 most frequent relations where parent and child node agree in Voice:
VERB –[conj]–> VERB (31074; 96%),
VERB –[aux]–> AUX (24296; 51%),
VERB –[ccomp]–> VERB (20819; 87%),
VERB –[advcl]–> VERB (12947; 84%),
VERB –[parataxis]–> VERB (969; 72%),
VERB –[csubj:pass]–> VERB (522; 72%),
VERB –[appos]–> VERB (464; 94%),
VERB –[dep]–> VERB (399; 86%),
VERB –[ccomp]–> AUX (298; 91%),
AUX –[conj]–> VERB (285; 98%).