Treebank Statistics: UD_Dutch-LassySmall: POS Tags: AUX
There are 8 AUX
lemmas (0%), 47 AUX
types (0%) and 10237 AUX
tokens (3%).
Out of 16 observed tags, the rank of AUX
is: 16 in number of lemmas, 12 in number of types and 10 in number of tokens.
The 10 most frequent AUX
lemmas: zijn, worden, hebben, zullen, kunnen, moeten, mogen, krijgen
The 10 most frequent AUX
types: is, was, werd, zijn, wordt, worden, werden, waren, zou, had
The 10 most frequent ambiguous lemmas: zijn (AUX 4565, PRON 1575, VERB 541, ADV 1), worden (AUX 2996, VERB 540), hebben (AUX 811, VERB 598), zullen (AUX 681, VERB 2), kunnen (AUX 657, VERB 26), moeten (AUX 425, VERB 9), mogen (AUX 95, VERB 2), krijgen (VERB 289, AUX 7)
The 10 most frequent ambiguous types: is (AUX 1697, VERB 130, X 1), was (AUX 1617, VERB 156, NOUN 8, X 3), werd (AUX 1359, VERB 281), zijn (PRON 1430, AUX 709, VERB 131, ADV 1), wordt (AUX 597, VERB 68), worden (AUX 534, VERB 87), werden (AUX 503, VERB 46, X 1), waren (AUX 451, VERB 79, NOUN 1), zou (AUX 403, VERB 2), had (AUX 313, VERB 203)
- is
- was
- AUX 1617: Het was de enige keer dat hij Oostende verliet voor een langere tijd .
- VERB 156: Ook binnen de liberale familie was er onenigheid over de te varen koers .
- NOUN 8: De broedcellen worden met was afgesloten .
- X 3: Bij wijze van excuus , of zelfs verdediging , zingt Dylan : “ I was so much older then / I’m younger than that now “ .
- werd
- zijn
- PRON 1430: ” Wie een hoofddoek draagt , tekent hiermee zijn terugkeercontract . “
- AUX 709: ” Mensenrechten zijn valse schijnwaarden . “
- VERB 131: Er zijn zeer veel steden die Alexandrië heten of hebben geheten .
- ADV 1: Juist in de periode dat er een gat was in Vandersteen zijn werk , half 1942 tot voorjaar 1943 , was er tevens een striptekenaar actief met een gelijkaardige stijl als die van Vandersteen , onder de naam Kaproen .
- wordt
- worden
- werden
- waren
- AUX 451: Deze Engelse grootouders waren renteniers uit Sussex .
- VERB 79: In Europa waren er aanvankelijk vooral hak- en brandtechnieken .
- NOUN 1: Het gaat om een oud pand met magazijnen eertijds toebehorend aan een zekere Matthieu , handelaar in koloniale waren , dat op 27 mei 1831 werd geplunderd .
- zou
- had
Morphology
The form / lemma ratio of AUX
is 5.875000 (the average of all parts of speech is 1.223407).
The 1st highest number of forms (9) was observed with the lemma “zijn”: ben, bent, geweest, is, waren, was, zij, zijn, zijnde.
The 2nd highest number of forms (7) was observed with the lemma “kunnen”: kan, kon, konden, konder, kun, kunnen, kunt.
The 3rd highest number of forms (7) was observed with the lemma “zullen”: zal, zou, zouden, zounden, zul, zullen, zult.
AUX
occurs with 3 features: VerbForm (10237; 100% instances), Number (9418; 92% instances), Tense (9418; 92% instances)
AUX
occurs with 7 feature-value pairs: Number=Plur
, Number=Sing
, Tense=Past
, Tense=Pres
, VerbForm=Fin
, VerbForm=Inf
, VerbForm=Part
AUX
occurs with 6 feature combinations.
The most frequent feature combination is Number=Sing|Tense=Past|VerbForm=Fin
(4070 tokens).
Examples: was, werd, zou, had, kon, moest, mocht, kreeg
Relations
AUX
nodes are attached to their parents using 4 different relations: aux:pass (3683; 36% instances), cop (3316; 32% instances), aux (3235; 32% instances), conj (3; 0% instances)
Parents of AUX
nodes belong to 13 different parts of speech: VERB (7002; 68% instances), NOUN (1609; 16% instances), ADJ (1160; 11% instances), PROPN (126; 1% instances), NUM (95; 1% instances), PRON (69; 1% instances), ADV (67; 1% instances), ADP (60; 1% instances), X (30; 0% instances), SYM (9; 0% instances), DET (6; 0% instances), AUX (3; 0% instances), INTJ (1; 0% instances)
10170 (99%) AUX
nodes are leaves.
65 (1%) AUX
nodes have one child.
2 (0%) AUX
nodes have two children.
The highest child degree of a AUX
node is 2.
Children of AUX
nodes are attached using 3 different relations: punct (58; 84% instances), conj (8; 12% instances), cc (3; 4% instances)
Children of AUX
nodes belong to 6 different parts of speech: PUNCT (58; 84% instances), AUX (3; 4% instances), CCONJ (3; 4% instances), VERB (3; 4% instances), ADJ (1; 1% instances), NUM (1; 1% instances)