Treebank Statistics: UD_French-GSD: POS Tags: VERB
There are 2262 VERB
lemmas (6%), 8054 VERB
types (17%) and 32047 VERB
tokens (8%).
Out of 17 observed tags, the rank of VERB
is: 4 in number of lemmas, 3 in number of types and 5 in number of tokens.
The 10 most frequent VERB
lemmas: avoir, faire, pouvoir, situer, naître, devoir, prendre, être, devenir, trouver
The 10 most frequent VERB
types: a, fait, peut, né, située, faire, est, situé, partir, trouve
The 10 most frequent ambiguous lemmas: avoir (AUX 3338, VERB 893, NOUN 1), faire (VERB 733, AUX 270), pouvoir (VERB 681, NOUN 89), devoir (VERB 359, NOUN 9), être (AUX 9301, VERB 318, NOUN 9), devenir (VERB 281, NOUN 1), aller (VERB 259, NOUN 3), dire (VERB 216, NOUN 1), sortir (VERB 122, NOUN 3), vouloir (VERB 116, NOUN 1)
The 10 most frequent ambiguous types: a (AUX 1821, VERB 370, ADP 22, DET 4, X 4, NOUN 1, PROPN 1), fait (VERB 321, NOUN 127, AUX 117), né (VERB 264, NOUN 1), faire (VERB 173, AUX 84), est (AUX 5103, VERB 150, NOUN 44, ADJ 3, CCONJ 1), situé (VERB 142, ADJ 1), ont (AUX 552, VERB 115), voir (VERB 91, SCONJ 3, ADV 1), mort (VERB 89, NOUN 85, ADJ 7), reste (VERB 89, NOUN 38)
- a
- AUX 1821: Le gardien algérien a lui aussi laissé filer le ballon dans ses buts .
- VERB 370: Elle a le statut de ville depuis 1957 .
- ADP 22: Emily Hirst est née a Vancouver à le Canada .
- DET 4: En anglais elle porte d’ ailleurs le nom de sail of a lugger , ou lugsail , c’est-à-dire voile de lougre .
- X 4: On peut modifier a posteriori la couleur et le nom d’ un objet , mais ceci se fait avec une boîte de dialogue modale qui cache la figure .
- NOUN 1: Ce toponyme suggère le nom d’ un homme germain , Alaman , marquant une origine ethnique , à lequel a été ajouté le suffixe -onem , le a initial pris pour la préposition à ayant disparu par aphérèse .
- PROPN 1: San Felice a Cancello est une commune italienne de la province de Caserte dans la région Campanie en Italie .
- fait
- né
- faire
- est
- AUX 5103: C’ est véritablement pour le futur baptisé un changement de cap .
- VERB 150: La question suivante est : Peut -on y prendre épouse ?
- NOUN 44: Elles sont situées à l’ est de la République serbe de Bosnie .
- ADJ 3: Environ 84 autres sont encerclés sur la partie est de l’ île , capturés et jugés .
- CCONJ 1: De ce château , il ne reste actuellement que des restes passifs : quelques communs et une annexe : la Jardinnerie et la Serrurerie et le Mardelin , des aqueducs souterrains , des caves , ses trois sources , son réservoir inférieur , ses fossés , est bien sûr ses bois de le parc … Victor Petit .
- situé
- ont
- voir
- mort
- reste
Morphology
The form / lemma ratio of VERB
is 3.560566 (the average of all parts of speech is 1.305352).
The 1st highest number of forms (30) was observed with the lemma “avoir”: a, ai, aient, ait, as, aura, aurai, auraient, aurais, aurait, aurez, auriez, auront, avaient, avais, avait, avez, avions, avoir, avons, ayant, ayons, eu, eurent, eus, eut, eût, non, ont, à.
The 2nd highest number of forms (25) was observed with the lemma “pouvoir”: peut, peuvent, peux, pourra, pourrai, pourraient, pourrais, pourrait, pourrez, pourrions, pourront, pouvaient, pouvais, pouvait, pouvant, pouvez, pouvions, pouvoir, pouvons, pu, puisse, puissent, purent, put, pû.
The 3rd highest number of forms (24) was observed with the lemma “devoir”: devaient, devais, devait, devant, devez, devoir, devons, devra, devraient, devrait, devriez, devrions, devront, dois, doit, doive, doivent, du, due, dues, durent, dus, dut, dû.
VERB
occurs with 6 features: VerbForm (31968; 100% instances), Tense (26437; 82% instances), Number (24877; 78% instances), Mood (13701; 43% instances), Person (13701; 43% instances), Gender (11176; 35% instances)
VERB
occurs with 18 feature-value pairs: Gender=Fem
, Gender=Masc
, Mood=Cnd
, Mood=Imp
, Mood=Ind
, Mood=Sub
, Number=Plur
, Number=Sing
, Person=1
, Person=2
, Person=3
, Tense=Fut
, Tense=Imp
, Tense=Past
, Tense=Pres
, VerbForm=Fin
, VerbForm=Inf
, VerbForm=Part
VERB
occurs with 44 feature combinations.
The most frequent feature combination is Mood=Ind|Number=Sing|Person=3|Tense=Pres|VerbForm=Fin
(7997 tokens).
Examples: a, peut, fait, est, devient, doit, trouve, permet, agit, faut
Relations
VERB
nodes are attached to their parents using 30 different relations: root (12003; 37% instances), acl (5293; 17% instances), conj (3661; 11% instances), acl:relcl (3061; 10% instances), xcomp (3037; 9% instances), advcl (2667; 8% instances), ccomp (1372; 4% instances), parataxis (478; 1% instances), advmod (124; 0% instances), advcl:cleft (105; 0% instances), appos (50; 0% instances), fixed (46; 0% instances), csubj (40; 0% instances), dep (20; 0% instances), nmod (17; 0% instances), case (11; 0% instances), obl (10; 0% instances), obl:mod (9; 0% instances), compound (8; 0% instances), dislocated (6; 0% instances), obl:arg (6; 0% instances), obj (5; 0% instances), nsubj (4; 0% instances), mark (3; 0% instances), orphan (3; 0% instances), csubj:pass (2; 0% instances), goeswith (2; 0% instances), obl:agent (2; 0% instances), cc (1; 0% instances), flat:name (1; 0% instances)
Parents of VERB
nodes belong to 15 different parts of speech: (12003; 37% instances), VERB (10000; 31% instances), NOUN (7464; 23% instances), PROPN (930; 3% instances), ADJ (704; 2% instances), PRON (527; 2% instances), ADV (326; 1% instances), NUM (38; 0% instances), X (20; 0% instances), ADP (12; 0% instances), INTJ (7; 0% instances), AUX (6; 0% instances), SCONJ (4; 0% instances), SYM (4; 0% instances), DET (2; 0% instances)
699 (2%) VERB
nodes are leaves.
3463 (11%) VERB
nodes have one child.
5643 (18%) VERB
nodes have two children.
22242 (69%) VERB
nodes have three or more children.
The highest child degree of a VERB
node is 15.
Children of VERB
nodes are attached using 47 different relations: punct (21079; 18% instances), nsubj (16060; 14% instances), obj (13148; 11% instances), advmod (8316; 7% instances), obl (7772; 7% instances), obl:mod (7574; 6% instances), obl:arg (6587; 6% instances), mark (6194; 5% instances), aux (4541; 4% instances), xcomp (4184; 4% instances), conj (3551; 3% instances), cc (3309; 3% instances), aux:pass (2850; 2% instances), advcl (2694; 2% instances), nsubj:pass (2551; 2% instances), obl:agent (1540; 1% instances), ccomp (1249; 1% instances), expl (1214; 1% instances), iobj (790; 1% instances), expl:pass (769; 1% instances), parataxis (402; 0% instances), aux:caus (270; 0% instances), nsubj:caus (144; 0% instances), obj:agent (114; 0% instances), appos (103; 0% instances), case (70; 0% instances), dep (68; 0% instances), det (46; 0% instances), discourse (27; 0% instances), nmod (26; 0% instances), fixed (25; 0% instances), cop (23; 0% instances), amod (20; 0% instances), iobj:agent (19; 0% instances), csubj (17; 0% instances), dislocated (17; 0% instances), nummod (10; 0% instances), compound (8; 0% instances), goeswith (7; 0% instances), acl (6; 0% instances), advcl:cleft (6; 0% instances), obj:lvc (6; 0% instances), vocative (5; 0% instances), flat:name (3; 0% instances), csubj:pass (2; 0% instances), orphan (2; 0% instances), reparandum (1; 0% instances)
Children of VERB
nodes belong to 17 different parts of speech: NOUN (35042; 30% instances), PUNCT (21079; 18% instances), PRON (14509; 12% instances), VERB (10000; 9% instances), ADV (8628; 7% instances), AUX (7685; 7% instances), PROPN (6706; 6% instances), ADP (4596; 4% instances), CCONJ (3190; 3% instances), NUM (2758; 2% instances), SCONJ (1808; 2% instances), ADJ (1004; 1% instances), SYM (165; 0% instances), DET (137; 0% instances), X (80; 0% instances), INTJ (28; 0% instances), PART (4; 0% instances)