Treebank Statistics: UD_French-GSD: POS Tags: NUM
There are 1849 NUM
lemmas (5%), 1850 NUM
types (4%) and 10522 NUM
tokens (3%).
Out of 16 observed tags, the rank of NUM
is: 6 in number of lemmas, 6 in number of types and 11 in number of tokens.
The 10 most frequent NUM
lemmas: deux, trois, 2, 3, 5, quatre, 2010, un, 4, 20
The 10 most frequent NUM
types: deux, trois, 2, 3, 5, quatre, 2010, 4, 20, 2009
The 10 most frequent ambiguous lemmas: un (DET 10063, PRON 319, NUM 122, X 1), 4 (NUM 120, PROPN 2, X 1), 7 (NUM 104, X 1), II (NUM 78, PROPN 5), cinq (NUM 77, NOUN 3), 1er (NUM 44, ADJ 18), h (NOUN 40, NUM 35), 50 (NUM 39, X 1), I (NUM 29, PROPN 9, X 1), cent (NUM 20, NOUN 1)
The 10 most frequent ambiguous types: 4 (NUM 120, PROPN 2, X 1), 7 (NUM 104, X 1), II (NUM 78, PROPN 5), cinq (NUM 68, NOUN 3), une (DET 3373, PRON 114, NUM 58, NOUN 1), un (DET 3929, PRON 182, NUM 58, X 1), 1er (NUM 44, ADJ 16), h (NOUN 40, NUM 35), 50 (NUM 39, X 1), I (NUM 29, PROPN 9, X 1)
- 4
- NUM 120: Côte de Bellevue Catégorie 4 ( 109,5 km )
- PROPN 2: ” C’ est la panique totale sur le marché , et la chute de le cours suit le risque souverain “ , explique Nuria Alvarez , analyste chez Renta 4 .
- X 1: Le premier single extrait de l’ album , “ 4 Seasons of Loneliness “ , sortit en aout 1997 .
- 7
- NUM 104: Maxime , 10 ans , est mannequin depuis l’ âge de 7 ans .
- X 1: Le label a sorti plusieurs albums de groupe influent , sinon des groupe “ genre-defining “ , incluent 7 Seconds et SNFU dans les années 1980 et Leatherface , The Unseen , Throw Rag , Pistol Grip , Souls , Youth Brigade / Swinging Utters et Alkaline Trio / One Man Army et d’ autres groupe de nos jours .
- II
- cinq
- une
- DET 3373: On en avait vue une dizaine à le premier contrôle mais pas celle là .
- PRON 114: M. Enzo a d’ ailleurs envoyé paître une de mes collègues !
- NUM 58: En une à deux semaines , la feuille a repris sa forme initiale .
- NOUN 1: Il vaut donc mieux éviter l’ expression « la clôture algébrique » et privilégier l’ article indéfini « une » ( une autre façon de le voir est qu’ il n’ existe pas de foncteur de la catégorie de les corps dans elle-même qui envoie tout corps K sur une clôture algébrique de K ) .
- un
- DET 3929: Aviator , un film sur la vie de Hughes .
- PRON 182: Il a trois frères , dont l’ un est l’ entomologiste Théodore Lacordaire .
- NUM 58: En 1980 il n’ en reste plus qu’ un seul : St-Auban .
- X 1: C’ est à cette époque que Mère Théodore Guérin ( canonisée en 2006 ) fonde sa première un institution , un orphelinat à Vincennes et que sa congrégation essaime dans le nord de le pays .
- 1er
- h
- 50
- NUM 39: Ce taux atteint même 50 % dans certains centres .
- X 1: Ainsi en 2004 , elle fut à l’ affiche de les films Une famille pour la vie et 50 Ways to Leave Your Lover , en 2005 Passions sous la neige et L’ héritage de la passion et plus récemment le thriller Between , où elle rencontra également l’ amour avec Adam Kaufman , son co-star dans ce film .
- I
Morphology
The form / lemma ratio of NUM
is 1.000541 (the average of all parts of speech is 1.308785).
The 1st highest number of forms (2) was observed with the lemma “cent”: cent, cents.
The 2nd highest number of forms (2) was observed with the lemma “un”: un, une.
The 3rd highest number of forms (1) was observed with the lemma “’06”: ‘06.
NUM
occurs with 4 features: Number (10505; 100% instances), Gender (61; 1% instances), ExtPos (2; 0% instances), Typo (2; 0% instances)
NUM
occurs with 5 feature-value pairs: ExtPos=PROPN
, Gender=Fem
, Number=Plur
, Number=Sing
, Typo=Yes
NUM
occurs with 6 feature combinations.
The most frequent feature combination is Number=Plur
(9214 tokens).
Examples: deux, trois, 2, quatre, 2010, 2009, 2008, 2011, 3, 5
Relations
NUM
nodes are attached to their parents using 22 different relations: nummod (3639; 35% instances), nmod (3268; 31% instances), obl:mod (2211; 21% instances), obl:arg (741; 7% instances), conj (375; 4% instances), appos (54; 1% instances), orphan (40; 0% instances), nsubj (32; 0% instances), obj (32; 0% instances), root (24; 0% instances), flat:name (19; 0% instances), parataxis (19; 0% instances), acl:relcl (18; 0% instances), flat (16; 0% instances), nsubj:pass (12; 0% instances), xcomp (11; 0% instances), advcl (3; 0% instances), ccomp (3; 0% instances), obl:agent (2; 0% instances), dep (1; 0% instances), fixed (1; 0% instances), obl (1; 0% instances)
Parents of NUM
nodes belong to 14 different parts of speech: NOUN (5778; 55% instances), VERB (2691; 26% instances), NUM (706; 7% instances), PROPN (640; 6% instances), SYM (446; 4% instances), X (66; 1% instances), ADJ (63; 1% instances), ADP (58; 1% instances), PRON (36; 0% instances), (24; 0% instances), ADV (9; 0% instances), INTJ (3; 0% instances), AUX (1; 0% instances), DET (1; 0% instances)
5614 (53%) NUM
nodes are leaves.
2404 (23%) NUM
nodes have one child.
1742 (17%) NUM
nodes have two children.
762 (7%) NUM
nodes have three or more children.
The highest child degree of a NUM
node is 10.
Children of NUM
nodes are attached using 26 different relations: case (2949; 35% instances), punct (1725; 20% instances), nmod (1437; 17% instances), det (1091; 13% instances), conj (380; 4% instances), cc (281; 3% instances), advmod (186; 2% instances), obl:arg (174; 2% instances), amod (57; 1% instances), nummod (43; 1% instances), appos (39; 0% instances), cop (31; 0% instances), nsubj (26; 0% instances), flat (16; 0% instances), acl (15; 0% instances), obl:mod (9; 0% instances), orphan (9; 0% instances), parataxis (9; 0% instances), acl:relcl (6; 0% instances), flat:name (6; 0% instances), mark (6; 0% instances), advcl:cleft (5; 0% instances), expl:subj (5; 0% instances), advcl (3; 0% instances), aux:tense (1; 0% instances), discourse (1; 0% instances)
Children of NUM
nodes belong to 16 different parts of speech: ADP (2959; 35% instances), PUNCT (1725; 20% instances), NOUN (1282; 15% instances), DET (1091; 13% instances), NUM (706; 8% instances), CCONJ (256; 3% instances), ADV (173; 2% instances), PROPN (66; 1% instances), ADJ (63; 1% instances), PRON (53; 1% instances), SYM (44; 1% instances), VERB (39; 0% instances), AUX (32; 0% instances), X (16; 0% instances), SCONJ (4; 0% instances), INTJ (1; 0% instances)