Treebank Statistics: UD_French: POS Tags: NUM
There are 1953 NUM
lemmas (5%), 1953 NUM
types (4%) and 10672 NUM
tokens (3%).
Out of 17 observed tags, the rank of NUM
is: 5 in number of lemmas, 5 in number of types and 11 in number of tokens.
The 10 most frequent NUM
lemmas: deux, trois, 2, 3, 5, quatre, 4, 2010, 2009, 2008
The 10 most frequent NUM
types: deux, trois, 2, 3, 5, quatre, 4, 2010, 2009, 2008
The 10 most frequent ambiguous lemmas: deux (NUM 601, PRON 10, NOUN 4), trois (NUM 227, PRON 2), 2 (NUM 158, PROPN 5, PRON 1), 3 (NUM 135, ADJ 1), quatre (NUM 115, PRON 1), 4 (NUM 123, PROPN 2), 2010 (NUM 122, PROPN 1), 1 (NUM 110, PROPN 2), 6 (NUM 97, ADJ 1), 15 (NUM 95, PROPN 1)
The 10 most frequent ambiguous types: deux (NUM 600, PRON 6, NOUN 4), trois (NUM 227, PRON 2), 2 (NUM 158, PROPN 5, PRON 2), 3 (NUM 135, ADJ 1), quatre (NUM 115, PRON 1), 4 (NUM 123, PROPN 2, ADJ 1), 2010 (NUM 122, PROPN 1), 1 (NUM 110, PROPN 2, ADJ 1), 7 (NUM 108, ADJ 1), 10 (NUM 99, ADJ 1)
- deux
- trois
- 2
- NUM 158: Il peut mesurer jusqu’ à 2 m de diamètre voir plus .
- PROPN 5: EarthSiege 2 est un jeu vidéo de stratégie développé par Dynamix et publié par Sierra .
- PRON 2: Chaque Eyze en possède en effet un ( voir 2 ) , dont la plupart de les lames sont de couleurs bleues ( le sabre-laser d’ Armanda est bleu ) , mais peuvent parfois être vertes .
- 3
- quatre
- NUM 115: En 1582 , il a terminé de commenter les quatre premières Journées .
- PRON 1: Toujours en Géométrie euclidienne , on montre que dans un triangle , le centre de gravité G , l’ orthocentre H , le centre de le cercle circonscrit Ω , et le centre de le cercle d’ Euler E sont tous les quatre alignés sur une droite dite droite d’ Euler de le triangle , de plus ils sont en division harmonique ( dans cet ordre ) .
- 4
- NUM 123: Côte de Bellevue Catégorie 4 ( 109,5 km )
- PROPN 2: ” C’ est la panique totale sur le marché , et la chute de le cours suit le risque souverain “ , explique Nuria Alvarez , analyste chez Renta 4 .
- ADJ 1: LInternational football cup 1964-1965 est la 4 édition de l’ International football cup .
- 2010
- 1
- NUM 110: « Les Pourquoi ? » passeront sur RTL , puis sur Europe 1 .
- PROPN 2: John Fisher entame une très longue carrière dans la marine britannique , qui lui vaudra le titre de 1 Lord de la Mer en 1905 , après avoir obtenu le titre de Troisième Lord de la Mer en 1892 , puis le Deuxième Lord de la Mer en 1902 .
- ADJ 1: Remarque : Chypre est entré en zone euro le 1 janvier 2008 .
- 7
- 10
- NUM 99: Il ne sera présent que durant les 10 premières parties .
- ADJ 1: Passé professionnel en 1973 , il devient champion d’ Europe EBU de les super-welters en 1975 puis champion de le monde WBC de la catégorie le 18 juin 1976 après sa victoire par arrêt de l’ arbitre à le 10 round contre Elisha Obed .
Morphology
The form / lemma ratio of NUM
is 1.000000 (the average of all parts of speech is 1.306238).
The 1st highest number of forms (2) was observed with the lemma “1963”: 1963, 1969.
The 2nd highest number of forms (1) was observed with the lemma “’06”: ‘06.
The 3rd highest number of forms (1) was observed with the lemma “’900”: ‘900.
NUM
occurs with 2 features: Gender (10; 0% instances), Number (10; 0% instances)
NUM
occurs with 2 feature-value pairs: Gender=Fem
, Number=Plur
NUM
occurs with 2 feature combinations.
The most frequent feature combination is _
(10662 tokens).
Examples: deux, trois, 2, 3, 5, quatre, 4, 2010, 2009, 2008
Relations
NUM
nodes are attached to their parents using 22 different relations: nummod (5452; 51% instances), nmod (2496; 23% instances), obl (2023; 19% instances), conj (372; 3% instances), appos (114; 1% instances), compound (62; 1% instances), nsubj (31; 0% instances), obj (25; 0% instances), xcomp (25; 0% instances), root (24; 0% instances), flat:name (12; 0% instances), nsubj:pass (11; 0% instances), dep (9; 0% instances), amod (6; 0% instances), advcl (2; 0% instances), fixed (2; 0% instances), acl:relcl (1; 0% instances), advmod (1; 0% instances), ccomp (1; 0% instances), det (1; 0% instances), orphan (1; 0% instances), parataxis (1; 0% instances)
Parents of NUM
nodes belong to 14 different parts of speech: NOUN (6894; 65% instances), VERB (2004; 19% instances), PROPN (693; 6% instances), NUM (483; 5% instances), SYM (429; 4% instances), ADJ (56; 1% instances), X (45; 0% instances), PRON (33; 0% instances), (24; 0% instances), ADV (3; 0% instances), INTJ (3; 0% instances), ADP (2; 0% instances), PUNCT (2; 0% instances), SCONJ (1; 0% instances)
6580 (62%) NUM
nodes are leaves.
3012 (28%) NUM
nodes have one child.
842 (8%) NUM
nodes have two children.
238 (2%) NUM
nodes have three or more children.
The highest child degree of a NUM
node is 8.
Children of NUM
nodes are attached using 24 different relations: case (2790; 50% instances), punct (1124; 20% instances), conj (395; 7% instances), advmod (385; 7% instances), nmod (286; 5% instances), cc (255; 5% instances), det (118; 2% instances), appos (39; 1% instances), nummod (36; 1% instances), cop (28; 1% instances), nsubj (27; 0% instances), acl (20; 0% instances), amod (17; 0% instances), compound (12; 0% instances), obl (12; 0% instances), mark (5; 0% instances), acl:relcl (4; 0% instances), advcl (3; 0% instances), aux (2; 0% instances), ccomp (2; 0% instances), expl (1; 0% instances), fixed (1; 0% instances), parataxis (1; 0% instances), xcomp (1; 0% instances)
Children of NUM
nodes belong to 17 different parts of speech: ADP (2809; 50% instances), PUNCT (1122; 20% instances), NUM (483; 9% instances), ADV (362; 7% instances), CCONJ (246; 4% instances), NOUN (190; 3% instances), DET (122; 2% instances), PROPN (52; 1% instances), PRON (38; 1% instances), VERB (34; 1% instances), AUX (30; 1% instances), ADJ (29; 1% instances), X (22; 0% instances), SCONJ (12; 0% instances), SYM (11; 0% instances), INTJ (1; 0% instances), PART (1; 0% instances)