Treebank Statistics: UD_Polish-MPDT: POS Tags: NUM
There are 187 NUM lemmas (2%), 213 NUM types (2%) and 716 NUM tokens (2%).
Out of 17 observed tags, the rank of NUM is: 6 in number of lemmas, 7 in number of types and 14 in number of tokens.
The 10 most frequent NUM lemmas: dwa, 2, 3, 4, trzy, 1, 10, pięć, cztery, sześć
The 10 most frequent NUM types: 2, dwa, 3, 4, 1, 10, dwie, trzy, 7, pięć
The 10 most frequent ambiguous lemmas: sześć (NUM 16, X 1), sto (NUM 14, NOUN 4), siła (NOUN 13, NUM 6, ADV 1), moc (NOUN 15, NUM 4), tysiąc (NOUN 29, NUM 4), cokolwiek (PRON 4, ADV 1, NUM 1)
The 10 most frequent ambiguous types: sześć (NUM 8, X 1), siła (NUM 6, NOUN 2, ADV 1), moc (NOUN 8, NUM 4), cokolwiek (PRON 3, ADV 1, NUM 1), kilkanaście (DET 6, NUM 1), kroć (ADV 1, NUM 1), set (NOUN 1, NUM 1), sta (NOUN 3, NUM 1)
- sześć
- siła
- NUM 6: Na ten koniec wiele Okrętów wspaniałych zbudowawszy , niemi siła wysep Duńskich nad Morzem Bałtyckim leżących zawojowali , one odebrali i wszędzie nad nimi tak wodą jako i lądem zwycięstwo odnosili .
- NOUN 2: z sławnej jazdy / szlacheckiej / stali się wozownicy / podusznicy / z łóżkami i stołkami się włócząc : zbrojny i jezdny pachołek zginął / i siła męska rozkoszami struchlała .
- ADV 1: Bo m ja nie na to ciebie męża wzięła , nie komu inszemu i wiedz to pewnie , że ć tego nie odpuszczę aż na sądzie bożym , bo ja siła cierpię dla ciebie ” .
- moc
- cokolwiek
- PRON 3: Tym obyczajem BÓG wszystko przejrzał , i przepowiedział w Starym Testamencie cokolwiek spełnić się miało , i już spełniło się w Nowym Testamencie .
- ADV 1: Często też ów zgiełk elektryczny cokolwiek poprzedza wstrząśnienie ziemi , lub też po nim następuje , przez co sobie można podchlebiać , że się jest daleko od miejsca , z którego piorun podziemny wyszedł , i nie podpada się tak wielkiemu niebezpieczeństwu .
- NUM 1: Kunicki opaliwszy Miedzybóż / a Zamkowi dawszy pokój / to ż i w Barze uczyniwszy poszedł z Kozakami / do Niemirowa / gdzie o wielkiej wszytkiego obfitości powiadają / stamtąd wziąwszy cokolwiek dział ma powrócić do ekspugnacjej Baru .
- kilkanaście
- kroć
- ADV 1: Niemałą uczynił szkodę dla Literatów Leo Isauricus Cesarz Grecki Obrazoborca , kiedy po Obrazach i na Księgi złość obróciwszy , Ksiąg mądrych spalił 3 . kroć sto tysięcy , jako świadczy Księga o Schizmie Greckiej .
- NUM 1: 10 . A ci dwa z sześci kroć sta tysięcy pieszych wybawieni są od niebezpieczeństwa , aby byli wprowadzeni do dziedzictwa , do ziemie , która opływa mlekiem i miodem .
- set
- sta
- NOUN 3: Wszystkie siły Indianów obrócono na wydobycie miner , wytapiano co rok złota około sta tysięcy Funtów Szterlingów ; wielka to suma była pod ten czas około roku 1506 .
- NUM 1: Trzeci , na kształt zapony , w którem jest diamentowa róża w środku , około niej diamentowych tabliczek ośm ; w tem że graniastych diamencików 2 ; za który klejnot złotych liczby polskiej półtrzecia sta .
Morphology
The form / lemma ratio of NUM is 1.139037 (the average of all parts of speech is 1.675682).
The 1st highest number of forms (9) was observed with the lemma “dwa”: dwa, dwaj, dwie, dwiema, dwoje, dwojgiem, dwoma, dwu, dwóch.
The 2nd highest number of forms (4) was observed with the lemma “cztery”: czterech, czterej, cztery, czworo.
The 3rd highest number of forms (4) was observed with the lemma “sto”: set, sta, sto, stu.
NUM occurs with 7 features: NumForm (716; 100% instances), Case (276; 39% instances), Gender (276; 39% instances), Number (276; 39% instances), Animacy (21; 3% instances), ExtPos (1; 0% instances), NumType (1; 0% instances)
NUM occurs with 16 feature-value pairs: Animacy=Hum, Case=Acc, Case=Gen, Case=Ins, Case=Loc, Case=Nom, ExtPos=ADV, Gender=Fem, Gender=Masc, Gender=Neut, NumForm=Digit, NumForm=Word, NumType=Card, Number=Dual, Number=Plur, Number=Sing
NUM occurs with 36 feature combinations.
The most frequent feature combination is NumForm=Digit (438 tokens).
Examples: 2, 3, 4, 1, 10, 7, 5, 12, 8, 6
Relations
NUM nodes are attached to their parents using 20 different relations: nummod (227; 32% instances), list (153; 21% instances), amod (67; 9% instances), flat (55; 8% instances), conj (54; 8% instances), obl (38; 5% instances), obj (26; 4% instances), iobj (19; 3% instances), nsubj (18; 3% instances), root (18; 3% instances), orphan (10; 1% instances), obl:arg (8; 1% instances), nmod:arg (6; 1% instances), nmod (4; 1% instances), appos (3; 0% instances), dep (3; 0% instances), obl:cmpr (3; 0% instances), nsubj:pass (2; 0% instances), advcl:relcl (1; 0% instances), nummod:flat (1; 0% instances)
Parents of NUM nodes belong to 12 different parts of speech: NOUN (376; 53% instances), VERB (195; 27% instances), NUM (67; 9% instances), ADJ (30; 4% instances), (18; 3% instances), ADV (9; 1% instances), DET (7; 1% instances), PROPN (7; 1% instances), PRON (4; 1% instances), ADP (1; 0% instances), CCONJ (1; 0% instances), PART (1; 0% instances)
244 (34%) NUM nodes are leaves.
279 (39%) NUM nodes have one child.
109 (15%) NUM nodes have two children.
84 (12%) NUM nodes have three or more children.
The highest child degree of a NUM node is 11.
Children of NUM nodes are attached using 27 different relations: punct (357; 45% instances), nmod:arg (136; 17% instances), conj (67; 8% instances), case (45; 6% instances), flat (38; 5% instances), cc (29; 4% instances), advmod:emph (24; 3% instances), nmod (23; 3% instances), dep (15; 2% instances), nmod:flat (14; 2% instances), amod (13; 2% instances), det (7; 1% instances), orphan (7; 1% instances), acl:relcl (5; 1% instances), mark (4; 1% instances), acl (3; 0% instances), advmod (2; 0% instances), parataxis:insert (2; 0% instances), advcl (1; 0% instances), appos (1; 0% instances), det:poss (1; 0% instances), fixed (1; 0% instances), iobj (1; 0% instances), list (1; 0% instances), obl (1; 0% instances), obl:arg (1; 0% instances), obl:cmpr (1; 0% instances)
Children of NUM nodes belong to 14 different parts of speech: PUNCT (357; 45% instances), NOUN (210; 26% instances), NUM (67; 8% instances), ADP (46; 6% instances), CCONJ (29; 4% instances), PART (24; 3% instances), ADV (18; 2% instances), ADJ (15; 2% instances), DET (15; 2% instances), VERB (7; 1% instances), SCONJ (4; 1% instances), PROPN (3; 0% instances), SYM (3; 0% instances), PRON (2; 0% instances)