Statistics of NUM in UD_Coptic-Scriptorium

home edit page issue tracker

This page pertains to UD version 2.

It appears that you have Javascript disabled. Please consider enabling Javascript for this page to see the visualizations.

Treebank Statistics: UD_Coptic-Scriptorium: POS Tags: `NUM`

There are 50 NUM lemmas (2%), 56 NUM types (2%) and 318 NUM tokens (1%). Out of 15 observed tags, the rank of NUM is: 7 in number of lemmas, 8 in number of types and 13 in number of tokens.

The 10 most frequent NUM lemmas: ⲟⲩⲁ, ⲥⲛⲁⲩ, ϣⲉ, ϣⲟⲙⲛⲧ, ⲙⲛⲧⲥⲛⲟⲟⲩⲥ, ⲙⲏⲧ, ⲥⲁϣϥ, ⲧⲃⲁ, ϩⲙⲉ, ⲙⲁⲁⲃ

The 10 most frequent NUM types: ⲟⲩⲁ, ⲥⲛⲁⲩ, ϣⲉ, ϣⲟⲙⲛⲧ, ⲙⲛⲧⲥⲛⲟⲟⲩⲥ, ⲙⲏⲧ, ⲥⲁϣϥ, ⲧⲃⲁ, ⲟⲩⲉⲓ, ⲥⲛⲧⲉ

The 10 most frequent ambiguous lemmas: ⲥⲛⲁⲩ (NUM 30, NOUN 4), ϣⲉ (NUM 20, NOUN 6, VERB 2, ADP 1), ⲙⲛⲧⲥⲛⲟⲟⲩⲥ (NUM 13, NOUN 1), ⲥⲁϣϥ (NUM 11, NOUN 1), ⲥⲉ (NUM 6, PART 3), ⲟⲩⲉⲓ (NUM 2, NOUN 1), ⲛ (ADP 3926, ADV 134, PART 7, DET 1, NUM 1), ⲟⲩⲱⲧ (NOUN 33, ADJ 1, NUM 1), ⲥⲛⲧⲉ (NOUN 5, NUM 1)

The 10 most frequent ambiguous types: ⲥⲛⲁⲩ (NUM 24, NOUN 4), ϣⲉ (NUM 20, NOUN 6, VERB 2, ADP 1), ⲙⲛⲧⲥⲛⲟⲟⲩⲥ (NUM 13, NOUN 1), ⲥⲁϣϥ (NUM 9, NOUN 1), ⲟⲩⲉⲓ (NUM 8, NOUN 1), ⲥⲛⲧⲉ (NUM 7, NOUN 5), ⲥⲉ (PRON 160, NUM 6, PART 3), ⲙⲛⲧⲏ (NUM 2, VERB 2), ⲙⲏⲧⲉ (NOUN 17, NUM 1), ⲛ (ADP 2312, DET 672, PRON 371, AUX 345, ADV 123, VERB 6, PART 4, NUM 1, X 1)

ⲥⲛⲁⲩ
- NUM 24: ⲁ ϥ ϯ ⲡⲉϥ ⲟⲩⲟⲓ ⲁ ϥ ⲑⲩⲥⲓⲁⲍⲉ ⲙⲛ ⲡⲉϥ ⲕⲉ ϣⲃⲏⲣ ⲥⲛⲁⲩ : —
- NOUN 4: ⲡⲉ ⲥⲛⲁⲩ ⲙⲉⲛ ⲁ ⲩ ϯ ⲛⲁ ⲩ ⲛ ⲟⲩ ⲛⲟϭ ⲛ ⲧⲁⲝⲓⲥ · ϩⲙ ⲡ ⲡⲁⲗⲗⲁϯⲟⲛ ⲛ ⲛ ⲣⲣⲱⲩ ·
ϣⲉ
- NUM 20: ⲁⲩⲱ ⲁ ⲩ ⲛⲟϫ ⲟⲩ ⲉ ⲩ ⲟ ⲛ ⲁⲩⲏⲧ ⲁⲩⲏⲧ ϣⲉ ϣⲉ ⲁⲩⲱ ⲧⲁⲉⲓⲟⲩ ⲧⲁⲉⲓⲟⲩ .
- NOUN 6: ⲏ ϫⲉ ⲁ ⲩ ⲁϣⲧ ϥ ⲉ ⲡ ϣⲉ · ⲉ ⲧⲣⲉ ϥ ⲥⲉⲕ ⲟⲩⲟⲛ ⲛⲓⲙ ϣⲁⲣⲟ ϥ · ⲏ ⲉ ϯⲱⲛϩ ⲛⲁ ⲩ ·
- VERB 2: ⲛⲧⲉⲣⲉ ⲛⲁⲩ ⲇⲉ ϣⲉ . ⲛⲉϥ ⲙⲁⲑⲏⲧⲏⲥ ⲁ ⲩ ϯ ⲡⲉⲩ ⲟⲩⲟⲉⲓ ⲉⲣⲟ ϥ ⲉ ⲩ ϫⲱ ⲙⲙⲟ ⲥ ⲛⲁ ϥ ϫⲉ ⲡ ⲙⲁ ⲟⲩ ϫⲁⲓⲉ ⲡⲉ . ⲁⲩⲱ ⲏⲇⲏ ⲁ ⲛⲁⲩ ϣⲉ .
- ADP 1: ϣⲉ ⲡ ⲟⲩϫⲁⲓ ⲙ ⲡⲁ ⲕⲣⲁⲧⲟⲥ · ⲙⲛ ⲡ ⲟⲩϫⲁⲓ ⲙ ⲡⲉ ⲥϣϥⲉ ⲛ ⲛⲟⲩⲧⲉ ⲙⲛ ⲡ ⲛⲟϭ ⲛ ⲛⲟⲩⲧⲉ ⲡ ⲁⲡⲟⲗⲗⲱⲛ · ϯ ⲛⲁ ⲧⲣⲉ ⲡ ⲕⲟⲥⲙⲟⲥ ⲟⲩⲱϣⲧ ⲛ ⲛⲁ ⲛⲟⲩⲧⲉ ·
ⲙⲛⲧⲥⲛⲟⲟⲩⲥ
- NUM 13: ⲁⲩⲱ ⲟⲩ ⲥϩⲓⲙⲉ ⲉⲣⲉ ⲡⲉ ⲥⲛⲟϥ ϣⲟⲩⲟ ⲙⲙⲟ ⲥ ⲉⲓⲥ ⲙⲛⲧⲥⲛⲟⲟⲩⲥ ⲛ ⲣⲟⲙⲡⲉ .
- NOUN 1: ⲛⲧⲉⲣⲉ ϥ ⲕⲁ ⲡ ⲙⲏⲏϣⲉ ⲇⲉ ⲁ ⲩ ϫⲛⲟⲩ ϥ ⲛϭⲓ ⲛ ⲉⲧ ⲛⲙⲙⲁ ϥ ⲛⲙ ⲡ ⲙⲛⲧⲥⲛⲟⲟⲩⲥ ⲉ ⲛ ⲡⲁⲣⲁⲃⲟⲗⲏ
ⲥⲁϣϥ
- NUM 9: ϣⲁ ϥ ⲣ ϣⲙⲛⲧϣⲉⲥⲉⲧⲏ ⲛ ⲥⲟⲡ ⲛ ϣⲗⲏⲗ ⲙ ⲡⲉ ϩⲟⲟⲩ · ⲁⲩⲱ ⲥⲁϣϥ ⲛ ϣⲉ ⲙⲁⲁⲃ ⲛ ⲧⲉ ⲩϣⲏ ·
- NOUN 1: ⲁ ϥ ϫⲛⲟⲩ ⲟⲩ ϫⲉ ⲟⲩⲛⲧⲏ ⲧⲛ ⲟⲩⲏⲣ ⲙⲙⲁⲩ ⲛ ⲟⲉⲓⲕ . ⲛⲧⲟⲟⲩ ⲇⲉ ⲡⲉϫⲁ ⲩ ϫⲉ ⲥⲁϣϥ .
ⲟⲩⲉⲓ
- NUM 8: ⲉ ⲧⲣⲉ ⲩ ⲉⲓⲣⲉ ⲛ ⲧ ⲟⲩⲉⲓ ⲧ ⲟⲩⲉⲓ ⲙⲙⲱ ⲧⲛ ⲕⲁⲧⲁ ⲡⲉⲥ ⲙⲡϣⲁ ·
- NOUN 1: ⲡ ϩⲗⲗⲟ ⲇⲉ ϩⲛ ⲟⲩ ϭⲉⲡⲏ ⲁ ϥ ⲕⲧⲟ ⲉⲣⲟ ϥ ⲛ ⲧ ⲕⲉ ⲟⲩⲉⲓ ·
ⲥⲛⲧⲉ
- NUM 7: ⲁⲗⲗⲁ ⲉⲣⲉ ⲛⲉⲩ ⲥⲁⲛⲇⲁⲗⲓⲟⲛ ⲟⲧϩ ⲉⲣⲁⲧ ⲟⲩ . ⲟⲩⲇⲉ ⲛ ⲥⲉ ⲧⲙ ϯ ϣⲧⲏⲛ ⲥⲛⲧⲉ ϩⲓⲱ ⲟⲩ
- NOUN 5: ⲟⲩ ϣⲱⲥ ⲛ ⲣⲉϥⲙⲟⲟⲛⲉ ⲕⲁⲗⲱⲥ ⲡⲉ ⲉ ϥ ⲫⲟⲣⲉⲓ ⲛ ⲧ ⲥⲛⲧⲉ ⲛ ⲁⲣⲉⲧⲏ · ⲧ ⲡⲁⲣⲑⲉⲛⲓⲁ · ⲁⲩⲱ ⲡ ⲅⲁⲙⲟⲥ ⲛ ⲥⲉⲙⲛⲟⲛ ·
ⲥⲉ
- PRON 160: ⲁⲗⲗⲁ ⲉⲣⲉ ⲛⲉⲩ ⲥⲁⲛⲇⲁⲗⲓⲟⲛ ⲟⲧϩ ⲉⲣⲁⲧ ⲟⲩ . ⲟⲩⲇⲉ ⲛ ⲥⲉ ⲧⲙ ϯ ϣⲧⲏⲛ ⲥⲛⲧⲉ ϩⲓⲱ ⲟⲩ
- NUM 6: ⲁⲛⲟⲕ ⲅⲁⲣ ϯ ϩⲛ ⲥⲉ ⲝ ⲛ ⲣⲟⲙⲡⲉ ⲙ ⲡ ϩⲟⲟⲩ ·
- PART 3: ⲛⲧⲟϥ ⲇⲉ ⲡⲉϫⲁ ϥ ϫⲉ ⲥⲉ
ⲙⲛⲧⲏ
- NUM 2: ⲙⲡ ϥ ⲛⲕⲟⲧⲕ ⲅⲁⲣ ⲉ ϭⲗⲟϭ ϫⲓⲛ ⲉ ϥ ϩⲛ ⲙⲛⲧⲏ ⲛ ⲣⲟⲙⲡⲉ ·
- VERB 2: ⲡⲗⲏⲛ ϣⲁⲣⲉ ϩⲁϩ ⲛ ⲣⲉϥⲧⲱϩ ϫⲟⲟ ⲥ ϫⲉ ⲙⲏ ⲙⲛⲧⲏ ⲡⲁⲓ ⲧⲉϥ ⲥϩⲓⲙⲉ ⲙⲙⲁⲩ · ⲉ ϥ ϫⲱ ⲛ ⲛⲉⲓ ϣⲁϫⲉ ⲛ ϯ ϩⲉ ·
ⲙⲏⲧⲉ
- NOUN 17: ⲁⲩⲱ ϯ ϫⲟⲟⲩ ⲙⲙⲱ ⲧⲛ ⲛ ⲧ ϩⲉ ⲛ ϩⲉⲛ ⲉⲥⲟⲟⲩ ⲛ ⲧ ⲙⲏⲧⲉ ⲛ ϩⲉⲛ ⲟⲩⲱⲛϣ :
- NUM 1: ⲁⲩⲱ ⲁ ⲩ ϫⲓ ⲛⲁ ⲩ ⲛ ϩⲉⲛ ϩⲓⲟⲙⲉ ⲉⲃⲟⲗ ϩⲙ ⲡ ⲕⲁϩ ⲙ ⲙⲱⲁⲃ ⲉ ⲡ ⲣⲁⲛ ⲛ ⲧ ⲟⲩⲓ ⲙⲙⲟ ⲟⲩ ⲡⲉ ⲟⲣⲫⲁ ⲁⲩⲱ ⲡ ⲣⲁⲛ ⲛ ⲧ ⲙⲉϩⲥⲛⲧⲉ ⲧⲉ ϩⲣⲟⲩⲑ ⲁ ⲩ ⲟⲩⲱϩ ϩⲙ ⲡ ⲙⲁ ⲉⲧ ⲙⲙⲁⲩ ⲛⲁ ⲙⲏⲧⲉ ⲛ ⲣⲟⲙⲡⲉ
ⲛ
- ADP 2312: ⲉ ⲩ ⲧⲛⲧⲱⲛ ⲉ ϩⲉⲛ ϩⲏⲃⲥ ⲉ ⲁ ⲩ ϫⲉⲣⲱ ⲟⲩ ϩⲛ ϩⲉⲛ ⲙⲁ ⲛ ⲕⲁⲕⲉ ·
- DET 672: ⲁⲩⲱ ⲛ ⲁⲧϩⲏⲧ ⲉⲧ ⲣϩⲟⲩⲟ ⲉⲙⲁⲧⲉ ϩⲛ ϩⲉⲛ ⲙⲛⲧⲥⲟϭ · ⲉ ⲩ ⲧⲛⲧⲱⲛ ⲉ ϩⲉⲛ ⲛⲩⲕⲧⲉⲣⲓⲥ ·
- PRON 371: ⲁⲗⲗⲁ ⲉϥⲉ ϣⲱⲡⲉ ⲛⲁ ⲛ ⲛ ⲟⲩ ϫⲁϫⲉ ⲉⲧⲃⲉ ⲡ ⲛⲟⲩⲧⲉ ⲉ ⲡⲉⲛ ⲥⲟⲛ ⲡⲉ
- AUX 345: ⲁⲗⲗⲁ ⲉⲣⲉ ⲛⲉⲩ ⲥⲁⲛⲇⲁⲗⲓⲟⲛ ⲟⲧϩ ⲉⲣⲁⲧ ⲟⲩ . ⲟⲩⲇⲉ ⲛ ⲥⲉ ⲧⲙ ϯ ϣⲧⲏⲛ ⲥⲛⲧⲉ ϩⲓⲱ ⲟⲩ
- ADV 123: ⲛ ⲧⲉⲧⲛ ϩⲁⲣⲉϩ ⲅⲁⲣ ⲁⲛ .
- VERB 6: ⲉⲣϣⲁⲛ ⲡ ⲕⲁⲣⲡⲟⲥ ⲇⲉ ⲡⲱϩ ⲛ ⲧⲉ ⲩⲛⲟⲩ ϣⲁ ϥ ⲛ ⲡ ⲟϩⲥ ϫⲉ ⲁ ⲡ ⲧⲏ ⲙ ⲡ ⲱϩⲥ ϣⲱⲡⲉ
- PART 4: ϩⲱⲥⲧⲉ · ϣⲉ ϫⲟⲩⲱⲧ ⲛ ⲕⲉⲛⲧⲏⲛⲁⲣⲓⲟⲛ ⲛ ⲛⲟⲩⲃ ⲛ ⲥⲉ ⲧⲁⲁ ⲩ ⲛ ⲭⲁⲣⲓⲥⲙⲁ ⲙ ⲡ ⲁⲡⲟⲗⲗⲱⲛ ·
- NUM 1: ⲁⲩⲱ ⲧⲉ ⲥϩⲓⲙⲉ ⲉ ⲧⲉⲧⲛ ⲛⲁⲩ ⲉⲣⲟ ⲥ ⲧⲁϣ ⲛ ⲟⲩⲁ ⲧⲉ ·
- X 1: ⲁⲩⲱ ⲁ ⲥ ϣⲱⲡⲉ ⲉⲣⲉ ⲡ ⲣⲏ ⲛⲁ ϣⲁ ⲡ ⲛⲟⲩⲧⲉ ⲁ ϥ ⲟⲩⲉϩⲥⲁϩⲛⲉ ⲛ ⲟⲩ ⲧⲏⲩ ⲉ ϥ ⲣⲟⲕϩ ⲁⲩⲱ ⲛ .. ⲣⲟⲟⲃ ⲁⲩⲱ ⲁ ⲡ ⲣⲏ ϩⲓⲟⲩⲉ ⲉ ⲧ ⲁⲡⲉ ⲛ ⲓⲱⲛⲁ ⲁ ϥ ϣⲱⲥⲙ ⲛ ϩⲏⲧ ⲁⲩⲱ ⲁ ϥ ⲕⲁ ⲧⲟⲟⲧ ϥ ⲉⲃⲟⲗ ⲡⲉϫⲁ ϥ ϫⲉ ⲛⲁⲛⲟⲩ ⲥ ⲛⲁ ⲓ ⲉ ⲙⲟⲩ ⲉϩⲟⲩⲉ ⲱⲛϩ :

Morphology

The form / lemma ratio of NUM is 1.120000 (the average of all parts of speech is 1.141945).

The 1st highest number of forms (4) was observed with the lemma “ⲟⲩⲁ”: ⲟⲩⲁ, ⲟⲩⲉⲓ, ⲟⲩⲓ, ⲩⲁ.

The 2nd highest number of forms (3) was observed with the lemma “ⲥⲁϣϥ”: ⲥϣϥⲉ, ⲥⲁϣϥ, ⲥⲁϣϥⲉ.

The 3rd highest number of forms (2) was observed with the lemma “ϥⲧⲟⲟⲩ”: ϥⲧⲟⲟⲩ, ϥⲧⲟⲩ.

NUM occurs with 2 features: NumType (318; 100% instances), Foreign (2; 1% instances)

NUM occurs with 2 feature-value pairs: Foreign=Yes, NumType=Card

NUM occurs with 2 feature combinations. The most frequent feature combination is NumType=Card (316 tokens). Examples: ⲟⲩⲁ, ⲥⲛⲁⲩ, ϣⲉ, ϣⲟⲙⲛⲧ, ⲙⲛⲧⲥⲛⲟⲟⲩⲥ, ⲙⲏⲧ, ⲥⲁϣϥ, ⲧⲃⲁ, ⲟⲩⲉⲓ, ⲥⲛⲧⲉ

Relations

NUM nodes are attached to their parents using 18 different relations: nummod (129; 41% instances), nsubj (31; 10% instances), obl (29; 9% instances), nmod:unmarked (23; 7% instances), conj (22; 7% instances), compound (18; 6% instances), obj (18; 6% instances), dislocated (16; 5% instances), nmod (14; 4% instances), acl:relcl (4; 1% instances), ccomp (4; 1% instances), root (3; 1% instances), parataxis (2; 1% instances), iobj (1; 0% instances), obl:unmarked (1; 0% instances), orphan (1; 0% instances), reparandum (1; 0% instances), xcomp (1; 0% instances)

Parents of NUM nodes belong to 7 different parts of speech: NOUN (147; 46% instances), VERB (99; 31% instances), NUM (63; 20% instances), PRON (4; 1% instances), (3; 1% instances), DET (1; 0% instances), PROPN (1; 0% instances)

150 (47%) NUM nodes are leaves.

57 (18%) NUM nodes have one child.

66 (21%) NUM nodes have two children.

45 (14%) NUM nodes have three or more children.

The highest child degree of a NUM node is 6.

Children of NUM nodes are attached using 21 different relations: det (91; 26% instances), case (81; 23% instances), nmod (38; 11% instances), nmod:unmarked (24; 7% instances), compound (20; 6% instances), acl:relcl (17; 5% instances), conj (16; 5% instances), punct (15; 4% instances), cc (14; 4% instances), cop (8; 2% instances), mark (7; 2% instances), nummod (4; 1% instances), advmod (3; 1% instances), nsubj (3; 1% instances), orphan (3; 1% instances), csubj (2; 1% instances), aux (1; 0% instances), nmod:poss (1; 0% instances), obl (1; 0% instances), parataxis (1; 0% instances), reparandum (1; 0% instances)

Children of NUM nodes belong to 13 different parts of speech: DET (96; 27% instances), ADP (76; 22% instances), NUM (63; 18% instances), NOUN (26; 7% instances), PRON (23; 7% instances), VERB (19; 5% instances), PUNCT (15; 4% instances), CCONJ (11; 3% instances), PART (9; 3% instances), SCONJ (8; 2% instances), PROPN (3; 1% instances), ADV (1; 0% instances), AUX (1; 0% instances)

Treebank Statistics: UD_Coptic-Scriptorium: POS Tags: NUM

Morphology

Relations

Treebank Statistics: UD_Coptic-Scriptorium: POS Tags: `NUM`