Treebank Statistics: UD_Alemannic-DIVITAL: POS Tags: X
There are 1 X lemmas (6%), 42 X types (1%) and 46 X tokens (0%).
Out of 17 observed tags, the rank of X is: 17 in number of lemmas, 12 in number of types and 16 in number of tokens.
The 10 most frequent X lemmas: _
The 10 most frequent X types: ta, bon, n, Alsace, BA, BE, BI, BO, BU, Little
The 10 most frequent ambiguous lemmas: _ (PUNCT 3196, NOUN 2914, DET 2712, VERB 1796, ADP 1640, PRON 1458, ADV 1365, AUX 1350, ADJ 1096, CCONJ 729, PROPN 413, PART 313, SCONJ 313, NUM 222, INTJ 169, X 46, SYM 11)
The 10 most frequent ambiguous types: Alsace (PROPN 6, X 1), Texas (PROPN 1, X 1), a (DET 14, ADP 6, ADV 1, X 1), ar (PRON 5, DET 1, X 1), ari (ADV 1, X 1), di (PRON 4, DET 2, X 1), en (ADP 5, DET 2, X 1), er (PRON 56, X 1)
- Alsace
- Texas
- a
- DET 14: Nee , dann morje hann m’r viellicht widder a Runzel meh uff d’r Stirn .
- ADP 6: Sider a m 1 . Janer 2009 heissa dia Universitäda neï L’ Université de Strasbourg .
- ADV 1: Un no hàn mer so die Köjle ghet , hàn mer se àls uf Dreieck gsetzt , sin àls so veer , fenef wie mit hàn gspielt , no hàn mer e Dreieck gemolt mit ere Kried uf d’ Stroos , un uf des Dreieck , do sin hiwe un diwe esch eins gsetzt wore , un owe uf ‘s Eck , un no hiwe un diwe , wàs dezwische gewaan esch , do sin a noch dezwische , un no het mer gewessi Màsse Streck genumme , ich wod sàje , ebene fenef , sechs Meter devon esch mer gebliewe , un no het mer so Köjle g’het , so üs Stein gedrajt , oder Holzköjle , oder Bliiköjle , un no het mer geworfe , het mer de Ding gezeilt , uf die Springkejele , un der wie se no getroffe het , der het no àls widdersch derffe spiele , bis dàs er kenni meh getroffe het , un no esch de Nachscht dràn kumme , un no esch ‘s àls noch de Reje gànge , un die het mer ö gepàlte .
- X 1: mìt em dunkla a , wo sìch fàscht wia ì m Frànzeescha en àheert .
- ar
- PRON 5: Mr het gsahn , wie ar äu sìch Mìehj gann het .
- DET 1: Ma müas noch d’r züasätza dàss da Vogel vor 100 Johr üssgrotta worra-n- esch dur dàs àss ar , no gwessana Sààga , durgandig d’r Mänsch àgreffa hàtt .
- X 1: Armorica ésch de Latinisation vun däm Wort - « ari » kummt vu m Indoeuropeisch « pri » vor , bi ( Àltirisch : « air , ar » : vor , Wallisisch « er » : f’r ) , « mori » = Meer ( Irisch « muir » , Genitiv « mara » , Wallisisch un Breton : « mor » ) .
- ari
- ADV 1: Jaja , dann as het d’r Chrischtian ari gare .
- X 1: Armorica ésch de Latinisation vun däm Wort - « ari » kummt vu m Indoeuropeisch « pri » vor , bi ( Àltirisch : « air , ar » : vor , Wallisisch « er » : f’r ) , « mori » = Meer ( Irisch « muir » , Genitiv « mara » , Wallisisch un Breton : « mor » ) .
- di
- en
- er
- PRON 56: Noh het er e Gràmmàtikbuech rüssgholt ùn het ùns ùnsri Lehr vorgelase .
- X 1: Armorica ésch de Latinisation vun däm Wort - « ari » kummt vu m Indoeuropeisch « pri » vor , bi ( Àltirisch : « air , ar » : vor , Wallisisch « er » : f’r ) , « mori » = Meer ( Irisch « muir » , Genitiv « mara » , Wallisisch un Breton : « mor » ) .
Morphology
The form / lemma ratio of X is 42.000000 (the average of all parts of speech is 312.588235).
The 1st highest number of forms (42) was observed with the lemma “_”: Alsace, BA, BE, BI, BO, BU, Little, Pace, Texas, The, a, air, anada, ani, ar, ari, berri, bloavezh, bon, bonna, di, en, er, f’r, lanné, mara, mat, mor, mori, muir, n, n’, nou, of, on, pri, salute, ta, urte, è, ʃp, ʃt.
X occurs with 1 features: Foreign (32; 70% instances)
X occurs with 1 feature-value pairs: Foreign=Yes
X occurs with 2 feature combinations.
The most frequent feature combination is Foreign=Yes (32 tokens).
Examples: bon, Alsace, BA, BE, BI, BO, BU, Little, Pace, Texas
Relations
X nodes are attached to their parents using 8 different relations: flat (17; 37% instances), conj (11; 24% instances), appos (10; 22% instances), goeswith (3; 7% instances), obl (2; 4% instances), nsubj (1; 2% instances), obj (1; 2% instances), root (1; 2% instances)
Parents of X nodes belong to 7 different parts of speech: X (22; 48% instances), NOUN (12; 26% instances), VERB (5; 11% instances), PROPN (3; 7% instances), ADV (2; 4% instances), (1; 2% instances), SCONJ (1; 2% instances)
21 (46%) X nodes are leaves.
3 (7%) X nodes have one child.
5 (11%) X nodes have two children.
17 (37%) X nodes have three or more children.
The highest child degree of a X node is 6.
Children of X nodes are attached using 10 different relations: punct (39; 46% instances), flat (17; 20% instances), appos (12; 14% instances), conj (5; 6% instances), case (4; 5% instances), det (3; 4% instances), amod (2; 2% instances), acl:relcl (1; 1% instances), advmod (1; 1% instances), cc (1; 1% instances)
Children of X nodes belong to 9 different parts of speech: PUNCT (39; 46% instances), X (22; 26% instances), NOUN (9; 11% instances), ADP (7; 8% instances), DET (3; 4% instances), ADJ (2; 2% instances), ADV (1; 1% instances), CCONJ (1; 1% instances), VERB (1; 1% instances)