Statistics of X in UD

home edit page issue tracker

This page pertains to UD version 2.

It appears that you have Javascript disabled. Please consider enabling Javascript for this page to see the visualizations.

Treebank Statistics: UD_Finnish-FTB: POS Tags: `X`

There are 271 X lemmas (1%), 278 X types (1%) and 313 X tokens (0%). Out of 17 observed tags, the rank of X is: 8 in number of lemmas, 11 in number of types and 16 in number of tokens.

The 10 most frequent X lemmas: _, 70-, in, sosiaali-, the, ala-, kauppa-, keng-, maa-, 50-

The 10 most frequent X types: 70-, in, sosiaali-, the, Kauppa-, ala-, keng-, maa-, 50-, Lilla

The 10 most frequent ambiguous lemmas: the (X 4, PROPN 1), out (NOUN 2, X 2), home (NOUN 3, X 1), is (PROPN 2, X 1), made (NOUN 1, X 1), me (DET 1, X 1), new (PROPN 8, X 1), partners (PROPN 1, X 1), queen (PROPN 1, X 1), ride (PROPN 1, X 1)

The 10 most frequent ambiguous types: out (NOUN 1, X 1), New (PROPN 8, X 1), Ride (PROPN 1, X 1), hyvä (ADJ 128, X 1), kumpi (PRON 3, DET 1, X 1), m- (PRON 1, X 1), me (PRON 123, VERB 1, X 1), sana (NOUN 11, X 1), se- (PRON 1, X 1), termi (NOUN 2, X 1)

out
- NOUN 1: Aini toivoi , että työterveysasema olisi koonnut burn out -ryhmän , missä olisi voinut jakaa kokemuksia toisten kansa .
- X 1: Kuten tunnettua yleensä vasta Microsoft pystyy muuttamaan seuraavan lauseen imperfektiin : the cash is out there .
New
- PROPN 8: Lontoo on Tokion ja New Yorkin aikavyöhykkeiden välissä .
- X 1: Nykyisin hän lentää aina muutaman viikon väliajoin Bostonista Tokioon kahdeksi viikoksi johtamaan nuorta New Japan Philharmonic Orchestraa ja lisäksi johtaa aika ajoin Euroopassa .
Ride
- PROPN 1: Hiukan eilistä lämpimämmällä säällä vauhtihirmu olisi varmasti hätyytellyt Ride The Nightin nimissä olevaa SE:tä 14,4 .
- X 1: Express Ride vain mennä hutkutteli loppumatkan .
hyvä
- ADJ 128: maultaan varsin hyvä viini
- X 1: ” Se on ihan sika hyvä , ja hauska ! “
kumpi
- PRON 3: Kuudennella aistillako hän päättelee , kumpi on parempi : .
- DET 1: kumpi teistä teki tämän ?
- X 1: Jos jompi kumpi parlamenteista ei ratifioi sopimusta , asian käsittely siirtyy Haagin kansainväliselle tuomioistuimelle .
m-
- PRON 1: Toi ihmettelee välillä että m- nukun selkä häneem päin
- X 1: siin poika sit meinas , m- pudotti hattunsa päästä ja … katso taakse siinä niinku … kaatu … ajoi siin semmoseen … suureen kiveen ja kaatu pyörällääm siinä ja …
me
- PRON 123: no sit yks toinen kaveri lähti armeijaan ja me oltiin sovittu .
- VERB 1: se oli pannus semmosia ehtoja ett ei semmosiin ehtoin kukaam me
- X 1: Why did you do this to me !? Colin valitti itkuisen humalaisella äänellä .
sana
- NOUN 11: Se on sana , jota käytetään enää harvoin kirkossakaan .
- X 1: Niin tää feminismi sana tuli tuli semmoseen aikaan kun kun taas esimes Usassa oli tää radikaali feminismiliike ja se niinku miellettiin tämmösenä hyvin radik- radikaalina radikaalina käsitteenä .
se-
- PRON 1: Onko se- ku se täällä Pieksämäellä on ni onko se sit ihan täällä kokonaan ett ei se tuu yökskään kottiin ,
- X 1: ko se on se- semmonen ujo ollu
termi
- NOUN 2: PC-kortti on selvästi parempi termi kuin PCMCIA .
- X 1: Muuten asialliseen kiuasartikkeliinne oli tullut ikävä , joskin yleinen asia- ( termi ) virhe .

Morphology

The form / lemma ratio of X is 1.025830 (the average of all parts of speech is 2.049638).

The 1st highest number of forms (9) was observed with the lemma “_”: hyvä, ihogeeli, kumpi, sana, skertso, tyyppistä, vastoin, veellä, yhdistelmä.

The 2nd highest number of forms (1) was observed with the lemma “10-”: 10-.

The 3rd highest number of forms (1) was observed with the lemma “100-”: 100-.

X occurs with 1 features: Foreign (129; 41% instances)

X occurs with 1 feature-value pairs: Foreign=Yes

X occurs with 2 feature combinations. The most frequent feature combination is _ (184 tokens). Examples: 70-, sosiaali-, Kauppa-, ala-, keng-, maa-, 50-, Vesi-, e-, kieli-

Relations

X nodes are attached to their parents using 24 different relations: nmod (44; 14% instances), amod (37; 12% instances), conj (35; 11% instances), root (33; 11% instances), dep (31; 10% instances), nsubj (29; 9% instances), obl (23; 7% instances), obj (17; 5% instances), reparandum (17; 5% instances), flat (9; 3% instances), goeswith (9; 3% instances), compound:nn (5; 2% instances), nsubj:cop (5; 2% instances), ccomp (4; 1% instances), advcl (3; 1% instances), case (2; 1% instances), obl:agent (2; 1% instances), xcomp (2; 1% instances), acl (1; 0% instances), cc (1; 0% instances), compound:prt (1; 0% instances), csubj:cop (1; 0% instances), nmod:gobj (1; 0% instances), vocative (1; 0% instances)

Parents of X nodes belong to 10 different parts of speech: VERB (85; 27% instances), X (83; 27% instances), NOUN (80; 26% instances), (33; 11% instances), PROPN (17; 5% instances), ADJ (9; 3% instances), PRON (3; 1% instances), ADV (1; 0% instances), DET (1; 0% instances), SCONJ (1; 0% instances)

114 (36%) X nodes are leaves.

148 (47%) X nodes have one child.

18 (6%) X nodes have two children.

33 (11%) X nodes have three or more children.

The highest child degree of a X node is 7.

Children of X nodes are attached using 21 different relations: conj (144; 46% instances), punct (52; 17% instances), amod (27; 9% instances), nmod (19; 6% instances), dep (14; 5% instances), flat (8; 3% instances), cop (7; 2% instances), acl (6; 2% instances), nsubj:cop (6; 2% instances), advmod (5; 2% instances), cc (5; 2% instances), nsubj (5; 2% instances), case (3; 1% instances), aux (2; 1% instances), vocative (2; 1% instances), compound:nn (1; 0% instances), compound:prt (1; 0% instances), csubj:cop (1; 0% instances), det (1; 0% instances), mark (1; 0% instances), obj (1; 0% instances)

Children of X nodes belong to 13 different parts of speech: NOUN (104; 33% instances), X (83; 27% instances), PUNCT (52; 17% instances), ADJ (18; 6% instances), VERB (14; 5% instances), PROPN (13; 4% instances), AUX (9; 3% instances), ADV (6; 2% instances), PRON (5; 2% instances), CCONJ (4; 1% instances), ADP (1; 0% instances), DET (1; 0% instances), SCONJ (1; 0% instances)

Treebank Statistics: UD_Finnish-FTB: POS Tags: X

Morphology

Relations

Treebank Statistics: UD_Finnish-FTB: POS Tags: `X`