Statistics of X in UD_Lithuanian-ALKSNIS

home edit page issue tracker

This page pertains to UD version 2.

It appears that you have Javascript disabled. Please consider enabling Javascript for this page to see the visualizations.

Treebank Statistics: UD_Lithuanian-ALKSNIS: POS Tags: `X`

There are 307 X lemmas (3%), 341 X types (2%) and 1571 X tokens (2%). Out of 17 observed tags, the rank of X is: 7 in number of lemmas, 7 in number of types and 12 in number of tokens.

The 10 most frequent X lemmas: pat, ES, d., proc., nr., kuris, tikras, nors, p., to

The 10 most frequent X types: pat, ES, d, proc, Nr, nors, a, p, to, tūkst

The 10 most frequent ambiguous lemmas: pat (X 105, ADV 1), kuris (DET 382, X 50), tikras (X 38, ADJ 20), nors (SCONJ 45, X 37, PART 1), pats (DET 84, X 27), kas (PRON 159, X 20, PART 5), tai (PART 44, X 16, CCONJ 7, ADV 1, PRON 1), tiek (ADV 56, X 16), pirma (ADV 11, X 11), t. (ADV 16, X 8)

The 10 most frequent ambiguous types: pat (X 105, ADV 1), nors (X 37, SCONJ 26, PART 1), to (DET 62, X 35), V (X 19, NUM 3), kas (PRON 62, X 18, PART 5), kurie (DET 61, X 17), tai (DET 156, PART 42, X 17, CCONJ 7, ADV 1, PRON 1), tiek (ADV 53, X 16), esmės (X 15, NOUN 4), pirma (X 11, NUM 1)

pat
- X 105: Vidutinė registracijos procedūros trukmė taip pat sutrumpėjo 50 % .
- ADV 1: Straipsnyje aptariama Mindaugo Urbaičio muzika filmams , taip pat jos sąsajos su kompozitoriaus kitų žanrų muzika .
nors
- X 37: Arba kas nors rimčiau – pavyzdžiui , televizijos laidų vedėjas .
- SCONJ 26: Kremliuje jam ir vieta , nors kai kas gal mano , jog kurioj nors „ Maximoj “ .
- PART 1: Tad antroji hipotezė vis dėlto , nors ir netiesiogiai , – pasitvirtina .
to
- DET 62: Viso to galima išvengti nusprendus dirbti namuose .
- X 35: Be to , dirbančiųjų namuose tyrimų rezultatai yra nevienareikšmiai .
V
- X 19: Prezidentūra aiškina , kad V . Adamkus siūlė ne tai .
- NUM 3: V . APIE IDEALĄ IR TĖVYNĖS MEILĘ .
kas
- PRON 62: Labai čia kas jo prašė kištis !
- X 18: Pabrėšiu , kad kol kas mes tikrai nenorime eiti į TVF .
- PART 5: Chirurgas atgalia ranka braukia nuo kaktos prakaitą , seselė kas kiek laiko nuvalo jo akinius .
kurie
- DET 61: „ Suprantu tų įstaigų vadovus , kurie dėkoja iš anksto .
- X 17: Dėl neįgudimo kai kurie žmonės painioja .
tai
- DET 156: Prezidentūra aiškina , kad V . Adamkus siūlė ne tai .
- PART 42: Darbas namuose – tai ne karjera tradicine šio žodžio prasme .
- X 17: Visa tai sukelia tik milžinišką įtampą ir savotiškas varžybas .
- CCONJ 7: Jei ji tikrai yra stambi , tai pati seniai tą žino , todėl svarbu to neakcentuoti .
- ADV 1: Anot ULPKC specialistų , ši grėsminga liga dažniau nustatoma vyresniame amžiuje , tai yra 55 - 64 ir per 65 metų amžiaus žmonėms .
- PRON 1: Tačiau demografinių charakteristikų nustatymu tyrime neapsiribojama , o siekiama atsakyti į klausimą , „ kokia dalis išvykusiųjų neišnaudoja savo turimos kvalifikacijos ir užsienyje dirba žemesnės kvalifikacijos darbus “ ir kokią tai daro įtaką išvykusiųjų pajamoms , žmogiškajam kapitalui ir galimybėms grįžti ( p . 8 ) .
tiek
- ADV 53: Mes neturime tiek lėšų , mus gali paremti tik valstybė .
- X 16: Atrodo šiek tiek iš mėnulio nukritęs .
esmės
- X 15: Tai konkretu , lokalu ir tai iš esmės guodžia .
- NOUN 4: Tuomet atsiveria vaizduotė , iš esmės - literatūra .
pirma
- X 11: Taip pat reikėtų iš esmės gerinti bendradarbiavimą su trečiosiomis šalimis , visų pirma gerosios patirties mainus su JAV .
- NUM 1: Deja , trinaris modelis turi nemažai trūkumų : pirma , skirtingos grupuotės LKP ir Sąjūdyje tarsi neišvengiamai priskiriamos šiose organizacijose dominuojančiai daugumai , antra , pasakojime neminimi Sąjūdžio ir naujai besikuriančių , kartais su Sąjūdžiu tiesiogiai nieko bendra neturinčių , politinių organizacijų santykiai .

Morphology

The form / lemma ratio of X is 1.110749 (the average of all parts of speech is 2.065341).

The 1st highest number of forms (13) was observed with the lemma “tikras”: tikra, tikrai, tikrais, tikras, tikri, tikro, tikroje, tikromis, tikros, tikru, tikrus, tikrą, tikrų.

The 2nd highest number of forms (12) was observed with the lemma “pats”: pati, patiems, paties, pats, patys, pačia, pačioje, pačiomis, pačios, pačiu, pačius, pačią.

The 3rd highest number of forms (11) was observed with the lemma “kuris”: kuri, kurias, kurie, kurioms, kurios, kuriose, kuriuo, kuriuos, kuriuose, kurią, kurių.

X occurs with 8 features: Abbr (866; 55% instances), Hyph (579; 37% instances), Foreign (130; 8% instances), Case (2; 0% instances), Gender (2; 0% instances), Number (2; 0% instances), Definite (1; 0% instances), Degree (1; 0% instances)

X occurs with 10 feature-value pairs: Abbr=Yes, Case=Gen, Definite=Def, Degree=Pos, Foreign=Yes, Gender=Fem, Gender=Masc, Hyph=Yes, Number=Plur, Number=Sing

X occurs with 7 feature combinations. The most frequent feature combination is Abbr=Yes (864 tokens). Examples: ES, d, proc, Nr, p, a, tūkst, R, mln, pan

Relations

X nodes are attached to their parents using 13 different relations: nmod (1122; 71% instances), conj (130; 8% instances), obl (102; 6% instances), parataxis (43; 3% instances), flat:foreign (31; 2% instances), obl:arg (28; 2% instances), flat (26; 2% instances), nsubj (26; 2% instances), obj (24; 2% instances), root (21; 1% instances), appos (15; 1% instances), nsubj:pass (2; 0% instances), dep (1; 0% instances)

Parents of X nodes belong to 12 different parts of speech: NOUN (439; 28% instances), ADV (245; 16% instances), VERB (182; 12% instances), X (157; 10% instances), PROPN (146; 9% instances), PRON (133; 8% instances), PART (113; 7% instances), NUM (67; 4% instances), DET (55; 4% instances), (21; 1% instances), ADJ (11; 1% instances), INTJ (2; 0% instances)

806 (51%) X nodes are leaves.

292 (19%) X nodes have one child.

190 (12%) X nodes have two children.

283 (18%) X nodes have three or more children.

The highest child degree of a X node is 9.

Children of X nodes are attached using 23 different relations: punct (920; 53% instances), nummod (244; 14% instances), nmod (192; 11% instances), conj (117; 7% instances), cc (70; 4% instances), case (56; 3% instances), flat:foreign (31; 2% instances), obl (16; 1% instances), acl (14; 1% instances), advmod (12; 1% instances), amod (7; 0% instances), appos (6; 0% instances), parataxis (6; 0% instances), det (5; 0% instances), flat (5; 0% instances), mark (4; 0% instances), obl:arg (4; 0% instances), advcl (3; 0% instances), advmod:emph (3; 0% instances), acl:relcl (2; 0% instances), nsubj (2; 0% instances), dep (1; 0% instances), obj (1; 0% instances)

Children of X nodes belong to 15 different parts of speech: PUNCT (920; 53% instances), NUM (279; 16% instances), X (157; 9% instances), NOUN (154; 9% instances), CCONJ (68; 4% instances), ADP (56; 3% instances), VERB (30; 2% instances), ADV (12; 1% instances), PROPN (12; 1% instances), ADJ (11; 1% instances), SCONJ (6; 0% instances), DET (5; 0% instances), SYM (5; 0% instances), PART (3; 0% instances), PRON (3; 0% instances)

Treebank Statistics: UD_Lithuanian-ALKSNIS: POS Tags: X

Morphology

Relations

Treebank Statistics: UD_Lithuanian-ALKSNIS: POS Tags: `X`