Treebank Statistics: UD_Lithuanian-HSE: POS Tags: CCONJ
There are 17 CCONJ lemmas (1%), 15 CCONJ types (1%) and 311 CCONJ tokens (6%).
Out of 16 observed tags, the rank of CCONJ is: 11 in number of lemmas, 13 in number of types and 7 in number of tokens.
The 10 most frequent CCONJ lemmas: ir, bet, o, ar, bei, arba, nei, ne, tačiau, taigi
The 10 most frequent CCONJ types: ir, bet, o, ar, bei, arba, nei, ne, tačiau, taigi
The 10 most frequent ambiguous lemmas: ir (CCONJ 162, PART 32), ar (CCONJ 15, PART 2), ne (PART 38, CCONJ 5), taigi (CCONJ 4, PART 3), čia (CCONJ 2, ADV 1), kiek (ADV 4, CCONJ 1, PART 1), kuo (ADV 1, CCONJ 1), ne%tik (CCONJ 1, PART 1), taip (PART 10, ADV 6, CCONJ 1), vis%dėlto (CCONJ 1, SCONJ 1)
The 10 most frequent ambiguous types: ir (CCONJ 160, PART 32), ar (CCONJ 15, PART 2), ne (PART 36, CCONJ 6), taigi (CCONJ 4, PART 3), čia (ADV 1, CCONJ 1), kiek (ADV 4, CCONJ 1), kuo (PRON 2, ADV 1, CCONJ 1), taip (PART 7, ADV 5, CCONJ 1)
- ir
- ar
- ne
- taigi
- čia
- kiek
- kuo
- PRON 2: Šiose srityse , deja , dar maža kuo galime didžiuotis .
- ADV 1: Esu skaitęs – tiesa , ne lietuvių spaudoje , - interviu su mergina iš Europos , kuri atsako į klausimą , kuo skiriasi Rytų Europos politinė scena nuo Vakarų politinės scenos .
- CCONJ 1: Tapatinti ją su TSRS yra piktybiška demagogija – šiaip ar taip , kiekvienas lietuvis žino , kuo skiriasi Kolyma nuo Dublino ar Londono .
- taip
- PART 7: Deja , taip nėra – šiandien jie pastebimai aštrėja .
- ADV 5: Autorius aiškiai yra Strepsiado pusėje – taip Sokratui ir reikia .
- CCONJ 1: Tikras lietuvis yra tik tas , kuris nemėgsta , o dar geriau nekenčia rusų , lenkų , žydų , taip pat ir vakariečių , mėgsta nebent palestiniečius ( beje , nesunku įsivaizduoti , ką mūsų patriotai pradėtų sakyti apie palestiniečius , jeigu su jais susidurtų kasdienybėje , kaip susidūrė su čečėnais ) .
Morphology
The form / lemma ratio of CCONJ is 0.882353 (the average of all parts of speech is 1.442977).
The 1st highest number of forms (2) was observed with the lemma “bet%ir”: bet, ir.
The 2nd highest number of forms (1) was observed with the lemma “ar”: ar.
The 3rd highest number of forms (1) was observed with the lemma “arba”: arba.
CCONJ occurs with 2 features: Polarity (8; 3% instances), Degree (1; 0% instances)
CCONJ occurs with 2 feature-value pairs: Degree=Pos, Polarity=Neg
CCONJ occurs with 3 feature combinations.
The most frequent feature combination is _ (302 tokens).
Examples: ir, bet, o, ar, bei, arba, nei, tačiau, taigi, čia
Relations
CCONJ nodes are attached to their parents using 4 different relations: cc (287; 92% instances), fixed (16; 5% instances), advmod (4; 1% instances), case (4; 1% instances)
Parents of CCONJ nodes belong to 10 different parts of speech: NOUN (110; 35% instances), VERB (101; 32% instances), ADJ (46; 15% instances), PROPN (22; 7% instances), ADV (13; 4% instances), SCONJ (10; 3% instances), CCONJ (4; 1% instances), DET (2; 1% instances), PRON (2; 1% instances), PART (1; 0% instances)
293 (94%) CCONJ nodes are leaves.
17 (5%) CCONJ nodes have one child.
1 (0%) CCONJ nodes have two children.
The highest child degree of a CCONJ node is 2.
Children of CCONJ nodes are attached using 2 different relations: fixed (12; 63% instances), punct (7; 37% instances)
Children of CCONJ nodes belong to 4 different parts of speech: PUNCT (7; 37% instances), ADV (5; 26% instances), CCONJ (4; 21% instances), PART (3; 16% instances)