AUX
: auxiliary verb
In Kazakh, only a closed list of verbs can act as auxiliaries. These are words
take part in participle constructions. They are tagged AUX
.
The full list of auxiliaries is as follows:
- ал- “do, make”
- баста- “start”
- бер- “”
- біт- “”
- бітір- “”
- бол- “be”
- ет- “”
- жазда- “”
- жат- “”
- жүр- “”
- қал- “”
- кел- “come”
- кет- “”
- көр- “see”
- отыр- “”
- сал- “”
- тұр- “stand”
- шық- “”
Note: Some of these are ambiguous with lexical verbs.
Treebank Statistics (UD_Kazakh)
There are 20 AUX
lemmas (1%), 80 AUX
types (3%) and 324 AUX
tokens (5%).
Out of 16 observed tags, the rank of AUX
is: 10 in number of lemmas, 7 in number of types and 5 in number of tokens.
The 10 most frequent AUX
lemmas: е, ал, жат, кет, баста, қал, кел, жүр, отыр, бер
The 10 most frequent AUX
types: _, бастады, жатыр, екен, кетті, еді, емес, қалды, алды, екенін
The 10 most frequent ambiguous lemmas: е (AUX 174, INTJ 1), ал (VERB 33, AUX 24, CONJ 4, INTJ 1), жат (AUX 19, VERB 3), кет (AUX 18, VERB 8), баста (AUX 15, VERB 11, ADP 1), қал (AUX 14, VERB 6, NOUN 1), кел (VERB 28, AUX 11), жүр (AUX 9, VERB 5), отыр (AUX 9, VERB 2), бер (VERB 26, AUX 8)
The 10 most frequent ambiguous types: _ (AUX 154, PART 76, NOUN 75, ADJ 72, VERB 29, PRON 23, CONJ 13, ADV 7, ADP 7, PROPN 5, NUM 4, PUNCT 1), кетті (AUX 8, VERB 2), емес (AUX 7, PART 2, ADV 1), алды (AUX 4, VERB 2), жатқан (AUX 4, VERB 1), келеді (AUX 4, VERB 3), тұрды (AUX 3, VERB 1), қалады (AUX 3, VERB 2), алдым (AUX 2, VERB 1), берді (VERB 2, AUX 2)
- _
- AUX 154: Иран — діни _ _ .
- PART 76: Қазірде орыстан оқыған балалардан артық жақсы кісі шыға _ _ тұр .
- NOUN 75: Иран — діни _ _ .
- ADJ 72: Жер беті суы _ _ .
- VERB 29: Құлдық пен құл саудасына , қандай түрде _ _ , тыйым салынады .
- PRON 23: Сіздің атыңыз _ _ ?
- CONJ 13: Ол _ _ , _ _ емес .
- ADV 7: — Бәйбіше _ _ ?
- ADP 7: Неке , тек екі жақтың өзара еркін және толық келісімі _ _ қиылады .
- PROPN 5: Баяғыда біреу той жасапты , тойға көп кісі жиналыпты , _ _ келіпті .
- NUM 4: Қала халқы _ _ .
- PUNCT 1: Халқының ұлттық құрамы : парсылар ( 51% ) , әзірбайжандар ( 27% ) , күрдтер ( 5% ) , арабтар , түрікмендер , белуджилер , армяндар , еврейлер , _ _ _
- кетті
- емес
- алды
- жатқан
- келеді
- тұрды
- қалады
- алдым
- берді
Morphology
The form / lemma ratio of AUX
is 4.000000 (the average of all parts of speech is 1.549647).
The 1st highest number of forms (13) was observed with the lemma “ал”: _, ала, алады, алды, алдым, алмады, алмай, алмайды, алмаймын, алмас, алмауда, алып, алғаннан.
The 2nd highest number of forms (8) was observed with the lemma “е”: _, еді, едім, екен, екендіктерін, екенін, емес, еместігіме.
The 3rd highest number of forms (7) was observed with the lemma “кел”: келген__жоқ, келді, келдім, келе, келеді, келмеді, келіп.
AUX
occurs with 11 features: kk-feat/Tense (87; 27% instances), kk-feat/Number (84; 26% instances), kk-feat/Person (84; 26% instances), kk-feat/VerbForm (10; 3% instances), kk-feat/Aspect (6; 2% instances), kk-feat/Polarity (6; 2% instances), kk-feat/Evidentiality (4; 1% instances), kk-feat/Case (2; 1% instances), kk-feat/Mood (1; 0% instances), kk-feat/Number[psor] (1; 0% instances), kk-feat/Person[psor] (1; 0% instances)
AUX
occurs with 21 feature-value pairs: Aspect=Impf
, Aspect=Perf
, Case=Dat
, Case=Loc
, Evidentiality=Fh
, Mood=Imper
, Number=Plur
, Number=Sing
, Number[psor]=Plur,Sing
, Person=1
, Person=2
, Person=3
, Person[psor]=3
, Polarity=Neg
, Tense=Aor
, Tense=Past
, Tense=Prs
, VerbForm=Coverb
, VerbForm=Ger
, VerbForm=Part
, VerbForm=Trans
AUX
occurs with 21 feature combinations.
The most frequent feature combination is _
(229 tokens).
Examples: _, бастады, жатыр, емес, алды, еді, екен, екенін, жүр, алмайды
Relations
AUX
nodes are attached to their parents using 4 different relations: kk-dep/cop (173; 53% instances), kk-dep/aux (149; 46% instances), kk-dep/advcl (1; 0% instances), kk-dep/dobj (1; 0% instances)
Parents of AUX
nodes belong to 7 different parts of speech: VERB (148; 46% instances), ADJ (80; 25% instances), NOUN (64; 20% instances), PRON (17; 5% instances), ADV (10; 3% instances), PROPN (3; 1% instances), NUM (2; 1% instances)
315 (97%) AUX
nodes are leaves.
7 (2%) AUX
nodes have one child.
1 (0%) AUX
nodes have two children.
1 (0%) AUX
nodes have three or more children.
The highest child degree of a AUX
node is 3.
Children of AUX
nodes are attached using 7 different relations: kk-dep/case (3; 25% instances), kk-dep/punct (3; 25% instances), kk-dep/nmod (2; 17% instances), kk-dep/ccomp (1; 8% instances), kk-dep/conj (1; 8% instances), kk-dep/discourse (1; 8% instances), kk-dep/nsubj (1; 8% instances)
Children of AUX
nodes belong to 7 different parts of speech: ADP (3; 25% instances), PUNCT (3; 25% instances), PROPN (2; 17% instances), INTJ (1; 8% instances), NOUN (1; 8% instances), PRON (1; 8% instances), VERB (1; 8% instances)
AUX in other languages: [bg] [cs] [de] [el] [en] [es] [eu] [fa] [fi] [fr] [ga] [he] [hu] [it] [ja] [ko] [sv] [u]