Statistics of PRON in UD_Nheengatu-CompLin

home edit page issue tracker

This page pertains to UD version 2.

It appears that you have Javascript disabled. Please consider enabling Javascript for this page to see the visualizations.

Treebank Statistics: UD_Nheengatu-CompLin: POS Tags: `PRON`

There are 45 PRON lemmas (2%), 57 PRON types (2%) and 3523 PRON tokens (13%). Out of 16 observed tags, the rank of PRON is: 7 in number of lemmas, 7 in number of types and 4 in number of tokens.

The 10 most frequent PRON lemmas: i, se, aintá, waá, aé, ne, ixé, maã, indé, yané

The 10 most frequent PRON types: i, se, aintá, waá, aé, ne, ixé, maã, indé, yané

The 10 most frequent ambiguous lemmas: i (PRON 495, CCONJ 1), se (PRON 474, SCONJ 1), waá (PRON 359, SCONJ 2), aé (PRON 293, DET 5), maã (PRON 166, VERB 163, NOUN 31, DET 28, PART 28), awá (PRON 78, DET 4), kwá (DET 187, PRON 50, VERB 21, ADV 20, AUX 2), amú (DET 48, PRON 47, PART 2, NOUN 1), nhaã (DET 192, PRON 41), pe (PRON 41, NOUN 1)

The 10 most frequent ambiguous types: i (PRON 464, CCONJ 1), se (PRON 364, SCONJ 1), waá (PRON 304, SCONJ 2), aé (PRON 202, DET 4), maã (PRON 110, PART 28, DET 17, NOUN 16), ta (PRON 102, PART 9, VERB 1), awá (PRON 44, DET 1), pe (ADP 82, PRON 38, X 1), nhaã (DET 159, PRON 28), kwá (DET 123, PRON 26, ADV 16, AUX 2)

i
- PRON 464: Yamburi maniáka paranã upé i membeka arama .
- CCONJ 1: Tupana umunhã mira i rangawa yawé waá : i rangawa yawé waá Tupana umunhã aé : apigawa i kunhã umunhã aintá .
se
- PRON 364: Ayuíri putari se retama kití .
- SCONJ 1: Aputari maã asendú se nunca taukastigari indé .
waá
- PRON 304: Kuxiima aikwé yepé feiticeiro akunheseri waá .
- SCONJ 2: Yandé yasarú usika waá pe manha , yaú arã pupunha yukisé .
aé
- PRON 202: Nhaã yawara , aé usuú apigawa .
- DET 4: Awá taá aé Tupana ?
maã
- PRON 110: Taína umaã maã ?
- PART 28: Ayuká ramé maã kuíri indé , panhẽ mira unheẽ maã puxí se resé .
- DET 17: Yupirungawa ramé intí maã pituna ; ara nhũ panhẽ ara upé .
- NOUN 16: Amunhã panhẽ maã mamé apurakí waá aikú .
ta
- PRON 102: Aintá ta rurí .
- PART 9: Indé ta , rekwá repinaitika ?
- VERB 1: Ape , paá , mira-itá ta yatiri takamirika kirimbawa nhaã sukuriú resá resé , ariré wã uyurá nhaã apigá kwera suí .
awá
- PRON 44: Aikwé awá ururi indé u reyuri putari tẽ ne rupí ?
- DET 1: Jesus upurandú aintá : ― Maã rangawa taá kwá uyari waá dinheru resé , awá rera taá kwá uyari waá dinheru resé ?
pe
- ADP 82: Usika ramé aintá kupixá pe , umaã paá suasú umuaíwa aintá kupixawa .
- PRON 38: Kurumĩ rendawa pe tawa ruakí .
- X 1: Yepé aintá suiwara uyumasí waá reté ana , umaã tapurú siiya mirá-etá pu pe , upisika yeperesé yepé putawa aintá suí , umbaú .
nhaã
- DET 159: Aikwé kamixá-itá puranga nhaã piripanasawa ruka upé .
- PRON 28: Muíri rupí nhaã ?
kwá
- DET 123: Indé muíri akayú taá remurari iké kwá cidade upé ?
- PRON 26: Amaã putari kwá uri waá-itá .
- ADV 16: Ti apitá , ayuíri kwá kití .
- AUX 2: Kuíri taína umanú kwá maãresé sera wã .

Morphology

The form / lemma ratio of PRON is 1.266667 (the average of all parts of speech is 1.537997).

The 1st highest number of forms (3) was observed with the lemma “amú”: amú, amú-etá, amú-itá.

The 2nd highest number of forms (3) was observed with the lemma “ne”: intí, n, ne.

The 3rd highest number of forms (2) was observed with the lemma “aintá”: aintá, intá.

PRON occurs with 12 features: PronType (3523; 100% instances), Number (3169; 90% instances), Case (2667; 76% instances), Person (2666; 76% instances), Poss (947; 27% instances), Deixis (100; 3% instances), Style (76; 2% instances), Definite (16; 0% instances), Typo (16; 0% instances), ExtPos (9; 0% instances), Red (2; 0% instances), Degree (1; 0% instances)

PRON occurs with 27 feature-value pairs: Case=Acc,Nom, Case=Dat, Case=Gen, Definite=Ind, Degree=Dim, Deixis=Prox, Deixis=Remt, ExtPos=ADV, ExtPos=SCONJ, Number=Plur, Number=Sing, Person=1, Person=2, Person=3, Poss=Yes, PronType=Art, PronType=Dem, PronType=Emp, PronType=Ind, PronType=Int, PronType=Prs, PronType=Rel, PronType=Tot, Red=Yes, Style=Arch, Style=Rare, Typo=Yes

PRON occurs with 68 feature combinations. The most frequent feature combination is Case=Gen|Number=Sing|Person=1|Poss=Yes|PronType=Prs (367 tokens). Examples: se, xe

Relations

PRON nodes are attached to their parents using 22 different relations: nsubj (1209; 34% instances), nmod:poss (990; 28% instances), obj (480; 14% instances), obl (317; 9% instances), expl (170; 5% instances), iobj (156; 4% instances), root (43; 1% instances), fixed (36; 1% instances), dislocated (25; 1% instances), det (22; 1% instances), nmod (18; 1% instances), ccomp (12; 0% instances), conj (11; 0% instances), mark (8; 0% instances), acl:relcl (6; 0% instances), advcl (5; 0% instances), parataxis (4; 0% instances), orphan (3; 0% instances), advcl:relcl (2; 0% instances), appos (2; 0% instances), vocative (2; 0% instances), xcomp (2; 0% instances)

Parents of PRON nodes belong to 12 different parts of speech: VERB (2031; 58% instances), NOUN (1146; 33% instances), ADJ (139; 4% instances), PRON (60; 2% instances), ADV (51; 1% instances), (43; 1% instances), PART (30; 1% instances), NUM (8; 0% instances), ADP (6; 0% instances), PROPN (6; 0% instances), DET (2; 0% instances), AUX (1; 0% instances)

2796 (79%) PRON nodes are leaves.

596 (17%) PRON nodes have one child.

63 (2%) PRON nodes have two children.

68 (2%) PRON nodes have three or more children.

The highest child degree of a PRON node is 7.

Children of PRON nodes are attached using 29 different relations: case (462; 48% instances), acl:relcl (148; 15% instances), punct (98; 10% instances), advmod (62; 6% instances), nsubj (54; 6% instances), det (50; 5% instances), nmod (18; 2% instances), conj (9; 1% instances), cop (9; 1% instances), fixed (9; 1% instances), appos (6; 1% instances), acl (5; 1% instances), mark (5; 1% instances), advcl (4; 0% instances), cc (4; 0% instances), parataxis (4; 0% instances), csubj (3; 0% instances), nmod:poss (3; 0% instances), amod (2; 0% instances), dislocated (2; 0% instances), nummod (2; 0% instances), obl (2; 0% instances), advcl:relcl (1; 0% instances), aux (1; 0% instances), expl (1; 0% instances), goeswith (1; 0% instances), obj (1; 0% instances), vocative (1; 0% instances), xcomp (1; 0% instances)

Children of PRON nodes belong to 15 different parts of speech: ADP (471; 49% instances), VERB (134; 14% instances), PUNCT (98; 10% instances), PRON (60; 6% instances), NOUN (54; 6% instances), PART (53; 5% instances), DET (42; 4% instances), ADJ (16; 2% instances), ADV (12; 1% instances), AUX (10; 1% instances), SCONJ (5; 1% instances), CCONJ (4; 0% instances), NUM (4; 0% instances), PROPN (4; 0% instances), X (1; 0% instances)

Treebank Statistics: UD_Nheengatu-CompLin: POS Tags: PRON

Morphology

Relations

Treebank Statistics: UD_Nheengatu-CompLin: POS Tags: `PRON`