Treebank Statistics: UD_Icelandic-Modern: POS Tags: PRON
There are 28 PRON
lemmas (0%), 109 PRON
types (1%) and 7734 PRON
tokens (10%).
Out of 16 observed tags, the rank of PRON
is: 10 in number of lemmas, 8 in number of types and 4 in number of tokens.
The 10 most frequent PRON
lemmas: það, ég, hann, hún, annar, hver, sig, sinn, minn, maður
The 10 most frequent PRON
types: það, ég, við, því, þess, hann, mér, hún, hvað, sér
The 10 most frequent ambiguous lemmas: það (PRON 3000, ADV 3, DET 2), hún (PRON 325, DET 1), annar (PRON 263, ADJ 34, ADV 5), hver (PRON 243, DET 68, SCONJ 2, ADV 1), sinn (PRON 174, NOUN 41, ADV 1), maður (NOUN 211, PRON 76), sami (ADJ 42, PRON 23), því (PRON 5, ADV 3), annaðhvort (PRON 3, DET 1), hvaða (DET 59, PRON 3)
The 10 most frequent ambiguous types: það (PRON 1359, DET 172, ADV 1), við (PRON 622, ADP 471, X 1), því (PRON 717, DET 68, ADV 4), þess (PRON 279, DET 20, ADV 1), hvað (PRON 101, ADV 16, DET 6), sér (PRON 142, VERB 5, ADJ 4, ADV 1), þeir (PRON 89, DET 28), þau (PRON 82, DET 32), annað (PRON 66, ADJ 6), þær (PRON 55, DET 32)
- það
- PRON 1359: Þetta var mjög pent og huggulegt , takk fyrir það .
- DET 172: Það er það sem fólk er ósátt við .
- ADV 1: Þetta á að endurspegla raunkostnað því að allt sem ekki gerir það og er umfram það hvar sem það er í gjaldtöku af þessu tagi er undir fölsku flaggi , þá er það Forseti hringir . skattur en ekki þjónustugjöld eða kostnaðargjöld .
- við
- því
- þess
- PRON 279: Við höfum alveg tímann til þess , ég tek undir það .
- DET 20: Belgar tróna á toppi þess lista , en hann var síðast gefinn út 3. mars .
- ADV 1: Vissulega kemur það í ljós út frá reiði almennings og allra sem ég talaði við á sínum tíma , sem létu sig málið varða á annað borð , að forgangsröðunin á að vera á heilbrigðiskerfinu og þess vegna er afskaplega leiðinlegt að sjá þá hugmynd dvína sem maður hafði um að heilbrigðiskerfið á Íslandi væri gott . Ekki bara út frá þjónustulegu sjónarmiði heldur líka að því leyti að fólk þyrfti ekki að greiða mikið fyrir það , að fólk hefði raunhæfan aðgang að þjónustunni óháð efnahag .
- hvað
- sér
- PRON 142: „ Næst er bara að koma sér í úrslit og synda vonandi hraðar í kvöldin .
- VERB 5: Hvernig sér hv. þingmaður þróunina hvað þetta varðar ?
- ADJ 4: Síðan er það valkostagreining ráðherra , sem mun ráða einn Forseti hringir . og sér samkvæmt reglugerð hvar línustæði munu liggja .
- ADV 1: Herra forseti . Ég tek undir það með hæstv. fjármálaráðherra að vonandi getum við , a. m. k. sum hver , átt málefnalegar rökræður um það hvernig er best að haga skattkerfinu og alveg einkum og sér í lagi álagningu tekjuskatts á einstaklinga því að það er eitt stærsta og öflugasta tækið sem við höfum í höndum til þess að reyna að vinna til dæmis gegn vaxandi launamun og bremsa vinnumarkaðinn af í þeim efnum o. s. frv. Ég tel það í sjálfu sér ekki vera nein rök , þó að rétt sé , að ríkið fái ekki út úr tekjuskatti manna fyrr en launin eru komin yfir 230 þúsund vegna fyrirkomulags sem hefur verið langalengi við lýði , að ríkið bæti sveitarfélögunum upp það sem á vantar í fullt útsvar af launum þar fyrir neðan .
- þeir
- þau
- annað
- þær
Morphology
The form / lemma ratio of PRON
is 3.892857 (the average of all parts of speech is 1.738114).
The 1st highest number of forms (13) was observed with the lemma “annar”: annan, annar, annarra, annarrar, annarri, annars, annað, aðra, aðrar, aðrir, önnur, öðru, öðrum.
The 2nd highest number of forms (11) was observed with the lemma “minn”: minn, minnar, minni, mitt, mín, mína, mínar, mínir, míns, mínu, mínum.
The 3rd highest number of forms (11) was observed with the lemma “sinn”: sinn, sinna, sinnar, sinni, sitt, sín, sína, sínar, síns, sínu, sínum.
PRON
occurs with 6 features: Case (7646; 99% instances), Number (7446; 96% instances), PronType (7436; 96% instances), Gender (4843; 63% instances), Person (2603; 34% instances), Definite (8; 0% instances)
PRON
occurs with 16 feature-value pairs: Case=Acc
, Case=Dat
, Case=Gen
, Case=Nom
, Definite=Ind
, Gender=Fem
, Gender=Masc
, Gender=Neut
, Number=Plur
, Number=Sing
, Person=1
, Person=2
, PronType=Dem
, PronType=Ind
, PronType=Int
, PronType=Prs
PRON
occurs with 102 feature combinations.
The most frequent feature combination is Case=Nom|Number=Sing|Person=1|PronType=Prs
(1366 tokens).
Examples: ég
Relations
PRON
nodes are attached to their parents using 19 different relations: nsubj (3742; 48% instances), obl (1429; 18% instances), obj (801; 10% instances), nmod:poss (436; 6% instances), expl (415; 5% instances), root (189; 2% instances), det (163; 2% instances), conj (136; 2% instances), iobj (115; 1% instances), nmod (72; 1% instances), ccomp (46; 1% instances), amod (45; 1% instances), parataxis (36; 0% instances), xcomp (30; 0% instances), advcl (29; 0% instances), appos (23; 0% instances), dep (10; 0% instances), acl (9; 0% instances), acl:relcl (8; 0% instances)
Parents of PRON
nodes belong to 14 different parts of speech: VERB (5067; 66% instances), NOUN (1221; 16% instances), ADJ (603; 8% instances), (189; 2% instances), PRON (167; 2% instances), AUX (157; 2% instances), ADV (138; 2% instances), DET (103; 1% instances), PROPN (32; 0% instances), PART (19; 0% instances), ADP (17; 0% instances), CCONJ (11; 0% instances), NUM (7; 0% instances), SCONJ (3; 0% instances)
5546 (72%) PRON
nodes are leaves.
943 (12%) PRON
nodes have one child.
838 (11%) PRON
nodes have two children.
407 (5%) PRON
nodes have three or more children.
The highest child degree of a PRON
node is 13.
Children of PRON
nodes are attached using 28 different relations: case (1295; 30% instances), ccomp (496; 11% instances), punct (459; 11% instances), cop (397; 9% instances), advmod (332; 8% instances), acl (239; 6% instances), obl (204; 5% instances), cc (126; 3% instances), nsubj (109; 3% instances), conj (95; 2% instances), xcomp (91; 2% instances), mark (71; 2% instances), amod (68; 2% instances), acl:relcl (65; 1% instances), advcl (58; 1% instances), appos (42; 1% instances), compound:prt (38; 1% instances), dep (28; 1% instances), nmod (25; 1% instances), obj (22; 1% instances), expl (18; 0% instances), det (14; 0% instances), parataxis (14; 0% instances), aux (12; 0% instances), discourse (7; 0% instances), vocative (6; 0% instances), csubj (2; 0% instances), nmod:poss (2; 0% instances)
Children of PRON
nodes belong to 16 different parts of speech: ADP (1335; 31% instances), VERB (781; 18% instances), PUNCT (459; 11% instances), AUX (454; 10% instances), ADV (344; 8% instances), NOUN (328; 8% instances), PRON (167; 4% instances), CCONJ (128; 3% instances), ADJ (111; 3% instances), DET (76; 2% instances), SCONJ (73; 2% instances), PROPN (40; 1% instances), PART (27; 1% instances), INTJ (7; 0% instances), NUM (3; 0% instances), X (2; 0% instances)