Treebank Statistics: UD_Turkish-Kenet: POS Tags: NOUN
There are 10030 NOUN
lemmas (49%), 26647 NOUN
types (57%) and 66683 NOUN
tokens (37%).
Out of 15 observed tags, the rank of NOUN
is: 1 in number of lemmas, 1 in number of types and 1 in number of tokens.
The 10 most frequent NOUN
lemmas: ol, el, yer, gün, göz, baş, iş, ev, iç, şey
The 10 most frequent NOUN
types: gün, zaman, adam, şey, arasında, kadın, çocuk, iş, su, olduğunu
The 10 most frequent ambiguous lemmas: ol (VERB 1083, NOUN 618, ADJ 421, ADV 216), el (NOUN 536, ADJ 26, PROPN 2, VERB 2), yer (NOUN 532, VERB 26, ADJ 17, ADV 3), gün (NOUN 504, ADJ 37, VERB 9, ADV 7), göz (NOUN 498, ADJ 10, VERB 6), baş (NOUN 478, ADJ 28, VERB 16, ADV 3), iş (NOUN 438, VERB 8, ADJ 5), ev (NOUN 408, VERB 16, ADJ 10, ADV 4), iç (NOUN 388, VERB 97, ADJ 60, ADV 15), şey (NOUN 383, VERB 26, ADV 1)
The 10 most frequent ambiguous types: kadın (NOUN 107, ADJ 15), Türk (NOUN 106, PROPN 3), içinde (ADV 213, NOUN 106), üstüne (NOUN 98, ADV 3), yer (NOUN 87, VERB 1), kız (NOUN 69, ADJ 8), yere (NOUN 80, VERB 2), beni (PRON 111, NOUN 54), yüz (NOUN 61, NUM 38), ben (PRON 142, NOUN 27)
- kadın
- Türk
- içinde
- üstüne
- yer
- kız
- yere
- beni
- yüz
- ben
Morphology
The form / lemma ratio of NOUN
is 2.656730 (the average of all parts of speech is 2.284446).
The 1st highest number of forms (98) was observed with the lemma “ol”: olabileceği, olabileceğine, olabileceğini, olabilmek, olacağa, olacağı, olacağıma, olacağımı, olacağına, olacağından, olacağını, olamadığı, olamadığımın, olamayacaklarını, olamayacağını, olana, olanla, olanlar, olanlara, olanlardan, olanları, olanların, olanı, olanın, olasıyı, olduk, oldukları, olduklarına, olduklarından, olduklarını, olduktan, oldurtmak, olduğu, olduğum, olduğuma, olduğumdan, olduğumu, olduğumuz, olduğumuza, olduğumuzdan, olduğumuzu, olduğun, olduğuna, olduğunda, olduğundan, olduğunu, olduğunun, olduğunuz, olma, olmadan, olmadıkları, olmadıklarını, olmadıktan, olmadığı, olmadığımı, olmadığımızı, olmadığına, olmadığından, olmadığını, olmadığının, olmak, olmakla, olmaktan, olmaları, olmalarına, olmama, olmamak, olmamanız, olmaması, olmamı, olmamın, olmamız, olmanın, olmanızın, olması, olmasına, olmasından, olmasını, olmasının, olmaya, olmayacağını, olmayacağının, olmayanlar, olmayı, olmayışı, olmazları, olmuşsunuz, olmuşunu, oluncaya, olursunuz, oluvermek, oluş, oluşlarında, oluşlarından, oluşu, oluşunda, oluşundan, oluşuyla.
The 2nd highest number of forms (71) was observed with the lemma “et”: Etliye, edebiliş, edebilmek, edeceğim, edeceğini, edeceğiniz, edemedik, edemediği, edememekle, edemeyecekleri, edemeyeceği, edene, edenin, edenler, edenlere, edenleri, edenlerin, ederim, ederler, edesiniz, edildiğini, edilmek, edilmesi, edilmeyi, edin, edince, edinceye, ediş, edişi, edişlerini, et, eti, etin, etini, etleri, etlerine, etme, etmediğime, etmek, etmekle, etmekten, etmem, etmemek, etmemekle, etmemesi, etmemeye, etmemizi, etmen, etmenin, etmesinden, etmesine, etmesini, etmeye, etmeyeceğini, etmeyenlere, etmeyi, etmişler, etmişlerin, etten, ettikleri, ettiklerimi, ettiklerini, ettikten, ettirme, ettiği, ettiğim, ettiğimi, ettiğimize, ettiğinden, ettiğini, ettiğiniz.
The 3rd highest number of forms (60) was observed with the lemma “iç”: iç, içe, içebilmek, içerden, içeri, içi, içilene, içim, içimde, içimden, içime, içimi, içimiz, içimizde, içimizden, içimize, içimizi, için, içinde, içinden, içine, içini, içinin, içiniz, içinizden, içinizi, içirmek, içirmeye, içiş, içleri, içlerimiz, içlerinde, içlerinden, içlerine, içlikler, içliliği, içmek, içmekle, içmekten, içmeye, içten, içtiklerim, içtiklerinin, içtikten, içtiğimi, İç, İçenlerin, İçi, İçim, İçimde, İçimize, İçimizin, İçinde, İçinden, İçine, İçini, İçinin, İçlerinde, İçlerinden, İçten.
NOUN
occurs with 5 features: Number (66683; 100% instances), Person (66683; 100% instances), Case (66568; 100% instances), Number[psor] (23270; 35% instances), Person[psor] (23270; 35% instances)
NOUN
occurs with 15 feature-value pairs: Case=Abl
, Case=Acc
, Case=Dat
, Case=Gen
, Case=Ins
, Case=Loc
, Case=Nom
, Number=Plur
, Number=Sing
, Number[psor]=Plur
, Number[psor]=Sing
, Person=3
, Person[psor]=1
, Person[psor]=2
, Person[psor]=3
NOUN
occurs with 105 feature combinations.
The most frequent feature combination is Case=Nom|Number=Sing|Person=3
(24511 tokens).
Examples: gün, zaman, adam, şey, çocuk, iş, kadın, su, gece, Türk
Relations
NOUN
nodes are attached to their parents using 28 different relations: obl (15095; 23% instances), nmod (13117; 20% instances), obj (10359; 16% instances), nsubj (9464; 14% instances), compound (5824; 9% instances), conj (3090; 5% instances), root (2890; 4% instances), ccomp (1570; 2% instances), amod (1229; 2% instances), advcl (851; 1% instances), xcomp (672; 1% instances), iobj (443; 1% instances), acl (407; 1% instances), parataxis (348; 1% instances), csubj (317; 0% instances), flat (264; 0% instances), list (187; 0% instances), vocative (151; 0% instances), nummod (107; 0% instances), case (86; 0% instances), discourse (83; 0% instances), appos (56; 0% instances), dislocated (18; 0% instances), fixed (18; 0% instances), clf (12; 0% instances), orphan (10; 0% instances), dep (8; 0% instances), reparandum (7; 0% instances)
Parents of NOUN
nodes belong to 14 different parts of speech: VERB (29133; 44% instances), NOUN (23450; 35% instances), ADJ (6846; 10% instances), ADV (3638; 5% instances), (2890; 4% instances), PROPN (296; 0% instances), PRON (247; 0% instances), NUM (81; 0% instances), ADP (46; 0% instances), DET (24; 0% instances), X (23; 0% instances), CCONJ (4; 0% instances), INTJ (3; 0% instances), AUX (2; 0% instances)
26161 (39%) NOUN
nodes are leaves.
23351 (35%) NOUN
nodes have one child.
11541 (17%) NOUN
nodes have two children.
5630 (8%) NOUN
nodes have three or more children.
The highest child degree of a NOUN
node is 8.
Children of NOUN
nodes are attached using 33 different relations: amod (12478; 19% instances), nmod (12000; 18% instances), punct (7817; 12% instances), det (6842; 10% instances), acl (3706; 6% instances), conj (3107; 5% instances), obl (2857; 4% instances), compound (2816; 4% instances), case (2683; 4% instances), obj (2357; 4% instances), advmod (2069; 3% instances), nsubj (1478; 2% instances), cc (1469; 2% instances), nummod (1292; 2% instances), advcl (698; 1% instances), aux (307; 0% instances), ccomp (289; 0% instances), parataxis (267; 0% instances), list (182; 0% instances), xcomp (157; 0% instances), flat (150; 0% instances), discourse (113; 0% instances), mark (112; 0% instances), iobj (77; 0% instances), csubj (70; 0% instances), appos (60; 0% instances), dep (41; 0% instances), vocative (33; 0% instances), dislocated (10; 0% instances), orphan (9; 0% instances), fixed (7; 0% instances), clf (6; 0% instances), reparandum (6; 0% instances)
Children of NOUN
nodes belong to 15 different parts of speech: NOUN (23450; 36% instances), ADJ (15328; 23% instances), PUNCT (7817; 12% instances), DET (6824; 10% instances), ADP (2391; 4% instances), CCONJ (2305; 4% instances), ADV (2116; 3% instances), PRON (1694; 3% instances), NUM (1346; 2% instances), PROPN (984; 2% instances), VERB (831; 1% instances), AUX (309; 0% instances), INTJ (74; 0% instances), X (60; 0% instances), SCONJ (36; 0% instances)