home edit page issue tracker

This page pertains to UD version 2.

Treebank Statistics: UD_Turkish-Penn: POS Tags: NOUN

There are 6215 NOUN lemmas (34%), 18325 NOUN types (50%) and 66720 NOUN tokens (36%). Out of 15 observed tags, the rank of NOUN is: 1 in number of lemmas, 1 in number of types and 1 in number of tokens.

The 10 most frequent NOUN lemmas: bay, dolar, hisse, ol, şirket, yıl, piyasa, fiyat, et, iş

The 10 most frequent NOUN types: bay, hisse, dolar, yıl, şirket, olduğunu, şekilde, satın, devam, gelir

The 10 most frequent ambiguous lemmas: bay (NOUN 1048, VERB 1), dolar (NOUN 1001, ADJ 102, VERB 34, PROPN 22), hisse (NOUN 997, ADJ 15, VERB 4, ADV 1), ol (NOUN 945, VERB 930, ADV 879, ADJ 617), şirket (NOUN 836, VERB 21, ADJ 10, PROPN 1), yıl (NOUN 753, ADJ 174, ADV 28, VERB 2), piyasa (NOUN 488, ADJ 39, PROPN 1), fiyat (NOUN 433, ADJ 24, VERB 5), et (VERB 1089, NOUN 416, ADJ 285, ADV 37), (NOUN 401, ADJ 7, VERB 2)

The 10 most frequent ambiguous types: dolar (NOUN 374, NUM 5), şirket (NOUN 175, ADJ 1), gelir (NOUN 77, VERB 10), Amerikan (NOUN 179, ADJ 115, PROPN 1), konusunda (NOUN 156, ADV 1), menkul (NOUN 60, ADJ 33), alım (NOUN 130, VERB 1), yatırım (NOUN 118, VERB 1), tarafından (ADV 186, NOUN 128), satış (NOUN 101, VERB 2)

Morphology

The form / lemma ratio of NOUN is 2.948512 (the average of all parts of speech is 2.012465).

The 1st highest number of forms (98) was observed with the lemma “et”: EDİLMESİ, ETLER, Etler, edebildiğine, edebileceklerini, edebileceği, edebileceğine, edebileceğini, edebileceğinin, edebileceğiniz, edebilme, edebilmeyi, edeceklerine, edeceklerini, edeceğinden, edeceğine, edeceğini, edemediklerini, edememeleri, edememesinden, edemeyeceğimizden, edemeyeceğini, edemeyeceğinin, edemezsin, edenler, edenlere, edenlerin, ederinde, edici, edildikten, edildiği, edildiğince, edildiğinde, edildiğini, edileceği, edileceğini, edilemeyeceğini, edilenden, edilenlerden, edilme, edilmediği, edilmediğinden, edilmediğini, edilmek, edilmesi, edilmesinde, edilmesine, edilmesini, edilmesinin, edilmesiyle, edilmeye, edilmişlerden, et, eti, etin, etinin, etme, etmede, etmediğini, etmek, etmekle, etmekte, etmekten, etmelisiniz, etmemem, etmemesi, etmemeye, etmemeyi, etmemi, etmemizi, etmenin, etmesi, etmesine, etmesini, etmesinin, etmeye, etmeyecekleri, etmeyeceklerini, etmeyeceğini, etmeyi, ettikleri, ettiklerinde, ettiklerini, ettikten, ettireceğini, ettirme, ettirmediler, ettirmeye, ettirmeyi, ettiği, ettiğimiz, ettiğinde, ettiğinden, ettiğine, ettiğini, ettiğiniz, tutmak, yaptığına.

The 2nd highest number of forms (88) was observed with the lemma “ol”: kaldığını, olabilecekleri, olabileceklerin, olabileceklerini, olabileceğinden, olabileceğine, olabileceğini, olabileceğinin, olabilirler, olabilmesi, olacaklar, olacaklarını, olacağı, olacağımı, olacağına, olacağından, olacağını, olacağının, olamadığını, olamayacağını, olana, olandan, olanlar, olanlardan, olanları, olanların, olanı, olanın, oldukları, olduklarına, olduklarında, olduklarından, olduklarını, olduktan, olduğu, olduğum, olduğumdan, olduğumu, olduğumuzu, olduğuna, olduğunda, olduğundan, olduğunu, olduğunun, olma, olmadan, olmadıkları, olmadıklarını, olmadığı, olmadığımızı, olmadığına, olmadığında, olmadığını, olmak, olmakla, olmakta, olmaktan, olmaları, olmalarına, olmalarını, olmamakla, olmamanın, olmaması, olmamasına, olmamasını, olman, olmanın, olması, olmasına, olmasında, olmasından, olmasını, olmasının, olmasıyla, olmaya, olmayabileceğini, olmayacakları, olmayacağı, olmayacağını, olmayacağının, olmayanlar, olmayanlara, olmayanların, olmayı, olmayışı, olunmaya, oluşuyla, var.

The 3rd highest number of forms (68) was observed with the lemma “al”: Alacağın, alabileceğini, alabilme, alacaklara, alacaklarda, alacaklarının, alacağa, alacağımızı, alacağını, alamayacaklarını, alamayacağını, alana, alanlar, alanlarında, alanı, aldıklarını, aldıktan, aldığı, aldığımı, aldığına, aldığında, aldığını, alma, almada, almadan, almadığını, almak, almakta, almaktan, almalar, almalara, almalardan, almalarla, almaları, almalarına, almalarını, almanın, almanız, almanızı, alması, almasına, almasından, almasını, almasının, almasıyla, almaya, almayacaklarını, almayla, almayı, alıcı, alıcılar, alıcılarından, alıcının, alım, alımı, alınacağını, alındıktan, alındığında, alındığından, alındığını, alınma, alınmaması, alınması, alınmasına, alınmasından, alınmasını, alınmayı, alışımız.

NOUN occurs with 6 features: Number (66720; 100% instances), Person (66720; 100% instances), Case (66693; 100% instances), Number[psor] (21757; 33% instances), Person[psor] (21757; 33% instances), Typo (13; 0% instances)

NOUN occurs with 16 feature-value pairs: Case=Abl, Case=Acc, Case=Dat, Case=Gen, Case=Ins, Case=Loc, Case=Nom, Number=Plur, Number=Sing, Number[psor]=Plur, Number[psor]=Sing, Person=3, Person[psor]=1, Person[psor]=2, Person[psor]=3, Typo=Yes

NOUN occurs with 98 feature combinations. The most frequent feature combination is Case=Nom|Number=Sing|Person=3 (27697 tokens). Examples: bay, hisse, dolar, yıl, şirket, devam, satın, gelir, dün, Amerikan

Relations

NOUN nodes are attached to their parents using 29 different relations: nmod (21522; 32% instances), nsubj (11449; 17% instances), obl (9092; 14% instances), obj (7662; 11% instances), compound (5995; 9% instances), ccomp (2363; 4% instances), amod (2041; 3% instances), conj (1743; 3% instances), root (1546; 2% instances), advcl (640; 1% instances), xcomp (499; 1% instances), flat (438; 1% instances), csubj (364; 1% instances), case (323; 0% instances), nummod (227; 0% instances), appos (193; 0% instances), acl (181; 0% instances), list (112; 0% instances), discourse (109; 0% instances), parataxis (104; 0% instances), fixed (61; 0% instances), iobj (22; 0% instances), clf (15; 0% instances), dep (7; 0% instances), dislocated (4; 0% instances), vocative (4; 0% instances), nsubj:outer (2; 0% instances), nmod:tmod (1; 0% instances), orphan (1; 0% instances)

Parents of NOUN nodes belong to 15 different parts of speech: NOUN (27445; 41% instances), VERB (27075; 41% instances), ADJ (5586; 8% instances), ADV (2104; 3% instances), PROPN (2099; 3% instances), (1546; 2% instances), NUM (373; 1% instances), PRON (229; 0% instances), ADP (119; 0% instances), DET (77; 0% instances), X (22; 0% instances), AUX (19; 0% instances), CCONJ (15; 0% instances), INTJ (10; 0% instances), SCONJ (1; 0% instances)

22786 (34%) NOUN nodes are leaves.

26643 (40%) NOUN nodes have one child.

11605 (17%) NOUN nodes have two children.

5686 (9%) NOUN nodes have three or more children.

The highest child degree of a NOUN node is 11.

Children of NOUN nodes are attached using 33 different relations: nmod (19936; 29% instances), amod (12327; 18% instances), det (5572; 8% instances), nummod (4105; 6% instances), case (3423; 5% instances), punct (3380; 5% instances), compound (2964; 4% instances), acl (2580; 4% instances), nsubj (2567; 4% instances), obj (2425; 3% instances), obl (2199; 3% instances), advmod (2075; 3% instances), conj (1721; 2% instances), cc (1711; 2% instances), mark (563; 1% instances), flat (389; 1% instances), advcl (366; 1% instances), appos (340; 0% instances), ccomp (258; 0% instances), aux (225; 0% instances), xcomp (161; 0% instances), list (154; 0% instances), discourse (144; 0% instances), parataxis (90; 0% instances), csubj (85; 0% instances), dep (33; 0% instances), fixed (31; 0% instances), goeswith (13; 0% instances), clf (6; 0% instances), iobj (5; 0% instances), dislocated (4; 0% instances), nsubj:outer (1; 0% instances), orphan (1; 0% instances)

Children of NOUN nodes belong to 15 different parts of speech: NOUN (27445; 39% instances), ADJ (13995; 20% instances), DET (5781; 8% instances), PROPN (5183; 7% instances), NUM (4536; 6% instances), PUNCT (3380; 5% instances), ADP (2772; 4% instances), CCONJ (2550; 4% instances), ADV (2460; 4% instances), PRON (939; 1% instances), VERB (406; 1% instances), AUX (227; 0% instances), X (163; 0% instances), INTJ (10; 0% instances), SCONJ (7; 0% instances)