home edit page issue tracker

This page pertains to UD version 2.

Treebank Statistics: UD_Turkish-Kenet: POS Tags: NOUN

There are 10030 NOUN lemmas (49%), 26647 NOUN types (57%) and 66683 NOUN tokens (37%). Out of 15 observed tags, the rank of NOUN is: 1 in number of lemmas, 1 in number of types and 1 in number of tokens.

The 10 most frequent NOUN lemmas: ol, el, yer, gün, göz, baş, iş, ev, iç, şey

The 10 most frequent NOUN types: gün, zaman, adam, şey, arasında, kadın, çocuk, iş, su, olduğunu

The 10 most frequent ambiguous lemmas: ol (VERB 1083, NOUN 618, ADJ 421, ADV 216), el (NOUN 536, ADJ 26, PROPN 2, VERB 2), yer (NOUN 532, VERB 26, ADJ 17, ADV 3), gün (NOUN 504, ADJ 37, VERB 9, ADV 7), göz (NOUN 498, ADJ 10, VERB 6), baş (NOUN 478, ADJ 28, VERB 16, ADV 3), (NOUN 438, VERB 8, ADJ 5), ev (NOUN 408, VERB 16, ADJ 10, ADV 4), (NOUN 388, VERB 97, ADJ 60, ADV 15), şey (NOUN 383, VERB 26, ADV 1)

The 10 most frequent ambiguous types: kadın (NOUN 107, ADJ 15), Türk (NOUN 106, PROPN 3), içinde (ADV 213, NOUN 106), üstüne (NOUN 98, ADV 3), yer (NOUN 87, VERB 1), kız (NOUN 69, ADJ 8), yere (NOUN 80, VERB 2), beni (PRON 111, NOUN 54), yüz (NOUN 61, NUM 38), ben (PRON 142, NOUN 27)

Morphology

The form / lemma ratio of NOUN is 2.656730 (the average of all parts of speech is 2.284446).

The 1st highest number of forms (98) was observed with the lemma “ol”: olabileceği, olabileceğine, olabileceğini, olabilmek, olacağa, olacağı, olacağıma, olacağımı, olacağına, olacağından, olacağını, olamadığı, olamadığımın, olamayacaklarını, olamayacağını, olana, olanla, olanlar, olanlara, olanlardan, olanları, olanların, olanı, olanın, olasıyı, olduk, oldukları, olduklarına, olduklarından, olduklarını, olduktan, oldurtmak, olduğu, olduğum, olduğuma, olduğumdan, olduğumu, olduğumuz, olduğumuza, olduğumuzdan, olduğumuzu, olduğun, olduğuna, olduğunda, olduğundan, olduğunu, olduğunun, olduğunuz, olma, olmadan, olmadıkları, olmadıklarını, olmadıktan, olmadığı, olmadığımı, olmadığımızı, olmadığına, olmadığından, olmadığını, olmadığının, olmak, olmakla, olmaktan, olmaları, olmalarına, olmama, olmamak, olmamanız, olmaması, olmamı, olmamın, olmamız, olmanın, olmanızın, olması, olmasına, olmasından, olmasını, olmasının, olmaya, olmayacağını, olmayacağının, olmayanlar, olmayı, olmayışı, olmazları, olmuşsunuz, olmuşunu, oluncaya, olursunuz, oluvermek, oluş, oluşlarında, oluşlarından, oluşu, oluşunda, oluşundan, oluşuyla.

The 2nd highest number of forms (71) was observed with the lemma “et”: Etliye, edebiliş, edebilmek, edeceğim, edeceğini, edeceğiniz, edemedik, edemediği, edememekle, edemeyecekleri, edemeyeceği, edene, edenin, edenler, edenlere, edenleri, edenlerin, ederim, ederler, edesiniz, edildiğini, edilmek, edilmesi, edilmeyi, edin, edince, edinceye, ediş, edişi, edişlerini, et, eti, etin, etini, etleri, etlerine, etme, etmediğime, etmek, etmekle, etmekten, etmem, etmemek, etmemekle, etmemesi, etmemeye, etmemizi, etmen, etmenin, etmesinden, etmesine, etmesini, etmeye, etmeyeceğini, etmeyenlere, etmeyi, etmişler, etmişlerin, etten, ettikleri, ettiklerimi, ettiklerini, ettikten, ettirme, ettiği, ettiğim, ettiğimi, ettiğimize, ettiğinden, ettiğini, ettiğiniz.

The 3rd highest number of forms (60) was observed with the lemma “iç”: iç, içe, içebilmek, içerden, içeri, içi, içilene, içim, içimde, içimden, içime, içimi, içimiz, içimizde, içimizden, içimize, içimizi, için, içinde, içinden, içine, içini, içinin, içiniz, içinizden, içinizi, içirmek, içirmeye, içiş, içleri, içlerimiz, içlerinde, içlerinden, içlerine, içlikler, içliliği, içmek, içmekle, içmekten, içmeye, içten, içtiklerim, içtiklerinin, içtikten, içtiğimi, İç, İçenlerin, İçi, İçim, İçimde, İçimize, İçimizin, İçinde, İçinden, İçine, İçini, İçinin, İçlerinde, İçlerinden, İçten.

NOUN occurs with 5 features: Number (66683; 100% instances), Person (66683; 100% instances), Case (66568; 100% instances), Number[psor] (23270; 35% instances), Person[psor] (23270; 35% instances)

NOUN occurs with 15 feature-value pairs: Case=Abl, Case=Acc, Case=Dat, Case=Gen, Case=Ins, Case=Loc, Case=Nom, Number=Plur, Number=Sing, Number[psor]=Plur, Number[psor]=Sing, Person=3, Person[psor]=1, Person[psor]=2, Person[psor]=3

NOUN occurs with 105 feature combinations. The most frequent feature combination is Case=Nom|Number=Sing|Person=3 (24511 tokens). Examples: gün, zaman, adam, şey, çocuk, iş, kadın, su, gece, Türk

Relations

NOUN nodes are attached to their parents using 28 different relations: obl (15095; 23% instances), nmod (13117; 20% instances), obj (10359; 16% instances), nsubj (9464; 14% instances), compound (5824; 9% instances), conj (3090; 5% instances), root (2890; 4% instances), ccomp (1570; 2% instances), amod (1229; 2% instances), advcl (851; 1% instances), xcomp (672; 1% instances), iobj (443; 1% instances), acl (407; 1% instances), parataxis (348; 1% instances), csubj (317; 0% instances), flat (264; 0% instances), list (187; 0% instances), vocative (151; 0% instances), nummod (107; 0% instances), case (86; 0% instances), discourse (83; 0% instances), appos (56; 0% instances), dislocated (18; 0% instances), fixed (18; 0% instances), clf (12; 0% instances), orphan (10; 0% instances), dep (8; 0% instances), reparandum (7; 0% instances)

Parents of NOUN nodes belong to 14 different parts of speech: VERB (29133; 44% instances), NOUN (23450; 35% instances), ADJ (6846; 10% instances), ADV (3638; 5% instances), (2890; 4% instances), PROPN (296; 0% instances), PRON (247; 0% instances), NUM (81; 0% instances), ADP (46; 0% instances), DET (24; 0% instances), X (23; 0% instances), CCONJ (4; 0% instances), INTJ (3; 0% instances), AUX (2; 0% instances)

26161 (39%) NOUN nodes are leaves.

23351 (35%) NOUN nodes have one child.

11541 (17%) NOUN nodes have two children.

5630 (8%) NOUN nodes have three or more children.

The highest child degree of a NOUN node is 8.

Children of NOUN nodes are attached using 33 different relations: amod (12478; 19% instances), nmod (12000; 18% instances), punct (7817; 12% instances), det (6842; 10% instances), acl (3706; 6% instances), conj (3107; 5% instances), obl (2857; 4% instances), compound (2816; 4% instances), case (2683; 4% instances), obj (2357; 4% instances), advmod (2069; 3% instances), nsubj (1478; 2% instances), cc (1469; 2% instances), nummod (1292; 2% instances), advcl (698; 1% instances), aux (307; 0% instances), ccomp (289; 0% instances), parataxis (267; 0% instances), list (182; 0% instances), xcomp (157; 0% instances), flat (150; 0% instances), discourse (113; 0% instances), mark (112; 0% instances), iobj (77; 0% instances), csubj (70; 0% instances), appos (60; 0% instances), dep (41; 0% instances), vocative (33; 0% instances), dislocated (10; 0% instances), orphan (9; 0% instances), fixed (7; 0% instances), clf (6; 0% instances), reparandum (6; 0% instances)

Children of NOUN nodes belong to 15 different parts of speech: NOUN (23450; 36% instances), ADJ (15328; 23% instances), PUNCT (7817; 12% instances), DET (6824; 10% instances), ADP (2391; 4% instances), CCONJ (2305; 4% instances), ADV (2116; 3% instances), PRON (1694; 3% instances), NUM (1346; 2% instances), PROPN (984; 2% instances), VERB (831; 1% instances), AUX (309; 0% instances), INTJ (74; 0% instances), X (60; 0% instances), SCONJ (36; 0% instances)