Treebank Statistics: UD_Korean-LittlePrince: POS Tags: NOUN
There are 615 NOUN lemmas (26%), 1204 NOUN types (25%) and 2731 NOUN tokens (20%).
Out of 15 observed tags, the rank of NOUN is: 2 in number of lemmas, 2 in number of types and 3 in number of tokens.
The 10 most frequent NOUN lemmas: _, 왕자, 것, 사람, 별, 꽃, 말, 왕, 양, 일
The 10 most frequent NOUN types: 왕자가, 왕자는, 수, 사람이, 꽃은, 말을, 것을, 가로등, 것은, 왕이
The 10 most frequent ambiguous lemmas: _ (ADV 763, NOUN 622, AUX 375, DET 247, CCONJ 239, NUM 156, PRON 117, ADJ 53, ADP 25, VERB 18, INTJ 16, PROPN 14, SCONJ 3, PART 1), 왕자 (NOUN 175, ADV 9, VERB 1), 것 (NOUN 92, VERB 81, ADV 24, CCONJ 3), 사람 (NOUN 92, VERB 15, ADV 12, CCONJ 4, SCONJ 4), 별 (NOUN 91, ADV 20, VERB 10, CCONJ 5, SCONJ 1), 꽃 (NOUN 65, ADV 13, VERB 8, CCONJ 3), 말 (NOUN 38, VERB 25, ADV 10, SCONJ 4, CCONJ 3), 왕 (NOUN 33, CCONJ 2, ADV 1), 양 (NOUN 30, ADV 3, VERB 1), 일 (NOUN 30, VERB 18, ADV 7, SCONJ 1)
The 10 most frequent ambiguous types: 안녕 (NOUN 17, INTJ 3), 아저씨가 (NOUN 7, ADV 2), 그때 (NOUN 6, ADV 2), 별 (NOUN 5, ADP 1, ADV 1), 오랫동안 (NOUN 5, ADV 4), 조금 (ADV 7, NOUN 5), 줄 (NOUN 5, VERB 4), 지금 (ADV 4, NOUN 4), 살 (NOUN 3, VERB 2), 아저씬 (NOUN 3, ADV 2)
- 안녕
- 아저씨가
- 그때
- 별
- 오랫동안
- 조금
- 줄
- 지금
- 살
- 아저씬
Morphology
The form / lemma ratio of NOUN is 1.957724 (the average of all parts of speech is 1.979464).
The 1st highest number of forms (283) was observed with the lemma “_”: 가, 가로등, 가지, 감기, 거, 거짓말, 것, 것(, 게, 골치, 골프, 곳’, 구석, 국제, 그날, 그때, 그랫, 그림, 그림물감, 금빛, 금속성, 급행, 기관사, 기분, 기억, 기차, 꼬마, 꽃, 꽃한테, 꾸러미, 꿀벌, 꿈, 나머지, 나무, 나비, 나이, 날, 내일, 널, 년, 녹슨, 놀자, 누더기, 눈, 눈물, 다를바, 다음, 다음날, 달, 담배불, 담비, 대로, 대신, 데, 돌, 돌담, 동안, 두어번, 듯, 땅, 때, 떠돌이별, 마리, 마음, 마일, 마지막, 마흔, 마흔네번, 만큼, 말, 망토, 매주, 맵시, 먼저번, 명, 명하노니, 모든걸, 모래, 무대, 무렵, 무릎높이, 무심코, 무턱대고, 문법, 문제지, 물, 물체, 미소, 밑, 바늘, 바다, 바둑판, 바람, 바오밥나무, 바퀴, 반대, 발레, 발자국, 발짝, 발톱, 밤, 밧줄, 방, 백번, 뱀, 번, 벌서, 별, 별들’, 별빛, 병, 보아뱀, 보통, 본시, 볼트, 부속, 불, 불쑥, 비극, 비행기, 비행기(, 뿐, 뿔, 사년, 사람, 사막, 산, 산수, 살, 삼심, 색깔, 석, 선녀, 섬, 성실성, 세상, 셋, 소리, 소릴, 소행성, 속, 손대, 수, 수백만년, 수수께끼같은, 순간, 술꾼, 숫자, 슬플, 시간, 시절, 신경질, 신경통, 신사, 심연, 쓸모, 씨뻘건, 아, 아버진, 아이, 아이참, 아저씬, 아침, 안녕, 앞, 애, 애도, 앤, 야, 약속, 양, 얘, 어느날, 어둠, 어언, 언덕, 여기저기, 여러가지, 여우, 역사, 연녹색, 연필, 열차, 예, 오, 오늘, 오랫동안, 오억, 오후, 옷, 왕, 왕(, 왕자, 왜요, 외부, 우물, 웬, 유리, 육십, 으흠, 음악, 응, 이내, 이년, 이름, 이마, 이맘때, 이백번, 이상, 이십, 이야기, 이익, 이해력, 일주일, 일흔두번, 임자, 자, 작년, 작별, 잠근단, 장사꾼, 장소, 저길, 저녁, 전, 절대, 정신, 정원, 제, 조금, 존재, 종이, 주홍빛, 줄, 줄기, 중, 쥐, 지가, 지구, 지금, 지길, 지도, 지리, 지붕, 질문, 집, 채, 책상, 처녀림, 척, 첫날, 친구, 친구야, 칠백, 침묵, 카빈, 크리스마스, 통, 통치, 트럼프, 편, 평생, 포기, 풀, 프랑짜리, 피곤, 필요, 하늘, 하루종일, 한, 한가운데, 한동안, 한번, 한줄기, 한편, 할아버지, 해, 햇빛, 허영심, 화산폭발, 후, 휴우, 흑인.
The 2nd highest number of forms (13) was observed with the lemma “별”: 별들, 별들은, 별들을, 별들의, 별들이, 별에는, 별에서는, 별에선, 별엔, 별은, 별을, 별의, 별이.
The 3rd highest number of forms (13) was observed with the lemma “사람”: 사람들, 사람들에게는, 사람들에겐, 사람들은, 사람들을, 사람들의, 사람들이, 사람에게는, 사람에겐, 사람은, 사람을, 사람의, 사람이.
NOUN occurs with 2 features: Case (1976; 72% instances), ExtPos (105; 4% instances)
NOUN occurs with 4 feature-value pairs: Case=Acc, Case=Gen, Case=Nom, ExtPos=AUX
NOUN occurs with 6 feature combinations.
The most frequent feature combination is Case=Nom (1132 tokens).
Examples: 왕자가, 왕자는, 사람이, 꽃은, 것은, 왕이, 건, 여우가, 별은, 사람들은
Relations
NOUN nodes are attached to their parents using 19 different relations: obj (671; 25% instances), nsubj (588; 22% instances), dislocated (500; 18% instances), compound (373; 14% instances), obl (248; 9% instances), nmod (138; 5% instances), dep (99; 4% instances), conj (49; 2% instances), csubj (25; 1% instances), ccomp (11; 0% instances), compound:lvc (10; 0% instances), vocative (7; 0% instances), acl (2; 0% instances), amod (2; 0% instances), parataxis (2; 0% instances), reparandum (2; 0% instances), root (2; 0% instances), advcl (1; 0% instances), fixed (1; 0% instances)
Parents of NOUN nodes belong to 11 different parts of speech: VERB (1653; 61% instances), NOUN (309; 11% instances), ADJ (237; 9% instances), SCONJ (187; 7% instances), ADV (174; 6% instances), CCONJ (147; 5% instances), NUM (13; 0% instances), PRON (7; 0% instances), (2; 0% instances), ADP (1; 0% instances), PROPN (1; 0% instances)
1242 (45%) NOUN nodes are leaves.
1153 (42%) NOUN nodes have one child.
243 (9%) NOUN nodes have two children.
93 (3%) NOUN nodes have three or more children.
The highest child degree of a NOUN node is 6.
Children of NOUN nodes are attached using 23 different relations: amod (423; 22% instances), acl (391; 20% instances), compound (276; 14% instances), punct (264; 14% instances), det (151; 8% instances), nmod (140; 7% instances), fixed (105; 5% instances), nummod (99; 5% instances), advmod (15; 1% instances), conj (13; 1% instances), advcl (11; 1% instances), nsubj (11; 1% instances), obj (10; 1% instances), obl (9; 0% instances), cc (7; 0% instances), case (6; 0% instances), dislocated (5; 0% instances), iobj (5; 0% instances), ccomp (4; 0% instances), aux (3; 0% instances), dep (3; 0% instances), reparandum (2; 0% instances), xcomp (1; 0% instances)
Children of NOUN nodes belong to 14 different parts of speech: VERB (469; 24% instances), ADJ (414; 21% instances), NOUN (309; 16% instances), PUNCT (264; 14% instances), DET (151; 8% instances), PRON (126; 6% instances), NUM (107; 5% instances), ADV (40; 2% instances), CCONJ (37; 2% instances), SCONJ (17; 1% instances), PROPN (10; 1% instances), ADP (6; 0% instances), AUX (3; 0% instances), INTJ (1; 0% instances)