home edit page issue tracker

This page pertains to UD version 2.

Treebank Statistics: UD_Korean-PUD: POS Tags: PROPN

There are 424 PROPN lemmas (16%), 1319 PROPN types (16%) and 1676 PROPN tokens (10%). Out of 13 observed tags, the rank of PROPN is: 2 in number of lemmas, 2 in number of types and 2 in number of tokens.

The 10 most frequent PROPN lemmas: _, 중국, 영국, 미국, 러시아, 마케도니아, 유럽, 프랑스, 그리스, 독일

The 10 most frequent PROPN types: 미국, 영국, 중국, 중국의, 유럽, 지중해, 트럼프, 프랑스, 그리스, 독일

The 10 most frequent ambiguous lemmas: _ (NOUN 4325, VERB 1625, PROPN 1035, ADJ 609, ADV 517, DET 463, AUX 458, CCONJ 125, NUM 27, PRON 24, X 3, PUNCT 1), 지구 (PROPN 2, NOUN 1), 자신들 (PRON 3, PROPN 1)

The 10 most frequent ambiguous types: 유럽 (PROPN 8, NOUN 1), of (PROPN 4, X 1), 공화당 (PROPN 4, NOUN 1), 일 (NOUN 32, AUX 12, PROPN 3), 청 (PROPN 3, NOUN 1), 노스 (NOUN 4, PROPN 2), 데 (NOUN 7, PROPN 2), 북 (NOUN 2, PROPN 2), 인도 (NOUN 2, PROPN 2), 레코드 (NOUN 3, PROPN 1)

Morphology

The form / lemma ratio of PROPN is 3.110849 (the average of all parts of speech is 3.165468).

The 1st highest number of forms (765) was observed with the lemma “_”: ‘s, A, America, American, Andes, Art, Aviva, Avro, B.C., BA, BBC, BID, Bank, Bass, Benoît, Brands, Breaking, Brisbane, Bruyn, Buck, Buena, CBC, CBS, CGI, CNN, CRTC, CTV, Center, Circuit, City, Civil, Club, Convention, Corporation, Cup, DFB, DPA, Davis, Dead, Die, Do, Dream, Dündar, EU, Energy, Erdogan, F1, FSLN, Friendship, GTA, Garden, Glasgow, Go, Günter, H, Health, Heart, Heritage, Hospitals, IAG, IRENA, If, Jadaan, Kigali, King, Knuck, Kori, Krätschmer, LUISS, Liberties, MGB, MahaNakhon, Marat, Marina, Mash, Mate, Merdingen, Metro, Metropolitan, Metti, Miami, Mohammed, Monster, Moscone, Multi, My, NATO, National, Natural, Nectar, New, News, Nine, NoMa, North, Now, Paire, Power, RECO, Return, SPIEGEL, SS, Sade, Salaman, SaskTel, School, Schulman, Select, Simon, Simple, Socialists, South, Spring, Stranger, Strategy, Style, Talking, Target, Team, Telekom, The, Things, Thought’, Tower, Traum, Uber, Union, Weiss, Winds, Winter, Ya, Yas, Yerba, York, You, Yum, Z., ZEIT, Zay, Zettel’s, al, and, andino, at, de, dinner, infill, massebot, n’t, night, of, one, tipo, Ötzi, 가나안, 가론, 가스, 가우디, 가톨릭, 개러드, 개신교, 갬슨, 거란, 게리, 게셀, 게오르크, 게이, 게이트, 게지라, 고든, 고려, 고프레도, 곤잘레스, 곤잘레즈, 골드, 골든, 공화당, 괌, 구글, 귄터, 그래닛, 그래비티, 그래프턴, 그레코, 그렌빌, 그룹, 그리스, 글래스고, 글로리아, 글린다, 기독교, 나스카, 나이틀리, 나일, 나치, 나토, 나폴레옹, 난징, 남, 남미, 남아프리카, 남해, 네간, 네덜란드, 네바다, 네스투스, 노마, 노스, 노스햄프턴, 노트, 노팅엄, 뉴욕, 뉴프랑스, 니콜라, 니콜라스, 니콜라이, 니트라, 다네비크, 다뉴브, 다르낭, 다티, 대루카스, 대모라비아, 대프랑스, 대한민국, 더글라스, 데, 데이비드, 데이비스, 데이비슨, 데카, 덴마크, 델, 델리, 델타, 도널드, 도미니카, 도쿠가와, 독일, 동, 동남아시아, 동아프리카, 둔다르, 드, 디, 디스, 디즈니, 디지보덴베르크, 디피에이, 딘, 라브로카, 라사, 라스, 라시다, 라이헨바흐, 라인, 라틴, 람세스, 랠리, 램블러, 러디어드, 러빙, 러시아, 런던, 레녹스, 레딧, 레이첼, 레코드, 로마, 로마노프, 로빈슨, 로스, 로시, 로코, 론, 루도비쿠스, 루마니아, 루이, 루터, 루페르츠베르크, 르, 리안, 리차드, 리처드, 리치, 린제이, 링컨, 마, 마가렛, 마드리드, 마렝고, 마로토, 마르코, 마블, 마야, 마이애미, 마이클, 마케도니아, 마크, 마틴, 마하나컨, 매스봇, 맥그리거, 맥닐, 머펫, 머피, 메르딘젠, 메세니아, 메스타, 메스트레, 메엔키엘리어, 메이, 메이지, 메자, 멕시코, 멜라니아, 모건, 모나코, 모라비아, 모리코네, 모빌, 모스콘, 모이미르, 몬트리올, 몰리세, 몽골, 문도, 미, 미국, 미군, 미셀, 미시시피, 미케네, 민주당, 밀리스, 바네즈, 바스, 바울, 바이스, 바티칸, 바하, 발렌티노, 발칸, 발트, 밴스, 버고인, 버지니아, 베네토, 베누아, 베르나르, 베르제론, 베를린, 베이징, 벨기에, 벨링스하우센, 벨링햄, 보거트, 보나파르트, 보이스트, 복드, 부머, 부시, 부에나, 부에노스, 북, 북서, 북아일랜드, 북한, 북해, 뷔르템베르크, 브라질, 브랜트, 브레멘, 브렉시트, 브로인, 브루노, 브루스, 브리스, 블라디보스토크, 비르누브, 비버리힐즈, 비안, 빅토리아스, 빈터, 빈터코른, 빌, 빌라, 빌보드, 사드, 사라, 사르코지, 사브리나, 사울, 사하라, 사헬, 산, 산체스, 산타, 살만, 상하이, 샌프란시스코, 샐리언, 생고뎅, 섀클턴, 서머싯, 선더랜드, 성공회, 세걸, 세레나, 세르비아, 세스토, 세실리아, 세인트, 소니, 솔하임, 쇼와, 수비안토, 수에즈, 수코타이, 쉥크, 슈피겔, 슐라이, 스마라그디스, 스웨덴, 스카이, 스코틀랜드, 스코틀랜드인, 스콧, 스크리티, 스타, 스턴리엡, 스테판, 스톨러, 스트래댄, 스틸러스, 스파르타, 스페인, 스페인계, 스페인어, 스포티파이, 슬라브, 슬로바키아, 시규어, 시몬, 시베리아, 시저, 시푸엔테스, 신약, 아나야, 아덴브룩, 아드난, 아드리아, 아랍, 아마르나, 아메리카, 아메리카인들, 아메리칸, 아무루, 아민, 아민타스, 아스티, 아시아, 아우스테를리츠, 아이레스, 아이빙엔, 아이슬란드, 아일랜드, 아카이아, 아케메네스, 아테네, 아풀리아, 아프리카, 안데스, 안드레, 안셀미, 안토니오, 안티파스, 안틸라스, 알래스카, 알렉산더, 알렉산드라, 알바니아, 알프스, 앙헬, 애버츠포드, 애킨슨, 앤드류, 앰네스티, 야니스, 야스, 야지디, 얌, 어니스트, 에드워드, 에든버러, 에라니, 에르도안, 에릭, 에볼, 에센, 에이버리, 엑슨, 엔니오, 엔듀어런스호, 엘, 영국, 영국민, 예바, 오데사, 오드리, 오르트푀, 오바마, 오블라스트, 오스만, 오스카, 오스트레일리아, 오스트리아, 오트, 오하이오, 온타리오, 올니, 올림픽, 와트, 외몽골, 외치, 요나라, 요제프, 요크, 우버, 우악삭툰, 우크라이나, 워싱턴, 원, 월마, 월트, 웨일즈, 웰스, 위안, 윈스턴, 윈햄, 윌리스, 윌리엄, 윌리엄스, 유대인, 유라시아, 유럽, 유엔, 이, 이렌, 이스탄불, 이슬람, 이슬람계, 이에야스, 이완, 이집트, 이탈리아, 인, 인도, 인도네시아, 인디애나, 일, 일본, 일본식, 잉글랜드, 자니, 자비에르, 자호리, 잘츠부르크, 전미, 제닝스, 제로니모, 제시, 제이슨, 제임스, 제프, 제프리, 조, 조셉, 조지타운, 존, 존슨, 졸리오, 주니어, 주데텐, 주안, 주커버그, 중국, 중국인, 중동, 지구, 지미, 지중해, 차이트, 채플, 챈들러, 천주교, 청, 체코, 체코슬로바키아, 추밀원, 친중국, 카데시, 카라칼라, 카를로스, 카리브, 카메룬, 카사, 카스텔프랑코, 카슨, 카운티, 카이로, 카탈라노, 카터, 카테리나, 카푸아, 칼라브리아, 캐나다, 캐러비안, 캐롤라이나, 캐스티븐, 캔자스, 캘리포니아, 커미, 컴벌랜드, 케냐, 케이라, 케이프, 켄터키, 켈트, 코라도, 코로나, 코르시카, 코른, 코스페달, 코카서스, 콜럼버스, 콜로라도, 콩고, 콩테, 쾰른, 쿠바, 쿠아론, 퀘벡, 퀴리, 큐메, 크라나흐, 크라우치, 크래츠머, 크레이머, 크리스, 크리스찬, 크리스토퍼, 크리스티나, 크리스틴, 크림, 클라레, 클린턴, 키갈리, 키키, 킬리만자로, 킹, 타운, 타피에, 탄자니아, 탈마지, 태평양, 터키, 터키인, 테네시, 테레사, 테슬라, 텍사스, 텔, 톈진, 토마스, 톰, 투트모세, 툴체아, 튜닙, 트라키아, 트럼프, 트레, 트로이, 트위터, 티나, 티오만, 티치노, 파나마, 파리, 파세라, 파티마, 파푸아뉴기니, 팝워스, 패컴, 팰런, 페니키아, 페데리코, 페드로, 페르, 페르시아, 페터슨, 페텐, 페트라시, 펠루카, 펠리니, 펠리페, 평양, 포, 포토맥, 폰, 폴, 폴란드, 폴리티, 퐁비에유, 푸에르토리코, 푼타, 프라보오, 프라이스, 프란츠, 프란치스코, 프랑스, 프랑스령, 프러시아군, 프요르, 플라자, 플랜태저넷, 플레이노, 플로렌스, 플로리다, 피가로, 피테카우스, 핀란드, 핀타도, 하버드, 하인리히, 한국, 한스, 할리, 합스부르크, 해머스미스, 핼리팩스, 햅번, 허드슨, 헐리우드, 험블범, 험프리, 헤롯, 헤르베리트, 헤츨러, 헨리, 헬레나, 호주, 홀덴, 홀스트롬, 홍콩, 화웨이, 후난, 후베이, 후줌, 휠, 휠러, 휴, 히스파니아, 힐러리, 힐즈버러.

The 2nd highest number of forms (7) was observed with the lemma “영국”: 영국과, 영국에, 영국에서, 영국에선, 영국은, 영국을, 영국의.

The 3rd highest number of forms (7) was observed with the lemma “중국”: 중국과, 중국에서, 중국으로, 중국은, 중국을, 중국의, 중국이.

PROPN occurs with 3 features: Polite (630; 38% instances), Case (592; 35% instances), Number (13; 1% instances)

PROPN occurs with 7 feature-value pairs: Case=Acc, Case=Advb, Case=Comp, Case=Gen, Case=Nom, Number=Plur, Polite=Form

PROPN occurs with 12 feature combinations. The most frequent feature combination is _ (1045 tokens). Examples: 미국, 영국, 중국, 유럽, 지중해, 트럼프, 프랑스, 그리스, 독일, 도널드

Relations

PROPN nodes are attached to their parents using 17 different relations: compound (503; 30% instances), nsubj (297; 18% instances), flat:name (269; 16% instances), advmod (205; 12% instances), nmod:poss (167; 10% instances), conj (78; 5% instances), obj (69; 4% instances), appos (51; 3% instances), nsubj:pass (14; 1% instances), root (6; 0% instances), acl:relcl (4; 0% instances), iobj (4; 0% instances), advcl (3; 0% instances), compound:lvc (2; 0% instances), dep (2; 0% instances), amod (1; 0% instances), orphan (1; 0% instances)

Parents of PROPN nodes belong to 10 different parts of speech: NOUN (1004; 60% instances), PROPN (376; 22% instances), VERB (224; 13% instances), ADJ (44; 3% instances), PART (12; 1% instances), (6; 0% instances), PRON (4; 0% instances), ADV (3; 0% instances), NUM (2; 0% instances), X (1; 0% instances)

1192 (71%) PROPN nodes are leaves.

202 (12%) PROPN nodes have one child.

151 (9%) PROPN nodes have two children.

131 (8%) PROPN nodes have three or more children.

The highest child degree of a PROPN node is 9.

Children of PROPN nodes are attached using 18 different relations: flat:name (269; 28% instances), dep:prt (172; 18% instances), punct (158; 16% instances), acl:relcl (105; 11% instances), conj (87; 9% instances), compound (57; 6% instances), appos (30; 3% instances), nmod:poss (17; 2% instances), cc (14; 1% instances), cop (13; 1% instances), advmod (9; 1% instances), nsubj (9; 1% instances), goeswith (8; 1% instances), det (6; 1% instances), amod (5; 1% instances), advcl (3; 0% instances), obl:tmod (2; 0% instances), orphan (2; 0% instances)

Children of PROPN nodes belong to 12 different parts of speech: PROPN (376; 39% instances), NOUN (186; 19% instances), PART (172; 18% instances), PUNCT (158; 16% instances), VERB (24; 2% instances), CCONJ (14; 1% instances), AUX (13; 1% instances), ADJ (8; 1% instances), ADV (6; 1% instances), DET (6; 1% instances), PRON (2; 0% instances), NUM (1; 0% instances)