Statistics of DET in UD

home edit page issue tracker

This page pertains to UD version 2.

It appears that you have Javascript disabled. Please consider enabling Javascript for this page to see the visualizations.

Treebank Statistics: UD_Korean-PUD: POS Tags: `DET`

There are 3 DET lemmas (0%), 54 DET types (1%) and 464 DET tokens (3%). Out of 13 observed tags, the rank of DET is: 10 in number of lemmas, 10 in number of types and 10 in number of tokens.

The 10 most frequent DET lemmas: _, 있는가, 총

The 10 most frequent DET types: 그, 이, 두, 한, 다른, 여러, 모든, 만, 몇, 세

The 10 most frequent ambiguous lemmas: _ (NOUN 4295, VERB 1439, PROPN 1030, ADJ 596, ADV 516, DET 462, CCONJ 125, AUX 104, X 47, NUM 27, PRON 24, PUNCT 1)

The 10 most frequent ambiguous types: 그 (DET 127, NOUN 4), 이 (DET 52, PART 16, NOUN 3, PRON 1, PROPN 1), 한 (DET 35, VERB 10, NOUN 2, ADV 1, AUX 1, X 1), 다른 (DET 20, ADJ 6), 만 (DET 12, PART 5, NUM 1), 세 (NOUN 12, DET 11), 전 (NOUN 11, DET 9), 억 (DET 6, NUM 1), 천 (DET 3, NUM 1), 수 (NOUN 121, DET 2)

그
- DET 127: 판발카르는 그들이 그 건물에서 나와야 할 것 같은 느낌이 든 때가 있었다고 말했다 .
- NOUN 4: 최근 인터뷰에서 레이비는 일부 남자들이 그런 부류에 속하며 보노도 그 중 한 사람 이라 고 말했다 .
이
- DET 52: 이 부분에서 게임과 우리 일상 생활 사이의 유사점을 찾을 수 있습니다 .
- PART 16: 경찰 대변인은 “ 몇 마디 주고 받은 “ 후 “ 언쟁 “ 이 벌어졌지만 부상자는 없었다고 연합 통신에 밝혔다 .
- NOUN 3: 카리브 해는 1492 년까지 유라시아 사람들에게 는 알려지지 않은 곳 이었는데 이 때 크리스토퍼 콜럼버스 가 아시아 항로 탐색을 위한 목적으로 처음으로 카리브 해를 항해했다 .
- PRON 1: 원래 기단은 1950 년대에 일기 예보를 위해 사용되었지만 기상학자들은 1973 년 이 아이디어를 기반으로 종관 기후학 이란 분야를 만들기 시작했다 .
- PROPN 1: 이 박사는 “ 아고라 ( Agora ) 는 초대를 받아야만 입장할 수 있었지만 이 시장의 대부분은 검색 방법만 알면 쉽게 접근할 수 있다 ” 라고 덧붙였다 .
한
- DET 35: 한 목격자의 경찰 진술에 따르면 피해자가 4 월에 용의자를 공격했었다고 한다 .
- VERB 10: 감독의 관점에서 볼 때 그 영화는 유쾌한 가족 극과 직설적 인 사회 극 사이에서 위태위태하게 줄다리기를 한 작품 이다 .
- NOUN 2: 예술가들이 사람들의 심금을 울리는 순간만 이 우리가 서로의 차이점을 제쳐 두고 한 자리 에 모여 있는 순간 이다.
- ADV 1: 그는 “ 이것으로 남성 호르몬 피임법을 위한 올바른 조합을 찾기 위한 긴 여정에 한 발 들여놓게 되었다 “ 라고 덧붙였다 .
- AUX 1: 오늘 아침에 배포된 사진에 도 불구하고 B.C. 경찰은 애버츠포드 고등 학교 십 대 여학생을 칼로 찔러 죽게 한 혐의로 기소된 노숙자에 대해 알아낸 것보다 모르는 것이 더 많다고 말했다 .
- X 1: 나는 어쨌든 감옥에 가게 될 테 고 그만 한 가치가 있는 일 이기 를 바라요 .
다른
- DET 20: 당연히 중국은 공격용 헬리콥터와 수상 비행기 등 다른 군사 무기도 이번 주에 대량 선보일 것 이다 .
- ADJ 6: 70 년대 디자인과 는 다른 솜털 무늬 ( 표면을 덮는 것이 포인트 ) 가 다시 비상하고 있다 .
만
- DET 12: 그해 성공 보수 및 상여금 총액은 150 만 달러 였고 이는 2015 - 2016 년과 비슷한 수준 이었다 .
- PART 5: 이전에는 이런 제트기들을 블로그에서 만 볼 수 있었다 .
- NUM 1: 아시아와 태평양 지역의 경우 , 3 백만에서 1 천만 명 정도 ( 약 750 만 정도로 추산 ) 가 일본군에 의해 학살을 당했으며 이 중 대부분이 중국인 이었다 .
세
- NOUN 12: 모이미르 I 세 ( 830 - 846 년 통치 ) 가 초대 왕 이었다 .
- DET 11: 마치 그가 뒤집어 놓은 컵 세 잔 밑으로 공을 앞뒤로 휙휙 치고 있는 것 같았다 .
전
- NOUN 11: 천미부 기형종은 출생 전 태아기에 신생아의 꼬리뼈에서 자라는 종양 이다 .
- DET 9: 레이비는 그녀의 목소리가 말 그대로 전 세계를 누비고 다녔다고 말했다 .
억
- DET 6: 연간 예산이 14 억 달러를 넘고 , 직원 수는 6,000 명을 넘는다 .
- NUM 1: 그에 비해 , 2004 년에 운영을 시작한 NoMa infill Metro 전철 역을 짓는 데 1 억 370 만 달러가 소요되었다 .
천
- DET 3: 2 천 년 전 특정 일자를 기준으로 달의 기울기를 계산할 수 있지만 구름이나 연무로 인해 방해를 받는 경우는 불가능하다 .
- NUM 1: 2015 년 이 지역의 투자금은 6 % 상승한 2 천 2 백 1 십억 달러를 기록했다 .
수
- NOUN 121: 그녀가 하는 말과 그녀가 하는 행동은 사실 , 믿을 수 없을 정도 이다 .
- DET 2: 몬순은 계절풍으로 수 개월간 지속되며 해당 지역의 우기를 관장한다 .

Morphology

The form / lemma ratio of DET is 18.000000 (the average of all parts of speech is 3.181543).

The 1st highest number of forms (52) was observed with the lemma “_”: 각, 구, 그, 그런, 네, 다른, 다섯, 단, 두, 만, 몇, 몇몇, 모든, 새, 서른, 성, 세, 수, 수백만, 수백억, 수십, 수십억, 수천, 십, 십억, 아닌가, 아무, 약, 어느, 어떠한가, 어떤, 어떤가, 억, 여덟, 여러, 여섯, 열, 옛, 오랜, 온, 이, 이런, 일곱, 있겠는가, 있는가, 전, 천, 천만, 첫, 총, 한, 현.

The 2nd highest number of forms (1) was observed with the lemma “있는가”: 있는가를.

The 3rd highest number of forms (1) was observed with the lemma “총”: 총으로.

DET occurs with 5 features: PronType (7; 2% instances), VerbForm (7; 2% instances), Polite (2; 0% instances), Case (1; 0% instances), Typo (1; 0% instances)

DET occurs with 5 feature-value pairs: Case=Acc, Polite=Form, PronType=Int, Typo=Yes, VerbForm=Fin

DET occurs with 5 feature combinations. The most frequent feature combination is _ (455 tokens). Examples: 그, 이, 두, 한, 다른, 여러, 모든, 만, 몇, 세

Relations

DET nodes are attached to their parents using 5 different relations: det (456; 98% instances), root (5; 1% instances), advcl (1; 0% instances), ccomp (1; 0% instances), obl (1; 0% instances)

Parents of DET nodes belong to 8 different parts of speech: NOUN (445; 96% instances), PROPN (6; 1% instances), (5; 1% instances), VERB (3; 1% instances), PRON (2; 0% instances), ADJ (1; 0% instances), DET (1; 0% instances), NUM (1; 0% instances)

430 (93%) DET nodes are leaves.

26 (6%) DET nodes have one child.

5 (1%) DET nodes have two children.

3 (1%) DET nodes have three or more children.

The highest child degree of a DET node is 4.

Children of DET nodes are attached using 8 different relations: nummod (25; 54% instances), nsubj (7; 15% instances), punct (5; 11% instances), advmod (4; 9% instances), advcl (2; 4% instances), compound:lvc (1; 2% instances), det (1; 2% instances), goeswith (1; 2% instances)

Children of DET nodes belong to 8 different parts of speech: NUM (25; 54% instances), NOUN (7; 15% instances), PUNCT (5; 11% instances), ADJ (3; 7% instances), ADV (3; 7% instances), DET (1; 2% instances), PRON (1; 2% instances), X (1; 2% instances)

Treebank Statistics: UD_Korean-PUD: POS Tags: DET

Morphology

Relations

Treebank Statistics: UD_Korean-PUD: POS Tags: `DET`