Treebank Statistics: UD_Korean-PUD: Features: Case
This feature is universal.
It occurs with 3 different values: Acc, Gen, Nom.
3187 tokens (19%) have a non-empty value of Case.
2070 types (25%) occur at least once with a non-empty value of Case.
1617 lemmas (62%) occur at least once with a non-empty value of Case.
The feature is used with 8 part-of-speech tags: NOUN (2260; 14% instances), PROPN (440; 3% instances), PRON (309; 2% instances), PART (166; 1% instances), ADJ (5; 0% instances), NUM (5; 0% instances), AUX (1; 0% instances), DET (1; 0% instances).
NOUN
2260 NOUN tokens (28% of all NOUN tokens) have a non-empty value of Case.
The most frequent other feature values with which NOUN and Case co-occurred: Polite=Form (2250; 100%).
NOUN tokens may have the following values of Case:
Acc(894; 40% of non-emptyCase): 것을, 영향을, 모습을, 일을, 걸, 역할을, %를, 강을, 승리를, 시간을Gen(395; 17% of non-emptyCase): 지역의, 명의, 개의, 다수의, 사이의, 시대의, 최고의, 최초의, 국가의, 사람들의Nom(971; 43% of non-emptyCase): 것이, 것은, 정부는, 명이, 사람들이, 사람이, 경찰은, 이유는, 가능성이, 게EMPTY(5792): 년, 수, 것, 중, 월, 후, 말했다, 일, 때문에, 인해
| Paradigm 지역 | Nom | Acc | Gen |
|---|---|---|---|
| 지역은, 지역이 | 지역을 | 지역의 |
PROPN
440 PROPN tokens (26% of all PROPN tokens) have a non-empty value of Case.
The most frequent other feature values with which PROPN and Case co-occurred: Polite=Form (440; 100%).
PROPN tokens may have the following values of Case:
Acc(56; 13% of non-emptyCase): 남극을, 모라비아를, 영국을, 지중해를, 테르모필레를, Medal를, 광저우를, 그리스를, 대서양을, 독일을Gen(143; 33% of non-emptyCase): 중국의, 영국의, 마케도니아의, 유럽의, 태국의, 히치콕의, 더피의, 도스의, 러시아의, 로마의Nom(241; 55% of non-emptyCase): 미시마는, 블런트는, 스탈린은, 심괄은, 윈스턴은, 프랑스는, 가이어는, 그리스는, 디즈니는, 라이트는EMPTY(1237): 미국, 영국, 중국, 유럽, 지중해, 트럼프, 프랑스, 그리스, 독일, 도널드
| Paradigm 중국 | Nom | Acc | Gen |
|---|---|---|---|
| 중국은, 중국이 | 중국을 | 중국의 |
PRON
309 PRON tokens (83% of all PRON tokens) have a non-empty value of Case.
The most frequent other feature values with which PRON and Case co-occurred: Polite=Form (305; 99%), Number=EMPTY (273; 88%), Person=3 (162; 52%).
PRON tokens may have the following values of Case:
Acc(22; 7% of non-emptyCase): 이를, 그것을, 그를, 우리를, 그녀를, 그곳을, 나를, 이들을Gen(74; 24% of non-emptyCase): 자신의, 그의, 그녀의, 그들의, 이들의, 내, 자신들의, 나의, 여러분의, 우리의Nom(213; 69% of non-emptyCase): 그는, 그녀는, 나는, 그것은, 그들은, 이는, 그녀가, 자신이, 그가, 이것은EMPTY(65): 그곳에서, 누군, 그녀에게, 여기에서, 우리, 이것으로, 이로, 그것에, 그에게, 그와
| Paradigm 그 | Nom | Acc | Gen |
|---|---|---|---|
| 그는, 그가 | 그를 | 그의 |
PART
166 PART tokens (35% of all PART tokens) have a non-empty value of Case.
The most frequent other feature values with which PART and Case co-occurred: Polite=Form (166; 100%), VerbForm=EMPTY (158; 95%).
PART tokens may have the following values of Case:
Acc(29; 17% of non-emptyCase): 를, 을, 있음을, 나뉘어졌는가를, 되기를, 말고를, 주기를Gen(44; 27% of non-emptyCase): 의Nom(93; 56% of non-emptyCase): 는, 가, 은, 이, 됨은, 솟구침이EMPTY(312): 는, 고, 에, 도, 라고, 와, 에서, 과, 로, 만
Case seems to be lexical feature of PART. 100% lemmas (14) occur only with one value of Case.
ADJ
5 ADJ tokens (1% of all ADJ tokens) have a non-empty value of Case.
The most frequent other feature values with which ADJ and Case co-occurred: Form=EMPTY (5; 100%), Mood=EMPTY (5; 100%), VerbForm=Ger (3; 60%).
ADJ tokens may have the following values of Case:
Acc(2; 40% of non-emptyCase): 쌀쌀한지를, 있기를Nom(3; 60% of non-emptyCase): 놀랍기는, 심각함은, 있을지는EMPTY(624): 있는, 있다, 같은, 새로운, 큰, 많은, 이러한, 있었다, 없는, 높은
NUM
5 NUM tokens (1% of all NUM tokens) have a non-empty value of Case.
The most frequent other feature values with which NUM and Case co-occurred: NumType=Card (5; 100%).
NUM tokens may have the following values of Case:
Acc(1; 20% of non-emptyCase): 하나를Nom(4; 80% of non-emptyCase): 하나는, 1은EMPTY(508): 1, 10, 3, 2, 4, 6, 20, 8, 5, 9
| Paradigm 하나 | Nom | Acc |
|---|---|---|
| 하나는 | 하나를 |
AUX
1 AUX tokens (0% of all AUX tokens) have a non-empty value of Case.
The most frequent other feature values with which AUX and Case co-occurred: Form=EMPTY (1; 100%), Mood=EMPTY (1; 100%), Tense=EMPTY (1; 100%), VerbForm=Ger (1; 100%).
AUX tokens may have the following values of Case:
Acc(1; 100% of non-emptyCase): 있음을EMPTY(662): 인, 이다, 이었다, 이라, 였다, 있다, 있는, 이며, 일, 라
DET
1 DET tokens (0% of all DET tokens) have a non-empty value of Case.
DET tokens may have the following values of Case:
Acc(1; 100% of non-emptyCase): 있는가를EMPTY(463): 그, 이, 두, 한, 다른, 여러, 모든, 만, 몇, 세