Treebank Statistics: UD_Hindi-HDTB: Features: Case
This feature is universal.
It occurs with 7 different values: Acc
, Dat
, Erg
, Gen
, Ine
, Ins
, Nom
.
Some words have combined values of the feature; 5 combinations have been observed: Acc|Dat
, Acc|Erg
, Acc|Gen
, Acc|Ine
, Acc|Ins
.
189511 tokens (54%) have a non-empty value of Case
.
16016 types (84%) occur at least once with a non-empty value of Case
.
14023 lemmas (90%) occur at least once with a non-empty value of Case
.
The feature is used with 14 part-of-speech tags: NOUN (78053; 22% instances), PROPN (42541; 12% instances), ADP (26352; 7% instances), ADJ (14784; 4% instances), PRON (14042; 4% instances), VERB (6557; 2% instances), DET (4933; 1% instances), ADV (1386; 0% instances), AUX (535; 0% instances), NUM (288; 0% instances), PART (29; 0% instances), X (8; 0% instances), SCONJ (2; 0% instances), PUNCT (1; 0% instances).
NOUN
78053 NOUN tokens (100% of all NOUN
tokens) have a non-empty value of Case
.
The most frequent other feature values with which NOUN
and Case
co-occurred: Person=3 (77402; 99%), Number=Sing (62781; 80%), Gender=Masc (49748; 64%).
NOUN
tokens may have the following values of Case
:
Acc
(42114; 54% of non-emptyCase
): सरकार, लोगों, मामले, पुलिस, देश, पार्टी, सूत्रों, क्षेत्र, नेताओं, बैठकAcc,Dat
(1; 0% of non-emptyCase
): हमेंNom
(35938; 46% of non-emptyCase
): शुरू, बात, लोग, पुलिस, सरकार, बार, समय, जानकारी, चुनाव, फैसलाEMPTY
(102): ऑफ, एवं, रिटर्न, एक, वन, व, आस, एंड, ऑन, और
Paradigm सरकार | Nom | Acc |
---|---|---|
Gender=Masc|Number=Sing|Person=3 | सरकार | |
Gender=Masc|Number=Plur|Person=3 | सरकारों | |
Gender=Fem|Number=Sing | सरकार | |
Gender=Fem|Number=Sing|Person=3 | सरकार | सरकार |
Gender=Fem|Number=Plur|Person=3 | सरकारें, सरकार | सरकारों |
PROPN
42541 PROPN tokens (99% of all PROPN
tokens) have a non-empty value of Case
.
The most frequent other feature values with which PROPN
and Case
co-occurred: Person=3 (41484; 98%), Number=Sing (41327; 97%), Gender=Masc (31009; 73%).
PROPN
tokens may have the following values of Case
:
Acc
(21276; 50% of non-emptyCase
): सिंह, भारत, पाकिस्तान, कांग्रेस, भाजपा, दिल्ली, सरकार, प्रधानमंत्री, प्रदेश, मंत्रालयNom
(21265; 50% of non-emptyCase
): भारत, प्रधानमंत्री, मंत्री, सिंह, कांग्रेस, के., दिल्ली, मनमोहन, उत्तर, भाजपाEMPTY
(399): ऑफ, एवं, एंड, ए, और, द, फॉर, के, व, ऑल
Paradigm सिंह | Nom | Acc |
---|---|---|
Gender=Masc | सिंह | सिंह |
सिंह | सिंह |
ADP
26352 ADP tokens (36% of all ADP
tokens) have a non-empty value of Case
.
The most frequent other feature values with which ADP
and Case
co-occurred: AdpType=Post (25399; 96%), Number=Sing (21243; 81%), Gender=Masc (17512; 66%).
ADP
tokens may have the following values of Case
:
Acc
(13222; 50% of non-emptyCase
): के, की, कारण, ओर, रूप, वजह, समय, जैसे, तरह, अनुसारAcc,Gen
(25; 0% of non-emptyCase
): का, की, केNom
(13105; 50% of non-emptyCase
): का, की, के, साथ, बाद, दौरान, बीच, पहले, पास, सामनेEMPTY
(46863): में, को, के, ने, से, पर, लिए, तक, द्वारा, बारे
Paradigm का | Acc,Gen | Nom | Acc |
---|---|---|---|
AdpType=Post | का, के | के | |
AdpType=Post|Gender=Masc | के | ||
AdpType=Post|Gender=Masc|Mood=Ind|Number=Sing|Person=3|Polite=Form|Tense=Past|VerbForm=Fin | के | ||
AdpType=Post|Gender=Masc|Number=Sing | का, के, की | के, का, की | |
AdpType=Post|Gender=Masc|Number=Sing|Person=2|Polite=Form | के | ||
AdpType=Post|Gender=Masc|Number=Sing|Person=3 | का, की | के | |
AdpType=Post|Gender=Masc|Number=Sing|Person=3|Polite=Form | के | के | |
AdpType=Post|Gender=Masc|Number=Sing|Poss=Yes | का, के | ||
AdpType=Post|Gender=Masc|Number=Plur | के, का | के, का | |
AdpType=Post|Gender=Masc|Number=Plur|Person=3 | के | के | |
AdpType=Post|Gender=Masc|Number=Plur|Poss=Yes | के | ||
AdpType=Post|Gender=Fem | की | की | |
AdpType=Post|Gender=Fem|Number=Sing | की, के | की, के, का | |
AdpType=Post|Gender=Fem|Number=Sing|Person=3 | की | की | |
AdpType=Post|Gender=Fem|Number=Sing|Poss=Yes | की | ||
AdpType=Post|Gender=Fem|Number=Plur | की | की, के | |
AdpType=Post|Gender=Fem|Number=Plur|Person=3 | की | ||
AdpType=Post|Gender=Fem|Number=Plur|Poss=Yes | की | ||
Gender=Masc|Number=Sing | का | के | |
Gender=Masc|Number=Sing|Person=3|Polite=Form | के | ||
Gender=Masc|Number=Plur | के | ||
Gender=Fem|Number=Sing | की | की |
ADJ
14784 ADJ tokens (68% of all ADJ
tokens) have a non-empty value of Case
.
The most frequent other feature values with which ADJ
and Case
co-occurred: Number=EMPTY (10868; 74%), Gender=EMPTY (10844; 73%).
ADJ
tokens may have the following values of Case
:
Acc
(10029; 68% of non-emptyCase
): अन्य, वाले, पूर्व, भारतीय, स्थित, वरिष्ठ, पिछले, अमेरिकी, सरकारी, राजनीतिकNom
(4755; 32% of non-emptyCase
): विशेष, पूर्व, मुख्य, अन्य, वाले, अंतिम, अलग, पूरा, पूरी, महत्वपूर्णEMPTY
(6861): शामिल, जारी, तैयार, पेश, दर्ज, गौरतलब, बंद, लागू, तय, गिरफ्तार
Paradigm वाला | Nom | Acc |
---|---|---|
Gender=Masc | वाले | |
Gender=Masc|Number=Sing | वाला, वाले | वाले, वाला |
Gender=Masc|Number=Sing|Person=3 | वाला | वाला, वाले |
Gender=Masc|Number=Sing|Person=3|Polite=Form | वाले | वाले |
Gender=Masc|Number=Plur | वाले | वाले, वालों |
Gender=Masc|Number=Plur|Person=3 | वाले, वालों | |
Gender=Fem|Number=Sing | वाली | वाली |
Gender=Fem|Number=Sing|Person=3 | वाली | |
Gender=Fem|Number=Plur | वाली | वाली |
Number=Plur | वाले |
PRON
14042 PRON tokens (96% of all PRON
tokens) have a non-empty value of Case
.
The most frequent other feature values with which PRON
and Case
co-occurred: PronType=Prs (13992; 100%), Poss=EMPTY (11222; 80%), Polite=EMPTY (11161; 79%), Gender=EMPTY (10528; 75%), Person=3 (9913; 71%), Number=Sing (9287; 66%).
PRON
tokens may have the following values of Case
:
Acc
(2311; 16% of non-emptyCase
): अपने, किसी, अपनी, इस, अब, अभी, यहाँ, यहां, सभी, वहांAcc,Dat
(1164; 8% of non-emptyCase
): उन्हें, उसे, इसे, हमें, जिसे, मुझे, इन्हें, जिन्हें, आपको, उनकोAcc,Erg
(1758; 13% of non-emptyCase
): उन्होंने, उसने, हमने, मैंने, जिसने, जिन्होंने, आपने, इन्होंने, किसने, इसनेAcc,Gen
(2820; 20% of non-emptyCase
): इसके, उनके, उनकी, उसके, इसका, उनका, इसकी, उसकी, उसका, हमारेAcc,Ine
(482; 3% of non-emptyCase
): इसमें, जिसमें, इनमें, जिनमें, उसमें, उनमें, हममेंAcc,Ins
(511; 4% of non-emptyCase
): इससे, जिससे, उनसे, उससे, इनसे, जिनसे, सबसे, मुझसे, हमसे, उनकेNom
(4996; 36% of non-emptyCase
): यह, वह, कोई, अब, वे, जब, जो, यहां, हम, अपनाEMPTY
(660): तो, इसलिए, क्या, कभी, कैसे, क्यों, अब, अभी, इसीलिए, यहां
Paradigm वह | Acc,Dat | Acc,Erg | Acc,Gen | Acc,Ine | Acc,Ins | Nom | Acc |
---|---|---|---|---|---|---|---|
Gender=Masc|Number=Sing|Person=3|Polite=Form|Poss=Yes | उनके, उनका, उनकी | ||||||
Gender=Masc|Number=Sing|Person=3|Polite=Form | उन्हें | उन्होंने | उनसे | वे | उन | ||
Gender=Masc|Number=Sing|Person=3|Poss=Yes | उसके, उसका, उनका, उनके | ||||||
Gender=Masc|Number=Sing|Person=3 | उन्होंने, उसने | वही | उसी | ||||
Gender=Masc|Number=Plur|Person=3|Polite=Form|Poss=Yes | उनके | ||||||
Gender=Masc|Number=Plur|Person=3|Poss=Yes | उनके, उनका, उसके, उनकी | ||||||
Gender=Masc|Number=Plur|Person=3 | उन्होंने | वे | |||||
Gender=Masc|Number=Plur | उनके | ||||||
Gender=Fem|Number=Sing|Person=3|Polite=Form|Poss=Yes | उनकी | ||||||
Gender=Fem|Number=Sing|Person=3|Polite=Form | उनकी | उन्होंने | |||||
Gender=Fem|Number=Sing|Person=3|Poss=Yes | उसकी, उनकी | ||||||
Gender=Fem|Number=Sing|Person=3 | उसने | वह | |||||
Gender=Fem|Number=Plur|Person=3|Poss=Yes | उनकी | ||||||
Gender=Fem|Person=3|Polite=Form|Poss=Yes | उनकी | ||||||
Gender=Fem|Poss=Yes | उनकी | ||||||
Number=Sing|Person=3|Polite=Form|Poss=Yes | उनके, उनकी, उनका, उनको | ||||||
Number=Sing|Person=3|Polite=Form | उन्हें, उनको, उनकी, उनसे | उन्होंने, उन्होंने, उन्होनें, उसने | उनमें | उनसे | वे, वो, वह | उन, उन्होंने, वे | |
Number=Sing|Person=3|Poss=Yes | उसके, उनके, उसकी, उस, उसका | ||||||
Number=Sing|Person=3 | उसे, उसको, उन्हें | उसने, उन्होंने | उसमें | उससे, उनसे | वह, वही, वो, वे | उस, उसी, उसके, वह | |
Number=Plur|Person=3|Poss=Yes | उनके, उनकी, उनका, उन्हें | ||||||
Number=Plur|Person=3 | उन्हें, उनको, उनकी, उन्हें | उन्होंने | उनमें | उनसे | वे, वह, वही | उन, वे, उन्हें, उन्हीं | |
Number=Plur | उन्हें |
VERB
6557 VERB tokens (18% of all VERB
tokens) have a non-empty value of Case
.
The most frequent other feature values with which VERB
and Case
co-occurred: Aspect=EMPTY (6517; 99%), Voice=EMPTY (6508; 99%), VerbForm=Inf (6482; 99%), Gender=EMPTY (6314; 96%), Person=EMPTY (6071; 93%), Number=EMPTY (3416; 52%).
VERB
tokens may have the following values of Case
:
Acc
(5674; 87% of non-emptyCase
): करने, होने, देने, बनाने, आने, लेने, मिलने, रखने, कराने, जानेAcc,Erg
(9; 0% of non-emptyCase
): जाने, ढूंढ़ने, पहुंचने, सुलझाने, कराने, बांटने, मांगने, संभालनेAcc,Gen
(2; 0% of non-emptyCase
): करकेNom
(872; 13% of non-emptyCase
): कहना, करना, मानना, देना, होना, देखना, रखना, जाना, बनाना, लेनाEMPTY
(29402): कहा, किया, कर, की, दिया, हो, है, बताया, दी, हुई
Paradigm करना | Acc,Gen | Nom | Acc |
---|---|---|---|
_ | कर | ||
Aspect=Imp|Gender=Masc|Number=Sing|VerbForm=Part | करते | ||
Aspect=Imp|VerbForm=Part | करते | ||
Aspect=Perf|Number=Sing|Person=3|VerbForm=Part | किए | ||
Aspect=Perf|Number=Sing|VerbForm=Part | किए | ||
Aspect=Perf|VerbForm=Part | किए | ||
Gender=Masc|Number=Sing|Person=3|Polite=Form|VerbForm=Inf|Voice=Act | करने | ||
Gender=Masc|Number=Sing|Person=3|VerbForm=Inf|Voice=Act | करना | करने | |
Gender=Masc|Number=Sing|VerbForm=Inf | करने | ||
Gender=Masc|Number=Sing|Voice=Act | कर | ||
Gender=Masc|VerbForm=Inf | करने | ||
Gender=Masc|VerbForm=Inf|Voice=Act | करने | ||
Gender=Fem|Number=Sing|Person=3|VerbForm=Inf|Voice=Act | करने | ||
Gender=Fem|Number=Sing|Person=3|Voice=Act | कर | ||
Gender=Fem|VerbForm=Inf | करने | ||
Number=Sing|Person=3|Polite=Form|VerbForm=Inf | करने | ||
Number=Sing|Person=3|VerbForm=Inf | करने | ||
Number=Sing|Person=3|VerbForm=Inf|Voice=Act | करना | ||
Number=Sing|VerbForm=Inf | करने, करवाने | ||
Number=Sing|VerbForm=Inf|Voice=Act | करने | ||
Number=Plur|Person=3|VerbForm=Inf | करने | ||
Number=Plur|VerbForm=Inf | करने, करवाने | ||
Poss=Yes | करके | ||
VerbForm=Inf | करना, करने, करवाना | करने, करना, करवाना, कराने | |
VerbForm=Inf|Voice=Act | करना | करना |
DET
4933 DET tokens (66% of all DET
tokens) have a non-empty value of Case
.
The most frequent other feature values with which DET
and Case
co-occurred: PronType=Dem (4722; 96%), Person=3 (4546; 92%), Number=Sing (3980; 81%).
DET
tokens may have the following values of Case
:
Acc
(3518; 71% of non-emptyCase
): इस, इन, इसी, उस, उन, ऐसे, जिस, उसी, जिन, ऐसीNom
(1415; 29% of non-emptyCase
): यह, ये, जो, ऐसा, इस, यही, ऐसी, ऐसे, हम, वहीEMPTY
(2592): कुछ, कई, सभी, कम, ज्यादा, काफी, अधिक, और, हर, बहुत
Paradigm यह | Nom | Acc |
---|---|---|
Gender=Masc|Number=Sing|Person=3 | यही, यह | इस, इसी, यही |
Gender=Masc|Number=Sing | इसी | |
Gender=Masc|Number=Plur|Person=3 | इन्हीं | |
Gender=Fem|Number=Sing|Person=3 | इसी, यह | इसी, ऐसी |
Gender=Fem|Number=Plur|Person=3 | इन्हीं | |
Number=Sing|Person=1 | इसी | |
Number=Sing|Person=3|Polite=Form | इन | |
Number=Sing|Person=3 | यह, इस, यही, ये, इसी | इस, इसी, यह |
Number=Sing | इस | |
Number=Plur|Person=3 | ये, इन, यह, यही | इन, इन्हीं, ये |
ADV
1386 ADV tokens (42% of all ADV
tokens) have a non-empty value of Case
.
The most frequent other feature values with which ADV
and Case
co-occurred: AdvType=EMPTY (1384; 100%), Number=Sing (1380; 100%), AdpType=Post (1373; 99%), Person=3 (1371; 99%), Gender=Masc (1331; 96%).
ADV
tokens may have the following values of Case
:
Acc
(247; 18% of non-emptyCase
): बाद, पहले, बाहर, पूर्व, पास, आगे, आसपास, ऊपर, साथ, बीचAcc,Gen
(1; 0% of non-emptyCase
): बहुतNom
(1138; 82% of non-emptyCase
): बाद, पहले, आगे, साथ, दौरान, सामने, दूर, बीच, बाहर, पीछेEMPTY
(1921): सबसे, फिर, वहीं, जल्द, लगातार, फिलहाल, बहुत, जमकर, दोबारा, बार
Paradigm बाद | Nom | Acc |
---|---|---|
Number=Sing | बाद | |
Number=Sing|Person=3 | बाद | बाद |
Person=3 | बाद |
AUX
535 AUX tokens (2% of all AUX
tokens) have a non-empty value of Case
.
The most frequent other feature values with which AUX
and Case
co-occurred: Voice=EMPTY (535; 100%), Mood=EMPTY (534; 100%), Tense=EMPTY (534; 100%), Aspect=EMPTY (532; 99%), Person=EMPTY (532; 99%), Number=EMPTY (527; 99%), VerbForm=Inf (527; 99%), Gender=EMPTY (525; 98%).
AUX
tokens may have the following values of Case
:
Acc
(499; 93% of non-emptyCase
): जाने, पाने, रहने, होने, जाना, पाना, सकने, जानी, पड़नेAcc,Erg
(1; 0% of non-emptyCase
): जानेNom
(35; 7% of non-emptyCase
): जाना, पाना, कर, पड़ती, रहना, है, रहाEMPTY
(23221): है, हैं, गया, था, गई, हुए, गए, थी, जा, रहे
Paradigm जाना | Acc,Erg | Nom | Acc |
---|---|---|---|
_ | जाने | ||
Gender=Masc|Number=Sing|VerbForm=Inf | जाने | ||
Gender=Masc|VerbForm=Inf | जाने | ||
Gender=Fem|VerbForm=Inf | जानी | ||
VerbForm=Inf | जाना | जाने, जाना |
NUM
288 NUM tokens (4% of all NUM
tokens) have a non-empty value of Case
.
The most frequent other feature values with which NUM
and Case
co-occurred: NumType=Card (288; 100%).
NUM
tokens may have the following values of Case
:
Acc
(277; 96% of non-emptyCase
): दोनों, करोड़, हजार, लाख, शून्य, एक, तीन, १०, चार, छहNom
(11; 4% of non-emptyCase
): दोनों, पौने, एक, करोड़ों, चारों, दसियों, दो, ४६EMPTY
(6452): एक, दो, दोनों, तीन, करोड़, चार, लाख, हजार, पांच, छह
Paradigm एक | Nom | Acc |
---|---|---|
Number=Sing | एक | |
एक | एक |
Case
seems to be lexical feature of NUM
. 96% lemmas (107) occur only with one value of Case
.
PART
29 PART tokens (0% of all PART
tokens) have a non-empty value of Case
.
The most frequent other feature values with which PART
and Case
co-occurred: Polarity=EMPTY (29; 100%), PronType=EMPTY (29; 100%).
PART
tokens may have the following values of Case
:
Acc
(5; 17% of non-emptyCase
): सी, गुना, जैसे, सेNom
(24; 83% of non-emptyCase
): सी, सा, गुना, भी, सेEMPTY
(6980): भी, नहीं, ही, न, तो, करीब, से, भर, लगभग, सिर्फ
Paradigm सा | Nom | Acc |
---|---|---|
Gender=Masc|Number=Sing | सा | |
Gender=Masc|Number=Plur | से | |
Gender=Fem | सी | सी |
Gender=Fem|Number=Sing | सी | सी |
Gender=Fem|Number=Plur | सी |
X
8 X tokens (6% of all X
tokens) have a non-empty value of Case
.
The most frequent other feature values with which X
and Case
co-occurred: Foreign=EMPTY (8; 100%).
X
tokens may have the following values of Case
:
Acc
(1; 13% of non-emptyCase
): बडेNom
(7; 88% of non-emptyCase
): अलग, अपने, भूरि, दर्जन, साथEMPTY
(132): पास, रिकॉर्ड, डाउनलोड, फिट, फेल, बुक, आउट, आफ, इंटरसेप्ट, रेफर
SCONJ
2 SCONJ tokens (0% of all SCONJ
tokens) have a non-empty value of Case
.
SCONJ
tokens may have the following values of Case
:
Nom
(2; 100% of non-emptyCase
): जैसाEMPTY
(6724): कि, तो, हालांकि, अगर, यदि, क्योंकि, ताकि, बहरहाल, बल्कि, यानि
PUNCT
1 PUNCT tokens (0% of all PUNCT
tokens) have a non-empty value of Case
.
PUNCT
tokens may have the following values of Case
:
Nom
(1; 100% of non-emptyCase
): (EMPTY
(23454): ।, ,, -, ., ‘, ), (, -JOIN, ?, ‘1
Relations with Agreement in Case
The 10 most frequent relations where parent and child node agree in Case
:
NOUN –[amod]–> ADJ (11601; 97%),
NOUN –[nmod]–> PROPN (4459; 53%),
NOUN –[det]–> DET (4379; 65%),
PROPN –[nmod]–> NOUN (2151; 77%),
PROPN –[conj]–> PROPN (2139; 93%),
NOUN –[conj]–> NOUN (1913; 91%),
PROPN –[nmod]–> PROPN (1496; 62%),
PROPN –[amod]–> ADJ (687; 76%),
NOUN –[det]–> PRON (642; 98%),
ADJ –[amod]–> ADJ (356; 94%).