Treebank Statistics: UD_Urdu-UDTB: Features: Case
This feature is universal.
It occurs with 6 different values: Acc
, Dat
, Erg
, Gen
, Ins
, Nom
.
Some words have combined values of the feature; 4 combinations have been observed: Acc|Dat
, Acc|Erg
, Acc|Gen
, Acc|Ins
.
75768 tokens (55%) have a non-empty value of Case
.
9227 types (85%) occur at least once with a non-empty value of Case
.
8471 lemmas (89%) occur at least once with a non-empty value of Case
.
The feature is used with 14 part-of-speech tags: NOUN (32674; 24% instances), PROPN (17054; 12% instances), ADP (10907; 8% instances), ADJ (5581; 4% instances), PRON (5187; 4% instances), DET (1954; 1% instances), VERB (1578; 1% instances), ADV (475; 0% instances), AUX (189; 0% instances), NUM (94; 0% instances), PART (55; 0% instances), X (8; 0% instances), SCONJ (7; 0% instances), CCONJ (5; 0% instances).
NOUN
32674 NOUN tokens (99% of all NOUN
tokens) have a non-empty value of Case
.
The most frequent other feature values with which NOUN
and Case
co-occurred: Person=3 (32430; 99%), Number=Sing (27395; 84%), Gender=Masc (26421; 81%).
NOUN
tokens may have the following values of Case
:
Acc
(17199; 53% of non-emptyCase
): حکومت، عوام، پولیس، طور، انتخابات، ملک، عہدیداروں، عمل، اجلاس، پارٹیNom
(15475; 47% of non-emptyCase
): حاصل، آج، بات، کام، پولیس، وزیر، چیف، وقت، ضلع، ڈاکٹرEMPTY
(295): اللہ، علیہ، صلی، وسلم، رضی، مرحوم، عائد، عنہ، قرار، نقصان
Paradigm حکومت | Nom | Acc |
---|---|---|
Gender=Masc|Number=Sing | حکومت | حکومت |
Gender=Masc|Number=Plur | حکومتیں | حکومتوں |
Gender=Fem|Number=Sing | حکومت | حکومت |
Gender=Fem|Number=Plur | حکومتیں | حکومتوں, حکومتیں |
PROPN
17054 PROPN tokens (100% of all PROPN
tokens) have a non-empty value of Case
.
The most frequent other feature values with which PROPN
and Case
co-occurred: Person=3 (17027; 100%), Number=Sing (16976; 100%), Gender=Masc (16237; 95%).
PROPN
tokens may have the following values of Case
:
Acc
(7129; 42% of non-emptyCase
): کانگریس، ہندوستان، ریڈی، سنگھ، پاکستان، پی، امریکہ، آئی، مئی، اپریلNom
(9925; 58% of non-emptyCase
): پی، سی، بی، ایس، آئی، ٹی، ڈی، محمد، آر، جےEMPTY
(83): برائے، و، -، 27، ایک، 09، 2009، 25، 28، 29
Paradigm پی | Nom | Acc |
---|---|---|
Gender=Masc | پی, بی | پی |
Gender=Fem | پی | پی |
ADP
10907 ADP tokens (39% of all ADP
tokens) have a non-empty value of Case
.
The most frequent other feature values with which ADP
and Case
co-occurred: AdpType=Post (10307; 94%), Number=Sing (10268; 94%), Gender=Masc (6954; 64%).
ADP
tokens may have the following values of Case
:
Acc
(5103; 47% of non-emptyCase
): کے، کی، کا، والے، جانب، وجہ، بارے، تعلق، والوں، حیثیتNom
(5804; 53% of non-emptyCase
): کی، کا، بعد، ساتھ، کے، دوران، جانب، خلاف، قبل، ذریعہEMPTY
(17257): نے، سے، کے، مےں، کو، پر، میں، لیے، تک، لئے
Paradigm کا | Nom | Acc |
---|---|---|
AdpType=Post|Gender=Masc|Number=Sing | کا, کے, کی | کے, کا, کی, سے, نے |
AdpType=Post|Gender=Masc|Number=Sing|Person=3 | کا, کے | |
AdpType=Post|Gender=Masc|Number=Sing|Person=3|Polite=Form | کے | کے |
AdpType=Post|Gender=Masc|Number=Plur | کے | کے |
AdpType=Post|Gender=Masc|Number=Plur|Person=3 | کے | |
AdpType=Post|Gender=Masc|Number=Plur|Person=3|Polite=Form | کے | کے |
AdpType=Post|Gender=Fem | کی | |
AdpType=Post|Gender=Fem|Number=Sing | کی, کا, کو, کے | کی, کے, والی, کا |
AdpType=Post|Gender=Fem|Number=Sing|Person=3 | کی | |
AdpType=Post|Gender=Fem|Number=Plur | کی | کی |
AdpType=Post|Number=Sing | کا | |
AdpType=Post|Number=Sing|Person=3 | کو | |
AdpType=Post|Number=Plur | کے | |
Aspect=Perf|Gender=Fem|Number=Sing|VerbForm=Part | کی | |
Gender=Masc | کے |
ADJ
5581 ADJ tokens (55% of all ADJ
tokens) have a non-empty value of Case
.
The most frequent other feature values with which ADJ
and Case
co-occurred: Gender=EMPTY (4691; 84%).
ADJ
tokens may have the following values of Case
:
Acc
(3099; 56% of non-emptyCase
): سرکاری، سابق، دیگر، مختلف، ریاستی، مقامی، سیاسی، تمام، امریکی، مسلمNom
(2482; 44% of non-emptyCase
): سابق، گزشتہ، سخت، اہم، شدید، ریاستی، بہترین، دیگر، سیاسی، تمامEMPTY
(4538): جاری، شامل، موجود، پیدا، ہلاک، منعقد، ظاہر، فراہم، قائم، واضح
Paradigm جاری | Nom | Acc |
---|---|---|
جاری, جاریہ | جاری |
PRON
5187 PRON tokens (93% of all PRON
tokens) have a non-empty value of Case
.
The most frequent other feature values with which PRON
and Case
co-occurred: PronType=Prs (5102; 98%), Gender=EMPTY (4591; 89%), Polite=EMPTY (4433; 85%), Person=3 (3742; 72%), Number=Sing (3505; 68%).
PRON
tokens may have the following values of Case
:
Acc
(2656; 51% of non-emptyCase
): اس، ان، انہوں، جس، اپنے، اپنی، کسی، انھوں، جن، آپAcc,Dat
(365; 7% of non-emptyCase
): انہیں، اسے، انھیں، جسے، انہوں، ہمیں، مجھے، جنہیں، میرے، اُنھیںAcc,Gen
(35; 1% of non-emptyCase
): ان، ہم، میری، میرا، اس، جس، میرے، ہمارےAcc,Ins
(3; 0% of non-emptyCase
): ازیںNom
(2128; 41% of non-emptyCase
): وہ، جو، یہ، کوئی، اب، یہاں، اپنے، جب، اپنی، جہاںEMPTY
(409): سب، جو، خود، تو، کیا، اب، جب، کچھ، کیوں، انہوں
Paradigm یہ | Acc,Dat | Acc,Gen | Acc,Ins | Nom | Acc |
---|---|---|---|---|---|
Gender=Masc|Number=Sing|Person=3|Polite=Form|Poss=Yes|PronType=Prs | ان | ||||
Gender=Masc|Number=Sing|Person=3|Polite=Form|PronType=Prs | انہیں, انھیں, اُنھیں | ان | |||
Gender=Masc|Number=Sing|Person=3|PronType=Prs | انہیں | اس | |||
Gender=Masc|Number=Plur|Person=3|Polite=Form|PronType=Prs | انہیں, انھیں | انہوں | |||
Gender=Masc|Number=Plur|Person=3|PronType=Prs | انہیں | ||||
Gender=Fem|Number=Sing|Person=3|Polite=Form|PronType=Prs | انہیں | ||||
Gender=Fem|Number=Sing|Person=3|PronType=Dem | اسی | ||||
Number=Sing|Person=3|Polite=Form|PronType=Prs | انہیں, اِنھیں | انہیں | ان | ||
Number=Sing|Person=3|Poss=Yes|PronType=Prs | اس, ان | ||||
Number=Sing|Person=3|PronType=Dem | اس, یہ | اس, ان | |||
Number=Sing|Person=3|PronType=Prs | اسے, انہیں | یہ, اس, ان, یہی | اس, ان, اسی, اِس, اسے, یہ | ||
Number=Sing|PronType=Prs | اسی, یہی | ||||
Number=Plur|Person=3|Polite=Form|Poss=Yes|PronType=Prs | ان | ||||
Number=Plur|Person=3|Polite=Form|PronType=Prs | انہیں, ان | ان | |||
Number=Plur|Person=3|Poss=Yes|PronType=Prs | ان | ||||
Number=Plur|Person=3|PronType=Dem | ان | ||||
Number=Plur|Person=3|PronType=Prs | انہیں | یہ, ان, انھیں | ان, یہ | ||
Person=3|Polite=Form|PronType=Prs | انہیں | انہیں | |||
Person=3|PronType=Prs | یہی | ||||
PronType=Prs | ازیں | یہاں, یہ, یہی | ازیں, اسی |
DET
1954 DET tokens (78% of all DET
tokens) have a non-empty value of Case
.
The most frequent other feature values with which DET
and Case
co-occurred: PronType=Dem (1867; 96%), Person=3 (1775; 91%), Number=Sing (1671; 86%).
DET
tokens may have the following values of Case
:
Acc
(1045; 53% of non-emptyCase
): اس، ان، ایسے، اسی، دیگر، کسی، جن، جس، ایسی، اُسAcc,Dat
(1; 0% of non-emptyCase
): ہمNom
(908; 46% of non-emptyCase
): یہ، اس، اسی، کوئی، جو، وہ، ان، ایسے، ایسا، یہیEMPTY
(542): کئی، تمام، کچھ، ہر، چند، بعض، زیادہ، کم، بہت، کیا
Paradigm یہ | Nom | Acc |
---|---|---|
Gender=Masc|Number=Sing|Person=3 | یہ, اسی | |
Gender=Masc|Number=Sing | اس, اسی | اسی |
Gender=Fem|Number=Sing | اسی | اسی |
Gender=Fem|Number=Plur | ایسی | ایسی |
Number=Sing|Person=3 | یہ, اس, اسی, یہی, ان, اِس | اس, ان, اسی, یہ, یہی |
Number=Sing | اسی, یہی | اسی |
Number=Plur|Person=3 | یہ, ان, اِن | ان, اس |
Number=Plur | ان | |
اسی, یہی, اس | اسی |
VERB
1578 VERB tokens (13% of all VERB
tokens) have a non-empty value of Case
.
The most frequent other feature values with which VERB
and Case
co-occurred: Person=EMPTY (1557; 99%), Aspect=EMPTY (1540; 98%), Voice=EMPTY (1513; 96%), Number=EMPTY (1487; 94%), Gender=EMPTY (1477; 94%), VerbForm=Inf (1476; 94%).
VERB
tokens may have the following values of Case
:
Acc
(1497; 95% of non-emptyCase
): کرنے، ہونے، رکھنے، دینے، بنانے، لینے، آنے، رہنے، جانے، لگانےNom
(81; 5% of non-emptyCase
): کی، کرنے، کرنا، جانا، پڑھنا، کر، کھیل، گھرے، آنے، اٹھاناEMPTY
(10284): کیا، کہا، کر، کی، ہو، کرتے، ہے، بتایا، دیا، دی
Paradigm کر | Nom | Acc |
---|---|---|
_ | کر, کی | |
Aspect=Perf|Gender=Masc|Number=Sing|Person=3|VerbForm=Part | کیے | |
Aspect=Perf|Gender=Masc|Number=Sing|VerbForm=Part | کئے, کیے | |
Aspect=Perf|Gender=Fem|Number=Sing|VerbForm=Part | کی | |
Aspect=Perf|Gender=Fem|Number=Sing|VerbForm=Part|Voice=Act | کی | |
Aspect=Perf|Number=Sing|VerbForm=Part | کیے | |
Aspect=Perf|Person=3|VerbForm=Part|Voice=Act | کی | |
Aspect=Perf|VerbForm=Part | کئے, کرنے, کی, کیے | |
Gender=Masc|Number=Sing|VerbForm=Inf | کرنا | |
Gender=Masc|Number=Plur|Person=3|Voice=Act | کر | |
Gender=Masc|Number=Plur|VerbForm=Inf | کرنے | |
Gender=Masc|VerbForm=Inf | کرنے | کرنے |
Gender=Fem|Number=Sing|Person=3|Voice=Pass | کی | |
Gender=Fem|Number=Sing|Voice=Act | کی | |
Number=Plur|VerbForm=Inf | کرنے | |
VerbForm=Inf | کرنے, کرنا | کرنے, کرنا, کیے, کی |
VerbForm=Inf|Voice=Act | کرنے, کرنا | |
VerbForm=Inf|Voice=Pass | کرنے | |
Voice=Act | کر |
ADV
475 ADV tokens (34% of all ADV
tokens) have a non-empty value of Case
.
The most frequent other feature values with which ADV
and Case
co-occurred: AdvType=EMPTY (474; 100%), Number=Sing (435; 92%), Gender=Masc (433; 91%), Person=3 (410; 86%), AdpType=Post (371; 78%).
ADV
tokens may have the following values of Case
:
Acc
(45; 9% of non-emptyCase
): جانب، پہلے، بعد، خاصکر، دن، اندر، زاید، سب، قبل_ازیں، کلیدیNom
(430; 91% of non-emptyCase
): پیش، بعد، پہلے، دوران، طرف، آگے، باہر، جانب، سامنے، قبلEMPTY
(911): پھر، بہت، سے، پیش، مزید، دوبارہ، انتہائی، جلد، ہمیشہ، ہنوز
Paradigm بعد | Nom | Acc |
---|---|---|
AdpType=Post | بعد | |
AdpType=Post|Person=3 | بعد, بعدازاں | بعد |
Person=3 | بعد, بعدازاں | بعد |
AUX
189 AUX tokens (2% of all AUX
tokens) have a non-empty value of Case
.
The most frequent other feature values with which AUX
and Case
co-occurred: Mood=EMPTY (188; 99%), Tense=EMPTY (188; 99%), Voice=EMPTY (187; 99%), Aspect=EMPTY (178; 94%), Person=EMPTY (177; 94%), Gender=EMPTY (143; 76%), Number=EMPTY (142; 75%), VerbForm=Inf (141; 75%).
AUX
tokens may have the following values of Case
:
Acc
(164; 87% of non-emptyCase
): جانے، دینے، کے، کرنے، لینے، پڑنے، والے، پڑا، آنے، جاناAcc,Erg
(1; 1% of non-emptyCase
): جانےNom
(24; 13% of non-emptyCase
): دیا، جا، والا، والی، کی، کے، تھا، لو، والے، چکےEMPTY
(9800): ہے، ہیں، ہوئے، گیا، تھا، ہےں، جا، گئی، گئے، تھی
Paradigm جا | Acc,Erg | Nom | Acc |
---|---|---|---|
_ | جانے | جا | |
Aspect=Perf|VerbForm=Part | جانے | ||
Gender=Masc|Number=Sing | جا | ||
Gender=Masc|Number=Sing|VerbForm=Inf | جانے, جانا | ||
Gender=Masc|VerbForm=Inf | جانے | ||
Number=Plur|VerbForm=Inf | جانے | ||
VerbForm=Inf | جانے |
NUM
94 NUM tokens (4% of all NUM
tokens) have a non-empty value of Case
.
The most frequent other feature values with which NUM
and Case
co-occurred: NumType=Card (94; 100%).
NUM
tokens may have the following values of Case
:
Acc
(66; 70% of non-emptyCase
): اےک، دونوں، تین، تینوں، کروڑ، ہزار، 30، ایک، لاکھ، چارNom
(28; 30% of non-emptyCase
): دونوں، ایک، لاکھ، 02، 4، 50، آدھ، ارب، اےک، تینEMPTY
(2367): اےک، ایک، دو، تین، دونوں، لاکھ، پانچ، ہزار، چار، کروڑ
Paradigm اےک | Nom | Acc |
---|---|---|
Gender=Masc|Number=Sing | اےک | |
اےک | اےک |
PART
55 PART tokens (2% of all PART
tokens) have a non-empty value of Case
.
The most frequent other feature values with which PART
and Case
co-occurred: Polarity=EMPTY (55; 100%), PronType=EMPTY (55; 100%).
PART
tokens may have the following values of Case
:
Acc
(18; 33% of non-emptyCase
): بغیر، سالہ، کرام، کے، ہذا، بلا، بھلے، تعالی، حضرت، رفتہNom
(37; 67% of non-emptyCase
): مسٹر، جناب، جیسے، تر، فی، مبارک، مسز، گویا، تعالیٰ، حضراتEMPTY
(2985): بھی، نہیں، مسٹر، ہی، نہ، صرف، جناب، کہ، تو، بغیر
Paradigm حضرت | Nom | Acc |
---|---|---|
Number=Sing | حضرت | |
Number=Sing|Person=3 | حضرت | |
Number=Plur | حضرات |
Case
seems to be lexical feature of PART
. 93% lemmas (25) occur only with one value of Case
.
X
8 X tokens (36% of all X
tokens) have a non-empty value of Case
.
The most frequent other feature values with which X
and Case
co-occurred: Foreign=EMPTY (8; 100%), Gender=Masc (6; 75%), Number=Sing (5; 63%), Person=3 (5; 63%).
X
tokens may have the following values of Case
:
Acc
(4; 50% of non-emptyCase
): کتنے، افسوس، کاشNom
(4; 50% of non-emptyCase
): کاش، افسوس، جانےEMPTY
(14): خدارا، آخر، ئن، را، لوڈ، نئچ، نسبتاً، نہ، واقعی، چلو
Paradigm کاش | Nom | Acc |
---|---|---|
کاش | کاش |
SCONJ
7 SCONJ tokens (0% of all SCONJ
tokens) have a non-empty value of Case
.
SCONJ
tokens may have the following values of Case
:
Acc
(2; 29% of non-emptyCase
): توNom
(5; 71% of non-emptyCase
): ،، اگر، تب، گویاEMPTY
(2666): کہ، تو، اگر، کیونکہ، تاکہ، بلکہ، حالانکہ، چنانچہ، ,، کیوںکہ
CCONJ
5 CCONJ tokens (0% of all CCONJ
tokens) have a non-empty value of Case
.
CCONJ
tokens may have the following values of Case
:
Acc
(2; 40% of non-emptyCase
): اور، وNom
(3; 60% of non-emptyCase
): و، تاہمEMPTY
(3243): اور، و، لیکن، جبکہ، تاہم، یا، مگر، نیز، لہذا، آیا
Relations with Agreement in Case
The 10 most frequent relations where parent and child node agree in Case
:
NOUN –[amod]–> ADJ (4451; 74%),
NOUN –[nmod]–> NOUN (3359; 53%),
NOUN –[nmod]–> PROPN (1903; 65%),
NOUN –[det]–> DET (1623; 69%),
NOUN –[conj]–> NOUN (808; 74%),
PROPN –[nmod]–> NOUN (724; 55%),
NOUN –[nmod]–> PRON (714; 58%),
PROPN –[conj]–> PROPN (661; 88%),
PROPN –[nmod]–> PROPN (480; 65%),
PROPN –[amod]–> ADJ (173; 57%).