Treebank Statistics: UD_Georgian-GLC: Features: Case
This feature is universal.
It occurs with 7 different values: Dat
, Erg
, Ess
, Gen
, Ins
, Nom
, Voc
.
37748 tokens (63%) have a non-empty value of Case
.
12632 types (83%) occur at least once with a non-empty value of Case
.
7219 lemmas (81%) occur at least once with a non-empty value of Case
.
The feature is used with 7 part-of-speech tags: NOUN (20371; 34% instances), ADJ (8930; 15% instances), ADP (3452; 6% instances), PRON (2806; 5% instances), PROPN (1567; 3% instances), NUM (388; 1% instances), VERB (234; 0% instances).
NOUN
20371 NOUN tokens (99% of all NOUN
tokens) have a non-empty value of Case
.
The most frequent other feature values with which NOUN
and Case
co-occurred: Animacy=Inan (19122; 94%), Number=Sing (15812; 78%).
NOUN
tokens may have the following values of Case
:
Dat
(4624; 23% of non-emptyCase
): წელს, დროს, წლებ, საუკუნე, განმავლობა, საფუძველ, პერიოდ, შემთხვევა, პროცეს, ტერიტორიაErg
(198; 1% of non-emptyCase
): მეცნიერმა, განვითარებამ, მექანიკამ, ქიმიკოსმა, გამოყენებამ, ფიზიკოსმა, ადამიანმა, ასტრონომმა, აღმოჩენებმა, გამოგონებამEss
(339; 2% of non-emptyCase
): შედეგად, მაგალითად, საფუძვლად, მეცნიერებად, მიზნად, დღე, დაწყება, ფუძემდებლად, წლება, დისციპლინადGen
(7834; 38% of non-emptyCase
): საუკუნის, ადამიანის, განვითარების, დედამიწის, წლის, სამართლის, ხელოვნების, ენის, კვლევის, მეურნეობისIns
(990; 5% of non-emptyCase
): მიზნით, საშუალებით, წლი, სახით, გაგებით, გამოყენებით, განსხვავებით, დაკავშირებით, შედარებით, წლებიNom
(6385; 31% of non-emptyCase
): მეცნიერება, დარგი, ტერმინი, ნაწილი, მნიშვნელობა, სამართალი, სისტემა, მიზანი, ისტორია, მოძღვრებაVoc
(1; 0% of non-emptyCase
): ფაქტოEMPTY
(233): მაგ., წ., ა.შ, ა., ი., ა.შ., გ., დ., კ., რ.
Paradigm დარგი | Nom | Erg | Dat | Gen | Ins | Ess |
---|---|---|---|---|---|---|
Number=Sing | დარგი | დარგმა | დარგ, დარგს | დარგის | დარგად | |
Number=Sing|PartType=Emp | დარგადაც | |||||
Number=Plur | დარგები | დარგებ, დარგებს | დარგების, დარგთა, დარგებისა | დარგები | დარგებად | |
Number=Plur|PartType=Emp | დარგებ |
ADJ
8930 ADJ tokens (97% of all ADJ
tokens) have a non-empty value of Case
.
The most frequent other feature values with which ADJ
and Case
co-occurred: Number=Sing (8819; 99%), Degree=EMPTY (7721; 86%).
ADJ
tokens may have the following values of Case
:
Dat
(1785; 20% of non-emptyCase
): სხვადასხვა, თანამედროვე, ქიმიურ, ძველ, ზოგად, ფიზიკურ, ცოცხალ, ახალ, მრავალ, საერთაშორისოErg
(62; 1% of non-emptyCase
): გერმანელმა, რუსმა, ამერიკელმა, ინგლისელმა, არნახულმა, აღიარებულმა, ახალმა, ბიოფარმულმა, ბირთვულმა, ბიჰევიორისტულმაEss
(218; 2% of non-emptyCase
): დამოუკიდებელ, უმთავრესად, ბოლო, თანამედროვე, ისტორიულად, მეტად, უმეტესად, ძირითად, ახლად, ბუნებრივადGen
(3082; 35% of non-emptyCase
): სხვადასხვა, ქიმიური, საერთაშორისო, ახალი, მსოფლიო, ისტორიული, ფიზიკური, ქართული, თანამედროვე, სამეცნიეროIns
(407; 5% of non-emptyCase
): ფართო, სხვადასხვა, უძველესი, ბერძნული, სპეციალური, ფიზიკური, ქიმიური, ბოლო, გარკვეული, საერთოNom
(3376; 38% of non-emptyCase
): ძირითადი, დიდი, დაკავშირებული, მნიშვნელოვანი, მთავარი, საერთაშორისო, ცნობილი, ახალი, სამეცნიერო, ქიმიურიEMPTY
(245): ბერძნ., უფრო, ძვ., ინგლ., ლათ., ე.წ., ახ., ლიტ., ფრანგ., აზერ.
Paradigm ძველი | Nom | Erg | Dat | Gen | Ins | Ess |
---|---|---|---|---|---|---|
Degree=Pos|Number=Sing | ძველი | ძველ | ძველ | ძველი | ძველი | |
Degree=Pos|Number=Plur | ძველთა | |||||
Degree=Pos|Number=Plur|PartType=Emp | ძველთა | |||||
Degree=Sup|Number=Sing | უძველესი | უძველეს | უძველესი | უძველესი | უძველეს |
ADP
3452 ADP tokens (100% of all ADP
tokens) have a non-empty value of Case
.
The most frequent other feature values with which ADP
and Case
co-occurred: AdpType=Post (3446; 100%).
ADP
tokens may have the following values of Case
:
Dat
(2442; 71% of non-emptyCase
): ში, ზე, თან, შორის, შიც, შუა, ზეც, თანავე, ზევე, თანაცEss
(92; 3% of non-emptyCase
): მდე, დმი, დანGen
(675; 20% of non-emptyCase
): თვის, გან, შესახებ, მიერ, გამო, მიმართ, კენ, გარდა, გამოც, განაცIns
(242; 7% of non-emptyCase
): დან, დანვე, დანაცNom
(1; 0% of non-emptyCase
): ვით
Paradigm დან | Ins | Ess |
---|---|---|
დან, დანვე, დანაც | დან |
Case
seems to be lexical feature of ADP
. 94% lemmas (15) occur only with one value of Case
.
PRON
2806 PRON tokens (98% of all PRON
tokens) have a non-empty value of Case
.
The most frequent other feature values with which PRON
and Case
co-occurred: Poss=EMPTY (2461; 88%), Number=Sing (2351; 84%), Person=EMPTY (1565; 56%).
PRON
tokens may have the following values of Case
:
Dat
(776; 28% of non-emptyCase
): მათ, მას, რომლის, სხვა, რომელსაც, ყველა, ამ, რომელ, იმ, მისErg
(63; 2% of non-emptyCase
): მან, რომელმაც, ამ, რამაც, მანვე, მათ, ამან, მე, მისმა, რამEss
(22; 1% of non-emptyCase
): ერთ-ერთ, თავად, ასეთ, სხვა, ერთ, ერთადერთ, თავადვე, იმ, რამდენიმე, რანაირადGen
(756; 27% of non-emptyCase
): მისი, ამ, მათი, სხვა, მის, იმ, მათ, ყველა, რომელთა, ერთიIns
(88; 3% of non-emptyCase
): ამ, სხვა, იმ, თავისი, ამით, ერთი, ისეთი, მისი, იმით, სხვNom
(1101; 39% of non-emptyCase
): რომელიც, იგი, რომლებიც, ეს, სხვა, ერთ-ერთი, ის, მისი, ისინი, ყველაEMPTY
(43): სხვ., თვით, სხვ, თავად, თვითონ, რა, ამავე, ასეთივე
Paradigm სხვა | Nom | Erg | Dat | Gen | Ins | Ess |
---|---|---|---|---|---|---|
Number=Sing | სხვა, სხვ. | სხვა | სხვა | სხვა | სხვა, სხვ | სხვა |
Number=Plur | სხვები | სხვათა, სხვებს | სხვათა |
PROPN
1567 PROPN tokens (100% of all PROPN
tokens) have a non-empty value of Case
.
The most frequent other feature values with which PROPN
and Case
co-occurred: Number=Sing (1549; 99%).
PROPN
tokens may have the following values of Case
:
Dat
(306; 20% of non-emptyCase
): საქართველო, ევროპა, თბილის, საქართველოს, გერმანია, ამერიკა, რუსეთ, საბერძნეთ, არისტოტელეს, ბაბილონErg
(146; 9% of non-emptyCase
): ალექსანდრე, ივანე, ჯონ, ანტონ, ბარიმ, გოეთემ, გრიგორ, დე, იოზეფ, ლაისტერმაEss
(2; 0% of non-emptyCase
): ანგსტრემა, ინდოეთაGen
(780; 50% of non-emptyCase
): საქართველოს, თბილისის, აზერბაიჯანის, ამერიკის, კავკასიის, ვახტანგ, ნიუტონის, ალექსანდრე, ევროპის, კონფუცისIns
(6; 0% of non-emptyCase
): ამიერკავკასიით, აფრიკი, აღმოსავლეთ, აღმოსავლეთით, ევროპი, რუსეთიNom
(327; 21% of non-emptyCase
): არისტოტელე, მაგმური, საქართველო, ალექსანდრე, გიორგი, იულიუს, აფრიკანუსი, მიხეილ, პლატონი, ფერმაEMPTY
(4): პ., დუაითი, შ.
Paradigm ევროპა | Nom | Dat | Gen | Ins |
---|---|---|---|---|
ევროპა | ევროპა, ევროპასა | ევროპის | ევროპი | |
PartType=Emp | ევროპა |
NUM
388 NUM tokens (38% of all NUM
tokens) have a non-empty value of Case
.
The most frequent other feature values with which NUM
and Case
co-occurred: NumForm=EMPTY (364; 94%), Number=Sing (364; 94%), NumType=Ord (195; 50%).
NUM
tokens may have the following values of Case
:
Dat
(68; 18% of non-emptyCase
): მეორე, ერთ, პირველ, ორ, ბევრ, ათას, მესამე, ოთხ, მილიარდ, სამErg
(4; 1% of non-emptyCase
): პირველმა, VI-მEss
(28; 7% of non-emptyCase
): პირველ, ორ, ერთ, ათასა, მეორე, პირველად, 1859-1870-, 300-, 500-, ბევრადGen
(110; 28% of non-emptyCase
): მეორე, პირველი, ორი, ერთი, სამი, VI-ის, ხუთი, I-ის, მეოცე, ათასიIns
(26; 7% of non-emptyCase
): ერთი, ორი, სამი, პირველი, 103-, 199-, 20-, 2000–, 800-, მეორეNom
(152; 39% of non-emptyCase
): პირველი, ორი, ერთი, ბევრი, მეორე, სამი, ცოტა, ხუთი, მილიონი, ოთხიEMPTY
(637): XIX, XX, XVII, XVIII, II, 1992, 1999, 2, 1, 2008
Paradigm ერთი | Nom | Erg | Dat | Gen | Ins | Ess |
---|---|---|---|---|---|---|
Number=Sing|NumType=Card | ერთი, ერთ– | ერთ | ერთი, ერთ | ერთი | ერთ | |
Number=Sing|NumType=Card|PartType=Emp | ერთიცა | |||||
Number=Sing|NumType=Ord | პირველი | პირველმა | პირველ, პირველსა | პირველი, ერთი, პირველ | პირველი | პირველ, პირველად |
Number=Sing|NumType=Ord|PartType=Emp | პირველივე | |||||
Number=Plur|NumType=Ord | პირველთაგანი |
VERB
234 VERB tokens (6% of all VERB
tokens) have a non-empty value of Case
.
The most frequent other feature values with which VERB
and Case
co-occurred: Number[subj]=EMPTY (234; 100%), Person[io]=EMPTY (234; 100%), Person[obj]=EMPTY (234; 100%), Person[subj]=EMPTY (234; 100%), Subcat=EMPTY (234; 100%), Voice=EMPTY (234; 100%), Aspect=EMPTY (138; 59%), Mood=Ind (132; 56%).
VERB
tokens may have the following values of Case
:
Dat
(35; 15% of non-emptyCase
): წამყვან, გამოსხივებას, საცდელ, წამყვანი, ამონთხევისას, ამღერებულ, გადახურება, გადმოკვეთისას, გამოდენას, გამოდნობასErg
(2; 1% of non-emptyCase
): გახშირებულმა, დისკრეტულმაEss
(3; 1% of non-emptyCase
): ასაჭრელად, დამუხტულ, შესიტყვებებადGen
(99; 42% of non-emptyCase
): დანალექი, დამუხტული, გამოსხივების, სარწყავი, დაგეგმარების, დაკრისტალების, დაპროექტებისა, დაუსწრებელი, მოკვლევისა, მორწყვისIns
(9; 4% of non-emptyCase
): შესანიშნავი, დამლევი, მორწყვით, მოძრაობით, ნაღველით, შერევით, შესუნთქვით, ჩანერგვითNom
(86; 37% of non-emptyCase
): ასახული, დამზადებული, დანალექი, დარაიონება, არაევკლიდური, დამსახურებული, დამუხტული, სარწყავი, საცდელი, შესიტყვებაEMPTY
(3636): შეისწავლის, აქვს, შეიძლება, წარმოადგენს, გამოიყენება, მოიცავს, არსებობს, სწავლობს, ჩამოყალიბდა, იყენებენ
Paradigm დამუხტული | Nom | Dat | Gen | Ess |
---|---|---|---|---|
Number=Sing | დამუხტული | დამუხტულ | დამუხტული | დამუხტულ |
Number=Plur | დამუხტულებს |
Relations with Agreement in Case
The 10 most frequent relations where parent and child node agree in Case
:
NOUN –[amod]–> ADJ (6624; 96%),
NOUN –[conj]–> NOUN (2929; 96%),
NOUN –[case]–> ADP (2774; 99%),
NOUN –[det]–> PRON (784; 82%),
NOUN –[nsubj]–> NOUN (691; 95%),
ADJ –[conj]–> ADJ (501; 98%),
ADJ –[nsubj]–> NOUN (373; 95%),
ADJ –[amod]–> ADJ (319; 77%),
NOUN –[appos]–> NOUN (289; 64%),
PRON –[case]–> ADP (245; 97%).