UD Polish PDB
Language: Polish (code: pl
)
Family: Indo-European, Slavic
This treebank has been part of Universal Dependencies since the UD v1.2 release.
The following people have contributed to making this treebank part of UD: Alina Wróblewska, Daniel Zeman, Jan Mašek, Rudolf Rosa.
Repository: UD_Polish-PDB
Search this treebank on-line: PML-TQ
Download all treebanks: UD 2.12
License: CC BY-NC-SA 4.0
Genre: fiction, nonfiction, news
Questions, comments? General annotation questions (either Polish-specific or cross-linguistic) can be raised in the main UD issue tracker. You can report bugs in this treebank in the treebank-specific issue tracker on Github. If you want to collaborate, please contact [alina (æt) ipipan • waw • pl]. Development of the treebank happens outside the UD repository. If there are bugs, either the original data source or the conversion procedure must be fixed. Do not submit pull requests against the UD repository.
Annotation | Source |
---|---|
Lemmas | annotated manually in non-UD style, automatically converted to UD |
UPOS | annotated manually in non-UD style, automatically converted to UD |
XPOS | annotated manually |
Features | annotated manually in non-UD style, automatically converted to UD |
Relations | annotated manually in non-UD style, automatically converted to UD |
Description
The Polish PDB-UD treebank is based on the Polish Dependency Bank 2.0 (PDB 2.0), created at the Institute of Computer Science, Polish Academy of Sciences in Warsaw. The PDB-UD treebank is an extended and corrected version of the Polish SZ-UD treebank (the release 1.2 to 2.3).
The PDB-UD treebank consists of 22,152 sentences (350K tokens). It contains all 8K sentences of the Polish UD-SZ treebank and further 14K unique sentences. The additional sentences enclose linguistic phenomena that did not occur or were not annotated (e.g. relative clauses, reported speech) in the UD-SZ trees. The PDB-UD treebank contains enhanced graphs, i.e. trees with the enhanced edges encoding the shared dependents and the shared governors of coordinated conjuncts (9141 PDB-UD trees contain enhanced edges).
The morphological, syntactic and semantic annotation of the PDB-UD treebank is created through a conversion of PDB 2.0 data. The conversion procedure has been designed and implemented by Alina Wróblewska partly based on the conversion of the UD-SZ trees.
Acknowledgments
We would like to thank all of the contributors of the original Polish Dependency Bank 2.0. The development of the PDB-UD treebank was founded by the Polish Ministry of Science and Higher Education as part of the investment in the CLARIN-PL research infrastructure.
Statistics of UD Polish PDB
POS Tags
ADJ – ADP – ADV – AUX – CCONJ – DET – INTJ – NOUN – NUM – PART – PRON – PROPN – PUNCT – SCONJ – SYM – VERB – X
Features
Abbr – AdpType – Animacy – Aspect – Case – Clitic – ConjType – Degree – Emphatic – Foreign – Gender – Hyph – Mood – Number – Number[psor] – NumForm – NumType – PartType – Person – Polarity – Polite – Poss – PrepCase – PronType – Pun – PunctSide – PunctType – Reflex – Tense – Variant – VerbForm – VerbType – Voice
Relations
acl – acl:relcl – advcl – advcl:cmpr – advcl:relcl – advmod – advmod:arg – advmod:emph – advmod:neg – amod – amod:flat – appos – aux – aux:clitic – aux:cnd – aux:imp – aux:pass – case – cc – cc:preconj – ccomp – ccomp:cleft – ccomp:obj – conj – cop – csubj – csubj:pass – dep – det – det:numgov – det:nummod – det:poss – discourse:emo – discourse:intj – expl:pv – fixed – flat – flat:foreign – iobj – list – mark – nmod – nmod:arg – nmod:flat – nmod:poss – nmod:pred – nsubj – nsubj:pass – nummod – nummod:flat – nummod:gov – obj – obl – obl:agent – obl:arg – obl:cmpr – obl:orphan – orphan – parataxis:insert – parataxis:obj – punct – root – vocative – xcomp – xcomp:cleft – xcomp:pred – xcomp:subj
Tokenization and Word Segmentation
- This corpus contains 22152 sentences, 347377 tokens and 350036 syntactic words.
- This corpus contains 53073 tokens (15%) that are not followed by a space.
- This corpus contains 1 types of words with spaces. Examples: 11 313,2
- This corpus contains 388 types of words that contain both letters and punctuation. Examples: m.in, i/lub, n.p.m, Harry'ego, PPE-DE, PiS-u, S.A, 10-letni, 65-letniego, 70-lecia, BIG-u, Blake'a, F-16, Gaulle'a, George'a, ONZ-owskich, P.S, e-sporcie, kung-fu, sms-a, ub.r, -wymiarowej, -y, .pl, 1/28/H-L, 100-krotnie, 100-ml, 11-latek, 12-cyfrowy, 12-letni, 12-letnim, 12-tym, 1299-tym, 13-latek, 13-letni, 13-miesięcznego, 14-latka, 14-letni, 14-letniego, 15-letni, 16-latków, 17-latkom, 17-letnia, 18-godzinne, 18-latce, 18-latek, 18-letniego, 18-stymi, 185-osobową, 19-calowy
- This corpus contains 2495 multi-word tokens. On average, one multi-word token consists of 2.07 syntactic words.
- There are 1237 types of multi-word tokens. Examples: chciałbym, byłoby, byłem, miałem, powinniśmy, bym, mieliśmy, myślałem, chciałem, widziałem, mógłby, byłby, słyszałem, byłam, miałam, wiedziałem, mówiłem, chciałabym, byliśmy, chciałby, mogłem, widziałam, mogłyby, zostałem, zrobiłem, powiedziałem, zobaczyłem, żebym, byłaby, gdybym, myślałam, pomyślałem, powinieneś, wiedziałam, byłyby, chciałam, mogłaby, musiałem, żebyś, byłbym, byłeś, byś, miałaby, mogłoby, mógłbym, mógłbyś, usłyszałem, zacząłem, mogłam, należałoby.
Morphology
Tags
- This corpus uses 17 UPOS tags out of 17 possible: ADJ, ADP, ADV, AUX, CCONJ, DET, INTJ, NOUN, NUM, PART, PRON, PROPN, PUNCT, SCONJ, SYM, VERB, X
- This corpus contains 135 word types tagged as particles (PART): Azaliż, Czyżby, Istotnie, Jakżeż, Moze, Niemalże, Notabene, Otóż, a, aby, akurat, ale, ani, aż, ba, blisko, bo, bodaj, bowiem, byle, bynajmniej, chociaż, chociażby, choć, choćby, chyba, co, coraz, coś, czy, czyż, dopiero, doprawdy, dosyć, dość, gdyby, gdzie, gdzieś, głównie, i, jak, jakby, jakoby, jednak, jednakże, jedynie, jeszce, jeszcze, już, lada, ledwie, może, nadto, najwidoczniej, najwyraźniej, najwyżej, naprawdę, nareszcie, natomiast, nawet, niby, nie, niejako, niemal, nieomal, nieprawdaż, niespełna, niestety, no, nuż, oby, oczywiście, ok, około, ot, oto, pewnie, podobno, ponad, ponadto, poniekąd, ponoć, prawie, przecie, przecież, przeszło, przynajmniej, raczej, raptem, rzeczywiście, również, skądinąd, szczególnie, tak, także, tam, tego, też, to, toż, trochę, tu, tuż, tylko, widać, widocznie, więc, wprawdzie, wprost, wreszcie, wręcz, wszak, wszakże, wyłącznie, właściwie, właśnie, z, za, zaledwie, zapewne, zaraz, zarazem, zatem, zaś, ze, zgoła, znacznie, znowu, znowuż, znów, zresztą, zwłaszcza, zynajmniej, Żeby, że
- This corpus contains 23 lemmas tagged as pronouns (PRON): co, cokolwiek, coś, cóż, ja, kto, ktokolwiek, ktoś, któż, mu, my, nic, nie, nikt, on, siebie, się, tamto, to, ty, wszyscy, wszystko, wy
- This corpus contains 48 lemmas tagged as determiners (DET): czyj, czyjś, dużo, ile, ileż, jaki, jakikolwiek, jakiś, każdy, kilka, kilkadziesiąt, kilkanaście, kilkaset, który, którykolwiek, któryś, mało, mniej, mój, najmniej, najwięcej, nasz, nieco, niejaki, niejeden, niektóry, niewiele, parę, parędziesiąt, pewien, pełno, sporo, swój, taki, tamten, ten, tenże, trochę, twój, tyle, tyleż, wasz, wiele, więcej, wszelki, wszystek, ów, żaden
- This corpus contains 10 lemmas tagged as auxiliaries (AUX): by, bywać, być, niech, niechaj, niechby, niechże, to, zostawać, zostać
- Out of the above, 4 lemmas occurred sometimes as AUX and sometimes as VERB: bywać, być, zostawać, zostać
- There are 5 (de)verbal forms:
- Conv
- AUX: będąc
- VERB: trzymając, patrząc, mówiąc, mając, stojąc, uwzględniając, siedząc, chcąc, biorąc, używając
- Fin
- AUX: jest, to, będzie, są, był, było, będą, była, jestem, były
- VERB: ma, może, jest, stoi, można, mówi, siedzi, miał, było, należy
- Inf
- AUX: być, zostać, byc
- VERB: powiedzieć, być, mieć, zrobić, znaleźć, robić, patrzeć, zobaczyć, mówić, wziąć
- Part
- ADJ: dotyczące, dotyczących, związane, ubrany, określonych, związanych, przeznaczone, przedstawione, ubrana, dotyczącego
- Vnoun
- NOUN: stosowania, głosowania, przyjęcie, stosowanie, wprowadzenia, działania, wykorzystania, zapewnienia, tworzenia, osiągnięcia
Nominal Features
- Fem
- ADJ: europejskiej, jednej, drugiej, jedna, innych, polskiej, pierwszej, inne, jedną, sama
- ADJ-Part: dotyczących, dotyczące, ubrana, przyjęta, dotyczącej, lecącej, uniesionymi, związane, widziana, związanych
- AUX-Fin: była, została, były, zostały
- DET: tej, która, ta, które, której, tę, swoją, którą, tych, kilka
- NOUN: kobieta, pracy, osób, dziewczynka, pani, osoby, sprawie, ręce, wodzie, wody
- NUM: dwie, trzy, cztery, dwóch, pięć, obie, 10, sześć, 5, trzech
- PRON: jej, ją, ona, niej, mnie, ich, nią, mi, je, ja
- PROPN: Polsce, Polski, UE, Europy, Polska, Europie, Warszawie, Warszawy, AWS, Rosji
- VERB-Fin: miała, powinna, mogła, chciała, powiedziała, musiała, była, stała, widziała, wiedziała
- Masc
- ADJ: jeden, sam, pierwszy, cały, innych, drugi, 1, mały, jednym, duży
- ADJ-Part: ubrany, dotyczące, dotyczący, dotyczących, stojący, przeznaczone, przygotowany, związane, oparty, trzymający
- AUX-Fin: był, został, byli, były, zostały, zostali, byl, bywali
- DET: ten, który, tym, którzy, tego, którym, które, tych, te, których
- NOUN: mężczyzna, roku, pan, lat, człowiek, chłopiec, ludzi, sposób, domu, dnia
- NUM: dwa, dwóch, 10, trzech, trzy, 3, 2, dwaj, 30, 5
- PRON: jego, go, ich, mnie, mu, mi, nas, on, nim, kto
- PROPN: Andrzej, Jerzy, SLD, Marek, Piotr, Jan, Polacy, Polaków, Krzysztof, Jacek
- VERB-Fin: miał, powiedział, chciał, mógł, powinien, mówił, mieli, mogli, był, powinni
- Neut
- ADJ: członkowskie, członkowskich, drugie, jedno, pierwsze, dotyczące, jednym, nowe, całe, innych
- ADJ-Part: dotyczące, związane, dotyczących, rozpostartymi, dotyczącego, przeprowadzone, zawarte, przedstawione, przygotowane, przyjęte
- AUX-Fin: było, zostało, były, zostały, była
- DET: które, to, takie, tym, tego, te, swoje, tych, jakie, moje
- NOUN: dzieci, dziecko, życie, państwa, życia, pobliżu, miasta, prawa, miejscu, działania
- NOUN-Vnoun: stosowania, głosowania, przyjęcie, stosowanie, wprowadzenia, działania, wykorzystania, zapewnienia, tworzenia, osiągnięcia
- NUM: dwoje, dwa, pół, trzy, trzech, dwóch, Troje, obu, pięć, 10
- PRON: to, co, tym, tego, coś, wszystko, nic, czym, wszystkim, czego
- PROPN: USA, PiS, Niemczech, Niemiec, Stanów, PSL, WE, Włoszech, PKP, Chin
- VERB-Fin: było, stało, udało, powinno, miało, doszło, okazało, mogło, należało, wydawało
- Hum
- ADJ: jeden, sam, innych, młody, drugi, mały, młodych, ubrany, sami, inni
- ADJ-Part: ubrany, stojący, trzymający, widziany, obserwowany, przygotowany, zatrzymany, ubrani, mający, mianowany
- AUX-Fin: był, byli, został, zostali, byl, bywali
- DET: którzy, który, ten, każdy, wielu, ci, swoich, tych, których, którego
- NOUN: mężczyzna, pan, człowiek, chłopiec, ludzi, ludzie, człowieka, pana, chłopak, mężczyzn
- NUM: dwóch, dwaj, trzech, czterech, obaj, sześciu, pięciu, trzej, 10, dwoje
- PRON: jego, mnie, mu, go, ich, mi, nas, kto, ja, on
- PROPN: Andrzej, Jerzy, Marek, Piotr, Jan, Polacy, Polaków, Krzysztof, Jacek, Janusz
- VERB-Fin: powiedział, miał, chciał, mógł, mówił, mieli, mogli, powinien, powinni, był
- Inan
- ADJ: cały, pierwszy, 1, jeden, nowy, jednym, nowego, sportowym, inne, różnych
- ADJ-Part: dotyczące, dotyczący, dotyczących, przeznaczone, związane, przedstawiony, przeznaczonych, dotyczącego, mających, określonych
- AUX-Fin: był, został, były, zostały
- DET: ten, tym, tego, który, które, którym, te, kilka, tych, swój
- NOUN: roku, lat, sposób, domu, dnia, raz, czas, czasu, stroju, czasie
- NUM: dwa, 10, trzy, 3, dwóch, 2, 30, 5, trzech, 15
- PRON: go, jego, ich, je, on, nim, nich, niego, one, mu
- PROPN: SLD, Poznaniu, Krakowie, Izraela, ZUS, Jorku, VAT, Wrocławiu, Krakowa, Iraku
- VERB-Fin: miał, powinien, powinny, mógł, był, przyjął, stał, rozpoczął, zakończył, mogły
- Nhum
- ADJ: biały, duży, czarny, mały, szary, brązowy, czarnego, jeden, małego, drapieżny
- ADJ-Part: rozpędzonym, siedzącego, stojące, zgromadzonych, zwrócony, biegnącego, bujanym, stojącego, trzymany, ubarwiony
- AUX-Fin: był, został, Były, zostały
- DET: które, ten, który, jakiś, którym, takiego, twój, kilkuset, którego, mniej
- NOUN: pies, złotych, ptak, psy, dolarów, psa, konia, kot, konie, koniu
- NUM: dwa, trzy, 2, 100, 3, pięć, 1500, 20, 5, 500
- PRON: go, jego, ich, mu, nim, niego, nimi, im, nich, one
- PROPN: Ptak, Fiata, Dingiem, Humphrey, Instagramie, Mars, Odiego, Piast, Pożeracz, Presa
- VERB-Fin: mógł, usiadł, zamerdał, był, mogły, padł, powinien, urodziły, wpadł, zaczął
- Plur
- ADJ: innych, inne, różnych, nowych, dotyczące, dotyczących, członkowskich, członkowskie, europejskich, młodych
- ADJ-Part: dotyczące, dotyczących, związane, określonych, związanych, przeznaczone, uniesionymi, określone, prowadzone, przedstawione
- AUX: są, śmy, będą, były, będziemy, byli, zostały, zostaną, jesteśmy, ście
- AUX-Fin: są, będą, były, będziemy, byli, zostały, zostaną, jesteśmy, zostali, zostają
- DET: które, te, tych, którzy, których, kilka, wszystkie, wszystkich, wiele, takich
- NOUN: lat, osób, dzieci, ludzi, osoby, ludzie, dni, pieniądze, kobiety, ręce
- NOUN-Vnoun: zachorowań, działań, oskarżeniami, polubień, wytrzeźwień, zawirowań, Drgania, Wypędzeniom, Zakłócenia, chrapania
- NUM: dwie, dwa, dwóch, trzy, trzech, 10, cztery, 3, pięć, 2
- PRON: ich, nich, nas, je, nam, im, one, nimi, oni, my
- PROPN: Polacy, Polaków, Rosjanie, amerykanie, Niemcy, Niemców, PKP, Francuzi, Indian, Żydów
- VERB-Fin: mogą, mają, mamy, są, muszą, mieli, mogli, siedzą, stoją, musimy
- Ptan
- NOUN: drzwi, ramach, okularach, danych, dane, środki, spodenkach, środków, warunki, ludzi
- PRON: wszyscy, wszystkich, wszystkim, wszystkimi
- PROPN: USA, Niemczech, Niemiec, Stanów, Włoszech, Chin, Indii, Stanach, Włochy, Kielcach
- Sing
- ADJ: jeden, sam, europejskiej, pierwszy, jednym, cały, 1, jednej, drugiej, drugi
- ADJ-Part: ubrany, ubrana, dotyczącego, dotyczący, przyjęta, dotyczącej, lecącej, stojący, widziana, przygotowany
- AUX: jest, em, będzie, m, był, było, była, eś, jestem, został
- AUX-Fin: jest, będzie, był, było, była, jestem, został, została, będę, zostanie
- DET: ten, który, tej, tym, tego, która, którym, ta, to, którego
- NOUN: mężczyzna, roku, pan, kobieta, człowiek, pracy, chłopiec, dziewczynka, pani, sposób
- NOUN-Vnoun: stosowania, głosowania, przyjęcie, stosowanie, wprowadzenia, wykorzystania, działania, zapewnienia, tworzenia, osiągnięcia
- NUM: pół, półtora, 1, 35, półtorej, 0,4, 0,5, 1,9, 13, 2,26
- PRON: to, co, jego, jej, go, mnie, tym, mi, mu, tego
- PROPN: Polsce, Polski, UE, Europy, Andrzej, Polska, Europie, Warszawie, Jerzy, SLD
- VERB-Fin: ma, może, jest, stoi, mówi, siedzi, miał, było, należy, powiedział
- Acc
- ADJ: cały, pierwszy, inne, dotyczące, pierwsze, całą, drugą, nowe, jedną, drugie
- ADJ-Part: dotyczące, związane, dotyczący, dotyczącą, trzymany, lecącą, określone, otwarte, ustanawiający, wymienione
- ADP: temu
- DET: ten, te, swoje, które, kilka, tę, swoją, wiele, swój, wszystkie
- NOUN: sposób, raz, temat, czas, życie, pieniądze, uwagę, dzień, stronę, ręce
- NOUN-Vnoun: przyjęcie, stosowanie, tworzenie, odrzucenie, zmniejszenie, działanie, obniżenie, poparcie, prowadzenie, przeprowadzenie
- NUM: dwa, trzy, 10, dwie, 2, 3, pół, pięć, cztery, 5
- PRON: to, go, co, mnie, ją, je, coś, nas, siebie, cię
- PROPN: Europę, Polskę, Polaków, Rosję, Adama, Amerykę, Boga, Jana, Piotra, Warszawę
- Dat
- ADJ: innym, drugiemu, własnym, młodemu, młodym, całej, członkowskim, jednemu, nowemu, nowym
- ADJ-Part: biegnącemu, potrzebującym, Panującej, Zjednoczonemu, bitemu, będącego, będącej, błądzącym, dbającym, doprowadzającemu
- DET: którym, któremu, swoim, tym, temu, tej, naszym, swojemu, wszystkim, każdemu
- NOUN: panu, ludziom, komisji, dzieciom, osobom, pani, państwu, życiu, mężczyźnie, dziennikarzom
- NOUN-Vnoun: zastosowaniu, badaniu, wspieraniu, wydłużeniu, zmniejszeniu, Określeniu, Poparzeniu, Rozładowywaniu, Stosowaniu, Wypędzeniom
- NUM: dwóm, czterem, 2,3, 20, 260, 400, 43, 60, 80, 90
- PRON: mi, sobie, mu, nam, im, ci, jej, temu, wam, komu
- PROPN: Bogu, Jerzemu, Marcie, Andrzejowi, Europie, Niemcom, Łukaszence, Anglikom, Buzkowi, Dżabie
- Gen
- ADJ: innych, europejskiej, nowych, różnych, nowego, drugiej, jednego, polskiej, polskiego, dotyczących
- ADJ-Part: dotyczących, związanych, dotyczącego, określonych, lecącej, zawartych, zgromadzonych, dotyczącej, działających, mających
- DET: tego, tych, tej, których, którego, takich, wszystkich, swoich, takiego, naszych
- NOUN: lat, osób, roku, pracy, ludzi, dnia, dzieci, czasu, wody, życia
- NOUN-Vnoun: stosowania, głosowania, wprowadzenia, wykorzystania, działania, zapewnienia, tworzenia, przyjęcia, osiągnięcia, prowadzenia
- NUM: dwóch, trzech, pięciu, 10, czterech, obu, 2, 3, 5, dziesięciu
- PRON: jego, ich, jej, tego, siebie, nich, mnie, niego, nas, nic
- PROPN: Polski, Europy, UE, Warszawy, SLD, AWS, Polaków, Rosji, Stanów, USA
- Ins
- ADJ: jednym, innymi, samym, jedną, wielkim, dużym, drugim, długimi, Europejską, dużą
- ADJ-Part: uniesionymi, rozłożonymi, dotyczącymi, rozpostartymi, uniesioną, określoną, wyciągniętą, ośnieżonym, ugiętymi, prowadzącymi
- DET: tym, moim, swoim, tą, którym, każdym, którą, którymi, naszym, jakim
- NOUN: wodą, głową, razem, zdaniem, czasem, ręką, pomocą, względem, rękami, celem
- NOUN-Vnoun: przyjęciem, rozpoczęciem, wejściem, zastosowaniem, prowadzeniem, tworzeniem, uwzględnieniem, użyciem, wprowadzeniem, wskazaniem
- NUM: dwoma, trzema, dwiema, obiema, 3, 4, dwudziestu, pięcioma, 10, 1080
- PRON: tym, sobą, nim, nimi, wszystkim, nią, czym, kim, mną, nami
- PROPN: Andrzejem, Niemcami, Polską, Rosją, Stanami, Ukrainą, Wisłą, Aleksandrem, Bogiem, Europą
- Loc
- ADJ: czerwonej, jednym, sportowym, jednej, samym, czarnym, całym, innych, czerwonym, białej
- ADJ-Part: określonym, dmuchanych, dotyczących, określonych, pokrytej, wzburzonej, dotyczącej, prowadzonym, zastawionym, zaśnieżonym
- DET: tym, tej, którym, których, której, tych, swoim, każdym, naszym, takich
- NOUN: roku, sprawie, wodzie, stroju, czasie, trawie, pobliżu, przypadku, kasku, celu
- NOUN-Vnoun: zakończeniu, podejmowaniu, przeprowadzeniu, wprowadzeniu, leczeniu, przekazaniu, wejściu, wyjściu, wykonywaniu, wypiciu
- NUM: dwóch, trzech, obu, czterech, 10, 20, dziesięciu, 50, dwudziestu, pięciu
- PRON: tym, nim, czym, nich, niej, sobie, mnie, wszystkim, czymś, niczym
- PROPN: Polsce, Europie, Warszawie, Poznaniu, Krakowie, Niemczech, Wrocławiu, Włoszech, Ameryce, Łodzi
- Nom
- ADJ: jeden, sam, jedna, inne, mały, drugi, pierwszy, sama, europejska, członkowskie
- ADJ-Part: ubrany, dotyczące, związane, ubrana, przeznaczone, przyjęta, stojący, przedstawione, przygotowane, widziana
- DET: który, które, która, którzy, ten, ta, te, takie, to, każdy
- NOUN: mężczyzna, pan, kobieta, człowiek, chłopiec, dziewczynka, pani, ludzie, pies, osoby
- NOUN-Vnoun: stosowanie, przyjęcie, zapewnienie, otwarcie, wprowadzenie, rozszerzenie, badanie, ograniczenie, podawanie, wykorzystanie
- NUM: dwie, dwa, dwóch, trzy, cztery, dwaj, dwoje, pięć, trzech, obaj
- PRON: to, co, ja, on, kto, ona, ktoś, wszystko, nikt, one
- PROPN: Andrzej, Polska, Jerzy, Marek, Piotr, Jan, Polacy, Krzysztof, Jacek, Janusz
- Voc
- ADJ: droga, szanowny, głupi, młody, Drodzy, Nowy, Wspaniaty, Wysoki, dobrzy, duży
- ADJ-Part: trzymający
- DET: moja, mój, moje, nasz
- NOUN: panie, pośle, marszałku, pani, kochanie, tato, mamo, ministrze, panowie, doktorze
- PRON: ty
- PROPN: Boże, Panie, Jacku, Piotrze, Alicjo, Arturze, Basiu, Bello, Benedykcie, Czarny
- Npr
- PRON: jego, ich, jej, go, mu, ją, on, je, im, ona
- Pre
- ADJ: prostu, dawna, wolna, daleka, angielsku, niedawna, bliska, cichu, francusku, nowa
- PRON: nich, nim, niego, niej, nią, nimi, nie, niemu, ń, on
Degree and Polarity
- Cmp
- ADJ: większe, starszy, dalsze, lepsze, większej, starsza, większym, dalszych, większą, większa
- ADV: bardziej, wcześniej, lepiej, dalej, później, mniej, więcej, częściej, łatwiej, wyżej
- Pos
- ADJ: innych, jeden, inne, sam, europejskiej, pierwszy, różnych, jednym, cały, 1
- ADV: bardzo, tak, jak, dobrze, zgodnie, często, jednocześnie, obecnie, trudno, szybko
- Sup
- ADJ: najlepsze, najważniejsze, największe, najbliższych, najlepszym, najlepszy, najwyższe, najbliższym, najlepszych, największych
- ADV: najbardziej, najmniej, najczęściej, najlepiej, najszybciej, najprawdopodobniej, najwięcej, najbliżej, najchętniej, najdalej
- Neg
- ADJ-Part: niewykluczone, niepotwierdzonych, niewykorzystane, niewyprawione, niezrealizowane, NIEPOCHODZĄCYCH, Nieleczona, Nieprzejawionego, Nieprzeznaczony, niebędący
- NOUN-Vnoun: nieuzyskania, Niewypełnienie, niedopełnienie, niedopuszczenie, nieistnienia, niejedzenia, niekonkurowania, nienakładaniu, nieobjadanie, nieodpowiadanie
- PART: nie
- Pos
- ADJ-Part: dotyczące, dotyczących, związane, ubrany, określonych, związanych, przeznaczone, przedstawione, ubrana, dotyczącego
- NOUN-Vnoun: stosowania, głosowania, przyjęcie, stosowanie, wprowadzenia, działania, wykorzystania, zapewnienia, tworzenia, osiągnięcia
- Long
- ADP: ze, we, przede, ode, przeze, beze, nade, pode
- AUX: em, eś
- PRON: jego, ich, jej, mnie, nich, ją, on, je, nim, niego
- Short
- ADJ: gotów, ciekaw, winien, godzien
- ADP: w, z, od, przez, przed, pod, nad, bez, poprzez, spod
- AUX: m, śmy, ś, ście
- PRON: go, mi, mu, ci, cię, ich, je, im, ń, jej
Verbal Features
- Imp
- ADJ-Part: dotyczące, dotyczących, dotyczącego, dotyczący, prowadzone, stojący, dotyczącej, lecącej, stosowane, widziana
- AUX: jest, em, będzie, m, są, śmy, był, być, było, będą
- AUX-Conv: będąc
- AUX-Fin: jest, będzie, są, był, było, będą, była, jestem, były, będziemy
- AUX-Inf: być, byc
- NOUN-Vnoun: stosowania, głosowania, stosowanie, działania, tworzenia, prowadzenia, wykonywania, czynienia, pływania, tworzenie
- VERB-Conv: trzymając, patrząc, mówiąc, mając, stojąc, uwzględniając, siedząc, chcąc, biorąc, używając
- VERB-Fin: ma, może, jest, stoi, mówi, siedzi, miał, było, należy, mam
- VERB-Inf: być, mieć, robić, patrzeć, mówić, iść, wiedzieć, żyć, myśleć, prowadzić
- Perf
- ADJ-Part: związane, ubrany, określonych, związanych, przeznaczone, przedstawione, ubrana, przygotowane, przyjęta, określone
- AUX-Fin: został, została, zostanie, zostały, zostaną, zostało, zostali, zostacie, zostanę
- AUX-Inf: zostać
- NOUN-Vnoun: przyjęcie, wprowadzenia, wykorzystania, zapewnienia, osiągnięcia, przyjęcia, zastosowania, wprowadzenie, zapewnienie, wykonania
- VERB-Conv: począwszy, spojrzawszy, zważywszy, Dokonawszy, otrzymawszy, stanąwszy, straciwszy, wyzbywszy, Doszedłszy, Nadawszy
- VERB-Fin: powiedział, stało, udało, zrobił, zaczął, powiedziała, doszło, okazało, wystarczy, da
- VERB-Inf: powiedzieć, zrobić, znaleźć, zobaczyć, wziąć, zmienić, pomóc, przyjąć, kupić, skorzystać
- Imp
- AUX-Fin: bądź
- VERB-Fin: powiedz, daj, patrz, weź, chodź, Zobacz, idź, Przypomnijmy, powiedzmy, czekaj
- Ind
- AUX-Fin: jest, to, będzie, są, był, było, będą, była, jestem, były
- VERB-Fin: ma, może, jest, stoi, można, mówi, siedzi, miał, było, należy
- Fut
- AUX-Fin: będzie, będą, będziemy, będę, zostanie, zostaną, będziesz, będziecie, bedzie, bedziesz
- VERB-Fin: będzie, wystarczy, da, uda, odbędzie, znajdzie, powiem, stanie, będą, pozwoli
- Past
- AUX-Fin: był, było, była, były, został, została, byli, zostały, zostało, zostali
- VERB-Conv: począwszy, spojrzawszy, zważywszy, Dokonawszy, otrzymawszy, stanąwszy, straciwszy, wyzbywszy, Doszedłszy, Nadawszy
- VERB-Fin: miał, było, powiedział, chciał, mógł, miała, mówił, mieli, mogli, był
- Pres
- AUX-Conv: będąc
- AUX-Fin: jest, to, są, jestem, jesteś, jesteśmy, zostaje, zostają, bywa, bywają
- VERB-Conv: trzymając, patrząc, mówiąc, mając, stojąc, uwzględniając, siedząc, chcąc, biorąc, używając
- VERB-Fin: ma, może, jest, stoi, można, mówi, siedzi, należy, mam, mogą
- Act
- ADJ-Part: dotyczące, dotyczących, dotyczącego, dotyczący, stojący, dotyczącej, lecącej, dotyczącymi, mających, trzymający
- AUX-Conv: będąc
- AUX-Fin: jest, są, był, było, była, jestem, były, został, została, zostanie
- AUX-Inf: być, zostać, byc
- VERB-Conv: trzymając, patrząc, mówiąc, mając, stojąc, uwzględniając, siedząc, chcąc, biorąc, używając
- VERB-Fin: ma, może, jest, stoi, mówi, siedzi, miał, było, należy, powiedział
- VERB-Inf: powiedzieć, być, mieć, zrobić, znaleźć, robić, patrzeć, zobaczyć, mówić, wziąć
- Pass
- ADJ-Part: związane, ubrany, określonych, związanych, przeznaczone, przedstawione, ubrana, prowadzone, przygotowane, przyjęta
Pronouns, Determiners, Quantifiers
- Dem
- ADV: tak, tu, tam, dlatego, wtedy, tutaj, wówczas, stąd, dotąd, stamtąd
- DET: ten, tej, tym, tego, te, tych, ta, takie, to, takich
- PRON: to, tym, tego, temu, tamto, tamtym
- Ind
- ADV: kiedyś, gdzieś, kiedykolwiek, niekiedy, jakoś, skądś, gdziekolwiek, dokądś, jakkolwiek
- DET: kilka, wiele, więcej, wielu, kilku, jakiś, jakieś, dużo, niektórych, niektóre
- PRON: coś, ktoś, kogoś, czegoś, czymś, kimś, komuś, cokolwiek, ktokolwiek, kogokolwiek
- Int
- ADV: kiedy, jak, dlaczego, gdzie, skąd, czemu, dokąd, odkąd, ile, jakże
- DET: ile, jakie, jaki, które, których, jakim, którą, jakiej, jaka, jakich
- PRON: co, kto, czym, czego, kim, kogo, komu, cóż, czemu, któż
- Neg
- ADV: nigdy, nigdzie
- DET: żadnego, żadnych, żaden, żadnej, żadne, żadnym, żadna, żadnymi, żadną, żadnemu
- PRON: nic, nikt, niczego, nikogo, nikomu, niczym, nikim, niczemu
- Prs
- DET: swoje, swoich, swoją, swoim, naszych, swój, nasze, mój, naszym, moim
- PRON: się, jego, ich, jej, go, mnie, sobie, mi, mu, siebie
- Rel
- ADV: kiedy, gdzie, jak, skąd
- DET: które, który, która, którzy, których, którym, której, którego, którą, jakie
- PRON: co, kto, czego, czym, kim, kogo, komu, czemu
- Tot
- ADV: zawsze, wszędzie
- DET: wszystkie, wszystkich, każdy, każdym, każdego, każdej, wszyscy, każda, wszelkie, każde
- PRON: wszystko, wszystkim, wszyscy, wszystkich, wszystkiego, wszystkie, Wszystkiemu, wszystkimi, wszytko
- Card
- DET: kilka, wiele, więcej, wielu, kilku, ile, dużo, tyle, mniej, kilkanaście
- NUM: 10, 3, 2, 30, 5, 15, 20, 4, 50, 12
- Ord
- ADJ: 1, II, 2008, 2000, 2009, 2, 20, 15, 1995, XIX
- Sets
- NOUN: dzieci, dziecko, oczy, dziecka, oczach, dzieckiem, oczami, zwierząt, dziećmi, oczu
- NUM: dwoje, Troje, oboje, Czworo, Pięcioro, obojgu, czternaściorga, czworga, dwojgiem, dziesięcioro
- PROPN: Hedestad, INE, Lakis, Plovdiv, Poste, SUD
- Yes
- DET: swoje, swoich, swoją, swoim, naszych, swój, nasze, mój, naszym, moim
- Yes
- DET: swoje, swoich, swoją, swoim, swój, swojej, swojego, swych, swego, swej
- PRON: się, sobie, siebie, sobą, sie, se, sia
- 0
- VERB-Fin: stwierdzono, znaleziono, ustalono, zatrzymano, przeprowadzono, przedstawiono, traktowano, wprowadzono, zaczęto, pokazano
- 1
- AUX: em, m, śmy, jestem, będziemy, będę, jesteśmy, będziem, zostanę
- AUX-Fin: jestem, będziemy, będę, jesteśmy, będziem, zostanę
- DET: naszych, nasze, mój, naszym, moim, naszej, moja, nasz, moje, mojej
- PRON: mnie, mi, nas, ja, nam, my, mną, nami, NI
- VERB-Fin: mam, wiem, proszę, mamy, musimy, mogę, możemy, chcę, dziękuję, muszę
- 2
- AUX: eś, ś, jesteś, ście, będziesz, bądź, będziecie, jesteście, bedziesz, śmy
- AUX-Fin: jesteś, będziesz, bądź, będziecie, jesteście, bedziesz, ście
- DET: twój, twoje, twoim, twoja, twojego, twoją, wasze, wasz, twoich, twojej
- PRON: ci, cię, ty, ciebie, was, wam, tobą, tobie, wy, wami
- VERB-Fin: masz, wiesz, chcesz, możesz, powiedz, daj, musisz, myślisz, patrz, macie
- 3
- AUX-Fin: jest, będzie, są, będą, zostanie, zostaną, zostaje, zostają, bywa, bywają
- PRON: jego, ich, jej, go, mu, nich, ją, on, je, nim
- VERB-Fin: ma, może, jest, stoi, mówi, siedzi, należy, mogą, mają, musi
- Depr
- NOUN: chłopaki, nastolatki, Chłopy, Kamraty, Wykształciuchy, niedobitki, ułomka, zombie, łajzy
- PROPN: Jerze, VIP-y
- Plur
- DET: naszych, nasze, naszym, naszej, nasz, naszego, nasza, nasi, naszą, wasze
- Sing
- DET: mój, moim, moja, moje, mojej, mojego, twój, moją, moich, twoje
Other Features
- Abbr
- Yes
- PART: ok
- X: r, zł, art, tys, proc, m, s, ust, np, ul
- Yes
- AdpType
- Post
- ADP: temu
- Prep
- ADP: na, w, do, z, o, po, za, dla, od, przez
- Post
- Clitic
- Yes
- AUX: em, m, śmy, eś, ś, ście
- Yes
- ConjType
- Comp
- SCONJ: jak, niż, jakby, niczym, aniżeli, niby
- Oper
- CCONJ: plus, minus
- Pred
- SCONJ: jako
- Comp
- Emphatic
- Yes
- ADV: jakże, gdzież, skądże
- DET: ileż, iluż, tyleż
- PART: czyż
- PRON: cóż, któż, Kimże, czymże
- Yes
- Foreign
- Yes
- X: de, San, a, of, von, New, Don, bin, di, Le
- Yes
- Hyph
- Yes
- ADJ: czarno, biało, polsko, czerwono, południowo, żółto, brązowo, budowlano, niebiesko, niemiecko
- Yes
- NumForm
- Digit
- ADJ: 1, 2008, 2000, 2009, 2, 20, 15, 1995, 1996, 1997
- NUM: 10, 3, 2, 30, 5, 15, 20, 4, 50, 12
- X: 2, 1, 3, 4, 5, 6, 7, 8, 9, 10
- Roman
- ADJ: II, XIX, I, IV, III, XVI, XVIII, XX, VIII, XII
- NUM: IX
- X: I, IV, II, III, VI, XI
- Word
- NUM: dwie, dwa, dwóch, trzy, trzech, cztery, pięć, dwaj, czterech, pół
- Digit
- PartType
- Int
- PART: czy, Czyżby, czyż, Azaliż
- Mod
- PART: może, Moze
- Int
- Pun
- No
- X: zł, mln, pkt, nr, m, km, mg, kg, mld, cm
- Yes
- PART: ok
- X: r, art, tys, proc, ust, np, ul, godz, m.in, prof
- No
- PunctSide
- Fin
- PUNCT: ), ”, ], ’, ’’
- Ini
- PUNCT: (, „, [, “
- Fin
- PunctType
- Brck
- PUNCT: ), (, [, ]
- Colo
- PUNCT: :
- Comm
- PUNCT: ,, ,,
- Dash
- PUNCT: -, –, —, --
- Elip
- PUNCT: …
- Excl
- PUNCT: !
- Peri
- PUNCT: .
- Qest
- PUNCT: ?
- Quot
- PUNCT: ", ”, „, '', ', “, », «, ’, ’’
- Semi
- PUNCT: ;
- Slsh
- PUNCT: /
- Brck
- VerbType
- Mod
- VERB-Fin: powinien, powinna, powinny, powinni, powinno, winna, winny, winien, winni, winno
- Quasi
- AUX-Fin: to
- VERB-Fin: można, trzeba, wiadomo, widać, warto, oto, wolno, słychać, stać, szkoda
- Mod
Syntax
Auxiliary Verbs and Copula
- This corpus uses 3 lemmas as copulas (cop). Examples: być, to, bywać.
- This corpus uses 3 lemmas as auxiliaries (aux). Examples: być, zostać, zostawać.
- This corpus uses 4 lemmas as passive auxiliaries (aux:pass). Examples: być, zostać, zostawać, bywać.
Core Arguments, Oblique Arguments and Adjuncts
Here we consider only relations between verbs (parent) and nouns or pronouns (child).
- nsubj
- VERB-Fin--NOUN-Acc (7)
- VERB-Fin--NOUN-Dat (2)
- VERB-Fin--NOUN-Gen (642)
- VERB-Fin--NOUN-Gen-ADP(do) (3)
- VERB-Fin--NOUN-Ins (1)
- VERB-Fin--NOUN-Nom (11591)
- VERB-Fin--PRON-Acc (2)
- VERB-Fin--PRON-Dat (2)
- VERB-Fin--PRON-Gen (58)
- VERB-Fin--PRON-Nom (1796)
- VERB-Inf--NOUN-Gen (5)
- VERB-Inf--NOUN-Nom (108)
- VERB-Inf--PRON-Acc (1)
- VERB-Inf--PRON-Gen (1)
- VERB-Inf--PRON-Nom (22)
- obj
- VERB-Conv--NOUN-Acc (522)
- VERB-Conv--NOUN-Gen (56)
- VERB-Conv--NOUN-Nom (3)
- VERB-Conv--PRON-Acc (32)
- VERB-Conv--PRON-Gen (3)
- VERB-Fin--NOUN-Acc (5813)
- VERB-Fin--NOUN-Dat (1)
- VERB-Fin--NOUN-Gen (962)
- VERB-Fin--NOUN-Gen-ADP(z) (1)
- VERB-Fin--NOUN-Ins (12)
- VERB-Fin--NOUN-Loc-ADP(po) (1)
- VERB-Fin--NOUN-Nom (24)
- VERB-Fin--PRON-Acc (1379)
- VERB-Fin--PRON-Gen (229)
- VERB-Fin--PRON-Ins (6)
- VERB-Fin--PRON-Nom (3)
- VERB-Inf--NOUN-Acc (1628)
- VERB-Inf--NOUN-Dat (1)
- VERB-Inf--NOUN-Gen (339)
- VERB-Inf--NOUN-Ins (3)
- VERB-Inf--NOUN-Nom (8)
- VERB-Inf--PRON-Acc (411)
- VERB-Inf--PRON-Dat (1)
- VERB-Inf--PRON-Gen (81)
- VERB-Inf--PRON-Ins (1)
- iobj
- VERB-Conv--NOUN-Acc (23)
- VERB-Conv--NOUN-Dat (16)
- VERB-Conv--NOUN-Gen (19)
- VERB-Conv--NOUN-Ins (99)
- VERB-Conv--PRON-Acc (1)
- VERB-Conv--PRON-Dat (23)
- VERB-Conv--PRON-Ins (2)
- VERB-Fin--NOUN-Acc (921)
- VERB-Fin--NOUN-Dat (561)
- VERB-Fin--NOUN-Gen (587)
- VERB-Fin--NOUN-Ins (799)
- VERB-Fin--NOUN-Loc-ADP(o) (1)
- VERB-Fin--NOUN-Nom (17)
- VERB-Fin--PRON-Acc (178)
- VERB-Fin--PRON-Dat (974)
- VERB-Fin--PRON-Gen (110)
- VERB-Fin--PRON-Ins (55)
- VERB-Fin--PRON-Nom (7)
- VERB-Inf--NOUN-Acc (92)
- VERB-Inf--NOUN-Dat (159)
- VERB-Inf--NOUN-Gen (72)
- VERB-Inf--NOUN-Ins (173)
- VERB-Inf--NOUN-Loc-ADP(o) (1)
- VERB-Inf--NOUN-Nom (1)
- VERB-Inf--PRON-Acc (14)
- VERB-Inf--PRON-Dat (150)
- VERB-Inf--PRON-Gen (17)
- VERB-Inf--PRON-Ins (14)
Reflexive Verbs
- This corpus contains 1664 lemmas that occur at least once with an expl:pv child. Examples: stać się, znajdować się, udać się, wydawać się, okazać się, znaleźć się, starać się, pojawić się, odbyć się, czuć się, dowiedzieć się, zajmować się, bać się, cieszyć się, bawić się, dziać się, wspinać się, pojawiać się, stawać się, rozpocząć się, spotkać się, spodziewać się, zastanawiać się, unosić się, zdarzać się, zdecydować się, zatrzymać się, dać się, opierać się, trzymać się, zgadzać się, zająć się, domagać się, stosować się, zgodzić się, odbywać się, zbliżać się, obawiać się, posługiwać się, przyglądać się, uczyć się, zmienić się, kończyć się, podobać się, spotykać się, uśmiechać się, uśmiechnąć się, zacząć się, zwrócić się, mówić się
Verbs with Reflexive Core Objects
- This corpus contains 54 lemmas that occur at least once with a reflexive core object (obj or iobj). Examples: pozwolić sobie, robić sobie, zająć sobą, bronić siebie, darować sobie, dogonić swoich, dopiąć swego, gotować sobie, kochać siebie, kompromitować siebie, lubić siebie, manipulować sobą, obetrzeć sobie, oceniać siebie, odkrywać siebie, odmawiać sobie, odmówić sobie, odpowiedzieć sobie, określić siebie, opisać siebie, organizować sobie, parodiować siebie, pisać sobie, podawać sobie, pokochać siebie, poniżyć siebie, porównywać siebie, posłuchać siebie, poznać siebie, przynieść sobie, rozgrzeszyć siebie, rozpoznawać siebie, rozpoznać siebie, rozumieć siebie, sam siebie, sprawić sobie, stawiać siebie, stawiać sobie, ufać sobie, ukarać siebie, uprzytomnić sobie, uratować siebie, utrudnić sobie, uzdrowienie siebie, uświadamiać sobie, widzieć siebie, wybaczyć sobie, wybrać siebie, wydrzeć sobie, wyrażać siebie
Relations Overview
- This corpus uses 38 relation subtypes: acl:relcl, advcl:cmpr, advcl:relcl, advmod:arg, advmod:emph, advmod:neg, amod:flat, aux:clitic, aux:cnd, aux:imp, aux:pass, cc:preconj, ccomp:cleft, ccomp:obj, csubj:pass, det:numgov, det:nummod, det:poss, discourse:emo, discourse:intj, expl:pv, flat:foreign, nmod:arg, nmod:flat, nmod:poss, nmod:pred, nsubj:pass, nummod:flat, nummod:gov, obl:agent, obl:arg, obl:cmpr, obl:orphan, parataxis:insert, parataxis:obj, xcomp:cleft, xcomp:pred, xcomp:subj
- The following 3 main types are not used alone, they are always subtyped: discourse, expl, parataxis
- The following 5 relation types are not used in this corpus at all: dislocated, clf, compound, goeswith, reparandum