home edit page issue tracker

This page pertains to UD version 2.

Treebank Statistics: UD_German-HDT: POS Tags: ADJ

There are 14133 ADJ lemmas (18%), 24076 ADJ types (12%) and 262607 ADJ tokens (8%). Out of 16 observed tags, the rank of ADJ is: 3 in number of lemmas, 3 in number of types and 6 in number of tokens.

The 10 most frequent ADJ lemmas: neu, deutsch, erst, groß, weit, gut, null, eigen, hoch, schnell

The 10 most frequent ADJ types: neue, neuen, ersten, deutschen, deutsche, weitere, eigenen, erste, letzten, nächsten

The 10 most frequent ambiguous lemmas: erst (ADJ 4874, ADV 2007), gut (ADJ 3170, ADP 5), null (NUM 12, ADJ 1, X 1), eigen (ADJ 2889, NOUN 1), hoch (ADJ 2126, ADP 22), vergehen (ADJ 1560, VERB 46), digital (ADJ 1266, X 8, PROPN 1), entsprechen (ADJ 1215, VERB 537), nennen (ADJ 1203, VERB 961), gleich (ADJ 1080, ADV 203, ADP 25)

The 10 most frequent ambiguous types: deutschen (ADJ 1643, X 1), deutsche (ADJ 1035, X 1), eigenen (ADJ 1687, VERB 1, X 1), gut (ADJ 1152, ADP 5), beiden (ADJ 998, DET 177), bekannt (ADP 852, ADJ 810, VERB 31), natürlich (ADJ 570, X 1), online (PROPN 806, ADJ 640, X 7), gleichen (ADJ 512, VERB 10), recht (ADJ 482, ADP 3)

Morphology

The form / lemma ratio of ADJ is 1.703531 (the average of all parts of speech is 2.529657).

The 1st highest number of forms (138) was observed with the lemma “basieren”: ‘Cell’-basierte, .NET-basierte, 98-basierten, AIX-basierten, ARM-basiertes, ATM-basiertes, Access-basierender, Alpha-AXP-basiert, Alpha-AXP-basierte, Alpha-basierten, AppleShare-basierter, Athlon-basierten, BeIA-basiertes, Browser-basierten, C++-basierte, CLS-basierten, Celeron-basierten, Computer-basierenden, DOS-basierte, DOS-basierten, DSP-basierenden, DSP-basierten, Disc-basierendes, EPOC-basierte, Eprom-basierte, Funk-basierte, GMR-Kopf-basierte, GPS-basierte, HTML-basiertes, Host-basierter, ICE-basiert, IM-basierte, IP-basierende, IP-basierte, IP-basierten, IP-basiertes, ISDN-basierende, Intel-basierenden, Intel-basierte, Intel-basierten, Intel-basiertes, Internet-basierende, Internet-basierte, Internet-basierten, Internet-basiertes, Java-basierte, Java-basierten, Java-basiertes, Java3D-basierten, KDE-basierte, Linux-basierende, Linux-basierte, Linux-basiertem, MHP-basierten, MSN-basierten, Microkernel-basierte, Minuten-basierte, Mips-basierten, Mitgliedschaft-basierten, NDS-basierten, NT-basierenden, NT-basierten, NT-basierter, Netzwerk-basiertes, PC-basierte, PC-basierten, Palm-OS-basierten, Pentium-II-basierte, PowerPC-basierende, PowerPC-basierte, PowerPC-basierten, Qt-basierter, RISC-basierten, SOAP-basierten, SPARC-basierten, Satelliten-basierte, Satelliten-basiertem, Satelliten-basierter, Script-basierte, Server-basierenden, Server-basiert, Server-basierte, Server-basierten, Server-basiertes, SmartCard-basierten, Software-basiertes, Solaris-basierten, Stift-basierenden, Stift-basierte, Stratosphären-basierenden, Text-basierte, Tile-basierenden, Tile-basierendes, UMTS-basierenden, UNIX-basierte, US-basierender, UltraSPARC-basierte, Unix-basierende, Unix-basierenden, Unix-basierten, Unix-basierter, Voodoo-Graphics-basierte, WAP-basierten, Web-basierende, Web-basierenden, Web-basierte, Web-basierten, Windows-98-basierte, Windows-CE-basierte, Windows-CE-basiertes, Windows-NT-basierende, Windows-basierendes, Windows-basierte, Windows-basierten, WindowsCE-basierenden, XML-basierende, XML-basiert, XML-basierte, XML-basierten, Y2K-basierten, basierend, basierende, basierendem, basierenden, basierender, basierendes, basiert, basierte, browser-basierte, glibc-basierte, glibc-basiertes, libc5-basierte, linux-basierten, pc-basierter, software-basierte, text-basierten, web-basierter, web-basiertes.

The 2nd highest number of forms (82) was observed with the lemma “fähig”: 1,5-Volt-fähigen, 2.0-fähigen, 3-Plattform-fähigen, 4x-fähigen, 8-MByte-fähigen, AGP-4X-fähigen, ASP-fähig, AppleTalk-fähigen, Bluetooth-fähig, Bluetooth-fähigen, Bluetooth-fähiger, Busmaster-fähig, DRM-fähige, DirectX-fähigen, Dual-fähigen, E-Mail-fähigen, EMS-fähige, FireWire-fähigen, GPRS-fähige, GPRS-fähigen, HBCI-fähige, Hot-Plug-fähige, Hot-plug-fähige, IT-fähigen, Infrarot-fähigen, Internet-fähige, Internet-fähigen, JDK-1.1.2-fähigen, Jahr-2000-fähig, Jahr-2000-fähigen, Java-fähigen, Java-fähiger, JavaScript-fähiger, Jini-fähigen, Jini-fähiger, LAN-fähiger, Linux-fähig, MP3-fähigen, MP3-fähiger, Mac-OS-X-fähigen, NDS-fähigen, NTSC-fähigen, Netz-fähig, Netzwerk-fähigen, ODBC-fähigen, Palomino-fähigen, PnP-fähige, PostScript-fähige, Rückkanal-fähigen, SATA-fähigen, SDRAM-fähig, SMS-fähige, SMS-fähiges, SSE-fähig, Streaming-fähigen, TAPI-fähigen, UDMA/66-fähige, USB-2.0-fähige, USB-2.0-fähigen, Ultra-ATA/100-fähige, Ultra-ATA/100-fähigen, Upgrade-fähig, VBE-2.0-fähige, Vierkanal-fähigen, Voice-fähige, WAP-fähig, WAP-fähige, WAP-fähigen, WAP-fähiger, WAP-fähiges, WBEM-fähig, Web-fähig, Web-fähige, fähig, fähige, fähigen, fähiger, hörfunk-fähig, multisession-fähig, online-fähigen, plug&play-fähige, update-fähig.

The 3rd highest number of forms (62) was observed with the lemma “jährig”: 13-jährige, 13-jährigen, 15-jährige, 16-jährige, 16-jährigen, 17-jährige, 17-jährigen, 18-jährige, 18-jährigen, 19-jährige, 19-jährigen, 20-jährige, 20-jährigen, 21-jährige, 21-jährigen, 22-jähriger, 23-jährige, 24-Jährigen, 24-jährige, 25-jährige, 25-jährigen, 26-jährige, 26-jährigen, 27-jährigen, 28-jährige, 29-jährige, 29-jährigen, 30-jährige, 31-jährige, 32-jährige, 32-jährigen, 33-jährige, 33-jährigen, 35-jährige, 36-jährige, 38-jährige, 39-jährige, 39-jährigen, 40-jährigen, 41-jährige, 43-jährige, 44-jährige, 44-jährigen, 45-jährige, 46-jährige, 46-jährigen, 47-jährige, 47-jährigen, 50-jährige, 50-jährigen, 52-jährige, 54-jährige, 55-jährige, 55-jährigen, 57-jährige, 60-jährigen, 61-jährigen, 62-jährige, 66-jährige, 67-jährige, 70-jährigen, jährige.

ADJ occurs with 6 features: Degree (246379; 94% instances), Number (172251; 66% instances), Gender (84142; 32% instances), Variant (75390; 29% instances), Case (50236; 19% instances), NumType (4874; 2% instances)

ADJ occurs with 14 feature-value pairs: Case=Acc, Case=Dat, Case=Gen, Case=Nom, Degree=Cmp, Degree=Pos, Degree=Sup, Gender=Fem, Gender=Masc, Gender=Neut, NumType=Ord, Number=Plur, Number=Sing, Variant=Short

ADJ occurs with 195 feature combinations. The most frequent feature combination is Degree=Pos|Variant=Short (69626 tokens). Examples: möglich, gut, ganz, weltweit, deutlich, knapp, künftig, bekannt, schnell, offensichtlich

Relations

ADJ nodes are attached to their parents using 19 different relations: amod (181963; 69% instances), advmod (53486; 20% instances), root (9349; 4% instances), conj (4978; 2% instances), xcomp (3718; 1% instances), advcl (3192; 1% instances), obl (1439; 1% instances), ccomp (1144; 0% instances), acl (1045; 0% instances), nmod (513; 0% instances), nsubj (509; 0% instances), parataxis (332; 0% instances), obj (253; 0% instances), appos (212; 0% instances), compound:prt (197; 0% instances), csubj (188; 0% instances), nsubj:pass (49; 0% instances), csubj:pass (32; 0% instances), obl:arg (8; 0% instances)

Parents of ADJ nodes belong to 16 different parts of speech: NOUN (180467; 69% instances), VERB (45276; 17% instances), ADJ (14164; 5% instances), (9349; 4% instances), PROPN (4920; 2% instances), AUX (3404; 1% instances), X (1930; 1% instances), NUM (1648; 1% instances), DET (705; 0% instances), ADV (519; 0% instances), PRON (133; 0% instances), SCONJ (39; 0% instances), PART (30; 0% instances), ADP (21; 0% instances), CCONJ (1; 0% instances), INTJ (1; 0% instances)

205310 (78%) ADJ nodes are leaves.

33351 (13%) ADJ nodes have one child.

7492 (3%) ADJ nodes have two children.

16454 (6%) ADJ nodes have three or more children.

The highest child degree of a ADJ node is 12.

Children of ADJ nodes are attached using 27 different relations: advmod (36051; 27% instances), obl (21882; 17% instances), punct (20668; 16% instances), cop (13596; 10% instances), nsubj (11603; 9% instances), conj (5461; 4% instances), cc (4366; 3% instances), mark (3264; 2% instances), obj (2669; 2% instances), case (2157; 2% instances), aux (1915; 1% instances), det (1847; 1% instances), csubj (1579; 1% instances), parataxis (1329; 1% instances), ccomp (1194; 1% instances), expl (769; 1% instances), advcl (692; 1% instances), xcomp (598; 0% instances), acl (267; 0% instances), amod (180; 0% instances), nmod (157; 0% instances), appos (105; 0% instances), nummod (72; 0% instances), compound:prt (37; 0% instances), obl:arg (4; 0% instances), acl:relcl (1; 0% instances), discourse (1; 0% instances)

Children of ADJ nodes belong to 16 different parts of speech: NOUN (28022; 21% instances), ADV (23520; 18% instances), PUNCT (20668; 16% instances), AUX (15705; 12% instances), ADJ (14164; 11% instances), VERB (5937; 4% instances), CCONJ (5733; 4% instances), PROPN (4301; 3% instances), PRON (3741; 3% instances), PART (3424; 3% instances), DET (2434; 2% instances), ADP (2028; 2% instances), SCONJ (1638; 1% instances), X (592; 0% instances), NUM (554; 0% instances), INTJ (3; 0% instances)