Treebank Statistics: UD_German-HDT: POS Tags: ADJ
There are 14134 ADJ
lemmas (18%), 24077 ADJ
types (12%) and 262611 ADJ
tokens (8%).
Out of 16 observed tags, the rank of ADJ
is: 3 in number of lemmas, 3 in number of types and 6 in number of tokens.
The 10 most frequent ADJ
lemmas: neu, deutsch, erst, groß, weit, gut, null, eigen, hoch, schnell
The 10 most frequent ADJ
types: neue, neuen, ersten, deutschen, deutsche, weitere, eigenen, erste, letzten, nächsten
The 10 most frequent ambiguous lemmas: erst (ADJ 4874, ADV 2007), gut (ADJ 3170, ADP 5), null (NUM 12, ADJ 1, X 1), eigen (ADJ 2889, NOUN 1), hoch (ADJ 2126, ADP 22), vergehen (ADJ 1560, VERB 46), digital (ADJ 1266, X 8, PROPN 1), entsprechen (ADJ 1215, VERB 537), nennen (ADJ 1203, VERB 961), gleich (ADJ 1080, ADV 203, ADP 25)
The 10 most frequent ambiguous types: deutschen (ADJ 1643, X 1), deutsche (ADJ 1035, X 1), eigenen (ADJ 1687, VERB 1, X 1), gut (ADJ 1152, ADP 5), beiden (ADJ 998, DET 177), bekannt (ADP 852, ADJ 810, VERB 31), natürlich (ADJ 570, X 1), online (PROPN 806, ADJ 640, X 7), gleichen (ADJ 512, VERB 10), recht (ADJ 482, ADP 3)
- deutschen
- deutsche
- eigenen
- ADJ 1687: Billig zu der eigenen Domain
- VERB 1: Die fertigen 28Si-Epitaxial-Wafer eigenen sich für Forschungszwecke , doch da bei heutigen Flip-Chip-Prozessoren die Kühlung durch den Wafer hindurch erfolgt , sind die thermischen Vorteile in der Praxis gering .
- X 1: Die bestehenden Produktlinien von DPT will Adaptec zunächst weiter unterstützen , sie jedoch langfristig mit den eigenen zusammenführen , um ein umfassendes Portfolio an RAID-Lösungen anbieten zu können .
- gut
- beiden
- bekannt
- natürlich
- online
- gleichen
- recht
Morphology
The form / lemma ratio of ADJ
is 1.703481 (the average of all parts of speech is 2.529726).
The 1st highest number of forms (138) was observed with the lemma “basieren”: ‘Cell’-basierte, .NET-basierte, 98-basierten, AIX-basierten, ARM-basiertes, ATM-basiertes, Access-basierender, Alpha-AXP-basiert, Alpha-AXP-basierte, Alpha-basierten, AppleShare-basierter, Athlon-basierten, BeIA-basiertes, Browser-basierten, C++-basierte, CLS-basierten, Celeron-basierten, Computer-basierenden, DOS-basierte, DOS-basierten, DSP-basierenden, DSP-basierten, Disc-basierendes, EPOC-basierte, Eprom-basierte, Funk-basierte, GMR-Kopf-basierte, GPS-basierte, HTML-basiertes, Host-basierter, ICE-basiert, IM-basierte, IP-basierende, IP-basierte, IP-basierten, IP-basiertes, ISDN-basierende, Intel-basierenden, Intel-basierte, Intel-basierten, Intel-basiertes, Internet-basierende, Internet-basierte, Internet-basierten, Internet-basiertes, Java-basierte, Java-basierten, Java-basiertes, Java3D-basierten, KDE-basierte, Linux-basierende, Linux-basierte, Linux-basiertem, MHP-basierten, MSN-basierten, Microkernel-basierte, Minuten-basierte, Mips-basierten, Mitgliedschaft-basierten, NDS-basierten, NT-basierenden, NT-basierten, NT-basierter, Netzwerk-basiertes, PC-basierte, PC-basierten, Palm-OS-basierten, Pentium-II-basierte, PowerPC-basierende, PowerPC-basierte, PowerPC-basierten, Qt-basierter, RISC-basierten, SOAP-basierten, SPARC-basierten, Satelliten-basierte, Satelliten-basiertem, Satelliten-basierter, Script-basierte, Server-basierenden, Server-basiert, Server-basierte, Server-basierten, Server-basiertes, SmartCard-basierten, Software-basiertes, Solaris-basierten, Stift-basierenden, Stift-basierte, Stratosphären-basierenden, Text-basierte, Tile-basierenden, Tile-basierendes, UMTS-basierenden, UNIX-basierte, US-basierender, UltraSPARC-basierte, Unix-basierende, Unix-basierenden, Unix-basierten, Unix-basierter, Voodoo-Graphics-basierte, WAP-basierten, Web-basierende, Web-basierenden, Web-basierte, Web-basierten, Windows-98-basierte, Windows-CE-basierte, Windows-CE-basiertes, Windows-NT-basierende, Windows-basierendes, Windows-basierte, Windows-basierten, WindowsCE-basierenden, XML-basierende, XML-basiert, XML-basierte, XML-basierten, Y2K-basierten, basierend, basierende, basierendem, basierenden, basierender, basierendes, basiert, basierte, browser-basierte, glibc-basierte, glibc-basiertes, libc5-basierte, linux-basierten, pc-basierter, software-basierte, text-basierten, web-basierter, web-basiertes.
The 2nd highest number of forms (82) was observed with the lemma “fähig”: 1,5-Volt-fähigen, 2.0-fähigen, 3-Plattform-fähigen, 4x-fähigen, 8-MByte-fähigen, AGP-4X-fähigen, ASP-fähig, AppleTalk-fähigen, Bluetooth-fähig, Bluetooth-fähigen, Bluetooth-fähiger, Busmaster-fähig, DRM-fähige, DirectX-fähigen, Dual-fähigen, E-Mail-fähigen, EMS-fähige, FireWire-fähigen, GPRS-fähige, GPRS-fähigen, HBCI-fähige, Hot-Plug-fähige, Hot-plug-fähige, IT-fähigen, Infrarot-fähigen, Internet-fähige, Internet-fähigen, JDK-1.1.2-fähigen, Jahr-2000-fähig, Jahr-2000-fähigen, Java-fähigen, Java-fähiger, JavaScript-fähiger, Jini-fähigen, Jini-fähiger, LAN-fähiger, Linux-fähig, MP3-fähigen, MP3-fähiger, Mac-OS-X-fähigen, NDS-fähigen, NTSC-fähigen, Netz-fähig, Netzwerk-fähigen, ODBC-fähigen, Palomino-fähigen, PnP-fähige, PostScript-fähige, Rückkanal-fähigen, SATA-fähigen, SDRAM-fähig, SMS-fähige, SMS-fähiges, SSE-fähig, Streaming-fähigen, TAPI-fähigen, UDMA/66-fähige, USB-2.0-fähige, USB-2.0-fähigen, Ultra-ATA/100-fähige, Ultra-ATA/100-fähigen, Upgrade-fähig, VBE-2.0-fähige, Vierkanal-fähigen, Voice-fähige, WAP-fähig, WAP-fähige, WAP-fähigen, WAP-fähiger, WAP-fähiges, WBEM-fähig, Web-fähig, Web-fähige, fähig, fähige, fähigen, fähiger, hörfunk-fähig, multisession-fähig, online-fähigen, plug&play-fähige, update-fähig.
The 3rd highest number of forms (62) was observed with the lemma “jährig”: 13-jährige, 13-jährigen, 15-jährige, 16-jährige, 16-jährigen, 17-jährige, 17-jährigen, 18-jährige, 18-jährigen, 19-jährige, 19-jährigen, 20-jährige, 20-jährigen, 21-jährige, 21-jährigen, 22-jähriger, 23-jährige, 24-Jährigen, 24-jährige, 25-jährige, 25-jährigen, 26-jährige, 26-jährigen, 27-jährigen, 28-jährige, 29-jährige, 29-jährigen, 30-jährige, 31-jährige, 32-jährige, 32-jährigen, 33-jährige, 33-jährigen, 35-jährige, 36-jährige, 38-jährige, 39-jährige, 39-jährigen, 40-jährigen, 41-jährige, 43-jährige, 44-jährige, 44-jährigen, 45-jährige, 46-jährige, 46-jährigen, 47-jährige, 47-jährigen, 50-jährige, 50-jährigen, 52-jährige, 54-jährige, 55-jährige, 55-jährigen, 57-jährige, 60-jährigen, 61-jährigen, 62-jährige, 66-jährige, 67-jährige, 70-jährigen, jährige.
ADJ
occurs with 6 features: Degree (246383; 94% instances), Number (172255; 66% instances), Gender (84146; 32% instances), Variant (75390; 29% instances), Case (50239; 19% instances), NumType (4874; 2% instances)
ADJ
occurs with 14 feature-value pairs: Case=Acc
, Case=Dat
, Case=Gen
, Case=Nom
, Degree=Cmp
, Degree=Pos
, Degree=Sup
, Gender=Fem
, Gender=Masc
, Gender=Neut
, NumType=Ord
, Number=Plur
, Number=Sing
, Variant=Short
ADJ
occurs with 195 feature combinations.
The most frequent feature combination is Degree=Pos|Variant=Short
(69626 tokens).
Examples: möglich, gut, ganz, weltweit, deutlich, knapp, künftig, bekannt, schnell, offensichtlich
Relations
ADJ
nodes are attached to their parents using 19 different relations: amod (181964; 69% instances), advmod (53486; 20% instances), root (9349; 4% instances), conj (4978; 2% instances), xcomp (3718; 1% instances), advcl (3192; 1% instances), obl (1439; 1% instances), ccomp (1146; 0% instances), acl (1045; 0% instances), nmod (513; 0% instances), nsubj (512; 0% instances), parataxis (332; 0% instances), obj (246; 0% instances), appos (212; 0% instances), compound:prt (197; 0% instances), csubj (186; 0% instances), nsubj:pass (49; 0% instances), csubj:pass (32; 0% instances), obl:arg (15; 0% instances)
Parents of ADJ
nodes belong to 16 different parts of speech: NOUN (180471; 69% instances), VERB (45277; 17% instances), ADJ (14167; 5% instances), (9349; 4% instances), PROPN (4920; 2% instances), AUX (3402; 1% instances), X (1930; 1% instances), NUM (1650; 1% instances), ADV (630; 0% instances), DET (590; 0% instances), PRON (133; 0% instances), SCONJ (39; 0% instances), PART (30; 0% instances), ADP (21; 0% instances), CCONJ (1; 0% instances), INTJ (1; 0% instances)
205312 (78%) ADJ
nodes are leaves.
33353 (13%) ADJ
nodes have one child.
7491 (3%) ADJ
nodes have two children.
16455 (6%) ADJ
nodes have three or more children.
The highest child degree of a ADJ
node is 12.
Children of ADJ
nodes are attached using 28 different relations: advmod (36054; 27% instances), obl (21883; 17% instances), punct (20668; 16% instances), cop (13596; 10% instances), nsubj (11600; 9% instances), conj (5461; 4% instances), cc (4366; 3% instances), mark (3266; 2% instances), obj (2174; 2% instances), case (2156; 2% instances), aux (1915; 1% instances), det (1846; 1% instances), csubj (1579; 1% instances), parataxis (1329; 1% instances), ccomp (1196; 1% instances), expl (769; 1% instances), advcl (692; 1% instances), xcomp (598; 0% instances), obl:arg (497; 0% instances), acl (267; 0% instances), amod (180; 0% instances), nmod (158; 0% instances), appos (105; 0% instances), nummod (72; 0% instances), compound:prt (37; 0% instances), acl:relcl (1; 0% instances), discourse (1; 0% instances), expl:pv (1; 0% instances)
Children of ADJ
nodes belong to 16 different parts of speech: NOUN (28027; 21% instances), ADV (23549; 18% instances), PUNCT (20668; 16% instances), AUX (15705; 12% instances), ADJ (14167; 11% instances), VERB (5938; 4% instances), CCONJ (5733; 4% instances), PROPN (4301; 3% instances), PRON (3739; 3% instances), PART (3424; 3% instances), DET (2398; 2% instances), ADP (2027; 2% instances), SCONJ (1640; 1% instances), X (592; 0% instances), NUM (556; 0% instances), INTJ (3; 0% instances)