Treebank Statistics: UD_German-PUD: POS Tags: PROPN
There are 863 PROPN
lemmas (15%), 897 PROPN
types (13%) and 1218 PROPN
tokens (6%).
Out of 16 observed tags, the rank of PROPN
is: 2 in number of lemmas, 4 in number of types and 7 in number of tokens.
The 10 most frequent PROPN
lemmas: Chr., China, Trump, USA, Frankreich, Albanien, Clinton, Joseph, US, Disney
The 10 most frequent PROPN
types: Chr., China, Trump, USA, Frankreich, Joseph, US, Hong, Paris, Qing
The 10 most frequent ambiguous lemmas: US (PROPN 6, ADJ 1), Erde (PROPN 3, NOUN 1), de (ADP 3, PROPN 2), North (NOUN 4, PROPN 2), Thutmosis (PROPN 2, NOUN 1), Gold (NOUN 2, PROPN 1), Gott (NOUN 1, PROPN 1), Karibik (NOUN 1, PROPN 1), LaBeouf (NOUN 1, PROPN 1), Lincoln (NOUN 1, PROPN 1)
The 10 most frequent ambiguous types: US (PROPN 6, ADJ 1), Erde (PROPN 3, NOUN 1), de (ADP 3, PROPN 2), North (NOUN 4, PROPN 2), Gold (NOUN 2, PROPN 1), Karibik (NOUN 1, PROPN 1), Lincoln (NOUN 1, PROPN 1), MPS (NOUN 1, PROPN 1), Nord (NOUN 1, PROPN 1), Nordsee (NOUN 1, PROPN 1)
- US
- Erde
- PROPN 3: Die Industrielle Revolution fand in Großbritannien früher als in jedem anderen Staat der Erde statt .
- NOUN 1: Die Ergebnisse dieses Experiments liefern weitere Belege dafür , dass Rucolasamen zu der Internationalen Raumstation geflogen und dort sechs Monate aufbewahrt werden können , ohne dass es zu wesentlichen Auswirkungen auf ihre Keim - und Wachstumsfähigkeit auf der Erde kommt .
- de
- North
- Gold
- NOUN 2: Öl , Gold oder Nahrungsmittel wie Weizen sind Rohstoffe , in die Spekulanten weltweit Milliarden investieren .
- PROPN 1: Hitchcock hat an dem liebsten mit den größten Talenten seiner Zeit gearbeitet , zu dem B. mit Filmposter - Designern wie Bill Gold und Saul Bass , die Poster produzierten , in denen präzise seine Filme dargestellt waren .
- Karibik
- NOUN 1: Die Bezeichnung „ Karibik “ leitet sich von den Kahlina ab , einer der zu der Zeit des europäschen Kontakts während des späten 15. Jahrhunderts vorherrschenden uramerikanischen Gruppen in der Region .
- PROPN 1: Ab dem 16 . Jahrhundert bezeichneten Europäer , die die Karibik besuchten , sie als die „ Südsee “ ( den Pazifischen Ozean südlich des Isthmus von Panama ) , in dem Gegensatz zu der „ Nordsee “ ( das Karibische Meer nördlich desselben Isthmus ) .
- Lincoln
- NOUN 1: „ Ich weiß nicht , wie groß der BIP - Wachstum unter Washington und unter Lincoln war , aber die institutionellen Entwicklungen während dieser Amtszeiten hatten erhebliche und langanhaltende Auswirkungen .
- PROPN 1: Während der Jahre , die die Familie in Kentucky und Indiana verbrachte , arbeitete Thomas Lincoln als Landwirt , Tischler und Zimmermann .
- MPS
- Nord
- NOUN 1: Zu den kultischen Überresten , die an der Ausgrabungsstätte entdeckt wurden , zählten eine Reihe von zehn riesigen aufrecht stehenden Steinen , Massebe genannt , die in Nord - Süd - Richtung ausgerichtet waren - der höchste von ihnen drei Meter hoch - und in deren Mitte eine altarartige Struktur und ein großes quadratisches Steinbecken .
- PROPN 1: Nach einer genetischen Studie mit autosomalen Daten bei Roma liegt die südasiatische Herkunft der Roma in Nord - Westindien begründet .
- Nordsee
- NOUN 1: Die größten europäischen Flüsse fließen von der Schweiz aus , wie der Rhein , die Rhone , der Inn , der Tessin und der Po , die alle in den Alpen entspringen und in die umgebenden Länder fließen , und schließlich in die Nordsee , das Mittelmeer , die Adria und das Schwarze Meer münden .
- PROPN 1: Ab dem 16 . Jahrhundert bezeichneten Europäer , die die Karibik besuchten , sie als die „ Südsee “ ( den Pazifischen Ozean südlich des Isthmus von Panama ) , in dem Gegensatz zu der „ Nordsee “ ( das Karibische Meer nördlich desselben Isthmus ) .
Morphology
The form / lemma ratio of PROPN
is 1.039397 (the average of all parts of speech is 1.198007).
The 1st highest number of forms (3) was observed with the lemma “Hitchcock”: Hichcocks, Hitchcock, Hitchcocks.
The 2nd highest number of forms (2) was observed with the lemma “Afrika”: Afrika, Afrikas.
The 3rd highest number of forms (2) was observed with the lemma “Albanien”: Albanien, Albaniens.
PROPN
occurs with 4 features: Number (1218; 100% instances), Case (1214; 100% instances), Gender (1116; 92% instances), Foreign (2; 0% instances)
PROPN
occurs with 10 feature-value pairs: Case=Acc
, Case=Dat
, Case=Gen
, Case=Nom
, Foreign=Yes
, Gender=Fem
, Gender=Masc
, Gender=Neut
, Number=Plur
, Number=Sing
PROPN
occurs with 32 feature combinations.
The most frequent feature combination is Case=Nom|Gender=Masc|Number=Sing
(295 tokens).
Examples: Trump, Donald, Joseph, John, Mishima, Paul, Rafferty, Seagal, Shen, Stephen
Relations
PROPN
nodes are attached to their parents using 17 different relations: nsubj (235; 19% instances), nmod (229; 19% instances), flat:name (164; 13% instances), appos (148; 12% instances), obl (141; 12% instances), compound (92; 8% instances), conj (86; 7% instances), obj (47; 4% instances), nmod:poss (26; 2% instances), nsubj:pass (24; 2% instances), obl:arg (10; 1% instances), obl:agent (5; 0% instances), root (4; 0% instances), xcomp (3; 0% instances), parataxis (2; 0% instances), ccomp (1; 0% instances), flat (1; 0% instances)
Parents of PROPN
nodes belong to 9 different parts of speech: NOUN (479; 39% instances), VERB (430; 35% instances), PROPN (263; 22% instances), ADJ (24; 2% instances), NUM (8; 1% instances), DET (6; 0% instances), (4; 0% instances), ADV (2; 0% instances), PRON (2; 0% instances)
482 (40%) PROPN
nodes are leaves.
444 (36%) PROPN
nodes have one child.
206 (17%) PROPN
nodes have two children.
86 (7%) PROPN
nodes have three or more children.
The highest child degree of a PROPN
node is 7.
Children of PROPN
nodes are attached using 25 different relations: case (338; 29% instances), punct (175; 15% instances), flat:name (164; 14% instances), det (123; 11% instances), conj (89; 8% instances), cc (70; 6% instances), appos (54; 5% instances), amod (27; 2% instances), acl:relcl (25; 2% instances), nmod (22; 2% instances), advmod (20; 2% instances), compound (20; 2% instances), cop (5; 0% instances), nsubj (5; 0% instances), orphan (5; 0% instances), acl (3; 0% instances), cc:preconj (2; 0% instances), ccomp (2; 0% instances), flat (2; 0% instances), obl:tmod (2; 0% instances), det:poss (1; 0% instances), mark (1; 0% instances), nmod:poss (1; 0% instances), obl (1; 0% instances), parataxis (1; 0% instances)
Children of PROPN
nodes belong to 15 different parts of speech: ADP (339; 29% instances), PROPN (263; 23% instances), PUNCT (175; 15% instances), DET (126; 11% instances), NOUN (91; 8% instances), CCONJ (73; 6% instances), ADJ (31; 3% instances), VERB (28; 2% instances), ADV (20; 2% instances), AUX (5; 0% instances), NUM (2; 0% instances), X (2; 0% instances), PRON (1; 0% instances), SCONJ (1; 0% instances), SYM (1; 0% instances)