Treebank Statistics: UD_Norwegian-Nynorsk: POS Tags: X
There are 713 X
lemmas (3%), 713 X
types (2%) and 1232 X
tokens (0%).
Out of 17 observed tags, the rank of X
is: 6 in number of lemmas, 6 in number of types and 15 in number of tokens.
The 10 most frequent X
lemmas: of, the, og, det, en, i, for, som, til, den
The 10 most frequent X
types: of, the, og, det, en, i, for, som, til, den
The 10 most frequent ambiguous lemmas: of (X 35, ADP 6), the (X 20, DET 7, NUM 1), og (CCONJ 8213, X 28, ADV 17), det (PRON 5531, DET 1337, X 16), en (X 22, DET 5, ADP 1), i (ADP 9532, ADV 84, X 20, NOUN 3), for (ADP 3646, ADV 205, CCONJ 100, X 18), som (SCONJ 3460, ADP 1330, X 19, ADV 5), til (ADP 4375, ADV 223, SCONJ 40, X 16, PROPN 1), den (DET 1927, PRON 149, X 12, PROPN 1)
The 10 most frequent ambiguous types: of (X 35, ADP 6), the (X 20, DET 7, NUM 1), og (CCONJ 7882, X 28, ADV 16, PART 3), det (PRON 4104, DET 1165, X 16, ADV 1), en (X 22, DET 7, ADP 1), i (ADP 8727, ADV 81, X 20, NOUN 3), for (ADP 3509, ADV 197, CCONJ 52, X 18, VERB 1), som (SCONJ 3434, ADP 1268, X 19, ADV 5), til (ADP 4296, ADV 223, SCONJ 40, X 16, PROPN 1), den (DET 1665, PRON 115, X 12)
- of
- the
- X 20: Human Nature and the Limits of Science .
- DET 7: I DKK er dei “ Doctors of the church “ , men kva er dei i vår kyrkje ?
- NUM 1: Men å degradere gjensidig forståing og rasjonell vurdering i « the community of investigators » til ( kausalt produserte ) naturhendingar , er å gå til åtak på den form for rasjonell aktivitet som naturvitskapen utgjer .
- og
- det
- PRON 4104: Slik gjer eg det :
- DET 1165: … Er ofte det beste .
- X 16: den trenger det . »
- ADV 1: Dette samanfallet , pluss det faktum at Ronald Reagan gjekk i sin andre presidentperiode i 1984 , fekk nyleg ein filmkritikar i New York til å skriva at « ein ny episode i Terminator-franchisen er på veg , det må det bety at ein republikansk president stiller til attval » .
- en
- X 22: Det problemet får en ikke løst så lenge vi er utenfor EU . »
- DET 7: - Det er ein innsats som ikkje kan ha en uendeleg tidshorisont .
- ADP 1: 4 1.2.2.3 Danmark I Danmark utarbeidde eit hurtigarbeidande utval nedsett av Kulturministeriet i 2003 ein rapport med tittelen Sprog på spil - et udspil til en dansk sprogpolitik .
- i
- ADP 8727: Det får eg når eg bakar brødet i former .
- ADV 81: Varm opp steikepanna , og ha i smør .
- X 20: Ved en feiltakelse hadde et avsnitt blitt borte i papirutgaven .
- NOUN 3: Den nynorske formi vi kann ikkje førast attende på vér ( nokon ljodyvergang frå é til i er ikkje kjend ) , men er lånt frå dansk og svensk .
- for
- ADP 3509: Motoren byrja fyrst å gå for fullt att for fåe år sidan .
- ADV 197: Grove brød er sunt , men små barn bør ikkje få for grovt brød .
- CCONJ 52: Eg meiner ikkje å seie at alt er gale i Dnk , for det er det ikkje .
- X 18: Så kan vi klare oss med 363 dagers ekstrainntekter helt for oss selv ? »
- VERB 1: Mandag for ho på sjukehuset , og då ho kom heimatt på fredag møtte mannen hennar henne med denne helsinga :
- som
- til
- ADP 4296: Smør til steiking
- ADV 223: La brøda etterheve godt , minst ein time til .
- SCONJ 40: Steik brøda i 40 - 45 minutt til dei er ferdige .
- X 16: « Skal vi omdanne vårt folk til en søppelkasse rasebiologisk sett ? » )
- PROPN 1: Jamfør eit augevitne frå glanstida til filmen , sprang mange ut av salen då det gjekk opp for dei at det var ein pornofilm dei hadde kjøpt billett til .
- den
Morphology
The form / lemma ratio of X
is 1.000000 (the average of all parts of speech is 1.346300).
The 1st highest number of forms (1) was observed with the lemma “$/”: /.
The 2nd highest number of forms (1) was observed with the lemma “-e-”: -e-.
The 3rd highest number of forms (1) was observed with the lemma “07.30”: 07.30.
X
occurs with 1 features: Foreign (1021; 83% instances)
X
occurs with 1 feature-value pairs: Foreign=Yes
X
occurs with 2 feature combinations.
The most frequent feature combination is Foreign=Yes
(1021 tokens).
Examples: det, en, i, og, the, of, som, til, den, for
Relations
X
nodes are attached to their parents using 15 different relations: flat:foreign (874; 71% instances), flat:name (165; 13% instances), root (69; 6% instances), obj (23; 2% instances), appos (19; 2% instances), obl (18; 1% instances), ccomp (13; 1% instances), nsubj (13; 1% instances), xcomp (12; 1% instances), compound (10; 1% instances), conj (8; 1% instances), nmod (5; 0% instances), csubj (1; 0% instances), dislocated (1; 0% instances), nsubj:pass (1; 0% instances)
Parents of X
nodes belong to 7 different parts of speech: X (881; 72% instances), PROPN (168; 14% instances), (69; 6% instances), VERB (67; 5% instances), NOUN (35; 3% instances), ADJ (9; 1% instances), PRON (3; 0% instances)
1015 (82%) X
nodes are leaves.
63 (5%) X
nodes have one child.
16 (1%) X
nodes have two children.
138 (11%) X
nodes have three or more children.
The highest child degree of a X
node is 40.
Children of X
nodes are attached using 20 different relations: flat:foreign (874; 64% instances), punct (341; 25% instances), flat:name (41; 3% instances), case (26; 2% instances), mark (12; 1% instances), conj (11; 1% instances), cc (7; 1% instances), nmod:poss (6; 0% instances), nsubj (6; 0% instances), obl (6; 0% instances), amod (5; 0% instances), appos (5; 0% instances), cop (5; 0% instances), nmod (4; 0% instances), advmod (3; 0% instances), det (3; 0% instances), acl:relcl (2; 0% instances), advcl (2; 0% instances), parataxis (2; 0% instances), xcomp (1; 0% instances)
Children of X
nodes belong to 13 different parts of speech: X (881; 65% instances), PUNCT (341; 25% instances), PROPN (52; 4% instances), ADP (26; 2% instances), NOUN (17; 1% instances), SCONJ (12; 1% instances), CCONJ (8; 1% instances), ADJ (7; 1% instances), VERB (6; 0% instances), AUX (5; 0% instances), DET (3; 0% instances), ADV (2; 0% instances), PRON (2; 0% instances)