home edit page issue tracker

This page pertains to UD version 2.

Treebank Statistics: UD_Portuguese-GSD: POS Tags: NOUN

There are 5796 NOUN lemmas (56%), 9316 NOUN types (26%) and 56170 NOUN tokens (18%). Out of 16 observed tags, the rank of NOUN is: 1 in number of lemmas, 2 in number of types and 1 in number of tokens.

The 10 most frequent NOUN lemmas: _, ano, dia, r, pessoa, cidade, presidente, país, vez, acordo

The 10 most frequent NOUN types: anos, ano, dia, r, presidente, pessoas, acordo, cidade, governo, tempo

The 10 most frequent ambiguous lemmas: _ (PROPN 32806, ADP 9506, NUM 8462, PRON 7364, DET 4461, NOUN 3563, AUX 2298, CCONJ 1840, PUNCT 1596, VERB 1247, SYM 1008, PART 746, ADJ 703, X 526, ADV 231, SCONJ 1), local (NOUN 140, ADJ 57), final (NOUN 135, ADJ 53), meio (NOUN 129, ADJ 19, ADV 2), diretor (NOUN 123, ADJ 1), capital (NOUN 121, ADJ 3), técnico (NOUN 89, ADJ 50), direito (NOUN 86, ADJ 23), dado (NOUN 74, ADJ 1), objetivo (NOUN 70, ADJ 7)

The 10 most frequent ambiguous types: anos (NOUN 465, NUM 3, PROPN 1), presidente (NOUN 264, PROPN 2), parte (NOUN 181, VERB 4), forma (NOUN 144, VERB 3), casa (NOUN 134, DET 1), jogo (NOUN 139, VERB 2), meio (NOUN 129, ADJ 7, ADV 2, NUM 1), final (NOUN 126, ADJ 46), semana (NOUN 121, ADJ 1), mundo (NOUN 119, VERB 1)

Morphology

The form / lemma ratio of NOUN is 1.607315 (the average of all parts of speech is 3.372737).

The 1st highest number of forms (1440) was observed with the lemma “_”: ”, ‘, ‘s, 1, 100m, 10minBola, 11, 12, 12h, 13h, 15h45m, 16, 1kg, 2, 200m, 22h, 22h27, 22km, 23h59, 28, 29, 3, 4, 4x100m, 50m, 6, 93kg, 971R, 9h20, A., ANATEL, ANPR, APAE, ATR, Abraão, Acacia, Alessandro, Alexsandro, Alonso, Amém., América, Aníbal, Aseleições, Ataliva, Aureliano, BR, BRVias, BRs, CBMTV, CD, CEOs, CT, Caberia, Cafusa, Campina, Caputera, Casiano, Caxias, Celpa, Cemig, China, Com, Cooprol, Crato, DJs, DNA, DSPs, DST, DVD, DVDs, Ecuador, Eostre, Erundina, Fonce, Future, Gadaba, Gbps, HD, Hrubieszów, IR, ISSO, ISTOÉ, Iraque, Juquinha, LPs, LS, Leeds, Leleco, Lerum, MW, Makenga, Murtosa, NAO, NBA, Nicarágua, ONGs, Obs, Olímpia, PC, PCs, PDAs, PGR, PM, PPPs, PR, PRD, PREFERENCIAL, PSD, PagSeguro, Paraíba, Partidor, Pedro, Philippe, Qantas, RS, SFR, SMS, SUV, Sapucaí, Skoczów, Sr., Taekwondo, Temple, URL, UTI, Vasco, Venezuela, Victor, Vingador, Wade, Yahoo!, , a_n, abandonware, abcases, abordagm, abraçoterapia, abre, abássidas, ace, acionista, acionistas, acordeon, acumulado, acúfeno, adaptandos, adicionados, adicional, adipatos, adivogado, adotado, advanve, affair, affinity, afiliada, afinaçao, afrobrasileiros, afrodescendentes, aftermarket, agraciados, agregadores, agroenergia, agropecuária, aids, ainda, alauita, albendazol, ales, alfinetada, alone, alphavirus, alta, altas, alternativa, alternativas, alteta, alvirrubro, ambos, ambulante, ambulantes, americana, ameças, amistosa, amistoso, amistosos, ancestrais, anfitriães, anos.Na, ansiosos, anterior, anteriores, antes, anticolinérgicos, antiglobalização, antipulgas, anuncios, apart, apenados, apoiador, apoiadores, apostinha, app, aprovados, aquaponia, aquilo, aquícola, arboretum, arcade, areas, ares, argan, argente, arival, armarinho, aromatizadores, arquiteta, arrancada, arredores, art, art., aruanã, asessoria, assaltado, asteróide, atingidos, atingira, atirar, atriz, atrizes, attachment, atual, atuante, augmenting, augusto, autodescoberta, autodescrição, autodidata, autokrator, automobilística, autoprodução, autovetores, auxilio, avifauna, açoreamento, backing, baderneiros, bagatha, baia, baixa, baixas, balsâmicos, balão, bandanas, bandeirinha, bands, barbiere, barbies, barrada, barrigão, bastante, batida, batidas, batmóvel, beclometasona, belga, beneficio, beneficios, benzimidazólicos, beta, bicola, bilhões, biodiesel, biopolímeros, biotinidase, bird, blogueira, boards, bolsões, bolão, bolões, boneca, bonecas, bordadeiras, borracha, borrachas, box, braille, branca, brasiguaios, browser, buggy, bullying, bylaws, c., cabido, cabines, cadeirante, cadela, caia, calcar, calcinhas, call, calma, calçada, calçadas, calças, camareira, camp, canaleta, candidados, canhota, capazes, capitulo, caprinos, caracteres, característica, características, caradura, card, carinhas, carreira, carreiras, carrinho, carrinhos, carry, carteira, carteiras, carteirinha, casarão, casarões, cases, cash, cassetas, cassis, casta, cathedra, catholicós, catimba, causados, cautelar, cavadinha, cavaquinho, cavea, cebolinha, celeb, celestes, cell, celular, celulares, center, centers, certa, cerâmica, cessar, cevada, chamada, chamadas, check, chef, chefs, cheia, chistorra, choca, cibercrime, cicadófitas, cinomose, cintada, cinética, citoqueratinas, clado, cladograma, classicos, classificatória, clinkers, clobetasol, cloud, club, clínica, clínicas, coach, coaches, coaching, coautora, cobradas, cobrarem, coenobium, coevento, coicidencia, coitada, colegiado, colegiados, coletores, colocada, colocado, colocados, colorado, comandado, comandados, comercial, comercio, começa, comments, comodites, comoriano, compacto, compactos, compasão, computing, compõe, comte, concept, concuro, concursados, concurseiros, condessa, condicionadores, condulências, conformes, conições, conscience, conseguido, conseguinte, consellheiro, conseqüência, conseqüências, consevação, consignado, console, consoles, continuarão, contratado, contratados, contratenor, controle, controles, convencionais, conversa, conversas, convocado, convocados, coolers, cooperativa, cooperativas, coordenadas, copatrocinador, coptas, core, corficiente, corintiano, corintianos, corre, corretora, costas, cotidiano, cotistas, cova, coxa, cracolândia, craniossinostose, criativo, crispi, cruas, cruzada, crítica, críticas, custódia, câmaras, céria, cômodos, dC, dame, datashow, datum, decada, decidão, defeculdade, defesa, defesas, deficiente, deficientes, defumados, demais, demand, demonio, dentão, denunciado, denunciados, denuncias, depois, derivada, derrotada, derrubada, derrubadas, desabrigados, desafetos, desalavancagem, descidas, descoberta, descobertas, desejado, desembarcação, desembaçador, desenrolar, desfinanciamento, designers, desktop, desktops, desmanche, desnvolvimento, despedida, despossuídos, destrato, diafilmes, dianteira, diceção, difíceis, difícil, digitos, diligencias, dinâmica, direcionais, directors, direita, dirpoprionato, discs, disperso, disque, distintos, diurético, doe.name, dominatrix, dona, download, downloads, duas, dubla, dublador, dulzainas, duopóplio, dupla, duplas, duquesa, dye, dérbi, easter, ebuilds, ecommerce, ecssa, editora, editoras, egg, elections, eletrocenters, eletrodomésticos, eletrônicos, elevadas, eliminatória, elminação, emagrecedores, emissora, emissoras, emo, encarada, endolação, enfiada, entanto, entojada, entorno, entorpecente, entorpecentes, entrantes, entre, envolvidos, epigenética, epsilon, epsilon, equations, equipados, equivalente, erínias, escapulare, escolhido, escondidas, escorregada, escrita, escritas, esférócitos, especiais, especial, especies, especulado, esperado, espinha, espinhas, esportistas, esquerdo, estadunidenses, estar, estarão, estatal, estatística, estatísticas, estimado, estimativa, estimativas, eternit, euriptéridos, eurozona, evangélicos, evidênsias, exatas, excessões, executive, exeplo, exetrior, existente, existentes, exito, exportacões, exposto, fac, facão, falastrões, falha, falhas, falta, faltas, famosa, famosos, fanpage, fazer, federais, feira, feira.Equipes, feirão, fera, feromônios, fieis, filiados, finanças, fitness, fitofisionomias, flamenguistas, flex, flexíveis, fnal, foliar, food, foot, formado, fotocontêiner, franqueados, freelancers, freestyle, freiras, fronteira, fronteiras, fumetti, fundos, funerária, futsal, fuzis, férias, fêmea, fêmeas, física, gadget, gadgets, gaiola, galeada, gama, gandharas, gastrônoma, gata, geleira, geleiras, generis, genética, geopolítica, georeferenciação, geradoras, gerenciador, gigawatts, ginasial, ginástica, glam, global, glucose, gm, golaço, goleio, gonzaguinhas, graben, grafitagem, gramática, gratuita, gravadora, gravadoras, grelina, gremista, gremistas, grid, grife, gráfica, guerreira, hab, halteres, hard, has, hashtag, hatch, hatchback, hebiatria, hendecacampeão, herbivoria, hermanos, heroi, heroína, hersia, hidrelétrica, hidrelétricas, hijab, hikikomori, hoje, home, homegeado, horrores, hospitalizadas, hospitalizados, hotsite, how, i.e., iCarros, iCloud, iPad, iPhone, iPhones, idosa, idosos, idéia, idéias, ilhotas, imp, impeça, imprevisível, imprinting, improvável, in, incorre, incrível, incubadora, indecisos, independente, indicacações, indignados, indiretos, individual, individuos, infectadss, influencia, informática, inicio, ins, inscritos, institucionalidade, integrante, integrantes, inteira, interino, intermediador, internção, interprete, intranets, intrões, invervenção, investida, investidas, invictos, inéditas, ipratrópio, isopentano, israelenses, iuans, jam, jamaicanos, japonesas, jatapu, jitsu, jiu, john.doe.name, jordaniano, juegos, juquira, jurisdicionado, jurídicas, justificativa, justificativas, juíza, jítsu, kappa, kickboxing, know, kolam, kombis, konda, koya, kupia, ladroes, landegravina, lareira, larga, las, laureados, lazurite, ldots, led, legal, legislative, legislativo, leguminosa, letras, leves, liberdades, libertade, lider, ligações, liliopsida, line, lingüística, linha, linhas, loans, lobopodios, lock, locou, login, logística, loira, longa, look, looks, los, lot, lounge, loura, louros, luminárias, luvas, luzes, lógica, m2, machões, madeiras, madrinhas, magazineluiza, mains, mainstream, maiores, malianos, malware, malwares, manifestada, manobras, mantimentos, mantutenção, maquinas, mare, marinha, market, massagueira, massas, masseiro, matchpoints, matemática, mater, matricarca, matrimonio, matris, me, mebendazol, mecânica, medal, mediana, megabit, megafauna, megapátio, meia, meias, meios, melhorar, memórias, menores, mensalão, merdas, metais, metilbutano, metilprednisolona, metralhadora, mezzo, microblog, microempreendedores, microfibrilas, micênica, mil, milhas, milícias, min, mineira, mineradora, minhocas, ministra, minoica, mix, ml, model, modinha, moinhos, moiras, monergismo, morena, mortais, mortem, moscas, mostras, movies, muay, mudas, muglox, mujlher, municíopio, munições, musca, mutinarias, muçarela, m², m³, mágicas, máxima, média, médias, médica, mínima, mínimas, móveis, música, músicas, na, namorada, narrativa, negativa, negra, negrito, neta, netbook, netinha, nichiren, nivel, no, noise, nordestedo, normativos, norovírus, noticias, nulo, nulos, numero, oblonga, obrigatória, obtido, ocasição, ocorrer, ocorrido, ofensiva, oferecido, ofereça, off, oitavas, ok, oleaginosa, olfativo, olhada, olheiras, ombré, omnivoria, on, onshore, oposicão, orbitador, ordinárias, orkutização, orquidófilos, ouros, outra, outro, ovaloide, ovinos, oxide, pacha, padrinho, pageviews, pague, pais, paisana, palacetes, palmas, palmeirenses, palurdo, paparazzi, papeis, papiloscopistas, papéis, para, parabéns, paraguaios, paralelas, paralimpíadas, paramilitares, parasitas, paratleta, parciais, parcial, parquinho, partes, participa, parvovirose, passada, path, patido, pay, pecuária, pedados, pegada, pegadinha, pegar, peleteiros, pena, penas, pendrive, penitenciária, penúltimo, people, peração, percentuais, percentual, peridíolos, perigosos, pet, pets, phi, photoshoots, pichiciego, piers, pilates, pilha, pilhas, pin, pioglitazona, pior, pirambóia, piwo, planejado, plastificantes, platform, platinas, playsson, pocentagem, poderes, points, pole, policias, poliomelite, politico, polivinila, poltronas, política, políticas, pontilhão, ponyo, porcentuais, porcentual, porja, portabilididade, portage, porteira, portuguesa, posibilidade, position, posts, postulante, postulantes, pousada, povos, pracaxi, pracinha, pratas, prateleiras, prcesso, predominar, prefeiturável, prefeitável, preferida, preferido, prejudicado, prender, preparativos, preparatórios, preperação, presa, presas, presenteado, presentes, presidenciais, presidenta, previstos, prima, primeiroturno, primícias, princesa, princesas, principais, profiler, proibido, promeça, proposta, propostas, proteoglicanos, providencias, prticipação, prática, práticas, prévia, prínicpe, próprios, prōtospatharioi, ps, psiquiatras, pubalgia, publico, pulga, puta, pênalti.O, pênis, pêsames, quados, quadrinização, quarta, quartas, quarterback, que, quebequenses, quinta, quintos, química, races, radio, rafting, rainha, ramjet, raposa, reality, recall, recardas, receberão, receiver, reciclador, recompra, recíproca, refletores, reforços, reggaeton, registrada, registrado, reivindicado, relacionados, relargada, releção, remediação, remix, rendeiras, repetitivo, reporteres, república, repúblicas, resendenses, resort, responsibilities, retardados, retirada, retransmissora, retrospectiva, revolta, revoltas, ribeiros, rights, rins, riograndinos, risca, rizosfera, rodada, rodadas, rodolitos, rolé, rota, rotas, roupão, royalties, roças, rpm, ré, réis, rés, sacada, sacellum, sacola, sacolas, sacolés, sais, salafistas, salbutamol, salão, santista, santistas, sassânidas, sauditas, schwelkenfelders, scratch, seax, sec., seca, secada, secretario, secretária, secretárias, sectile, seer, seguida, segunda, segunda-feira, seguradoras, seletiva, seletivas, seller, sem, sequencia, seres, seria, session, setença, shido, shop, showman, side, siderúrgica, simulados, sinais, sistemico, sistemática, situada, skatistas, skins, smartphone, smartphones, sobreviragem, sobrinhas, sobrinho, sobrinhos, social, socinianos, sogra, solid, solvability, songbook, spam, stanza, startup, startups, streaming, stripper, sub, subcompactos, subcoordenadora, subida, subidas, submission, subtestes, suiço, superclássico, superendividamento, superesportiva, superfícies.Também, supersessionismo, superóxido, suspeita, suspeitas, suspensa, suspenso, sêxtupla, tablet, tablets, tag, talk, talosianos, taluk, taluks, tampa, tantu, tardar, tarde3, tecno, telecatch, telemedicina, telão, telões, tempos.A, tempura, tempão, temática, tendai, tentativa, tentativas, terceira, terceirizados, teresinenses, termelétrica, termoeléctricas, test, testa, tetravalente, thai, theater, tholus, tim, timeco, tinta, tocante, tomada, tomadas, tomara, torres, totaaal, touchdowns, touchscreen, tour, trabalinhos, trailers, transmuralidade, traseira, trasmissões, trechão, triangular, tricolor, trilhão, trilhões, trimeste, tripulada, triturno, troca, trocas, troll, tropical, trólebuses, turtablism, tweet, tweets, twittadas, twitter, tye, técnica, técnicas, térmicas, tórus, ulha, umidificador, up, uádis, vaca, vacas, vacilo, val, valores, vans, varejista, varia, variasss, vascaínos, veiculo, vencedor, vencedora, vencedores, venezuelano, venezuelanos, ventura, veterinária, videoscopia, view, vihuela, villa, virada, virtualização, visitante, visitantes, visual, vitóra, voivodia, voleio, votado, vulnerável, vídeomonitoramento, watching, web, website, wrestler, wrestling, x86, youtubers, yuko, zague, zen, zigue, zolami, zoológico, °, ², º, África, Ênio, âmnion, índices, íntegra, ïasapuka’i, óculos, órbiita, óvulos, última, δ, π, ω, €, 奇, 瑞瑞虎.

The 2nd highest number of forms (5) was observed with the lemma “garoto”: garota, garotas, garotinha, garoto, garotos.

The 3rd highest number of forms (4) was observed with the lemma “aluno”: aluna, alunas, aluno, alunos.

NOUN occurs with 3 features: Gender (6; 0% instances), Number (6; 0% instances), Polarity (2; 0% instances)

NOUN occurs with 5 feature-value pairs: Gender=Fem, Gender=Masc, Number=Plur, Number=Sing, Polarity=Neg

NOUN occurs with 5 feature combinations. The most frequent feature combination is _ (56162 tokens). Examples: anos, ano, dia, r, presidente, pessoas, acordo, cidade, governo, tempo

Relations

NOUN nodes are attached to their parents using 31 different relations: nmod (30188; 54% instances), obj (8910; 16% instances), nsubj (7345; 13% instances), conj (3803; 7% instances), nsubj:pass (1455; 3% instances), appos (1348; 2% instances), root (1310; 2% instances), flat (538; 1% instances), iobj (278; 0% instances), ccomp (235; 0% instances), fixed (169; 0% instances), parataxis (135; 0% instances), acl:relcl (124; 0% instances), advcl (63; 0% instances), amod (47; 0% instances), dep (45; 0% instances), xcomp (38; 0% instances), case (31; 0% instances), acl (30; 0% instances), obl (27; 0% instances), advmod (11; 0% instances), mark (11; 0% instances), csubj (10; 0% instances), nummod (8; 0% instances), cop (3; 0% instances), compound (2; 0% instances), orphan (2; 0% instances), cc (1; 0% instances), det:poss (1; 0% instances), expl:pv (1; 0% instances), flat:name (1; 0% instances)

Parents of NOUN nodes belong to 15 different parts of speech: VERB (30246; 54% instances), NOUN (20115; 36% instances), PROPN (1377; 2% instances), (1310; 2% instances), ADJ (953; 2% instances), ADV (646; 1% instances), PRON (569; 1% instances), PART (295; 1% instances), ADP (206; 0% instances), NUM (193; 0% instances), SYM (186; 0% instances), DET (37; 0% instances), X (25; 0% instances), AUX (10; 0% instances), CCONJ (2; 0% instances)

1762 (3%) NOUN nodes are leaves.

13103 (23%) NOUN nodes have one child.

17949 (32%) NOUN nodes have two children.

23356 (42%) NOUN nodes have three or more children.

The highest child degree of a NOUN node is 15.

Children of NOUN nodes are attached using 34 different relations: det (34930; 26% instances), case (30831; 23% instances), nmod (22679; 17% instances), amod (11819; 9% instances), punct (10200; 8% instances), conj (3753; 3% instances), appos (3664; 3% instances), nummod (3336; 2% instances), cc (2729; 2% instances), acl:relcl (2376; 2% instances), acl (1802; 1% instances), cop (1711; 1% instances), det:poss (1638; 1% instances), nsubj (1110; 1% instances), advmod (949; 1% instances), flat (672; 0% instances), mark (293; 0% instances), csubj (254; 0% instances), advcl (118; 0% instances), parataxis (100; 0% instances), aux (70; 0% instances), dep (67; 0% instances), expl:pv (51; 0% instances), acl:inf (43; 0% instances), aux:pass (24; 0% instances), obj (24; 0% instances), nsubj:pass (16; 0% instances), ccomp (11; 0% instances), fixed (9; 0% instances), iobj (2; 0% instances), orphan (2; 0% instances), compound (1; 0% instances), flat:name (1; 0% instances), xcomp (1; 0% instances)

Children of NOUN nodes belong to 15 different parts of speech: DET (36504; 27% instances), ADP (30658; 23% instances), NOUN (20115; 15% instances), ADJ (11815; 9% instances), PUNCT (10201; 8% instances), PROPN (8620; 6% instances), VERB (5552; 4% instances), NUM (4370; 3% instances), CCONJ (2914; 2% instances), AUX (1796; 1% instances), ADV (1243; 1% instances), PRON (647; 0% instances), SYM (535; 0% instances), X (182; 0% instances), PART (134; 0% instances)