Statistics of NOUN in UD_Vietnamese-TueCL

home edit page issue tracker

This page pertains to UD version 2.

It appears that you have Javascript disabled. Please consider enabling Javascript for this page to see the visualizations.

Treebank Statistics: UD_Vietnamese-TueCL: POS Tags: `NOUN`

There are 271 NOUN lemmas (35%), 271 NOUN types (35%) and 380 NOUN tokens (20%). Out of 15 observed tags, the rank of NOUN is: 1 in number of lemmas, 1 in number of types and 1 in number of tokens.

The 10 most frequent NOUN lemmas: người, điều, thứ, việc, băng, cách, cái, hàng, tham số, đảng

The 10 most frequent NOUN types: người, điều, thứ, việc, băng, cách, cái, hàng, tham số, đảng

The 10 most frequent ambiguous lemmas: có (VERB 29, NOUN 2), cha (NOUN 1, PRON 1), của (ADP 27, NOUN 1), dịch (VERB 2, NOUN 1), giờ (ADV 1, NOUN 1), hướng (NOUN 1, VERB 1), học (NOUN 1, VERB 1), lại (ADV 3, NOUN 1), qua (ADP 5, NOUN 1), quyết định (NOUN 1, VERB 1)

The 10 most frequent ambiguous types: có (VERB 27, NOUN 2), của (ADP 27, NOUN 1), dịch (VERB 2, NOUN 1), hướng (NOUN 1, VERB 1), học (NOUN 1, VERB 1), lại (ADV 3, NOUN 1), qua (ADP 5, NOUN 1), quyết định (NOUN 1, VERB 1), thí nghiệm (NOUN 1, VERB 1), tác động (NOUN 1, VERB 1)

có
- VERB 27: Hắn trầm tĩnh , có uống rượu , nhưng không tới nỗi say quá .
- NOUN 2: Mối quan hệ của chúng ta sẽ được nhiều hơn là có qua có lại .
của
- ADP 27: Mối quan hệ của chúng ta sẽ được nhiều hơn là có qua có lại .
- NOUN 1: Nhiệm vụ của ta là bắt những trùm sò , ko phải bọn trên phố .
dịch
- VERB 2: Tuy Google dịch khá hay một vài ngôn ngữ , nó dịch tiếng Trung vô cùng tệ .
- NOUN 1: Hàng trăm hàng ngàn cái chết không cần thiết ở một nước đã bị mắc bệnh dịch hạch tệ hại hơn bất cứ loại dịch nào .
hướng
- NOUN 1: Thế là tôi quyết định sẽ đi xa hơn theo hướng này và tới những nơi không có một bảo tàng nào cả .
- VERB 1: Tôi rất thích chủ đề lần này , - “ The Future You “ - bởi lẽ việc hướng đến tương lai cho ta cơ hội tranh luận ở hiện tại , cho ta nhìn tương lai qua lăng kính của từng người .
học
- NOUN 1: Và học tập hạn giám sát đề cập đến một thực tế rằng chúng tôi đã cung cấp các thuật toán một tập dữ liệu bằng các dấu ngoặc kép câu trả lời đúng chức .
- VERB 1: Có hai điều quan trọng phải biết về khoa học : Các định luật chúng ta học được qua kinh nghiệm và qua thí nghiệm .
lại
- ADV 3: Một mối quan hệ cộng sinh , liệu những loài biết bay như chim hay ong , chúng có nhận lại được thứ gì không , và thứ mà chúng nhận lại là mật hoa .
- NOUN 1: Mối quan hệ của chúng ta sẽ được nhiều hơn là có qua có lại .
qua
- ADP 5: Quân đội ông ấy đã được rèn dũa qua hàng trăm trận với quân Anh .
- NOUN 1: Mối quan hệ của chúng ta sẽ được nhiều hơn là có qua có lại .
quyết định
- NOUN 1: Những quyết định này ta không hề đưa ra hấp tấp đâu .
- VERB 1: Thế là tôi quyết định sẽ đi xa hơn theo hướng này và tới những nơi không có một bảo tàng nào cả .
thí nghiệm
- NOUN 1: Chúng tôi mang chúng đến một căn phòng và thực hiện thí nghiệm với chúng .
- VERB 1: Có hai điều quan trọng phải biết về khoa học : Các định luật chúng ta học được qua kinh nghiệm và qua thí nghiệm .
tác động
- NOUN 1: Và tôi sẽ nói rằng tôi tất nhiên hy vọng rằng các công nghệ khác cũng sẽ được xem xét như vậy , cũng như chúng ta sẽ muốn xem xét đến thứ gì có thể có tác động tiềm ẩn trong các lĩnh vực khác ngoài sinh học .
- VERB 1: Ống truyền dịch Levothyroxin là một loại thuốc tác động lên tuyến giáp .

Morphology

The form / lemma ratio of NOUN is 1.000000 (the average of all parts of speech is 1.000000).

The 1st highest number of forms (1) was observed with the lemma “Hula”: Hula.

The 2nd highest number of forms (1) was observed with the lemma “buồm”: buồm.

The 3rd highest number of forms (1) was observed with the lemma “bài giảng”: bài giảng.

NOUN occurs with 4 features: Typo (4; 1% instances), Case (1; 0% instances), NounType (1; 0% instances), Polite (1; 0% instances)

NOUN occurs with 4 feature-value pairs: Case=Voc, NounType=Clf, Polite=Elev, Typo=Yes

NOUN occurs with 4 feature combinations. The most frequent feature combination is _ (374 tokens). Examples: người, điều, thứ, việc, băng, cách, hàng, tham số, đảng, cuộc

Relations

NOUN nodes are attached to their parents using 22 different relations: obj (84; 22% instances), obl (58; 15% instances), nsubj (45; 12% instances), compound (44; 12% instances), nmod (44; 12% instances), clf (32; 8% instances), conj (18; 5% instances), root (16; 4% instances), appos (5; 1% instances), ccomp (5; 1% instances), nmod:poss (5; 1% instances), nsubj:pass (5; 1% instances), obl:tmod (5; 1% instances), advcl (3; 1% instances), fixed (3; 1% instances), nsubj:outer (2; 1% instances), acl:relcl (1; 0% instances), case (1; 0% instances), iobj (1; 0% instances), nmod:tmod (1; 0% instances), parataxis (1; 0% instances), vocative (1; 0% instances)

Parents of NOUN nodes belong to 10 different parts of speech: VERB (199; 52% instances), NOUN (133; 35% instances), (16; 4% instances), ADJ (10; 3% instances), NUM (10; 3% instances), PRON (6; 2% instances), DET (3; 1% instances), ADV (1; 0% instances), AUX (1; 0% instances), PROPN (1; 0% instances)

102 (27%) NOUN nodes are leaves.

102 (27%) NOUN nodes have one child.

85 (22%) NOUN nodes have two children.

91 (24%) NOUN nodes have three or more children.

The highest child degree of a NOUN node is 11.

Children of NOUN nodes are attached using 30 different relations: case (104; 15% instances), det (83; 12% instances), nmod (59; 9% instances), amod (56; 8% instances), compound (56; 8% instances), nummod (52; 8% instances), punct (49; 7% instances), acl:relcl (34; 5% instances), cop (26; 4% instances), advmod (24; 4% instances), nsubj (22; 3% instances), nmod:poss (19; 3% instances), clf (15; 2% instances), conj (14; 2% instances), cc (13; 2% instances), acl (11; 2% instances), appos (6; 1% instances), xcomp (6; 1% instances), discourse (4; 1% instances), parataxis (4; 1% instances), fixed (3; 0% instances), advcl (2; 0% instances), aux (2; 0% instances), mark (2; 0% instances), obl (2; 0% instances), csubj (1; 0% instances), iobj (1; 0% instances), nmod:tmod (1; 0% instances), obj (1; 0% instances), obl:tmod (1; 0% instances)

Children of NOUN nodes belong to 14 different parts of speech: NOUN (133; 20% instances), ADP (103; 15% instances), DET (78; 12% instances), VERB (58; 9% instances), ADJ (56; 8% instances), NUM (53; 8% instances), PUNCT (49; 7% instances), PRON (47; 7% instances), AUX (31; 5% instances), ADV (25; 4% instances), PROPN (19; 3% instances), CCONJ (13; 2% instances), PART (5; 1% instances), SCONJ (3; 0% instances)

Treebank Statistics: UD_Vietnamese-TueCL: POS Tags: NOUN

Morphology

Relations

Treebank Statistics: UD_Vietnamese-TueCL: POS Tags: `NOUN`