Treebank Statistics: UD_Vietnamese-VTB: POS Tags: PUNCT
There are 18 PUNCT
lemmas (0%), 18 PUNCT
types (0%) and 8151 PUNCT
tokens (14%).
Out of 17 observed tags, the rank of PUNCT
is: 13 in number of lemmas, 13 in number of types and 3 in number of tokens.
The 10 most frequent PUNCT
lemmas: ., ,, “, :, …, -, ?, !, rbkt, lbkt
The 10 most frequent PUNCT
types: ., ,, “, :, …, -, ?, !, RBKT, LBKT
The 10 most frequent ambiguous lemmas: . (PUNCT 2990, NOUN 16), , (PUNCT 2740, PROPN 1), - (PUNCT 149, SYM 67), / (PUNCT 16, SYM 4), & (PUNCT 6, NOUN 2, SYM 2, CCONJ 1)
The 10 most frequent ambiguous types: . (PUNCT 2990, NOUN 16), , (PUNCT 2740, PROPN 1), - (PUNCT 149, SYM 67), / (PUNCT 16, SYM 4), & (PUNCT 6, NOUN 2, SYM 2, CCONJ 1)
- .
- ,
- -
- /
- &
- PUNCT 6: Công ty kinh doanh dịch vụ thám tử tư duy nhất ở VN mang tên công ty điều tra & bảo vệ V .
- NOUN 2: Khi thám tử Tuấn về đến Hà Nội , hoàn thành vai sinh viên Hải thì công ty điều tra & V cũng hoàn tất hợp đồng với chị Hằng .
- SYM 2: Cũng tương tự trường hợp ông Lê Huy Ngọ , bị cáo Nguyễn Thiện Luân cho biết “ không cần thiết “ công bố nội dung đối chất giữa ông với nhân chứng Nguyễn Công Tạn LBKT nguyên bộ trưởng bộ NN & PTNT RBKT tại phiên tòa .
- CCONJ 1: Phát biểu tại hội nghị sơ kết ba năm công tác phòng chống ma túy , AIDS và mại dâm , tổ chức trong hai ngày 22 và 23 - 3 tại Hà Nội , bộ trưởng bộ Lao động - Thương binh & Xã hội Nguyễn Thị Hằng cho biết hiện cả nước có 36.000 người mại dâm , cùng gần 3.200 đối tượng chủ chứa , gần 1.100 môi giới mại dâm và 7.000 tiếp viên trong các cơ sở kinh doanh dịch vụ , khách sạn nhà hàng có biểu hiện nghi vấn hoạt động mại dâm .
Morphology
The form / lemma ratio of PUNCT
is 1.000000 (the average of all parts of speech is 1.001997).
The 1st highest number of forms (1) was observed with the lemma “!”: !.
The 2nd highest number of forms (1) was observed with the lemma “””: ”.
The 3rd highest number of forms (1) was observed with the lemma “&”: &.
PUNCT
does not occur with any features.
Relations
PUNCT
nodes are attached to their parents using 1 different relations: punct (8151; 100% instances)
Parents of PUNCT
nodes belong to 14 different parts of speech: VERB (5349; 66% instances), NOUN (1726; 21% instances), ADJ (617; 8% instances), PROPN (252; 3% instances), PRON (52; 1% instances), NUM (45; 1% instances), X (32; 0% instances), ADP (28; 0% instances), ADV (20; 0% instances), SCONJ (10; 0% instances), INTJ (8; 0% instances), PUNCT (5; 0% instances), AUX (4; 0% instances), PART (3; 0% instances)
8149 (100%) PUNCT
nodes are leaves.
0 (0%) PUNCT
nodes have one child.
1 (0%) PUNCT
nodes have two children.
1 (0%) PUNCT
nodes have three or more children.
The highest child degree of a PUNCT
node is 3.
Children of PUNCT
nodes are attached using 1 different relations: punct (5; 100% instances)
Children of PUNCT
nodes belong to 1 different parts of speech: PUNCT (5; 100% instances)