Treebank Statistics: UD_Vietnamese-VTB: POS Tags: SCONJ
There are 72 SCONJ
lemmas (1%), 72 SCONJ
types (1%) and 1511 SCONJ
tokens (3%).
Out of 17 observed tags, the rank of SCONJ
is: 7 in number of lemmas, 7 in number of types and 10 in number of tokens.
The 10 most frequent SCONJ
lemmas: thì, nhưng, như, mà, là, rồi, nếu, nên, và, tuy nhiên
The 10 most frequent SCONJ
types: thì, nhưng, như, mà, là, rồi, nếu, nên, Và, tuy nhiên
The 10 most frequent ambiguous lemmas: thì (SCONJ 256, PART 1), như (SCONJ 182, ADJ 3, ADP 1), mà (SCONJ 126, PART 6, ADP 1), là (AUX 497, SCONJ 89, CCONJ 7, PART 3), rồi (SCONJ 86, ADV 26, PART 7), nếu (SCONJ 79, ADP 5), nên (SCONJ 66, AUX 10, VERB 5, ADV 2), và (CCONJ 656, SCONJ 40), còn (ADV 69, VERB 54, SCONJ 35), rằng (SCONJ 30, ADP 2, ADV 1)
The 10 most frequent ambiguous types: như (SCONJ 172, ADJ 2, ADP 1), mà (SCONJ 124, PART 6, ADP 1), là (AUX 496, SCONJ 89, CCONJ 7, PART 3), rồi (SCONJ 72, ADV 26, PART 7), nếu (SCONJ 37, ADP 4), nên (SCONJ 65, AUX 10, VERB 5, ADV 2), còn (ADV 68, VERB 54, SCONJ 20), rằng (SCONJ 30, ADP 2, ADV 1), cùng (ADJ 46, SCONJ 26, ADV 7, CCONJ 6, NOUN 3, ADP 2), với (ADP 287, SCONJ 19, VERB 2)
- như
- mà
- là
- AUX 496: Người chồng trẻ là bộ đội đã nhiễm HIV và chết cách đây bảy năm .
- SCONJ 89: Vậy là anh Đặng Văn Thanh đi học .
- CCONJ 7: Bà chỉ biết viết hai ký tự ngoằn ngoèo mà con gái đã dạy là Zaosheng , tên ngôi làng của họ .
- PART 3: Cái tên Nguyễn Quang Trung mình đặt cho nó là cũng mong nó khỏe mạnh , giỏi giang như tướng quân Tây Sơn năm nào .
- rồi
- nếu
- nên
- SCONJ 65: Vì thính giác kém nên bà cũng không học được tiếng Trung .
- AUX 10: Vợ Mười bảo nên lấy mấy con này về nuôi làm cảnh cho sinh động .
- VERB 5: Điều gì đã làm nên sức mạnh nơi cô gái dịu dàng đa cảm ấy ?
- ADV 2: Những con người bình dị chân đất ấy đã làm cách nào tạo nên một kỳ quan như thế ? …
- còn
- rằng
- SCONJ 30: Cụ đã hứa rằng nếu chiến tranh nổ ra thì cụ sẽ rời khỏi miền Nam .
- ADP 2: Tuấn nói nghẹn ngào : “ xin xã hội đừng trừng phạt người nhiễm HIV vì cho rằng họ đã có hành vi sai lầm “ .
- ADV 1: Có người cho rằng , nhờ phong thổ cù lao ngọt mát , nhiều vườn cây bao bọc nên con gái ở đây có nước da trắng và rất xinh .
- cùng
- ADJ 46: Cường nói Thọ hãy kể địa chỉ nhà một số người cùng công ty Thu .
- SCONJ 26: Đi cùng “ thủy giới “ .
- ADV 7: Khi xuống nước , tất cả cùng bám chung vào một sợi dây dài hơn trăm mét .
- CCONJ 6: Bố Xinmei là một người trung thực , hiền lành , ngày ngày cùng vợ làm việc .
- NOUN 3: Mắt vẫn dõi theo đàn chim , ông H. thủng thẳng : “ Cũng không nhiều lắm , khoảng 20 con là cùng .
- ADP 2: Chị Xoan vừa đi nhặt ve chai , giấy vụn trở về đang cùng chồng và đứa con gái ăn vội miếng cơm đạm bạc .
- với
Morphology
The form / lemma ratio of SCONJ
is 1.000000 (the average of all parts of speech is 1.001997).
The 1st highest number of forms (1) was observed with the lemma “bởi”: Bởi.
The 2nd highest number of forms (1) was observed with the lemma “bởi vậy”: bởi vậy.
The 3rd highest number of forms (1) was observed with the lemma “cc”: CC.
SCONJ
does not occur with any features.
Relations
SCONJ
nodes are attached to their parents using 11 different relations: mark (962; 64% instances), cc (320; 21% instances), case (170; 11% instances), discourse (21; 1% instances), fixed (14; 1% instances), obl (11; 1% instances), compound (6; 0% instances), advcl (2; 0% instances), compound:svc (2; 0% instances), root (2; 0% instances), vocative (1; 0% instances)
Parents of SCONJ
nodes belong to 13 different parts of speech: VERB (1067; 71% instances), NOUN (224; 15% instances), ADJ (124; 8% instances), PRON (43; 3% instances), PROPN (25; 2% instances), ADV (10; 1% instances), ADP (4; 0% instances), PART (4; 0% instances), NUM (3; 0% instances), (2; 0% instances), SCONJ (2; 0% instances), X (2; 0% instances), AUX (1; 0% instances)
1497 (99%) SCONJ
nodes are leaves.
12 (1%) SCONJ
nodes have one child.
0 (0%) SCONJ
nodes have two children.
2 (0%) SCONJ
nodes have three or more children.
The highest child degree of a SCONJ
node is 4.
Children of SCONJ
nodes are attached using 9 different relations: punct (10; 50% instances), advmod (3; 15% instances), cc (1; 5% instances), ccomp (1; 5% instances), compound (1; 5% instances), csubj (1; 5% instances), csubj:asubj (1; 5% instances), mark (1; 5% instances), xcomp (1; 5% instances)
Children of SCONJ
nodes belong to 6 different parts of speech: PUNCT (10; 50% instances), ADV (3; 15% instances), VERB (3; 15% instances), SCONJ (2; 10% instances), ADJ (1; 5% instances), PRON (1; 5% instances)