Treebank Statistics: UD_Thai-PUD: POS Tags: ADP
There are 66 ADP lemmas (2%), 66 ADP types (2%) and 3135 ADP tokens (14%).
Out of 16 observed tags, the rank of ADP is: 7 in number of lemmas, 7 in number of types and 3 in number of tokens.
The 10 most frequent ADP lemmas: ใน, ของ, ว่า, จาก, กับ, ที่, โดย, ถึง, เมื่อ, ทาง
The 10 most frequent ADP types: ใน, ของ, ว่า, จาก, กับ, ที่, โดย, ถึง, เมื่อ, ทาง
The 10 most frequent ambiguous lemmas: ใน (ADP 682, ADJ 4, CCONJ 3, NOUN 2), ของ (ADP 488, NOUN 4), ว่า (ADP 231, VERB 23), จาก (ADP 222, CCONJ 4), กับ (ADP 195, CCONJ 21, NOUN 1), ที่ (DET 496, ADP 126, NOUN 102, PRON 30), ถึง (ADP 95, ADV 8, CCONJ 2, VERB 2), เมื่อ (ADP 91, NOUN 2), ทาง (ADP 72, NOUN 22), ด้วย (ADP 63, ADV 33)
The 10 most frequent ambiguous types: ใน (ADP 682, ADJ 4, CCONJ 3, NOUN 2), ของ (ADP 488, NOUN 4), ว่า (ADP 231, VERB 23), จาก (ADP 222, CCONJ 4), กับ (ADP 195, CCONJ 21, NOUN 1), ที่ (DET 496, ADP 126, NOUN 102, PRON 30), ถึง (ADP 95, ADV 8, CCONJ 2, VERB 2), เมื่อ (ADP 91, NOUN 2), ทาง (ADP 72, NOUN 22), ด้วย (ADP 63, ADV 33)
- ใน
- ADP 682: พยาน ให้การ กับ ตำรวจ ว่า เหยื่อ ทำร้าย ผู้ ต้อง สงสัย ใน เดือน เมษายน
- ADJ 4: สนธิสัญญา เปิด ใช้ ท่า ใหม่ ๆ เพื่อ การค้า และ อนุญาต ให้ ชาว ต่าง ชาติ เดินทาง เข้า มา ข้าง ใน ได้
- CCONJ 3: ใน ทาง กลับ กัน Vine ก็ เป็น ศิลปะ ใน เวลา หก วินาที
- NOUN 2: มี ทฤษฎี ที่ แตกต่าง กัน เกี่ยว กับ เหตุผล ใน การละทิ้ง ถิ่นฐาน
- ของ
- ว่า
- จาก
- กับ
- ที่
- ถึง
- เมื่อ
- ทาง
- ด้วย
Morphology
The form / lemma ratio of ADP is 1.000000 (the average of all parts of speech is 1.001399).
The 1st highest number of forms (1) was observed with the lemma “If”: If.
The 2nd highest number of forms (1) was observed with the lemma “กระทั่ง”: กระทั่ง.
The 3rd highest number of forms (1) was observed with the lemma “กระนั้น”: กระนั้น.
ADP occurs with 2 features: ExtPos (128; 4% instances), Foreign (2; 0% instances)
ADP occurs with 5 feature-value pairs: ExtPos=ADP, ExtPos=ADV, ExtPos=CCONJ, ExtPos=SCONJ, Foreign=Yes
ADP occurs with 6 feature combinations.
The most frequent feature combination is _ (3005 tokens).
Examples: ใน, ของ, ว่า, จาก, กับ, ที่, โดย, ถึง, เมื่อ, ทาง
Relations
ADP nodes are attached to their parents using 10 different relations: case (2343; 75% instances), mark (549; 18% instances), fixed (220; 7% instances), cc (14; 0% instances), cc:preconj (4; 0% instances), advmod (1; 0% instances), appos (1; 0% instances), csubj (1; 0% instances), obl (1; 0% instances), xcomp (1; 0% instances)
Parents of ADP nodes belong to 13 different parts of speech: NOUN (1577; 50% instances), VERB (833; 27% instances), PROPN (377; 12% instances), PRON (143; 5% instances), ADP (116; 4% instances), ADJ (45; 1% instances), ADV (12; 0% instances), CCONJ (11; 0% instances), NUM (11; 0% instances), PART (7; 0% instances), AUX (1; 0% instances), DET (1; 0% instances), SYM (1; 0% instances)
3000 (96%) ADP nodes are leaves.
105 (3%) ADP nodes have one child.
16 (1%) ADP nodes have two children.
14 (0%) ADP nodes have three or more children.
The highest child degree of a ADP node is 3.
Children of ADP nodes are attached using 6 different relations: fixed (171; 96% instances), punct (3; 2% instances), obj (2; 1% instances), amod (1; 1% instances), case (1; 1% instances), obl:tmod (1; 1% instances)
Children of ADP nodes belong to 10 different parts of speech: ADP (116; 65% instances), ADV (37; 21% instances), ADJ (9; 5% instances), NOUN (5; 3% instances), PART (3; 2% instances), PRON (3; 2% instances), PUNCT (3; 2% instances), CCONJ (1; 1% instances), DET (1; 1% instances), NUM (1; 1% instances)