home edit page issue tracker

This page pertains to UD version 2.

Treebank Statistics: UD_Chinese-HK: POS Tags: NOUN

There are 1 NOUN lemmas (6%), 496 NOUN types (30%) and 1565 NOUN tokens (18%). Out of 16 observed tags, the rank of NOUN is: 8 in number of lemmas, 1 in number of types and 2 in number of tokens.

The 10 most frequent NOUN lemmas: _

The 10 most frequent NOUN types: 議員、 主席、 個、 問題、 人、 會議、 選舉、 立法會、 現在、 程序

The 10 most frequent ambiguous lemmas: _ (VERB 1642, NOUN 1565, PUNCT 1533, ADV 1017, PRON 742, PART 521, AUX 405, ADP 282, ADJ 263, DET 234, NUM 168, PROPN 157, CCONJ 85, SCONJ 52, INTJ 34, SYM 1)

The 10 most frequent ambiguous types: 個 (NOUN 49, NUM 1, PART 1), 選舉 (NOUN 27, VERB 14), 宣誓 (NOUN 10, VERB 7), 澄清 (NOUN 7, VERB 7), 點 (NOUN 7, ADV 1), 工作 (NOUN 6, VERB 2), 投票 (VERB 8, NOUN 6), 提問 (NOUN 5, VERB 2), 時 (NOUN 5, ADP 4), 首 (NOUN 5, DET 2)

Morphology

The form / lemma ratio of NOUN is 496.000000 (the average of all parts of speech is 103.937500).

The 1st highest number of forms (496) was observed with the lemma “_”: Declaration_of_Renunciation_of_British_Citizenship, MP3, SET, Yes!卡, arbitrary_use_of_power, copy, shopping, 一四年, 一般, 七十, 七點半, 上, 下午, 中, 中位數, 中間, 主席, 主持人, 主題曲, 乞丐, 事, 事宜, 事情, 二十二日, 五月, 些, 交代, 人, 人情, 人氣, 今, 今天, 今晚, 仙, 代表性, 以前, 以往, 件, 任期, 份, 休, 位, 信, 信件, 信任, 個, 候選人, 做法, 傳媒, 傻瓜, 元, 兒子, 內, 內容, 內心, 兩兄妹, 八十年代, 八號, 公義, 出面, 分, 分別, 分鐘, 判斷, 利是, 利是錢, 利益, 刻, 前, 剛才, 副本, 力氣, 功課, 勞動, 勞動者, 勸諭, 包, 北極光, 十一點, 十一點半, 千禧年, 半夜, 卡, 卡啦OK, 卡拉OK, 卡通片, 印章, 危機, 反應, 口邊, 口頭上, 句, 司法, 同事, 名, 名單, 名字, 周公, 品味, 哥哥, 唱片, 問題, 噪音, 四周, 回答, 圈, 國家, 國籍, 國籍法, 圍, 基本法, 基礎, 報紙, 場, 場合, 場館, 塊, 壓力, 外, 外國, 夜, 夜總會, 大學, 大學生, 大家姐, 大眾, 天, 天線, 女, 女人, 女兒, 女孩, 女朋友, 好處, 妹妹, 姐姐, 媽, 媽咪, 媽媽, 子女, 孫子, 學校, 學生, 學生會, 學生證, 它, 安排, 宗教, 客人, 宣佈, 宣誓, 家, 家人, 家務, 封, 封面, 將來, 對, 小孩, 小時, 小時候, 小朋友, 小朋友們, 小鬼, 尺寸, 居留權, 屆, 岸, 工, 工作, 市民, 平均數, 年, 年代, 年紀, 店, 座位, 廢票, 廳, 建制, 式, 張, 後, 後果, 後面, 從前, 心, 性格, 情況, 意見, 感覺, 態度, 憲制, 戰鬥力, 手, 手續, 投票, 投票權, 投票箱, 折, 拖鞋, 拖鞋聲, 提問, 收檔, 收音機, 政府, 政府合署, 政治, 效力, 整天, 數, 文件, 文化, 文書, 斤, 新秀, 新聞, 方式, 方面, 旁邊, 旅, 旅客, 旅行, 旅行費, 日, 早上, 明信片, 明天, 明星, 明晚, 星期三, 星期二, 星期四, 昨天, 昨晚, 時, 時候, 時間, 晚, 晚上, 暑假, 書面, 最後, 會議, 會議廳, 月, 朋友, 期, 未來, 本, 東西, 桌子, 條, 條件, 條文, 椅子, 樂器, 標準, 機, 機會, 檔, 檔口, 欄杆, 權, 權利, 權力, 次, 次序, 款, 歌, 歌唱, 歌壇, 歌廳, 歌手, 歌檔, 歌迷, 正本, 此刻, 步, 歲, 段, 毒, 比賽, 毫, 民意, 水上人家, 決定, 沙灘, 法例, 法律, 泳池, 流行曲, 海, 消費, 消費力, 深夜, 潮流, 澄清, 燈, 爭議, 爸, 爺爺, 牆, 片段, 物品, 特色, 現在, 現時, 理據, 理由, 理解, 琴師, 甚麼, 番黎, 當中, 當事人, 當時, 當選者, 發言, 發電機, 白卡, 盒, 盜版, 直方圖, 直選, 眾數, 知名度, 碟, 確認, 社會, 神仙, 福氣, 秒, 秘書, 秘書處, 秘書長, 租, 秩序, 程, 程序, 程度, 程式, 稍後, 種, 空白, 窗, 立場, 立法會, 站, 章, 童年, 第六, 筆, 筆友, 答覆, 箱, 範圍, 範疇, 粵曲, 精神, 紙飛機, 組, 結果, 經典, 經紀, 經驗, 義務, 老母, 老豆, 老闆, 考慮, 聲, 聲明, 職業, 背景, 能力, 脾氣, 腸粉, 臭小鬼, 興趣, 舞台, 船費, 苛求, 英文, 藝名, 蛋撻, 血壓, 行業, 街, 表決, 裁決, 西人, 要求, 覆核, 規則, 規定, 規程, 視聽, 觀點, 解釋, 討論, 話, 誓詞, 語氣, 說法, 說話, 論壇, 諮詢, 證據, 證書, 議事, 議員, 議會, 議程, 財氣, 責, 責任, 資料, 資格, 賊, 質疑, 賭, 起初, 躉船, 身, 身份, 身後, 輩, 辦法, 辯論, 途徑, 遊戲, 運氣, 運輸, 過來人, 過程, 選擧, 選民, 選舉, 邊, 邏輯, 那邊, 部, 部分, 郵輪, 酒店, 酒店費, 酒樓, 鈔票, 錄影帶, 錄影機, 錄音帶, 錢, 錯, 閃卡, 間, 關係, 闡述, 阿哥, 阿媽, 阿爸, 阿爺, 附表, 限制, 階級, 障礙, 隻, 集, 雞翼, 雨, 零用錢, 電, 電台, 電工, 電源, 電燈泡, 電筒, 電視, 電視台, 電話, 電郵, 面, 面前, 音調, 項, 領事館, 頻率, 題, 風險, 餸, 首, 騎馬舞, 騷擾, 體力, 黃, 點.

NOUN occurs with 1 features: NounType (248; 16% instances)

NOUN occurs with 1 feature-value pairs: NounType=Clf

NOUN occurs with 2 feature combinations. The most frequent feature combination is _ (1317 tokens). Examples: 議員、 主席、 問題、 會議、 人、 選舉、 立法會、 現在、 程序、 規則

Relations

NOUN nodes are attached to their parents using 33 different relations: obj (523; 33% instances), nsubj (198; 13% instances), compound (135; 9% instances), obl (126; 8% instances), clf (102; 7% instances), obl:tmod (92; 6% instances), root (78; 5% instances), conj (61; 4% instances), nmod (54; 3% instances), flat (35; 2% instances), vocative (31; 2% instances), obj:periph (22; 1% instances), parataxis (19; 1% instances), advmod (13; 1% instances), det (11; 1% instances), case:loc (9; 1% instances), appos (8; 1% instances), ccomp (6; 0% instances), obl:patient (6; 0% instances), advmod:df (5; 0% instances), amod (5; 0% instances), compound:vo (5; 0% instances), mark (4; 0% instances), advcl (3; 0% instances), xcomp (3; 0% instances), acl (2; 0% instances), case (2; 0% instances), dislocated (2; 0% instances), compound:dir (1; 0% instances), dep (1; 0% instances), nsubj:pass (1; 0% instances), obl:agent (1; 0% instances), reparandum (1; 0% instances)

Parents of NOUN nodes belong to 13 different parts of speech: VERB (974; 62% instances), NOUN (298; 19% instances), (78; 5% instances), NUM (55; 4% instances), ADJ (42; 3% instances), PROPN (42; 3% instances), DET (37; 2% instances), PRON (14; 1% instances), ADP (9; 1% instances), AUX (9; 1% instances), ADV (5; 0% instances), PART (1; 0% instances), PUNCT (1; 0% instances)

636 (41%) NOUN nodes are leaves.

513 (33%) NOUN nodes have one child.

243 (16%) NOUN nodes have two children.

173 (11%) NOUN nodes have three or more children.

The highest child degree of a NOUN node is 8.

Children of NOUN nodes are attached using 31 different relations: punct (232; 14% instances), det (228; 14% instances), case (188; 11% instances), compound (152; 9% instances), nummod (145; 9% instances), acl (137; 8% instances), nmod (133; 8% instances), amod (99; 6% instances), conj (67; 4% instances), cop (52; 3% instances), nsubj (39; 2% instances), advmod (35; 2% instances), case:loc (32; 2% instances), cc (27; 2% instances), discourse:sp (17; 1% instances), advcl (15; 1% instances), parataxis (11; 1% instances), appos (10; 1% instances), aux (6; 0% instances), obl:tmod (6; 0% instances), flat (4; 0% instances), mark (4; 0% instances), obj (4; 0% instances), mark:rel (3; 0% instances), obl (3; 0% instances), clf (2; 0% instances), csubj (2; 0% instances), dep (2; 0% instances), discourse (2; 0% instances), ccomp (1; 0% instances), dislocated (1; 0% instances)

Children of NOUN nodes belong to 15 different parts of speech: NOUN (298; 18% instances), PUNCT (232; 14% instances), DET (220; 13% instances), VERB (174; 10% instances), ADP (153; 9% instances), NUM (153; 9% instances), ADJ (104; 6% instances), PRON (92; 6% instances), PART (80; 5% instances), AUX (49; 3% instances), PROPN (41; 2% instances), ADV (31; 2% instances), CCONJ (27; 2% instances), SCONJ (3; 0% instances), INTJ (2; 0% instances)