home edit page issue tracker

This page pertains to UD version 2.

Treebank Statistics: UD_Chinese-HK: POS Tags: NOUN

There are 1 NOUN lemmas (6%), 508 NOUN types (29%) and 1766 NOUN tokens (18%). Out of 16 observed tags, the rank of NOUN is: 8 in number of lemmas, 1 in number of types and 2 in number of tokens.

The 10 most frequent NOUN lemmas: _

The 10 most frequent NOUN types: 議員、 主席、 個、 問題、 會議、 人、 規則、 立法會、 程序、 現在

The 10 most frequent ambiguous lemmas: _ (VERB 1848, NOUN 1766, PUNCT 1738, ADV 1158, PRON 875, PART 560, AUX 502, ADP 321, ADJ 301, DET 260, NUM 177, PROPN 166, CCONJ 99, SCONJ 68, INTJ 34, SYM 1)

The 10 most frequent ambiguous types: 個 (NOUN 54, NUM 1, PART 1), 選舉 (NOUN 24, VERB 24), 決定 (NOUN 22, VERB 7), 宣誓 (VERB 18, NOUN 14), 點 (NOUN 9, ADV 1), 澄清 (NOUN 7, VERB 7), 工作 (NOUN 6, VERB 2), 投票 (VERB 8, NOUN 6), 提問 (NOUN 5, VERB 2), 規定 (NOUN 5, VERB 2)

Morphology

The form / lemma ratio of NOUN is 508.000000 (the average of all parts of speech is 107.937500).

The 1st highest number of forms (508) was observed with the lemma “_”: Declaration_of_Renunciation_of_British_Citizenship, MP3, SET, Yes!卡, arbitrary_use_of_power, copy, power, shopping, 一四年, 一般, 七十, 七點半, 上, 下午, 中, 中位數, 中立, 中間, 主席, 主持人, 主題曲, 乞丐, 事, 事宜, 事情, 事項, 二十二日, 五月, 些, 交代, 人, 人情, 人氣, 今, 今天, 今晚, 仙, 代表性, 以前, 以往, 件, 任期, 份, 休, 位, 信, 信件, 信任, 個, 候選人, 做法, 傳媒, 傻瓜, 儀式, 元, 先前, 兒子, 內, 內容, 內心, 兩兄妹, 八十年代, 八號, 公正, 公義, 出面, 分, 分別, 分鐘, 判斷, 利是, 利是錢, 利益, 刻, 剛才, 副本, 力氣, 功課, 勞動, 勞動者, 勸諭, 包, 北極光, 十一點, 十一點半, 千禧年, 半夜, 卡, 卡啦OK, 卡拉OK, 卡通片, 印章, 危機, 反應, 口邊, 口頭上, 句, 司法, 同事, 名, 名單, 名字, 周公, 品味, 哥哥, 唱片, 問題, 噪音, 四周, 回答, 圈, 國家, 國籍, 國籍法, 圍, 地方, 基本法, 基礎, 報紙, 場, 場合, 場館, 塊, 壓力, 外, 外國, 夜, 夜總會, 大學, 大學生, 大家姐, 大眾, 天, 天線, 女, 女人, 女兒, 女孩, 女朋友, 好處, 妹妹, 姐姐, 媽, 媽咪, 媽媽, 子女, 孫子, 學校, 學生, 學生會, 學生證, 它, 安排, 宗教, 客人, 宣佈, 宣誓, 家, 家人, 家務, 封, 封面, 將來, 對, 小孩, 小時, 小時候, 小朋友, 小朋友們, 小鬼, 尺寸, 居留權, 屆, 岸, 工, 工作, 市民, 平均數, 年, 年代, 年紀, 店, 座位, 廢票, 廳, 建制, 式, 張, 後果, 後面, 從前, 心, 性格, 情況, 意見, 感覺, 態度, 憲制, 戰鬥力, 手, 手續, 投票, 投票人, 投票權, 投票箱, 折, 拖鞋, 拖鞋聲, 提問, 收檔, 收音機, 政府, 政府合署, 政治, 效力, 教授, 整天, 數, 文件, 文化, 文書, 斤, 新秀, 新聞, 方式, 方面, 旁邊, 旅, 旅客, 旅行, 旅行費, 日, 早上, 明信片, 明天, 明星, 明晚, 星期三, 星期二, 星期四, 昨天, 昨晚, 時, 時候, 時間, 晚, 晚上, 暑假, 書面, 最後, 會議, 會議廳, 月, 朋友, 期, 未來, 本, 東西, 桌子, 條, 條件, 條文, 椅子, 樂器, 標準, 機, 機會, 檔, 檔口, 欄杆, 權, 權利, 權力, 次, 次序, 款, 歌, 歌唱, 歌壇, 歌廳, 歌手, 歌檔, 歌迷, 正本, 此刻, 步, 歲, 段, 毒, 比賽, 毫, 民意, 水上人家, 決定, 沙灘, 法例, 法庭, 法律, 泳池, 流行曲, 海, 消費, 消費力, 深夜, 潮流, 澄清, 燈, 爭議, 爸, 爺爺, 牆, 片段, 物品, 特色, 現在, 現時, 理念, 理據, 理由, 理解, 琴師, 甚麼, 番黎, 當中, 當事人, 當時, 當選者, 發言, 發電機, 白卡, 盒, 盜版, 直方圖, 直選, 眾數, 知名度, 碟, 確認, 社會, 神仙, 福氣, 秒, 秘書, 秘書處, 秘書長, 租, 秩序, 程, 程序, 程度, 程式, 稍後, 種, 空白, 窗, 立場, 立法會, 站, 章, 童年, 第六, 筆, 筆友, 答覆, 箱, 範圍, 範疇, 粵曲, 精神, 紙飛機, 組, 結果, 經典, 經紀, 經驗, 義務, 老母, 老豆, 老闆, 考慮, 聲, 聲明, 職業, 背景, 能力, 脾氣, 腸粉, 臭小鬼, 興趣, 舞台, 船費, 苛求, 英文, 藝名, 蛋撻, 血壓, 行業, 街, 表決, 裁決, 西人, 要求, 覆核, 規則, 規定, 規程, 視聽, 觀點, 解釋, 討論, 話, 誓詞, 語氣, 說法, 說話, 論壇, 諮詢, 證據, 證書, 議事, 議員, 議會, 議程, 財氣, 責, 責任, 資料, 資格, 賊, 質疑, 賭, 起初, 躉船, 身, 身份, 身後, 身旁, 輩, 辦法, 辯論, 途徑, 遊戲, 運氣, 運輸, 過來人, 過程, 選擧, 選民, 選舉, 邊, 邏輯, 那邊, 部, 部分, 郵輪, 酒店, 酒店費, 酒樓, 醜人, 鈔票, 錄影帶, 錄影機, 錄音帶, 錢, 錯, 閃卡, 間, 關係, 闡述, 阿哥, 阿媽, 阿爸, 阿爺, 附表, 限制, 階段, 階級, 障礙, 隻, 集, 雞翼, 雨, 零用錢, 電, 電台, 電工, 電源, 電燈泡, 電筒, 電視, 電視台, 電話, 電郵, 面, 面前, 音調, 項, 領事館, 頻率, 題, 風險, 餸, 首, 騎馬舞, 騷擾, 體力, 黃, 點.

NOUN occurs with 1 features: NounType (270; 15% instances)

NOUN occurs with 1 feature-value pairs: NounType=Clf

NOUN occurs with 2 feature combinations. The most frequent feature combination is _ (1496 tokens). Examples: 議員、 主席、 問題、 會議、 人、 規則、 立法會、 程序、 現在、 選舉

Relations

NOUN nodes are attached to their parents using 31 different relations: obj (603; 34% instances), nsubj (229; 13% instances), compound (145; 8% instances), obl (141; 8% instances), clf (115; 7% instances), obl:tmod (99; 6% instances), root (86; 5% instances), nmod (68; 4% instances), conj (65; 4% instances), flat (44; 2% instances), vocative (40; 2% instances), obj:periph (24; 1% instances), parataxis (19; 1% instances), appos (12; 1% instances), advcl (11; 1% instances), det (11; 1% instances), case:loc (9; 1% instances), ccomp (9; 1% instances), advmod:df (6; 0% instances), obl:patient (6; 0% instances), amod (5; 0% instances), compound:vo (5; 0% instances), xcomp (3; 0% instances), acl (2; 0% instances), advmod (2; 0% instances), dislocated (2; 0% instances), case (1; 0% instances), compound:dir (1; 0% instances), nsubj:pass (1; 0% instances), obl:agent (1; 0% instances), reparandum (1; 0% instances)

Parents of NOUN nodes belong to 12 different parts of speech: VERB (1102; 62% instances), NOUN (334; 19% instances), (86; 5% instances), NUM (60; 3% instances), PROPN (51; 3% instances), ADJ (48; 3% instances), DET (43; 2% instances), PRON (15; 1% instances), AUX (11; 1% instances), ADP (10; 1% instances), ADV (5; 0% instances), SCONJ (1; 0% instances)

713 (40%) NOUN nodes are leaves.

569 (32%) NOUN nodes have one child.

272 (15%) NOUN nodes have two children.

212 (12%) NOUN nodes have three or more children.

The highest child degree of a NOUN node is 8.

Children of NOUN nodes are attached using 31 different relations: punct (290; 15% instances), det (254; 13% instances), case (217; 11% instances), compound (167; 9% instances), acl (165; 8% instances), nmod (163; 8% instances), nummod (156; 8% instances), amod (124; 6% instances), conj (71; 4% instances), cop (63; 3% instances), advmod (58; 3% instances), nsubj (47; 2% instances), case:loc (35; 2% instances), cc (29; 1% instances), advcl (19; 1% instances), discourse:sp (17; 1% instances), appos (14; 1% instances), parataxis (12; 1% instances), aux (7; 0% instances), mark (6; 0% instances), obl:tmod (6; 0% instances), obl (5; 0% instances), flat (4; 0% instances), clf (2; 0% instances), csubj (2; 0% instances), discourse (2; 0% instances), mark:rel (2; 0% instances), vocative (2; 0% instances), ccomp (1; 0% instances), dislocated (1; 0% instances), obj (1; 0% instances)

Children of NOUN nodes belong to 15 different parts of speech: NOUN (334; 17% instances), PUNCT (290; 15% instances), DET (247; 13% instances), VERB (194; 10% instances), ADP (175; 9% instances), NUM (163; 8% instances), ADJ (126; 6% instances), PRON (116; 6% instances), PART (92; 5% instances), AUX (72; 4% instances), ADV (58; 3% instances), PROPN (41; 2% instances), CCONJ (29; 1% instances), SCONJ (3; 0% instances), INTJ (2; 0% instances)