home edit page issue tracker

This page pertains to UD version 2.

Treebank Statistics: UD_Chinese-PUD: POS Tags: PROPN

There are 1 PROPN lemmas (7%), 806 PROPN types (14%) and 1361 PROPN tokens (6%). Out of 15 observed tags, the rank of PROPN is: 11 in number of lemmas, 3 in number of types and 5 in number of tokens.

The 10 most frequent PROPN lemmas: _

The 10 most frequent PROPN types: 美國、 英國、 中國、 德國、 歐、 法國、 歐洲、 希臘、 特朗普、 地中海

The 10 most frequent ambiguous lemmas: _ (NOUN 5410, VERB 3467, PUNCT 2902, PART 1881, PROPN 1361, ADP 1288, ADV 1283, NUM 873, PRON 710, ADJ 650, AUX 618, DET 355, X 306, CCONJ 283, SCONJ 28)

The 10 most frequent ambiguous types: 美 (PROPN 8, NOUN 1), 非 (AUX 4, PROPN 3), 法 (PROPN 2, PART 1), 印 (PROPN 1, VERB 1), 希斯帕尼亞 (NOUN 1, PROPN 1), 張 (NOUN 5, ADP 1, PROPN 1), 時代 (NOUN 7, PROPN 1)

Morphology

The form / lemma ratio of PROPN is 806.000000 (the average of all parts of speech is 388.466667).

The 1st highest number of forms (806) was observed with the lemma “_”: 一世, 丁丁, 三世, 三島, 三星, 上海, 不來梅, 世凱, 丘吉爾, 中國, 中國人, 中東, 中華, 丹佛市, 丹內維爾克, 丹麥, 丹麥語, 乞力馬扎羅山, 二世, 五世, 亞, 亞加亞, 亞太, 亞尼斯, 亞斯, 亞歷山大, 亞歷杭德羅, 亞洲, 亞馬遜, 亨利, 亨弗萊, 以色列, 伊夫, 伊斯內爾, 伊斯坦堡, 伊斯蘭, 伊斯蘭教, 伊朗, 伊莎貝拉, 伊蓮娜, 伊雲, 伊雷娜, 休, 伯倫, 伯戈因, 伯納德, 伯羅奔尼撒, 伯諾瓦, 佐科維, 佛羅倫薩, 佛羅里達, 佛羅里達州, 佩妮斯頓, 佩特森, 俄亥俄河, 俄國, 俄羅斯, 保羅, 倫敦, 倫敦塔, 傑夫, 傑森, 傑濟拉島, 傑登, 傑西卡, 優步, 元朝, 克, 克拉納赫, 克斯蒂文, 克林頓, 克溫斯語, 克萊德, 克萊恩, 克里斯, 克里斯托弗, 克里斯蒂安, 克里斯蒂安鬆, 克里米亞, 克雷默, 克頓, 內華達州, 六世, 冰島, 冰島語, 凡爾賽, 凱拉, 凱撒, 凱撒軍, 凱爾奈克, 凱爾特海, 凱莎, 刁曼島, 別林斯高晉, 利勒桑, 利納雷斯, 則徐, 前外蒙古, 前英屬, 剛果, 劍橋, 加低斯, 加利福尼亞州, 加勒比, 加勒比人, 加勒比海, 加姆遜, 加拿大, 加斯, 加龍, 匈, 匈牙利, 北京, 北卡羅來納, 北卡羅來納州, 北卡羅萊納州, 北安普頓, 北海, 北約, 十世, 南京, 南極, 南海, 南銀, 南非, 南韓, 博伊, 博斯普魯斯, 博格達汗, 卡塔拉諾, 卡拉布里亞, 卡普亞, 卡普蘭, 卡森, 卡洛斯, 卡爾卡鬆, 卡特, 卡瑞卡拉, 卡蘭芝, 卡隆, 卡雷爾, 印, 印尼, 印度, 印度人, 印度洋, 印第安, 印第安人, 印第安納, 古巴, 古希臘, 史密斯, 史葛, 史蒂芬, 史達林, 吉卜林, 吉姆, 吉拉德, 吉瑪, 吉米, 君特, 哈佛, 哈利法克斯, 哈布斯堡, 哈德遜河, 哈里裡, 哈雷, 哈默史密斯, 哥倫佈, 哥倫布, 唐納, 唐納德, 喀麥隆, 喬, 喬格, 喬治, 喬治城, 喬瑟夫, 四世, 國會山, 圖尼普, 圖爾恰郡, 圖特摩斯, 土耳其, 地中海, 地球, 坎伯蘭, 坎貝爾, 埃及, 埃德加, 埃拉尼, 埃斯特角, 埃森, 埃爾多安, 埃里克, 培奧尼亞人, 基普林, 基色城, 基里繆爾, 堪薩斯州, 塔比, 塔爾梅奇, 塔爾羅, 塞斯托聖喬瓦尼, 塞法迪, 塞爾維亞, 塞舌爾, 塞薩利, 塞西亞, 墨, 墨菲, 墨西哥, 多塞特郡, 多斯, 多瑙河, 大京都, 大多倫多市, 大摩拉維亞國, 大英, 大衛, 大西洋, 天主教, 天津, 太平洋, 奇爾拉, 奈斯托斯河, 奈特利, 契丹, 契丹人, 奧, 奧古斯塔斯, 奧古斯都, 奧地利, 奧巴馬, 奧恩, 奧斯卡, 奧斯曼, 奧斯曼人, 奧斯本, 奧斯特利茨, 奧斯瓦, 奧林匹克, 奧爾尼, 奧爾巴尼, 奧爾特弗, 奧茲, 奧運會, 奧黛麗, 好萊塢, 姬絲汀, 威利斯, 威勒, 威尼托, 威尼斯, 威廉, 威爾克斯, 威爾士, 威爾斯市, 安吉爾, 安塞密爾, 安大略省, 安娜, 安娜亞, 安德烈, 安德魯, 安提帕斯, 安東尼, 安東尼奧, 安石, 安立奎, 安第斯, 安賽密爾, 安迪, 家康, 密西西比河, 寶河, 小威廉姆斯, 尤卡坦, 尤多約夫, 尼古拉斯, 尼根, 尼特拉, 尼羅, 尼羅河, 居里, 岡特, 岡薩雷斯, 崔絲, 川普, 巴布亞, 巴拉特, 巴拿馬, 巴斯, 巴爾干人, 巴爾幹, 巴羅佐, 巴西, 巴西利卡塔, 巴達爾普爾, 巴黎, 布什, 布呂因, 布宜諾斯艾利斯, 布朗特, 布沙爾, 布洛克, 布蘭斯菲爾德, 布里斯, 布里斯班, 布雷斯特德, 布魯克斯, 布魯斯, 希區柯克, 希律, 希拉里, 希斯帕尼亞, 希爾斯堡, 希特勒, 希羅底, 希臘, 希臘人, 帕克, 帕克漢姆, 帕塞拉, 帕爾雷, 帕爾馬, 平壤, 庫恩, 庫邁, 庫頁島, 廣州, 弗倫斯堡, 弗朗茨, 張, 強尼, 彼得, 彼拉多, 微軟, 德, 德克薩斯州, 德國, 德川, 德新社, 德里, 快拍, 恭愍王, 惠勒斯蒂芬, 意大利, 愛丁堡, 愛德華, 愛爾蘭, 愛爾蘭海, 愛麗絲, 戈梅里, 戴維斯盃, 戴維森, 戴高樂, 扎克伯格, 托利黨, 托爾, 托爾訥, 托馬斯, 拉丁, 拉丁姆, 拉博夫, 拉合爾, 拉布羅卡, 拉瑪爾, 拉美西斯, 拉費蒂, 拉迪亞德吉, 拉里, 拜占廷, 拜登, 括, 拿破崙, 挪威, 捷克, 捷克斯洛伐克, 推特, 提契諾河, 提庇留, 摩拉維亞, 摩根, 摩洛哥, 摩納哥, 撒哈拉, 撒海爾區, 敖德薩州, 斯大林, 斯巴達, 斯托勒, 斯拉夫, 斯拉夫人, 斯洛伐克, 斯特, 斯特拉森, 斯瑪拉迪斯, 斯頓雷, 新幾內亞, 新教, 新法蘭西, 施普林格, 施萊灣, 日本, 日耳曼, 明治, 明鏡, 昭和, 時代, 普, 普拉博沃, 普爾市, 曼德爾, 曼谷, 朝鮮, 朱利安, 朱婷, 李, 李維, 杰弗裡, 林, 林肯, 柏拉圖, 柏林, 查爾斯, 格倫達, 格德, 格拉夫頓, 格拉斯哥, 格林威爾, 格里, 桑德蘭, 梅, 梅塞, 梅拉尼亞, 梅爾丁根, 梅爾里斯, 梵蒂岡, 樂購, 歐, 歐元區, 歐內斯特, 歐洲, 歐洲人, 歐盟, 正日, 比佛利, 比利時, 比爾, 汴河, 沃爾卡, 沃爾瑪爾, 沈, 沙克爾頓, 沙特阿拉伯國, 法, 法倫, 法國, 法蘭克, 法蘭西, 法西斯, 波多黎各, 波托馬克河, 波拿巴, 波斯, 波羅的海, 波蘭, 波音, 泰加林, 泰國, 洛克, 洛杉磯, 海因里希, 深圳市, 深愛, 清朝, 湖, 湯姆, 湯普遜, 湯瑪絲, 溫斯頓, 溫斯頓杯, 溫泉關, 溫漢, 溫特, 溫特科恩, 滿族, 漢斯, 漫威, 潘, 澳, 澳大利亞, 澳大利亞人, 澳大利亞隊, 澳洲, 烏克蘭, 烏夏克吞, 烏爾里希, 牛頓, 特斯拉, 特朗普, 特洛伊, 特蕾莎, 特魯多, 猶太人, 猶太教, 王, 珍珠港, 理查, 理查德, 琳達, 瑞典, 瑞啟達, 瑞士, 瑞秋, 瑪塞爾, 瑪格麗特, 瑪雅, 瑪雅人, 環球, 瓦倫蒂諾, 瓦特, 瓶, 田納西州, 申克, 白吉龍, 百勝, 皮洛士, 皮特庫賽, 皮雅芙, 盧本巴希, 矽谷, 福特, 科密, 科斯佩達爾, 科朵拉, 科林斯, 科瑞, 科羅娜, 科羅拉多州, 科西嘉, 科貝爾, 科隆, 穆罕默德, 符拉迪沃斯托克, 符騰堡, 米爾德里德, 米蘭, 約克, 約瑟夫, 約翰, 約翰遜, 約里奧, 納什維爾, 納斯卡, 納粹, 紐約州, 紐約市, 素可泰, 索尼, 索爾, 索爾海姆, 維加, 維勒訥沃, 維多利亞, 羅娜, 羅密歐, 羅斯季斯拉夫, 羅曼諾夫, 羅蘭, 羅西, 羅訥河, 羅賓遜, 羅馬, 羅馬人, 羅馬化, 羅馬尼亞, 美, 美伽巴佐斯, 美利肯, 美國, 美國人, 美塞尼亞, 美孚, 美拉尼西亞人, 美洲, 美聯社, 美裔, 老盧卡斯, 耶穌, 耶路撒冷, 聖公會, 聖塞西莉亞, 聖戈當, 聖瑪爾塔, 聖赫勒拿島, 聖路易, 肯塔基, 肯尼亞山, 肯德基, 肯瑟斯, 胡安, 胡蘇姆, 腓尼基, 舊金山, 舊金山人, 舒爾曼, 色雷斯, 艾弗里, 艾根, 艾略特, 艾賓根, 艾達, 芬蘭, 芬蘭語, 芳特維耶區, 英, 英倫, 英傑華, 英國, 英國人, 英國法, 英格蘭, 茉莉, 茱麗葉, 茵河, 荷蘭, 荷蘭人, 莎拉, 莫, 莫伊米爾, 莫利塞, 莫斯克尼, 華人, 華為, 華爾街, 華特, 華盛頓, 菲利普, 菲奧雷洛, 菲律賓, 萊塞, 萊尼, 萊恩, 萊茵河, 萊辛巴哈, 萬斯, 葉卡捷琳娜, 葛拉德, 葛洛麗亞, 葛雷柯, 葡萄牙, 蒂娜, 蒙古, 蒙特利爾, 蒙特卡羅, 蓋耶, 薩勒曼, 薩奇布, 薩德, 薩拉, 薩拉斯, 薩拉託加, 薩爾茲堡, 薩科齊, 薩米, 薩米人, 薩萊諾, 薩謨奈, 薩默塞特郡, 蘇伊士, 蘇台德, 蘇拉, 蘇格蘭, 蘇格蘭人, 蘇格蘭人報, 蘇比安托, 袁, 裡根, 西伯利亞, 西方, 西格爾, 西班牙, 西班牙裔, 西班牙詞, 西班牙語, 西蒙, 西西莉, 西西里, 西西里島, 西雅那, 詹姆斯, 詹寧斯, 論諾克斯, 諾丁漢, 諾斯, 諾曼, 諾特, 諾瑪, 谷歌, 貝利亞, 貝爾格萊德, 貝瑞, 貝登, 貝貝, 貝靈漢, 費加羅報, 費德里克, 費里尼, 賴特, 赫伯特, 赫本, 赫爾勒, 赫爾茨, 路德, 路易, 迦南人, 迪卡, 迪士尼, 迪希邦登堡, 迪恩, 迪斯, 迪斯尼, 通用, 道明會, 道格拉斯, 達利, 達爾南德, 達菲, 遼國, 遼朝, 邁克爾, 邁爾, 邁科內爾里, 邁錫尼, 里奇, 金, 金門, 金雀花, 銀河系, 錢德勒, 開普敦, 開普敦市, 開羅, 關島, 阿伯茨福德, 阿伯茲福德, 阿契美尼德, 阿契美尼德波斯, 阿巴庫莫夫, 阿德南, 阿拉伯, 阿拉伯人, 阿拉斯加, 阿明, 阿普利亞, 阿爾卑斯, 阿爾卑斯山, 阿爾及利亞, 阿爾巴尼亞, 阿爾瓦雷茨, 阿特靈, 阿穆魯, 阿納亞, 阿迪達斯, 阿閔塔斯, 阿馬爾奈, 雅典, 雅茨克, 雅茲迪, 霍普利, 霍爾斯道姆, 霍爾登, 霍頓, 霍默, 非, 非洲, 非洲人, 韋斯, 韓國, 香港, 馬, 馬丁, 馬倫哥, 馬克, 馬克思, 馬其頓, 馬德里, 馬拉, 馬爾代夫, 馮, 高加索, 高登, 高迪, 高麗, 魁北克省, 魯帕斯堡, 鮑勃, 鮑嘉, 鮑爾, 麥加拉, 麥斯塔河, 麥葵格, 黑海, 龐培.

PROPN does not occur with any features.

Relations

PROPN nodes are attached to their parents using 20 different relations: compound (435; 32% instances), nsubj (266; 20% instances), obj (150; 11% instances), flat:name (142; 10% instances), nmod (131; 10% instances), appos (68; 5% instances), conj (67; 5% instances), obl (62; 5% instances), nsubj:pass (12; 1% instances), root (5; 0% instances), dep (4; 0% instances), iobj (4; 0% instances), obl:agent (4; 0% instances), acl:relcl (3; 0% instances), advcl (2; 0% instances), obl:patient (2; 0% instances), advmod (1; 0% instances), ccomp (1; 0% instances), csubj (1; 0% instances), nummod (1; 0% instances)

Parents of PROPN nodes belong to 10 different parts of speech: NOUN (623; 46% instances), VERB (522; 38% instances), PROPN (180; 13% instances), ADJ (9; 1% instances), X (7; 1% instances), ADP (6; 0% instances), (5; 0% instances), NUM (4; 0% instances), PART (4; 0% instances), PRON (1; 0% instances)

801 (59%) PROPN nodes are leaves.

407 (30%) PROPN nodes have one child.

104 (8%) PROPN nodes have two children.

49 (4%) PROPN nodes have three or more children.

The highest child degree of a PROPN node is 7.

Children of PROPN nodes are attached using 21 different relations: case (197; 25% instances), punct (168; 21% instances), flat:name (102; 13% instances), conj (66; 8% instances), appos (61; 8% instances), cc (49; 6% instances), compound (42; 5% instances), nmod (26; 3% instances), case:loc (21; 3% instances), acl:relcl (19; 2% instances), cop (9; 1% instances), nsubj (7; 1% instances), det (6; 1% instances), clf (4; 1% instances), dep (4; 1% instances), obl:tmod (4; 1% instances), mark:relcl (3; 0% instances), csubj (2; 0% instances), nummod (2; 0% instances), amod (1; 0% instances), dislocated (1; 0% instances)

Children of PROPN nodes belong to 13 different parts of speech: PROPN (180; 23% instances), PUNCT (168; 21% instances), PART (139; 18% instances), ADP (82; 10% instances), NOUN (77; 10% instances), X (55; 7% instances), CCONJ (49; 6% instances), VERB (22; 3% instances), AUX (9; 1% instances), DET (6; 1% instances), PRON (3; 0% instances), ADJ (2; 0% instances), NUM (2; 0% instances)