標籤:

為什麼維基百科上越南語的詞條數目這麼多?

今天上維基的主站Wikipedia,發現越南語的詞條數排在第一梯隊,比中文還多一個數量級。

為什麼越南語的詞條會這麼多?甚至都超過了日語和韓語?


為什麼別的回答都說提問者說的是俄語?

Ti?ng Vi?t 越南語維基的條目數確實是排在第一梯隊的,超過100w條。 是所有『單一國家使用的語言』里最大的維基百科。

但,其實不能只看條目數……

維基百科人工創建文章數/總文章數 ,排除redirect: (Wikipedia Statistics)

越南:38w/110w

韓國:30.6w/31w

日本:96w/96w.

鑒於一般『bot創建條目』比人工創建條目的質量低,日本維基百科在這三種里,算是綜合水準最高。越南維基百科應該是用bot刷物種資料庫沖條目數的。

另外,從上個月的wikidata dump里得到的數據,這三種維基百科裡,非Disambiguation非Redirect的page裡面 (這個是自己的數據算的,抱歉沒有url可以證實),只存在於本語言內的文章,也就是沒有其他翻譯,更偏向於本國內部的內容:

越南語16.7w,韓語 9.7w,日語46w。

總詞數, 排除了HTML 和Wiki markup,但是不知道像韓語日語這樣子的文章是不是一個字算一個詞,這樣越南語這樣使用拉丁字母+聲韻的語言略吃虧(Wikipedia Statistics):

越南語149m,韓語119m, 日語623m。

根據上個月數據平均的每天頁面訪問量(Page Views for Wikipedia, All Platforms, Raw data):

越南240w 韓國410w, 日本4500w

文章平均修改次數(Wikipedia Statistics),:

越南語14.7 韓語31.5 日語 46.8

貢獻者(Wikipedia Statistics):

越南語&<7000, 韓語1.5w,日語8.6w (插一句,中文只有4w喲)

編輯了5條以上的貢獻者(Wikipedia Statistics):

越南語314,韓語818,日語4356. (中文2436)

說三種語言的人口: 越南7500w,韓國7700w, 日語12500w. (來自這三種語言的英文維基頁面)

上個月,每一百萬說該語言的人口裡有多少人編輯了5個維基百科條目及以上:

越南語4人,韓語11人,日語31人。 (中文因為人口基數太大,只有2……)

更多統計數據在:Wikipedia Statistics

Bot只能增加條目數目(很可能還是無人問津的條目),增加不了editor和訪問者啊。

高質量的文章還得靠志願者費時費力來寫.


和前一位一樣,那是俄語吧。

還有這個

維基百科中為什麼越南語甚至菲律賓某種地方語言得版本都比漢語版本多? - 中文維基百科


因為在越南語中無需對外來專有名詞(如地名、人名)譯音而直接借用,這就給bot編寫詞條帶來了方便,而數量最多的就是這類詞條


推薦閱讀:

維基百科通過哪些重要的工具和機制,來迅速高效地防止和抵禦破壞行為?
各大網路百科的內容審查和糾錯機制是怎樣的?
為什麼維基百科中的繁體版本分為「港澳繁體」和「台灣繁體」?
維基百科的內容,有沒有版權,權利人是誰?
如何停止閱讀維基百科?

TAG:維基百科 |