為什麼中文維基與英文維基的活躍用戶比例那麼懸殊(5600 vs 140000)?

維基百科的活躍用戶的意思是近三十天內有參與編輯詞條的用戶。
數字的來源 → http://meta.wikimedia.org/wiki/List_of_Wikipedias#1_000_000.2B_articles
中文不是世界上最多人說的語言嗎?


其實英文維基百科人數高是必須的,是因為英語是事實上的世界語言,而中文(和其他語言)不是。其他語言的人查外文資料一般還是會選擇英文而不是中文。另外按照第一語言使用者和第二語言使用者(Prim.+Sec. Speakers)計算,其實英文的15億是超過中文的13億的,而且中文幾乎只在東南亞有影響力。

英文維基人多,一個原因大家都喜歡去熱鬧的地方編輯。經常有見到母語不是英語的人在英語維基當管理員,但自己母語的維基卻很少編輯。(不知道是不是用別的賬號什麼的)維基經常有這種情況,寫的條目一個月的訪問量還沒有自己用戶頁一天的高,也就上首頁那天訪問量會爆發;但是同一個內容在英文維基的對應頁面,訪問量就有很多,大家還是更喜歡自己的內容有人看吧。

其實在維基百科的一些統計趨勢圖上,都有「不列出英文維基百科」的選項——因為第一的英文維基和第二維基差的太遠了(條目數差3倍,活躍用戶數差4倍,訪問量差5倍),而第二和第三都很接近。

英語維基註定只是個傳說,和英文維基以外的維基比較更有意義。但是即使除掉英文,中文維基也只能排在第十左右,各方面(人口、編輯數、瀏覽量、條目數)也只是排名第二維基的1/3到1/10。其實中文人口看似很多,其實恰恰是輸在了人口上……

首先,允許我先說一下大陸以外的環境。中文用戶除掉大陸後,人口數量不佔優勢。港澳台加起來大約0.3億人,馬新人可能更喜歡英語維基,常年海外的人的人也會做一些貢獻。而大型維基都是幾乎都被西歐國家語言維基佔領,這些國家的人口大約1億到2億。(PS:唯一的亞洲國家是日本,而且幾年前曾經一度排在第三,日本版權嚴格的BT,維基百科的自由版權或許顯得很有影響力)有幾年大陸幾乎沒有編輯者,所以在大陸幾乎沒人的時候,他們把維基百科發展起來已經很努力了。

大陸人口是很多,但可能編輯維基百科的人其實不多:02年到06年維基暢通的時候大陸的上網人口不是很多,等到網民快速增長的這幾年,恰好趕上百度百科橫空出世以及被某牆那啥。記得有篇報道說法國主婦(也許是吧,記不清了)也熱衷參與維基百科,而且成年人佔了編輯的很大數量。相比而言,中國人大多還是只知道QQ/百度百科的。thegyrfalcon上面發了個編輯統計圖,13億大陸人的編輯量還沒有600萬香港人多。(還有個訪問量圖,大陸好像比香港高一些)

百度搜索引擎長期壓制維基百科這事來者猶可追,從去年三月解封以後,訪問量好像增加了不少。

在百度百科編輯,也在維基百科編輯的不知道有多少(知乎就有一位不自稱是管理員的維基百科管理員也是百度百科用戶),它們或許是因為不滿於百度的審核(辛辛苦苦的編輯被拒絕通過)、或許是好奇、或許只是傳播知識,也或許是是其他原因;然而淺嘗輒止繼續百度百科的多(不能直接Ctrl+C、Ctrl+V,編輯器很糟糕,明明是自己專業的常識還要被「請求來源」等),轉到維基百科的還是少。維基百科所標榜的「自由的百科全書」在大陸沒有優勢,因為百度百科「更自由」。

對讀者而言,多快好省的獲得資源才是硬道理:維基百科所有的,百度百科就能有;維基百科不能有的——比如主觀評價、「不具關注度」的主題、Fans向內容、版權圖片——百度百科也能有,而很多時候讀者確實就是需要這種主觀評價內容。另外百度百科內容全,更新快,一般讀者也就看看而已,不需要再看維基百科的。

(至於怎麼吸引大陸用戶,沒天時沒地利,所以多做宣傳吧,實際上現在中文維基還是有人在這上面花費精力的。另外強烈BS維基媒體基金會,有錢搞什麼WikiVoyage就沒錢早點開發WYSIWYG編輯器。)
(說道百度百科另外再多說兩句。雖然百度百科錯誤和廣告內容很多,不過還是要看讀者是不是有篩選能力,很多條目雖然沒有來源,但有用的信息還是很多。如果讀者有篩選信息的能力,百度百科很多時候還是比中文維基有用,因為中文維基信息太匱乏了。但是對於照單全收的讀者那我只有呵呵。)

有一點需要說的是,中文維基在剛發展時和俄語維基水平相當,但這幾年俄語維基發展很快,論規模已經排到第五了,中文維基將來也許也會像這樣趕上吧。

另外5600和14萬其實不能算「活躍用戶」,只是在30天內做過一次編輯而已。這些可能包括註冊一個賬號創建條目後就棄置不用,甚至只是其他語言的人去調整一次跨語言鏈接,算不得活躍的。維基百科超過7成的用戶數是長期活躍用戶編寫的,因此更有意義的數據應該是統計「相當活躍的人口」(100+編輯每月),即使這樣,中文還是比其它維基落後,只是差距不那麼懸殊而已。

數據調閱於: 維基百科數據


http://zh.wikipedia.org/wiki/%E4%B8%AD%E6%96%87%E7%BB%B4%E5%9F%BA%E7%99%BE%E7%A7%91
http://zh.wikipedia.org/wiki/Wikipedia:%E7%BB%B4%E5%9F%BA%E7%99%BE%E7%A7%91%E8%AF%AD%E8%A8%80%E5%88%97%E8%A1%A8


幾方面原因.
1.GFW, 在維基百科發展的關鍵幾年(2004-2008)中, 維基百科一直被完全封鎖, 導致百度百科發展起來了;
2.版權意識普遍低下, 掛copyvio都搞死人; 百度百科就可以忽視這個問題;
3.參與者年齡層, 知識水平的差距


The world"s most spoken language is chinese, but "most spoken" does NOT mean "the largest number" of active users in the Wiki.


樓上說的很清楚了。
其實就算在中國,很多時候我們也會用英文維科的。比如要查一些學術名詞,寫一些報告等等(有些學校學生叫報告要用英文寫,專業課開雙語……).就比如我室友,就是一個只用英文版維科的存在。


由於GFW的功勞,雖然中文維基百科在大陸可以訪問,但僅僅是可以,遠未達到通暢。能夠翻牆的人士或可愉快的忍受時不時蹦出「該頁無法訪問」的人士也就是那5600 人而已。


中文維基編輯還需要提高知識水平,我真是為他們捉急啊。英文維基有一個好,編輯詞條比所有維基都要快,那美國英國的編輯者比中文用戶不知道高到哪裡去了,在詞條內容里談笑風生。中國有句話叫悶聲發大財,總有一天中文用戶會趕上來,你一定要問我支持不支持,我說支持,都是中文為母語的人怎麼能不支持。百度百科啊,不要弄一個大標題,把詞條寫的亂七八糟,too simple , sometimes naive, im angry


惡性循環吧。使用的人少——編輯的人少——使用的人少。
首先wiki在發展階段被牆,以至於百度發展起來了(最早是互動),資源豐富,人們也喜歡用百度。
另外維基的編輯系統十分不友好,大量使用代碼,對於習慣圖形化的國人來說,不合適。
還有維基需要參考文獻,需要遵守版權條約這些破規矩,百科有么?
百度百科商業化做的很好,有錢了,甭管是否中立,幹掉了一大堆國內的山寨百科,比如互動之類。雖然詞條質量很多等於劣質廣告。但是人氣上來了。
另外很多國外網站在國內就是水土不服,本地化不好。歐美日本的網站,一大堆的設計停留在國內十年前的水平,可能他們比較喜歡簡介,突出內容吧,很多都是十分簡陋的,比如ebay,還有各種日本網站(簡直是2000年的設計水平)。相反國內的網站,很多設計的跟一個滿頭插著花,穿著花棉襖的村婦似的,但就是這樣國人才喜歡,類似的是qq空間,淘寶。
中文維基水平其實也不是很好,很多詞條沒有,內容質量也不高,我曾經編輯過幾個詞條,太累了,一個專業辭彙就要寫一個下午,實在懶得弄了。現在上網無論哪個網站都很少發言,看你們胡吹神侃。


中文是最大語種,但卻遠遠不是最重要的語種。參考這篇文獻:Johnson: Language networks:When bigger isn"t better(想省事可以只看第二段)

HOW would you rank 「important」 languages? If asked to rattle them off, many people start with English, but after that are reluctant to go further. Important how, they ask. One approach would be to look at people and money: surely a language is important if it is spoken by lots of people, in countries with great wealth (and presumably, therefore, power).

But in December came a new approach. A group of scholars* approached the task by first looking at how languages are connected to one another, rather than viewing them in isolation. They then decided to see if this was a good predictor of how many famous people spoke a given language. If a language is well connected to others (a 「hub」 language with many bilinguals), its speakers will tend to be famous. And the names of the connected languages turn out to be rather interesting.

To find links between languages, the researchers created a 「global language network」 (GLN) three different ways (see graphic). One was Wikipedia editors: a bilingual Wikipedian who edits articles in both Arabic and English counts as strengthening the bond between Arabic and English. The second was Twitter: users who had tweeted at least six full sentences in a second language were treated as strengthening the bond between those two languages. The third was a more formal, old-fashioned metric: book translation. UNESCO, the United Nations』 cultural organisation, keeps a database of translated books, and each of the 2.2m translations was counted as a bond strengthening the two languages. (These bonds, of course, are asymmetrical: some languages have more books translated out of them than into them and vice-versa.)


View full image here

The resulting networks are striking in many ways. English is central to all of them. But with many other languages, their connectivity has little to do with their home country』s modern power. Take the network implied by book-translation. The data come from 1979-2011, and so Russian is an important node in the network. Not only were books translated between Russian and other languages of the former Soviet Union (Armenian, Kirgiz and Latvian, say), but Russian is significantly connected to languages from South and South-East Asia and the Middle East. The contrast with Wikipedia and Twitter, which skew much more modern, is striking: Russian suddenly becomes a peripheral node.

Chinese, too, is peripheral in the authors』 networks. In the book-translation network, the world』s most spoken language is isolated, connected mainly to other Chinese languages plus a few in South-East Asia, notably Vietnamese. This may make sense given the time-frame of the book-translation database, skewed to decades before China』s spectacular rise. But Chinese is also a bit-player on Twitter, as a result of the popularity of Sina Weibo, a competing Twitter-like service, in China. The same is true of Wikipedia: here Chinese is somewhat better connected, but it is still much less than its size or GDP would predict, possibly thanks to the existence of a Wikipedia-like Baidu Baike collaborative encyclopedia.

The upshot is clear: big languages are not necessarily global, and vice-versa. Arabic and Hindi—two other languages with hundreds of millions of speakers—are as peripheral as Chinese and Russian. The big nodes in the networks besides English are predictable: French, Spanish and German, especially. The first two were successfully flung far and wide by colonialism. German has centuries of prestige in science, philosophy and literature, despite the failures of Germany』s colonial efforts.

But these results must be handled with care, the authors note. The paper says nothing about the inherent qualities of any language, or the cleverness of its speakers. César Hidalgo, one of the authors, notes that the paper is really about elites. Bilinguals with time to edit Wikipedia are not typical people, nor are book translators (or even bilingual Twitter users). But they do play an outsized role in the transmission of culture across borders. The main finding of the paper is that people are more likely to become globally famous (as measured, in part, among people with Wikipedia entries in at least 25 languages) if they speak one of the most networked languages. The world"s most brilliant person may be a speaker of Hmong or Nahuatl, but the road to fame leads through other languages.

There is a 「what else did you expect?」 nature to the outsized role of Western languages in three Western-born products: the mass book-publishing industry, Wikipedia and Twitter. But the results are still meaningful: Twitter really is globally important (just ask the Iranian mullahs or the former president of Tunisia). Sina Weibo and VK (Russia』s Facebook) are not. Their homemade nature may be a point of pride—it certainly keeps censors happy—but it also means cutting down a country』s cultural influence.

For the language learner, the networked nature of languages poses an interesting dilemma: should you learn a language popular among global elites? The tradition of learning French still looks like a good bet here. Or should you learn a language whose number of globetrotting bilinguals is small relative to its importance? Supply and demand says that this will be valuable. This is the real case for learning Chinese: not because it is the rising global language, but because it isn"t—at least certainly not yet. Given China』s huge role in the global economy, the number of outsiders fluent in Chinese is still far too few.


用百度測完網,就順手百度了一下。


呵呵,因為百度知道。


百度百科的用戶、詞條編輯次數和訪問量完爆維基百科。


用百度的比較多啦


遇到不懂的只會說問問度娘,不會說問問基叔


404。


你在國內給我好好的上個維基百科試試?


雖然中文是使用人數最多的語言,但使用頻率最高的搜索引擎叫百度


中文維基明顯還不夠完善,很多詞條還是要去英文維基才查得到,更何況國人習慣了一個叫百度百科的東西……


我編輯了個醫學條目,來個搞IT的認為我的條目不合格。我編輯的數學條目,直接翻譯自英文的,也判定為不合格。所以我現在不上了,壓根都是一幫SB駐紮。


因為我現在TM根本就登不上維基百科,WTF!


推薦閱讀:

為什麼很多人願意在知乎回答問題卻不去編輯維基百科?
怎麼評價中文維基百科裡面相互衝突的命名規則?
維基百科的除了募捐還能靠什麼獲得資金?如果沒有募捐要怎麼維持?
英文維基百科上的條目可信嗎,為什麼?
維基百科以什麼標準來鑒定條目的「廣告宣傳」意圖?

TAG:維基百科 | 中文維基百科 |