為什麼中文在互聯網的使用率才排在第七?

Languages used on the Internet

為什麼第二的網民數量才製造了第七的內容?


一個很正常的問題,為什麼上面一個個又是釣魚又是打臉又是黑又是給牆洗地的。

維基百科的頁面上是給出了數據出處的(Usage Statistics and Market Share of Content Languages for Websites),看一下不就知道了。

順便說一句,維基上給的是 2015 年 3 月 18 號的數據,那時中文內容排第七。

然而……

那個出處網站是每天更新數據的,今天(2016 年 5 月 31 日)去看,中文只排第九了!

那麼這個網站的數據又是從何而來呢?網站上也有說明,我們來看一下。

首先這個網站統計了很多種網站技術的使用情況,並不是只有內容語言,還包括比如客戶端語言(噗,這個語言跟前面那個語言不是一個意思)、字元編碼、圖片格式之類的東西。

比如伺服器端語言,PHP 遙遙領先,PHP 果然是世界上最好的語言~ (*^__^*)

那麼,這個網站有一頁專門講了他們的統計口徑,大意如下:

  • 我們分析的是網站,而不是單獨的網頁。一個網頁用了某技術,我們就認為該網站用了某技術,一個網站可能會使用多種技術。

  • 為了排除域名販子,我們只分析截至 2013 年 6 月、排名前一千萬的網站,排名用的是 Alexa 的三個月平均數據。

  • 子域名不算單獨的網站。

  • 重定向的域名不算單獨的網站。

翻譯:

知乎有幾千萬個問題,每天幾千萬人瀏覽發言,也算一個網站。新浪、淘寶等等同理。

我的個人網站只有十個頁面,只有我和我男票上,也算一個網站。

http://tieba.baidu.com、http://zhidao.baidu.com、http://baike.baidu.com 等等都只算是 http://baidu.com,只算一個站。

微信的所有內容都是在 http://qq.com 域名下,都只能算一個站。

所以那些大型網站人氣再高也沒用,只算網站數量。

小網站多的會比較佔優勢。當然也不能太小,他們說了要排除域名販子,域名販子的網站一般只有一個頁面,寫著本域名供出售,這種應該進不了前一千萬的。我那種個人網站應該還是能擠進的。

從這種統計口徑上看,中國的網站可能馬太效應更明顯一點。雖然大家感覺中文內容很多,但大部分都來自大網站,小網站數量相對少一些。

很多人熱衷開淘寶店、微店、個人公眾號之類的,依託於大網站提供的服務自己創建內容,這些建得再多也不能提升網站數量。

國外可能自己建小網站的相對更多。

順便說一句,國內政策上對建站的限制,導致建站要麻煩很多,恐怕跟這個有點關係。國外可以有一鍵建站,可以直接買域名、買空間、自動搭好 CMS,幾分鐘建站完成就可以往裡寫內容了。國內買域名,伺服器空間,備案,很多麻煩事,買國外的在國內還可能訪問不了,這個建過站的都懂,就不詳細說了。

  • 我們用的是網站自己公開的數據,有些網站可能不願公開數據,有些網站可能公開的數據是錯的。有些網站內容需要用戶註冊登錄才能看到,我們不會去模擬用戶行為,可能收集不到那些數據。

翻譯:

其實他們沒有明確說到底根據什麼來判斷網站語言,但是很可能就是根據網頁上自己的標記,比如類似這些來判斷的:

比如上面是知乎的網頁 HTML 源碼,lang="zh-CN" 就表示用的是中文。

那我們再來看中文第一網站百度的 HTML 碼,它寫的是什麼語言呢?嗯?它沒寫…… (⊙﹏⊙)b

再看微博,嗯,它也沒寫…… (⊙﹏⊙)b

淘寶也沒寫……

騰訊居然寫了!

當然可能還有別的方式來檢測網頁語言,但上面說的是一個最直接、最簡單的方式。雖然沒法把所有的網站一一看過來,但是平常看到中文網站里沒標明語言的實在是很多,中國的很多網站從業者可能沒有標明語言的習慣。而這個或多或少會對網頁語言的判斷有所影響吧。當然其他語言的網站可能也有漏標的,但是從結果推斷,估計漏標語言有可能是統計結果里中文網站數量偏低的一個原因。

樓上說的網站一般都會有個英文版,也許是原因之一吧。但這個能解釋英文網站為什麼數量那麼多,卻解釋不了為什麼法語、葡萄牙語、義大利語都比中文網站數量多,波蘭語、土耳其語之類的都跟中文網站數量差不多……


因為統計方法是錯誤的。

他們按照前1000萬網站中對應語言網站的數目進行統計。

就像哪個大洲的海軍最弱?北美洲,因為只有一個北美洲國家的海軍進入世界前十。

然而美國海軍吊打世界……


個人的感覺,在互聯網領域第二名,第七名和倒數第一沒啥區別。

現在很多信息都是最先用英文發表,之後翻譯成其他語言的。自然互聯網也是如此,如果真的很不錯的話,我也是選擇先用英文發表出去,再翻譯成中文轉載到國內的網站。


說明網路資源還是不夠多。

灌水的,寫小說的,再接再厲……(dva愛你喲)


我覺得題主不是黑,題主只是英文不太好


經常在網上搜技術資料,按質量、豐富程度分,英文〉日文〉〉(遠遠大於)中文


兒童節更新

還來婊我?這題目給改了多少遍了你們後來的知道不?

知乎能看題目的編輯歷史不?

2016.6.1

牆不是好東西 大家都知道 但這也不是低級黑的理由


中文第七的這個排名,叫做Content languages for websites,意思是中文在互聯網上按照內容所佔的比例。

我不是什麼從業人員或者研究者,但隱隱覺得這個名次還是比較靠譜的。好多國外網站都不提供中文頁面;但國內哪一個網站不來個English version?

此頁面中還有一個排名較Internet users by language,這是按人數來的,中文用戶數量僅次於英文用戶,排名第二。


題目有誤導,頁面里說的是中文網路頁面的數量排名落後,這一點並不能很大程度上綜合反映互聯網內容云云。

這個情況一點也不稀奇,真的,能反映的問題可能也沒題主感覺到的那麼大。

實際上原因在於外國人搭建的網站實在是太多了,其他國家我不知道,但英語網站的數量非常多是完全可以理解的。

舉個簡單的例子,我在我們村吃飯的幾家非連鎖中餐,我們村的獨立小劇院,旁邊村的電影院,你看都是小小的個體戶,根本沒多大客流量,但是他們真的都有網站,而且網站做的非常好,我每次需要獲取信息都是直接去網上看的,包括一個很小的書店,也有自己的非常完善的網站,但你想想你在中國,你學校旁邊賣教輔的書店會有網站嗎,新華書店的網站都破落不堪(我說的書店很大作用就是給大學賣教科書的),所以這個數據反映的就是這個數據本身,也可以說中國人在這個數據上落後是因為互聯網技術不普及,但事實上現在中國的團購什麼的也整合了很多信息,發展出了新的方法。

再加上各種語言都會多少提供英文版本,英語更加遙遙領先就可以理解了。


不了解統計口徑與策略。

但是,統計者把ip換成中國的呢?

很多國內大網站都支持國際化多語言,你從美國訪問就給你英文頁面;你從香港訪問就給你繁體中文頁面;你從大陸訪問就給你簡體中文頁面;你從日本訪問就給你日文頁面。

很懷疑這份數據的準確性。


很多網站沒有中文界面

為什麼沒有中文界面?因為中文用戶少

為什麼中文用戶少?因為很少中國用戶訪問

為什麼中國用戶訪問少?因為404 not found, connection failed, server no response, connection reset, no DNS record

為什麼404?因為[不宜公開討論的政治內容]

steam,一個著名的遊戲平台,不在屏蔽列表,目睹過評論區大量中文撕逼的盛況


說明世界並不總是圍著中國轉,中國沒了地球照樣轉。

另外最新的是下面的那一條

Estimates of the number of Internet users by language as of November 30, 2015


任天堂七國語言沒有中文


說明咱們英語好


瀉藥,這個問題不了解,不評價,坐等大神回復。


學短知乎回答,因為今天的科技園不是中國發明,互聯網更多的不是、否則黑白俄羅斯都得學習我國八十四畫一個字的漢語,,,不是嗎「」???


練葵花寶典必先自宮,尚若寶典沒練成,只能當太監嘍。


可能只統計了牆外的數據


這事應該問谷歌,算一下網路上一共有幾個英文字元,有幾個漢字字元,再按照平均信息量做一個調整,就能看出中文的使用率了


兩個跟大夥不一樣的原因:

1、備案。工信部的備案還不夠,還有公安備案、工商備案、廣電備案……一串省略號,消滅了大量的中文站,許多個人站被清。帶來的另一面是某種意義上提高了網站了質量;原本自己開個個人博客站的,只能轉到微博和新浪博客。

2、網賺。個人中文站被大量的消滅,那些網賺達人紛紛轉到國外,用國外空間,但是訪問慢,還老是被牆。這時有好多人就放棄轉行,當然還有一些人轉為批量搞英文站,賺美元,為豐富英文站做貢獻去了。


我能想到的有三個方面可以解釋這個問題:

1.很久以前看過一個統計,說中國人比西方人更不願意向網路提供內容。

2.中文的內容僅限於一個國家,而其他語種有很多國家在使用,所以可供產生的內容要多。

3.中國法律對內容的限制阻礙的內容的產生。如PORN,大約要佔到網站訪問流量的30%。這部分內容對於中文來說幾乎可以忽略。


謝邀。這問題你自己就能回答。你經常訪問的網站有什麼?淘寶,京東,新浪,網易,百度。

國內訪問的網站高度趨同,提供內容的就更少了。而且,國外發帖被刪的概率小一些。


推薦閱讀:

中文有類屬詞典嗎?
《現代漢語詞典》是否會再次根據大眾使用的錯字錯詞進行修訂?
「爸」「媽」這兩個字古代就有嗎?
如何看待馬克扎克伯格在清華大學用中文演講?
如何看待將生日快樂簡化為生快?

TAG:互聯網 | 語言 | 語言文化 | 漢語 |