百科詞條中數據來源的依據?

之前沒有注意過百科中的數據統計情況,今天在查資料時偶然發現了一個奇怪的現象:通常用的百度百科和維基百科在數據方面有很多出入,比如說法國的一個城市(假設來看「馬賽」中的人口欄),個人認為法語版的維基百科是相對精準的,但在查過詞條後,同是08年統計出來的數據居然各不相同,(維基英法文兩版基本一致),是什麼原因導致的呢?參照物不應該是所在國統計所公布的數據嗎?國內建詞條和修改詞條時數據來源的依據有哪些,國家統計研究所又或?其他的數據情況還沒有仔細看,但從人口這條來看,對其他的數字也表示質疑,以後想知道真實情況的話是不是需要到國家官網才可以呢,不僅僅是城市信息方面的問題,現在有很多人做調查或研究時會偷懶,數據統計來源於百科。

看那麼仔細似乎有點兒較真的意思,不過還是非常希望看百科像翻字典一樣得到最準確的解釋。這也是百科的意義所在吧。 很想知道建詞條下定義以及做翻譯的朋友們對這個問題的看法,大家一般都參照哪些呢? 編輯時的責任感,強烈嗎。

「馬賽」百度百科中詞條瀏覽約為 228930次,如果很多人,尤其是學生在寫馬賽介紹時估計會出現錯誤,(以前上學老師經常讓寫對某某城市的介紹然後課堂上讀給大家什麼的)或許大多人不以為意,但是還是會影響一部分想了解情況的同學吧。

百度百科:

http://baike.baidu.com/history/id=11827320

維基百科( ZH)

http://zh.wikipedia.org/wiki/%E9%A9%AC%E8%B5%9B

維基百科( FR)

http://fr.wikipedia.org/wiki/Marseille

維基百科( EN)

http://en.wikipedia.org/wiki/Marseille

L』Institut national de la statistique et des études économiques (Insee)

http://www.insee.fr


在涉及到需要具體數字的時候,維基百科一般會引用參考資料,這也是維基百科的三大支柱之一。

具體到特定的條目,參考資料往往會有第一手和第二手之分。譬如中國人編寫「北京」條目,會直接去傳說中的相關部門(民政局之類,blahblah)去取得第一手的數據;然而對於一個法國人來編寫「北京」條目,他們可能不識中文,反之會去一些法語雜誌報刊年鑒等去獲取這些數據,這些數據可能是通過其他手段統計而來的(當然,也有可能直接從中文維基把人口數字抄過去)。這樣就造成數據的不統一。

在維基百科的條目里,有參考資料來源的數據必定會優先於沒有參考資料來源的數據得到展示,這樣持續的小改進都會得到保留,從而整體提高維基百科條目的權威性。

舉個小小例子,我在中文維基編輯天文條目時,經常碰到恆星的「星等」問題。這個數據在大部分時間裡,不同的資料來源都會取得不同的數據。原因是多方面的:

  • 恆星的星等本身可能是變化的,有些數據給出的是最大星等,有的給出的是平均星等

  • 觀測環境(大氣、恆星方位)會影響所測的數據,不同的天文台給出的數據可能不一樣

  • 觀測方式不一樣(波段、濾光片),測出來的星等也是不一致的,但往往籠統地都稱為「星等」

但是你不能說南京紫金山天文台測出的數據就一定沒有哈佛天文台的數據精確和權威。所以參考資料是最好的評判者。即使和大多數的數據有出入,只要你給出了」還可以信得過「的參考資料,這個條目的數據就不算有大的問題。

在參考資料權威性的評判問題上,一般採取"權威專業機構/官方 &> 混飯吃的專業機構/官方 &> 權威新聞媒體 &> 混飯吃的新聞媒體 &> 較負責任的個人博客 &> 閑散的個人博客"這樣評判標準。實際上到了」個人博客「這一級的資料,維基百科基本上已經不會使用這些數據了,而寧願留空之。

國內的網路百科我也接觸了不少,基本原則就是,有數據就填上去唄。而且備受詬病的一個問題是,給出的更加權威的數據並給出參考資料,不一定能通過管理員的審查。最後數據的權威性可想而知。


在維基百科編過一些需要數據的條目。說一下我了解的。

就我個人來說,作為新手時大部分的數據都抄自外語維基對應的條目,或者直接用網上搜到的數據填入。不過隨著編輯熟練程度增加,對來源的要求也逐漸嚴格。如今編輯的時候盡量找可靠性最佳的數據和文獻,爭取做到學術論文的標準。實在無法找到好的參考來源時也會相應放低標準,使用一般新聞網站的數據,但也會在附註中給出引用的出處,是否可靠留給讀者自行判斷。

具體來說,現今我在編輯城市、車站等需要大量數據的條目的話,都需要先拿到官方的公開的資料庫才好開始編輯。比如「橋連城站」中的年出入站人次數據是找到了法國政府公共數據發布平台(http://www.data.gouv.fr/)發布的相關文件作為參考。各個歷史時期的人次數據則是從地方政府網站上的一篇介紹中挖掘出來。又比如「法國地理」中用到的人口、國土面積、耕地比之類的數據則是由法國統計部門INSEE的網站公布的文件中得到。不過也有一部分數據沒法找到,是從法語維基搬運過來的。

一般來說,在維基百科條目中的數據,如果沒有在後方附註參考來源,那麼可信度由於難以判斷,會比較低。註明了所引的來源的數據可信度比較高,但也要看來源本身是否足夠可靠。現在大部分地方條目是由機器人批量創建,可靠程度與所使用的資料庫素材有關,可信度應該都比較高。不過「馬賽」條目確實是需要大修了。


具體數據的話,看引文的出處啊,百度百科這東西可信度就太低了,平常看著玩可以。

就是維基的中文好多條目嚴謹性也不高。

比如你提到的馬賽人口數目,英法的wiki都提供了可靠的數據來源。如果寫論文或者做研究的,肯定會打開引文網站來驗證各個數據的可靠性。

中文的就沒有,也就是說中文說錯了,看得人也不知道。


城市人口統計方式有兩種:一種是市區人口,一種是轄區人口。

你在http://www.wolframalpha.com 中輸入:Marseille 2008

即可查詢到馬賽的2008年的人口

wolframalpha是基於計算的知識搜索引擎,數據來源於權威資料庫,例如聯合國……


百科只是收集各處的資料而已, 真正可信度的來源是權威的來源, 正如維基百科所說: "維基百科內容的門檻,是可供查證,而非真實正確——亦即是:加入維基百科的內容須要發表在可靠來源中能被讀者查知,而不能僅由我們認定它真實正確。"

--來自http://zh.wikipedia.org/wiki/Wikipedia:%E5%8F%AF%E4%BE%9B%E6%9F%A5%E8%AF%81


百度詞條中數據的來源,根據我的經驗:

1、從相關搜索結果中找出來的。

2、拿著一本旅遊雜誌、菜譜、某論文集、人物介紹抄上去的。

3、搞不好還有自己編的= =

其實WIKI也一樣。

如果是寫論文,應該去期刊網站查詢相關的論文,並且對數據的統計時間進行明確的說明。

另外,統計數據本身一般來說也是存在差異的,就你說的人口數而言,不同的時間進行統計,即使年份相同,數據差異可能也很大,要考慮的因素很多,所以,人口數一般只是標定量級,無法精確。這裡面有常住人口、流動人口、新增人口和死亡人口多個因素需要考慮。

而百科這種產品,註定了是網民活躍更新的,即使有專家更新了正確數據,也有可能被好心的網民誤會是錯誤數據而進行修改。所以百科這種數據的可信度不高,它只是提供了一個可以查詢的場所。

所以,要求「最準確」,那麼還是買套百科全書比較靠譜。


推薦閱讀:

HTC 跟三星比差在哪裡?為什麼 HTC 會拼不過三星?
作為一名生活在中國的男性,你在何種場景下感受到了來自性別的歧視?
你所學的學科中最經典最有代表性的一本入門教材是什麼?
瀏覽知乎最痛苦的事是什麼?

TAG:維基百科 | 定義 | 調查類問題 | 百度百科 | 翻譯 | 統計數據 |