標籤:

7步教你鑒別什麼才是真正的數據新聞

7步教你鑒別什麼才是真正的數據新聞

來自專欄 阿旦的數新筆記

阿旦的數新筆記:一

每每看到一則帶著地圖或圖表或信息圖,配上一點文字,再來點動態效果的文章,我總是懷疑:這玩意就是數據新聞?

到底什麼才是數據新聞?這個疑問已經環繞我多時。在學校上課的時候,老師只不過很輕易地說:」這個概念還沒有一個統一的定義,在我看來,所謂數據新聞,就是blablabla「。甩給我一個他的定義,如下:

以資料庫和信息視覺化為基礎,以事件可證性為特徵,秉承調查性新聞報道的傳統,在報道對象的某些相關關係中尋找難得的信息,通過事實的採集,借諸圖表,地圖,線圖等視覺化技術的交互性呈現,來解讀現象的複雜性,從而逼近事實的真實性和客觀性,最大程度地滿足用戶的好奇心與期待,幫助人們更好地理解自己所處的時代的新聞報道方式。(劉昶 2015)

當然,這個定義沒有什麼不好。但是當我想用這個看上去複雜,我又不怎麼理解的定義去鑒別茫茫「無良」媒體製作的「數據新聞」是不是真的時,簡直無法下手。無奈,我只好自己努力去找尋鑒別的方法。(其實老師好像上課分析自己的定義分析地超棒,只不過已經忘卻到九霄雲外了

我找尋的方法是這樣的:

  • 第一步,儘可能多找到幾個關於數據新聞的定義 。

別人現成的知識成果當然要撿。多看幾個,可以發現大家所認為的數據新聞具備什麼共同特徵,以及,數據新聞的什麼特性是被學者在不同定義里強調的。

分享兩個我找到的其他定義,相比老師的長定義,這兩個一個應該是最簡版,一個是普通版。

最簡版:用數據報道新聞。( 來源:歐洲新聞學中心和開放知識基金會聯合開發的全球第一本介紹數據新聞概念的《數據新聞手冊》)

普通版: 數據新聞是運用可視化和互動化手段,對社會某一熱點問題進行宏觀和中觀的呈現、解釋或預測的新聞樣式。(張超、鍾欣 2015)

由上三種定義,一眼望去,不用細看,大概可以得出兩三個共通的關鍵詞:數據、可視化及互動性、報道新聞

哇哦!是不是同時包含這三種元素的東西就是數據新聞了?不是,別高興太早,如果就這麼簡單,我老師會這麼長篇大論地定義嗎!

如果你學過一點新聞學的歷史,那麼你應該知道能同時包含這三種特性的新聞報道方式不僅僅只有數據新聞,還有精確新聞、計算機輔助報道新聞以及所謂的「數字新聞」。如果你沒學過,也沒關係,因為接下來要做的就是,教你區分它們。

  • 第二步,區分數據新聞、數字新聞、精確新聞

這三種新聞在實踐中經常被人混淆,因為它們往往都包含了數字信息和視覺化呈現形式

然而,所謂數字新聞是指:

以數字、公式、字母等靜態形式來輔助文字的報道。

例如:某媒體報道——全球化智庫(CCG)與攜程旅行網聯合發布了《從出入境旅遊看中國全球化發展》系列報告(下稱《報告》),稱中國入境游發展緩慢,外國人中國游增速趕不上中國人出國玩的速度,僅以遊客人數計,順差在2015年達到3000萬人次。

簡而言之,就是:

「這篇文章里有一個1000公里長的數字耶!」

「什麼?一千公里長是多長?」

「就相當於環繞地球……我也不知道了,看圖吧!」

另一種——精確新聞是指:

使用精準的數據分析新聞事件,以避免主觀、人為的錯誤。它側重於微觀的具體調查、實驗和內容分析。

最早,精確新聞興起於美國北卡羅來納大學新聞系教授邁爾(也譯作邁耶)。他在1976年擔任底特律《自由報》記者時恰遇該市發生嚴重的黑人暴動。他和另外兩位社會科學家採用隨機抽樣的方法在暴亂地區抽選437位黑人進行訪問,隨後他將訪問所得資料輸人電腦以統計方法仔細分析黑人暴亂的原因並依據研究結果為《自由報》寫了一系列報道。 邁爾的系列報道為該報贏得了普利策獎 ,後來邁爾便撰寫了《精確新聞報道》一書(劉保全 2004)(不錯的書!)

舉一個最簡單的例子,精確新聞後來被廣泛應用在美國大選的報道中。對!就是大家所熟知的關於民意調查的報道。這些都是要通過抽樣、收集、統計、分析再可視化報道的呀!

在許多中西方關於數據新聞定義闡釋的文獻中,「數據新聞」與基於科學的量化研究的「精確新聞」、計算機輔助報道新聞等概念息息相關。學者認為「數據新聞是精確新聞的延伸」(郭曉科 2013)。它具備了精確新聞和計算機輔助報道的客觀、真實和高效的優勢,是對這些傳統報道樣式的繼承和發揚。數據新聞報道離不開社會科學的統計方法,只是在樣本容量、呈現形式、傳播手段方面更為先進(黃駿 2015)。

樣本容量方面,學者獲取的數據通常分為三類:

1, 第一類是實驗數據,這類數據的數據量大小往往在10-50條記錄左右,在實驗的控制下屬於高質量數據,此時只適用於方差分析、回歸分析等十分成熟的模型。

2, 第二類數據是問卷調查數據,這類數據的數量大小在60-3000條記錄左右,數據質量中等,此時適用於傳統統計分析的很多模型,包括生存分析、回歸分析等等,並且經常考慮異方差問題。「精確新聞」的數據主要以前兩類數據為主,數據量小於3000。

3, 第三類數據也就是現在我們如今在互聯網時代常常遇到的資料庫數據,適用於數據挖掘的模型,包括神經網路、聚類、決策樹等等。「數據新聞」的數據來源主要是第三類數據,數據量較大。

看到這裡,你應該理清了數據新聞與數字新聞、精確新聞的區別。總結一下:

數據新聞與數字新聞相比

數據新聞不是簡單地描述某個事件、事物有多重、多高、多大等等一系列表面的數字信息,而是需要將大量的數據進行量化分析,得出結果。

數據新聞與精確新聞相比

數據新聞是精確新聞的發展,只是隨著技術發展,數據新聞樣本容量更為巨大,可視化形式更為豐富,傳播手段更為多樣。

這其中,決定數據新聞最為關鍵的特性就是大數據

看到這裡,恭喜你!離鑒別數據新聞只剩一步了!

  • 第三步,了解什麼是大數據

「大數據」(big data)概念從20世紀80年代誕生開始,如今已滲透入各個領域。它源於虛擬網路的極速發展以及現實世界的網路化。雲計算、物聯網、社交網路、即時通訊和移動互聯等技術的湧現,產生了數量巨大、類型多樣的原始數據(Raw Data)(黃駿 2015),使人們可以在數據海洋里,抓取有用的信息並對其進行解讀,增加信息附加值。

與傳統數據相比,大數據具有四大特徵:

1, 數量(Volume),即數據量巨大,從TB級別躍升到PB級別,數據量的個數在100萬到正無窮。

2, 多樣性(Variety),即數據類型繁多,數據結構複雜。一方面數據來源不僅包括傳統的格式化數據,還包括來自互聯網的文章、視頻、圖片、地理位置信息等。另一方面,數據是複雜、非結構化的。

3, 速度(Velocity)快」亦指兩方面,一是數據產生得快,例如歐洲核子研究中心的大型強子對撞機在工作狀態下每秒產出PB級數據。二是數據處理的快。大數據處理技術與傳統數據挖掘技術最大的區別,處理實時數據,並以實時結果為導向。

4, 真實性(Veracity),即追求高質量、真實的數據。

數據新聞是大數據在新聞領域的應用及體現,它與計算機輔助報道時代所用到的單一資料庫來源不同,除了數據體量巨大,應用到新聞中的大數據最重要的特點是大部分為公開分享的數據,任何人或組織都可以藉助手上的工具來求證新聞報道事實,完善新聞報道內容。

綜上而言,我也對數據新聞下了一個定義:

數據新聞是採用科學量化研究邏輯,運用大數據作為信息來源,對大數據進行了清理、挖掘、分析,最終以視覺化、互動化手段為主要呈現方式,以期受眾可以理解數據背後意義的新聞報道形式(阿旦 2017)

哈哈,你們更喜歡哪一個呢?

總結一下,當你遇見一篇有圖表、有交互的新聞時,如何判斷它是不是一篇(好的)數據新聞呢?

先看硬體要素:

1, 是否有且多個數據類型,有??繼續

2,是否有可視化或互動,有??繼續

3,是否能判斷數據量大小達標,能??繼續

4,原數據是否可以免費、公開獲取並檢驗,可以??繼續

再看內容:

1,是否有正確的量化分析數據,有??繼續

2,是否盡最大努力地解釋了數據分析結果代表的意義(我曾經對「美國媒體對今年美國大選進行的數據新聞報道」做過內容分析和個案分析,發現大多數據新聞報道都以「WHY和HOW」為標題,側重解釋數據結果)有??繼續

3,是否用數據講了一個好故事,而不是一個數據報告。有??完美

以上,就是我理想的數據新聞。

最後,本來想推薦一篇近期我看到很喜歡的數據新聞的——來自於《洛杉磯時報》。然而vpn突然連不上了,只能下期再推了。

# 參考目錄:

1, 黃駿. (2015). 從精確新聞到數據新聞:以 2014 央視《兩會大數據》解讀國內電視數據新聞,《中華傳播學刊》, 1-27

2, 張超, & 鍾新. (2015). 新聞業應用大數據: 展望, 誤區與對策. 中州學刊, (6), 169-173.

3, 郭曉科. (2013). 數據新聞學的發展現狀與功能. 編輯之友, (8), 87-89.

4, 胥琳佳. (2013). 大數據對於傳播學研究內容和方法的影響——基於社交媒體和移動互聯網的思考. 中國出版, (18), 3-6.

5, 劉保全. (2004).我國「精確新聞報道」發展綜述. 當代傳播,(3),37-40.

歡迎關註:

aHR0cDovL3dlaXhpbi5xcS5jb20vci9hRHJHM3ViRTY3dVVyYUs5OTI5Ng== (二維碼自動識別)

推薦閱讀:

五千個藥名和兩百份廣告詞告訴你,虛假醫療廣告套路深!

TAG:數據新聞 |