Ray的數據新聞學習日記(一):什麼是數據新聞
在我看來,進入任何一個領域之前首先最需要了解的就是:這個領域的歷史、這個領域究竟是做什麼以及這個領域的現狀和發展。首先聲明,以下內容來源於對課堂、文獻、網路資源和自己的一些思考的總結。文章末尾會標出所有來源的鏈接,以方便有興趣的朋友查閱。
數據新聞的定義
看了各種各樣的對數據新聞的定義,自己概括下來,最簡單的說法莫過於:數據新聞就是「用數據講述新聞故事」。關於這個定義,在我看來有幾點值得注意:
1、講述新聞故事是永遠的核心。
在我的第一堂數據新聞課上,老師問我們:你們覺得成為數據新聞記者最重要的能力是什麼?
最重要的能力是什麼?我的腦海里第一個出現的是大數據處理能力。在我看來,數據是數據新聞的源頭,學會處理大數據便是學會從源頭汲取養分,應該是最重要的能力。其次,就是數據可視化的能力,掌握各種數據可視化的軟體,是呈現數據的最重要的步驟。周圍的同學也大多如此,數據處理、編程能力、統計學、excel以及各種軟體的使用成了我們不斷嘗試的答案。
好了,到了劃重點的時候了。因為被忽略的那個答案,恰恰成為了最重要的那個能力:
最重要的是:你要知道如何講好一個新聞故事。
新聞記者的職責永遠是講述一個好的「新聞故事」。而數據是數據新聞記者講述故事的手段。
而手段永遠都是服務於目的的。
ps: 不由想到了課前老師讓我們評價一篇數據新聞時,我用到詞是beautiful,好想找個小黑屋躲里去。2、數據不等於數字。
data ≠ numbers
當我們談論數據新聞時候,我們大多數的時間是在談論數字,然後如果我們僅僅把數據看成數字就會在一定的程度上制約我們自己的思維。
舉例來說:
「Gay rights in the US, state by state」是衛報在2015年發表的一篇數據新聞(也是我非常喜歡的一篇數據新聞)。這篇數據新聞收集了美國各州在各個方面賦予同性戀的權利,包括:結婚權利、收養權利、醫院探視權等。這是一篇並非建立在大數據概念上的數據新聞。而用它舉例也是想要提醒自己,在考慮數據新聞點的時候,不要局限了自己的思維。數據新聞的產生:
新聞記者不喜歡數字、數學似乎是非常可以理解的。用我們的國情來看,記者常常自詡為「文字工作者」,而且最後走上新聞這條大路的大多數是文科生,文科生的普遍特點便是不那麼喜歡數學(可能有以偏概全之嫌)。但是不喜歡數字、數學,並不代表新聞工作者不擅長運用數字。
其實新聞工作者對數字的使用可以追溯到好多年以前,有時候數字本身就是新聞點,有的時候數字可以用來展示一定的事實。然後那個時候的數字的使用,從規模、數量以及呈現方式上都還是簡單和單一化的。
數據新聞這個概念是在2009年第一次被提出來,當時稱為Data-driven journalism,專指以通過對數據的處理、提取進行新聞報道的類型。
那麼是什麼原因,讓數據新聞成為了一種單獨的新聞類型被提出來了呢。通過一些文獻的閱讀和自己的總結,我覺得主要有以下的一些原因吧。
第一:科技的進步,讓更多的數據得以被記錄。可以說,當我們開始談論網路安全的時候,就是我們的大量信息被提取的時候。當然個人信息僅僅是大數據的一部分,但不得不說正是因為更多的數據得意被記錄,才成構建了數據新聞的基礎和源頭。
第二:更多可用於處理數據和可視化的工具的普及。過去的大數據處理以及數據的可視化基本都是依賴於專業人士。很難有記者能夠跨越這兩個領域,並且熟練的掌握新聞和數據、程序等技能。然而,隨著類似於excel, open refine, many eyes等軟體的出現,數據處理和可視化的難度被大大的降低了。也正是這些軟體的出現和普及,構建了數據新聞的手段和方法。
第三:信息爆炸。就如同我在第一篇文章中分析的,過去新聞工作者的任務是找到稀缺的信息,將他們呈現給受眾。而現在,新聞工作者的任務是提取信息和解釋信息。
這張圖我覺得非常形象的表達了這個趨勢。比起以前的提供者的角色,現在的記者角色更像是保護者。從這個角度來分析,在眾多的信息中,最難以理解的莫過於數字信息。有人說過pdf是數據的墳墓。因為當數據以pdf的形式展示時,對大多數人而言,是不構成意義的。即使能夠看懂,也無法將紙面上的數據與自己的生活實際構成聯繫。而這時,數據新聞記者的角色就顯得不可或缺了。所以,幫助受眾獲取有效信息,就構成了數據新聞的動力和目的。
以上就是自己對數據新聞的定義和產生的一些認識,毛皮之談,希望對數據新聞感興趣的小夥伴可以一起討論。
推薦閱讀:
※大數據在水利土木等工程學科中有什麼應用前景?
※如何合理搭建大數據分析團隊?需要有哪些背景的人?
※大數據時代,互聯網金融風控如何利用大數據建模而有別於傳統建模方式?