大數據與媒體的具體關係在哪方面,僅僅作為一個記者的話大數據有用嗎?
數據 媒體
數據新聞如今已經風靡世界,成了新聞業界創新的法寶。數據新聞利用數據挖掘可以延伸新聞中單一事件、現時信息的意義,拓展新聞的時空範圍,深化對新聞事實的認知,發現常規新聞中不能體現的邏輯,從而豐富了單篇新聞報道的內涵,新聞樣態也從封閉式告知話語轉換為開放式工具,用戶可以使用這些工具獲取多元的信息。
但是,數據新聞到底是什麼?它與數字新聞、大數據運用有何關聯?「大數據新聞」為何不是一類新聞?程序員、統計師能取代記者嗎?在對數據新聞的認知中,還有相當多的認知誤區;數據新聞也有被濫用之嫌,其實它不是萬能的;數據新聞也有其困境,它的內容和形態有著局限性。因此,本文將結合案例廓清相關概念,並分析大數據思維在新聞中的應用及其局限性。
數字圖表不等於數據新聞近兩年大數據成為時髦,不少媒體就以簡單的數字統計,來充當「數據新聞」。但是,只列有數字,那還不是數據新聞。關於數字、數據、大數據,數字化與數據化,數字新聞與數據新聞等概念,目前還存在一些混淆的情況。
「數據」不等於數字,也不一定是數字,它是對事件的一種描述,數據可以記錄、分析和重組事件。「大數據」不只表示數據量大一些,它是指無法在一定時間內用常規軟體工具對其內容進行抓取、管理和處理的數據集合。它的特點是:數據量大,數據類型多樣,處理速度快,價值密度低。
「數據化」簡單地說,是把現象轉變為可製表分析的量化形式。「數字化」是指把模擬數據轉換成0和1表示的二進位碼,從而使電腦可以處理那些數據。①「數字新聞」是指對文本、圖片、視頻等進行數字化,從而通過互聯網技術能傳輸的新聞報道。「數據新聞」是指用數據驅動的新聞,是內容量化了的報道,是用數據作為表述形式的新聞。數據新聞很少是以大數據驅動的。「大數據新聞」其實並不能成為一類新聞,而是以大數據的思維和工具做成的新聞,是將大數據思維內化到生產實踐及樣態創新之中。是基於互聯網及其衍伸技術平台實現的以大量數據搜集與分析為主要工具而生產出來的新聞,主要是數據新聞,通常是以圖表等形式,通過對一系列的簡要事實的相關性的表達,揭示出事實背後的意義。因此,目前一些媒體以數字、圖表羅列的新聞,並不是數據新聞。
為什麼專業新聞工作者是必要的隨著自媒體的出現,專業記者將不再需要的議論甚囂塵上。如今數據新聞又催生了一些新的報道者,比如「程序員記者」,即計算機程序員因為其技術的使用,成為了報道者,比如美國芝加哥論壇報之「犯罪新聞」(Crime in Chicagoland)網頁的程序員;「統計師記者」,即懂得統計的工作人員當上了信息報道者,比如博客「FiveThirtyEight」 博主內特·斯弗(Nate Silver)。②那麼專業記者還有存在的必要嗎?當然還是需要的,只是對專業新聞工作者的要求變得更高,他們不僅要理解統計、設計,而且要有新聞專業的敏銳性。
數據本身並不具備多大的新聞價值,有時數據帶有欺騙性,需要記者從紛繁複雜的數據、報道中尋找靈感,去發現其中的意義,發掘新聞的深層或新鮮的價值。舉例來說,股票行情天天向所有人公開,密密麻麻的名稱中,某一隻股票的價格,在什麼情況下會有比較大的新聞價值呢?彭博新聞社就從中找到了獨特的新聞價值。彭博的記者通過對過去10年在上海證券交易所交易的股票進行分析,發現貴州茅台酒業股票自2002年11月至2012年10月,10年間上漲達3451%,如今高達410億美元,成為世界第二大造酒公司。這算是一個很好的發現,具備了新聞價值的「新鮮性」。其中還有什麼意義呢?這些數字是中國經濟發展速度的證據之一,它也表明中國的經濟發展帶來的社會變遷:中國經濟10年來的發展,已經造就了一個富裕階層,他們對奢侈品類的需求,刺激了相關消費,因此出現了茅台酒及其股票的大幅增長。因此新聞又有了「重要性」價值。重要性還可以再擴大嗎?是的,時值中國十八大期間,通過數據挖掘報道的中國經濟發展及其影響,「重要性」價值就更大了。其實我們也可以把上述新聞看作是一個獨到的對中國十八大的解讀,因為要報道十八大,所以才有了記者的各種想像和挖掘。一位單純的程序員、統計師,是很難發掘出這樣的新聞價值的。
與傳統的新聞形態相比,數據新聞為單一事實或信息提供更多的表述可能、更深的邏輯關係、更大的想像空間。用數據新聞的引領者彭博新聞社的負責人的話來說,是一種「簡單而優雅的呈現觀點以及點燃想像力的」的方式。③如何才能點燃用戶的想像力?需要專業工作者具備更全面的知識和能力。
運用大數據思維的新聞更科學更有效嗎傳統的新聞是從哪兒來的?也就是新聞判斷是如何形成的?是依靠新聞記者的新聞直覺、新聞敏感——有一種叫news sense(新聞敏感)的意識,它是有賴記者的知識、水平、經驗、視野而形成的一種意識,雖然是來自客觀世界,但是也不排除「先驗性」。在西方的新聞教材里,就有新聞鼻(news nose)、新聞眼(news eyes)之說,有些記者的五官更靈敏,從一些小細節能「嗅」到多少英里之外的新聞。
大數據思維主要包括三個方面,即:總體樣本取代隨機樣本;對不精確的容忍度增加;相關關係取代因果關係。④那麼大數據思維下的新聞判斷,是如何形成的呢?這裡僅以其第一方面——樣本的總體性思維來說。
傳統的新聞是在記者的新聞敏感的基礎上判斷、採集發布的。記者認為這件事、那件事很有新聞價值,對社會的多數人會有吸引力和影響力。一般記者只會以個別人物或事件作為採訪對象,並通常認為這些事對多數人有意義。這是用的「隨機樣本」的方式,進行的新聞工作,其中包含了偶遇式新聞採訪(如「街采」)、先驗式的新聞敏感。而大數據思維則有能力獲取「總體樣本」,通過分析所有用戶的需求和興趣,從而得出新聞價值的判斷。
比如2014年春節前後,中央電視台《新聞聯播》編輯部的「『據』說春運」、「『據』說春節」欄目,即是以百度的搜索大數據為基礎做的系列報道,它呈現的不只是炫目的可視化數據信息,不只是新聞形態的一種改變,而且還從大數據中找到做新聞的點,展開關於春運、春節的故事。內容的選擇不再只是從傳者視角單方面揣測新聞敏感,而且融入了用戶的需求,基本上是點餐式的服務。設想一下,這樣的新聞不僅與信息接受者之間形成了內在的互動關係,而且帶活了內容,真正是貼近了受眾,而且也對一些傳統媒體的年長化、老齡化的受眾形勢,有積極的干預效果,能夠吸引更廣大各年齡層面的受眾。
大數據思維帶來了新聞內容的創新,是一種融合媒體的形態驅動的新聞報道的創新。融合媒體的概念,在上世紀80年代是關於技術形態方面的,90年代進入了產業化層面,如今進入用戶層面的遷移或者遷徙,是更新的融合。用戶層面的遷徙,最終會引發內容的融合。通過大數據找到了特別貼近用戶的報道話題,這些話題實際上是網民們感興趣的。網民集中於45歲以下、甚至更多為18歲到35歲之間的人群,他們不是傳統意義上的報紙讀者、電視觀眾。他們帶動傳統媒體的話題年輕化了,實際上是網民參與了新聞報道,必然逼迫內容要進行改革,所以大數據思維帶來了從形態到內容上的新聞創新。
大數據在新聞中的應用及其困境
大數據時代,數據新聞不只給新聞工作者提出了更高要求,也給政府、社會、媒體機構帶來了挑戰。一些媒體已經在不斷開發新的工具,來滿足數據新聞的需求,比如英國衛報、美國紐約時報不僅在擴展自己的資料庫,而且在技術上也提供了許多可能性,尤其是開源的方式,給用戶提供了工具、也讓用戶帶來了豐富的數據。華爾街日報開發的「中國經濟追蹤器」,就是一個中英雙語的數據新聞工具,它為中國的讀者和記者提供了便利,特別「為那些與中國經濟數據鬥爭多年焦頭爛額的外媒記者指了一條明路。」⑤路透社香港分社曾推出「關係中國」(Connected China)平台,他們從中國政府官方網站和出版物、中國及世界媒體報道、外國政府分析報告、學術論文等多渠道匯聚到上萬個權利實體(機構和個人)、3萬餘條關係、150萬文檔(相當於20本非虛構類圖書)的數據量,將海量數據劃分為「職業比較——行政級別升降」等幾大主題,開發基於HTML五代技術製成的數據、圖片、文檔和視頻無縫鏈接的平台。
傳媒機構可以從以下渠道獲取數據:與政府、企業、科研機構等部門實行數據共享,並通過新聞監督職能不斷推進「數據公開」運動;網路數據(特別是社交媒體數據)的篩選與使用,這類社交媒體信息過濾工具能夠幫助記者在突發性災難中通過現場勘探施救人員和志願者的社交賬號,篩選並核實新聞事實;感測器數據的捕捉及挖掘。感測器裝置逐漸普及到人們日常生活中,形成的數據網路,美國NPR記者就開始由此探索記者自己編織資料庫的潛能;將媒體既有的資料數據化;學術數據再利用;自行展開調查搜集數據。
值得一提的是,大數據的應用不是萬能的。首先大數據是掌握在少數權威機構、信息服務商的手裡,對於大多數媒體機構來說,是很難獲得的;第二是新聞記者個體,不僅難以獲得數據,而且如果沒有集團式的操作團隊,也難以充分分析、呈現大數據;第三是大數據思維本身的特質,在某些方面與新聞的特質是相悖的。大數據本身就是不精確的,這與新聞的精確性要求相悖;大數據是整體樣本的,這又與新聞的追求個性化、獨到相悖。當然,媒體機構與新聞工作者也可以化不利為有利,比如從不精確的總體樣本中發現趨勢和規律,從中找到自己的個性化的新聞點,並且通過精確的信息衍生出自己的故事。
更多請參考:
數據新聞與大數據運用有何關聯?-36大數據
電視記者需要具備的數據新聞素養-36大數據
如何把大數據處理為數據新聞?-36大數據
大數據應用:英國衛報的數據新聞實踐(一)-36大數據
大數據應用:英國衛報的數據新聞實踐(二)-36大數據
正好在看這方面的論文,簡單回答下~大數據給媒體帶來的機遇:首先就是改變了新聞采編的方式,比如說現在已經有的計算機輔助新聞報道,可以由計算機直接提取網路信息寫成新聞,體育報道、財經報道這種數據強的比較適用。然後就是建立在對大量數據分析解讀基礎上的預測性報道、深度報道還有數據新聞,挖掘數據背後的新聞,用數據講故事。現在比較多的就是數據的可視化報道,比如說央視用百度的遷徙地圖報道春運。未來可能直接建立在各種數據基礎上進行預測,輿情分析與傳媒預警。第三就是便於傳媒進行精準傳播,根據受眾的閱讀歷史、習慣和偏好推送可能感興趣的新聞,還有廣告。大數據時代媒體主要的問題就是技術和人才方面。僅僅作為記者的話,掌握大數據技術不大現實吧,畢竟技術含量太高了,不過學幾個數據分析的軟體還是用得上的;可能主要還是要有大數據的思維,學會從已經發布的各類數據中找新聞,然後把報道做的更生動可讀一些。如果自己做自媒體運營微博微信的話,就可以根據用戶的數據進行有針對性的傳播,應該會比較成功的。
推薦閱讀:
※在大數據分析/挖掘領域,哪些編程語言應用最多?
※為什麼大數據在公路交通領域的實際應用進展如此慢?
※零基礎,對大數據分析和數據挖掘有興趣,請問學習哪些課程作為切入口比較好呢?