基於社交網路信息傳播的規律,如何建立一個自動闢謠的機制?
本題已收錄至知乎圓桌:人工智慧 · 語言智能,更多「人工智慧」相關話題歡迎關注討論
我大學畢業論文就寫的和這個相關的,有些不成熟的想法,簡單講講。
自動闢謠的實質其實就是自動識別謠言,能夠識別謠言了就能闢謠了。我把謠言的狀態分為三個階段:發布時,傳播中,傳播併產生巨大影響後。那麼自動闢謠的思路也是從三個階段進行,防、阻、治。
防,就是在謠言發布階段就識別它。一個沒有傳播的謠言都不能叫謠言,這樣根本不會對社會產生危害,但這也是最難做到的階段。此階段,與謠言有關的參與者只有兩方:造謠者和信息發布平台(就是微博微信之類的新媒體啦),想要信息發布平台清理掉謠言?很難。作為一個自動闢謠的機制,必須具有識別謠言的能力,這個問題無解。至少目前沒人解決。
我記得清華有兩個研究智能技術的人在做這個,還寫了篇論文,這篇論文是我在知網上看了那麼多篇相關論文中唯一沒在扯淡的,基本就是基於語義分析和時序分析好像是。通過暴力搜索對既往的大量謠言樣本進行分析,從中找到一些語言上的共性,然後對這些謠言中常見的辭彙根據演算法賦予權重,當一條信息達到怎麼樣一個數據的時候就會被識別為謠言了,然後時序分析就是這種識別系統會著重對謠言發布的高峰期(其實就是微博微信發布的高峰期啦)發布的信息進行監控,具體的我也記不太清了。
南方那邊中山大學之前好像也有意向做這個研究來著,不過後來沒注意了,不知道有沒有成果。
第二個階段,阻,在傳播中識別謠言。此時謠言發布出來,還沒有產生巨大危害,在此階段,與謠言有關的參與者還是兩方:信息發布平台和謠言的接收者(其實就是玩微博微信的)。平台識別謠言還是可以採用清華大學那種手段,語義分析和時序分析。用戶識別那就是Facebook的那種手段了,對於有疑問的信息用戶可以添加標籤存疑,這個標籤其他讀者是能看到的,如果存疑的人足夠多就會觸發審核機制,由專業的第三方媒體團隊來進行調查,然後闢謠。
真心要誇FB機智。
第三個階段就是治了,這個階段的謠言也分為兩種情況,一種是謠言影響集中爆發,產生巨大危害,諸如福島核泄漏後的食鹽謠言;另一種是那種養生保健類的謠言,不會在短時間內引起的社會影響,但是卻像慢性毒藥一樣深入人心。
此時要利用信息發布平台對謠言進行信息稀釋和反向傳播。
對於第一種集中爆髮帶來巨大影響的謠言,其實要做的很簡單,就是大量快速的發布闢謠信息就行了,謠言發展到這種程度就是亡羊補牢了。這地方我感覺都不用什麼演算法,各個平台無差別的發布闢謠信息進行轟炸就行了,要有淘寶那種鍥而不捨的推送精神。這個階段也需要國家機器介入進行闢謠,維穩嘛,人人有責。還有就是對謠言的源頭進行回溯,找到造謠者,然後制裁他,這種能力其實現在已經具備了。
對於第二種謠言,其實危害也非常巨大,而且並不是所有人都收到了這種謠言,不可能進行大規模的闢謠轟炸。所以這時候要對謠言的整個傳播途徑進行反向傳播,有點像精準化扶貧,必須要盡量完整的了解到在謠言的傳播過程中誰分享了謠言(這是謠言傳播的節點,雖然很多但是只要通過網路都比較好找),還有一些人只作為謠言的接收者,不作為傳播者,他們就比較隱蔽了,要有海量的數據知道誰瀏覽過謠言,然後對他們進行精準的闢謠,當然也可以把用戶的瀏覽習慣做一種數據上的輔助,給他們也推送闢謠信息,打打預防針。
哎呀,感覺自己是瞎寫,沒有技術含量,畢竟文科生,當時論文里主要寫的還是從傳播學和語言學角度對謠言進行分類和語義上的分析,比較淺,不過都寫到這了,就發了吧 = =、、
===================================================================
補充一下,找到了清華大學的那篇論文,劉知遠、張樂、塗存超、孫茂松:《中文社交媒體謠言統計語義分析》,《中國科學·信息科學》,2015年第12期。
1. 建立權威機構,讓機構發聲(雖然很難)
2. 建立監測系統,不僅檢測信息,並追蹤源頭。把愛造謠的人揪出來。3. 建立懲罰機制,建立健全法律體制。讓造謠的人意識到造謠的嚴重後果並受到懲罰。最關鍵的一點就是讓普羅大眾樹立不羨慕別人生活,不評價別人的生活,努力做好自己的意識。並且培養自己的興趣愛好,把眼光從別人和別人的事情上移走。
說到底,就是一個從個人到社會的一個素質素養的大改善。還有很長的路要走!理論上很簡單。每個熱門話題都是有幾個關鍵詞的,在用戶搜索這些關鍵詞後,搜索引擎下最上面一條出現的不是推廣廣告,而是以下文字提醒「以下新聞真實性存疑,請自行辨別。」而後須存在專業闢謠機構,百度公司給加V。闢謠團隊進行調查,調查結果出來後,置於該關鍵詞下。關鍵詞搜索出來的頭條是該專業闢謠機構(或對熱點新聞考證調查機構)的專業調查結果。
製造謠言,相信謠言,相信權威,這都是人性,堵不住的。當人們相信某一流言,然後相互之間進行傳播時,忽然有人提出了相反的看法,而且更具有信服力,散播速度也會很快。之前流言的傳播者被打臉,下次再被如此的時候也會留個心眼,曾經的相信流言的人也會長一智。所以做成這件事需要首先找到一個機會,炒作一個反謠言熱點新聞事件,然後推出一個組織機構。這個問題前半部分問百度公司肯定是有辦法的,他們最懂得對用戶的定向引流。後半部分,專業的闢謠調查機構。政府設立有關部門的話,效率可能不夠,民間創業團隊的話公信力可能不夠。但是這樣的機構以後肯定會有的。首要任務不應該是考慮如何闢謠,這是一種消極的治療方式。應該把重心放在如何產生謠言又如何使人信服上來。謠言實際上是社會問題的虛擬化產生的結果,有著其合理性,因此,想徹底杜絕謠言的根源就是切實解決社會問題而不是大規模封殺甚至達到限制公民言論自由的地步。
不是我針對誰,你們大多數人已經too old to talk。謠言產生的本質是什麼?是因為有人信!為什麼有人信?因為信息不對稱,因為生活環境教育背景歷史原因!如果大家都有判斷力,不信謠;誰會造謠?那時候謠言產生還有意義嗎?
更多內容:
小強強 的知乎主頁 - http://www.zhihu.com/people/cell1006?utm_source=qqutm_medium=social監控,實時監控網上數據,建立謠言辨別機制,進行大數據篩選,然後同實名登記的發布者進行確認,並對每個謠言展開實地調查,方能得出結論,並在公共平台發送謠言真實性消息。
用社會達爾文主義,物競天擇即可
比如某公知拿死於地震的兒童照片發到網上,造謠說是某地強拆砸死了孩子
一些信以為真的網民暴跳如雷,拿著菜刀攻擊當地衙門
然後衙門把他們突突了
剩下的網民平均冷靜程度就提升了
一個思政課課老師曾經提到,社科類文獻中總是帶有價值觀念的。比如"小明打了小王。小明是錯的。"前一句是事實,後一句則是觀念。
如果能將任何文本,分解為事實與價值2個子文本呢?這樣對於事實子文本,利用機器閱讀,知識圖譜等技術判斷其一般意義上的真偽,做到去偽存真。對於觀念子文本,可以根據上機部門的需要進行篩選。只有在2個子文本的審查上都通過的文本才允許發布。
智慧出,有大偽。
偽就是假,可以騙人可以騙己。
騙人的目的
1.有保護自身; 2. 有謀利益(財色權); 3.有單純覺得好玩,也就是秀智商,愚弄他人。
識別謠言,首先要保障判斷標準的準確性
比如: 「地球是宇宙的中心」, 這樣的句子在傳播者或者製造者的文章影像中靠互聯網積累的數據就能夠判斷出來。
其次能夠有效識別用戶傳出的數據,比如圖片上的字元,以前驗證碼是各種顏色變形的字母或者數字,用於檢驗用戶是不是robot;如果用戶傳遞的內容是這樣的,不知道現有的技術能否有限識別;當然可以建立規範直接阻止這種數據的上傳。
PS: 這其實非常像一個特務機構,監聽你的聲音,檢查你的文字,想想都不寒而慄,如果標準被擁有者濫用謀取利益或者拿來尋開心;或者一想到自身被懷疑,被檢測,總會感覺非常噁心。
社交網路信息傳播類似傳銷、病毒是現實的虛擬表現。並且正所謂事不關己高高掛你所以才形成了如今真假難辨的局面。因此,一逐漸完成現實的完全虛擬(即按照現實設計警察的網站、虛擬警察,虛擬法院等用以處罰虛擬人物凍結虛擬及現實所有帳號);二之所以真假難辨在於信昆交流不完善應加強信息交流;三改變傳播方式(即不真不可分享必須有證據並經權威驗證);四人無利不起早!!!發賞善罰惡令(造謠者得惡點,查處造謠者得善點。有惡點關網路帳號,重者終身凍結所有帳號。有善點有賞金由造謠者、受害者、官方及民間出資,有重大貢獻者為虛擬警務人員工資參照現實但要受官方監管也參照現實)。一為上策!二為中策!三為下策!四為今策!!!
謠言的產生髮展和造成的嚴重後果的根本原因是因為人缺乏安全感。而人是社會化的動物,每一個人都在這個社會中生存,所以,人的不安全感來自基於社會。越是動蕩的社會越是會產生謠言,而且謠言的破壞力也因為社會的動蕩的嚴重程度而越來越大。
社交網路的傳播加速這種謠言散布的速度,在信息傳播方式上叫做病毒傳播,指的就是這種。
想要闢謠,根本上是要加強社會的穩定性建設。
如果要基於社交網路,以朋友圈為例:
騰訊可以在原創前面加上「原創」二字,也可以在前面前面加上「疑似謠言」字樣,如果舉報用戶到達一定程度,無法判斷是否是真的謠言,就可以標記成「疑似謠言」字樣。(因為闢謠,區分是不是謠言才是關鍵,而區分謠言需要權威聲音,需要時間)但是加上「疑似謠言」的字樣可以大大的提醒人們的警惕意識。
還有針對群聊的謠言,也增加單個信息舉報的功能,舉報人數到達一定數目既標記「疑似謠言」提醒人們注意。
推薦閱讀:
※求教關於割腎謠言的漏洞與真實情況都是怎樣的?
※網路謠言
※2016 年有哪些影響廣泛的謠言被證偽?
※遏制網路謠言主要靠打擊還是預防?