趙淑梅:「大數據」與提高黨的建設科學化水平
中國共產黨第十七屆四中全會通過的《中共中央關於加強和改進新形勢下黨的建設若干重大問題的決定》提出了「提高黨的建設科學化水平」這個重大命題和重大任務,十八大也將「全面提高黨的建設科學化水平」作為統領黨建工作的核心目標。提高黨的建設科學化水平的本質要求在於把握時代發展的規律和黨的建設的自身規律,使黨的路線、方針、政策適應不斷變化的時代要求。當前,伴隨信息科學的發展和科技革命的爆發,世界已經開始迎來「大數據」時代。客觀地講,相比其他領域,黨建工作沒能在20世紀第一波網路浪潮來臨時進行及時調整,一定程度上制約了黨的網路執政能力的提升。當前,「大數據」時代這一新的發展趨勢為提高黨的建設科學化水平創造了新的機遇,黨的各級組織必須加以把握。
一、「大數據」時代的深刻變革
「大數據」,狹義上是指無法在一定時間內用常規軟體工具對其內容進行抓取、管理和處理的數據集合;廣義上是從各種類型的海量信息中快速獲得有價值信息的能力。[1]本文是在廣義層面上使用「大數據」的概念。
隨著信息技術的迅猛發展和互聯網時代的來臨,移動通訊和網路使每個國家、社會、組織乃至個人都面臨著海量數據的衝擊。而寬頻技術的不斷提升更使得全球的新數據以驚人的速度增長。有資料顯示,1998年全球網民平均每月使用流量是1MB(兆位元組),2000年是10MB,2003年是100MB,2008年是1GB(1GB等於1024MB),2014年將是10GB。全網流量累計達到1EB(即10億GB或1000PB)的時間在2001年是一年,在2004年是一個月,在2007年是一周,而2013年僅需一天,即一天產生的信息量可刻滿1.88億張DVD光碟。2007年全球有5億個設備聯網,人均0.1個;2013年全球將有500億個設備聯網,人均70個。[2]按照這樣的發展速度,未來各種新的信息設備的大量湧現無疑會進一步加速新數據的形成過程,使我們面臨更為龐大的數據信息。
「在雲計算出現之前,傳統的計算機是無法處理如此量大、並且不規則的『非結構數據』的。」[3](P1)但是進入21世紀後,以雲計算為基礎的信息存儲、分享和挖掘手段,「將蜂擁而來的垃圾數據變為甄別實用的邏輯數據,使得處理龐大數據成為可能」。[4]技術上的突破使得人們不再認為數據是靜止和陳舊的,並將除文本之外的圖片、音頻、視頻等信息都納入數據的行列,方便人們處理和分析。由於數據分析是一切決策的重要依據,這種對海量數據進行量化的過程,不僅給人們的生活帶來影響,更深刻影響著媒體的宣傳策略、企業的管理決策和國家的發展戰略。基於此,很多領域的研究者都提出,信息爆炸已經積累到了一個開始引發變革的程度,人類社會正步入「大數據」的時代,迎接互聯網之後的又一次信息革命。被譽為「大數據時代預言家」的牛津大學教授維克托·邁爾-舍恩伯格則進一步認為,「大數據」時代將帶給人類的是思維方式的重大變革。首先,在決策前人們要分析與某事物相關的所有數據,而不是依靠分析少量的數據樣本。其次,人們將樂於接受數據的紛繁複雜,而不再追求精確性,從而改變傳統的資料庫設計理念。最後,人們的思想將發生轉變,不再探求難以捉摸的因果關係,轉而關注事物的相關關係,將探索的重點放在「是什麼」層面。[3](P29)概言之,掌握了「大數據」的能力,「人類思維和決策的方式及方法將進入更高層次」,真正從「智能」走向「智慧」。[1]
中國是人口大國,網民數居世界之首,且還在呈高速增長的趨勢。根據中國互聯網路信息中心(CNNIC)2014年1月發布的《第33次中國互聯網路發展狀況統計報告》,截至2013年12月,中國網民規模達6.18億,全年新增網民5358萬人,互聯網普及率為45.8%,較2012年底提升3.7個百分點;其中,手機網民規模達5億。[5]目前,中國每天產生的數據量位於世界前列,如何用好這些數據、在「大數據」時代的世界競爭中佔據優勢地位,是執政黨和政府必須要思考的戰略性問題。廈門等地方政府已經將大數據的思維理念和分析方法引入到政府的公共管理之中,深圳市社工委也將大數據理念引入到社會組織的管理之中,貴州省更將大數據作為一個戰略性新興產業大力發展,以期實現後發趕超的目標。但從黨建科學化的角度而言,大數據將要產生的變革式影響還沒有引起各級黨委的足夠重視,各地的數字化黨建也主要停留在將文本信息轉換為數字信息的初級階段,與挖掘「大數據」的潛在價值還有很大的差距。
二、「大數據」在黨的建設中的應用範圍
步入「大數據」時代後,「巨量數據正在成為一種資源、一種生產要素,滲透至各個領域,而擁有大數據能力,即善於聚合信息並有效利用數據,將會帶來層出不窮的創新,從某種意義上說它代表著一種生產力」[6]。這種能力未來將是衡量一個國家、政府、政黨的重要標準。在此前的幾次技術革命中,中國均處於追趕狀態;在即將到來的「大數據」競爭中,中國應當而且完全有條件躋身世界前列,引領新一輪信息技術革命。作為中國的執政黨,準確把握時代發展的脈搏,充分重視數據的價值,並嘗試將「大數據」應用於黨的建設之中,有利於增強黨自身的領導能力和執政能力。
目前,美國、日本等國已經應用「大數據」技術分析本國政黨施政綱領的實際效果、選民對黨魁或政黨候選人的態度以及某一事件對政黨支持的衝擊程度等。中國共產黨擁有8000多萬黨員,其規模甚至超過了世界上很多國家的人口數量。從中央到地方,各級黨委所掌握的不同類型的數據量非常之大,如果能夠充分有效地利用這些數據,將「大數據」技術引入到黨的建設中,對於提高黨的建設的科學化水平無疑是十分有益的。
首先,通過「大數據」,可以追蹤把握黨員、幹部的思想動態,為黨的思想建設和組織建設提供參考依據。為了解廣大黨員、幹部的思想動態,各級組織部門每年都要進行大量的實證調研。但出於種種原因,很多黨員、幹部在參加問卷調查、個別談話以及民主生活會時會刻意隱藏自己的真實想法,以至於一些傳統的調查研究方法在了解黨員、幹部的思想動態方面顯得「捉襟見肘」。花費大量的人力、物力,卻無法掌握黨內的真實情況,更不能為黨的建設提供切實的依據,是很多黨建研究者的困惑所在。「大數據」的應用有利於解決這一問題,因為它採取的方法是日常化數據的處理與分析。例如,通過分析黨員、幹部平日瀏覽的網頁信息、博客內容、關注的微博以及論壇發帖等相關數據,可以綜合判斷全黨抑或某一地區、某一部門黨員幹部的思想狀況。而將這些數據反饋給相關的教育培訓部門,可以提升黨員、幹部教育培訓的針對性。此外,由於數據抓取的時間比較靈活,既可以了解當前情況,又可以追蹤一個較長時間段內黨員、幹部思想的動態信息,所以得出的分析結果對於預測黨內思想的發展趨勢有很大的幫助,有利於系統制訂全黨思想發展的戰略規劃和實施方案。
其次,通過「大數據」,可以科學評估黨內製度規範的運行狀況,有利於完善黨內製度體系。進入20世紀90年代後,黨內製度建設步入快車道。經過20多年的探索與實踐,目前黨內製度的基本體系已經建立起來,但一些制度在實際運行過程中效果不佳,需要進一步完善。因此,十八屆三中全會將黨的建設制度改革納入全面深化改革的整體布局之中,以進一步提升黨的建設的科學化水平。進行黨的建設制度改革,首先就要對現有的制度體系的運行狀況進行科學的評估,找出各個環節的影響因子。過去由於技術條件的限制,只能把少量主要因素納入評估之中,「大數據」技術引入之後,就可以更為廣泛地採集相關影響因子的數據,不僅有利於綜合分析制度的運行效果,而且可以發現某一具體環節的細微情況。至於具體執行者和普通黨員群眾對於某項制度的意見,以往各地各級組織只能通過抽樣調查的方式予以了解,掌握的也只是某一地區或部門的情況。引入「大數據」技術之後,各級組織部門就可以將基層調研的數據同日常談話記錄、部門工作總結、網上相關評論等信息綜合在一起,整合為一個新的資料庫,從而進行全面深入的分析,得出有說服力的評估結果。
再次,通過「大數據」,可以了解各地黨群、幹群關係的發展趨勢,有針對性地加強黨的作風建設。十八大要求全黨「問政於民、問需於民、問計於民」,「多干讓人民滿意的好事實事」。[7](P51)對於一個長期執政、擁有8000多萬黨員的大黨來說,及時了解各地黨群、幹群關係的發展趨勢,提前預測可能出現的問題和事件,對於黨風建設乃至鞏固黨的執政地位來說,無疑是有很大幫助的。在「大數據」時代,通過抓取各級黨委、政府網站的群眾留言,某一時間段內各網路論壇討論的熱點話題以及某一地區黨員、群眾搜索的主要內容等,可以找出具體地區、具體時間內群眾最關注或最不滿意的問題,判斷當前和未來一個時期內黨群幹群關係的狀況以及矛盾焦點,從而進行及時有效的化解。這對於推動目前正在開展的黨的群眾路線教育實踐活動也將產生積極作用,提升全黨特別是基層組織聯繫群眾、服務群眾的能力。
最後,通過「大數據」,可以在相對短的時間內發現腐敗問題,提高反腐敗鬥爭的實效。對於任何一個執政黨來說,腐敗都是侵蝕政黨肌體、損害執政根基的不良因素。黨的十八大以來,新一代中央領導集體不斷加大反腐敗的力度,從快從重懲處了一批腐敗分子。但反腐敗形勢仍然十分嚴峻,其中一個重要原因是腐敗行為具有越來越強的隱蔽性,很多腐敗官員通過尋找和利用法律規定的模糊地帶,以人股分紅、證券買賣、特定關係人等新的手段收受賄賂,以權謀私。各種形式的隱性腐敗對反腐敗鬥爭形成了巨大挑戰。事實上,隱性腐敗並不是無跡可尋,只要有充足的相關信息,就可以找到它們的犯罪證據。在這方面,著重分析海量數據的「大數據」技術具有以往信息技術所無法比擬的優勢。隨著我國各個領域系統性信息數據平台的建立,「大數據」對於發現腐敗分子的作用將會進一步凸顯。
上述只是以黨的建設中的一些突出問題為例,分析了「大數據」的理念和方法在黨的建設領域中應用的可能和益處。事實上,「大數據」可以應用的範疇遠不止以上四個方面。在流動黨員管理、領導幹部考核、黨代表履職情況評估、黨的基層組織建設等方面,「大數據」的價值也都有待進一步挖掘。
三、應用「大數據」加強黨的建設的主要途徑
大數據的「大」包括兩層含義:一是從量的角度,指我們現在擁有的數據量之大;二是從質的角度,指現在我們所擁有數據的價值之大。因此,在應用大數據加強黨的建設時,要從「量」和「質」兩方面入手:一方面,注重各類數據的收集、整理、儲存,儘快建立黨的建設領域的相關資料庫;另一方面,儘快提升各級黨組織挖掘數據價值的能力。長期以來,由於認識水平和硬體條件等原因,黨內數據的保存以及存儲數據的利用都相對有限,今後有必要從三個方面改變這一狀況。
第一,進一步推動黨務公開,保證數據的充分性、真實性和共通性。收集黨內數據、建立資料庫是應用「大數據」的第一個環節,而這很大程度上要依託於各級黨組織和黨內各個部門的黨務公開程度。從內部來說,黨務公開是指黨組織的工作和活動向黨員公開;從外部關係來看,黨務公開是指黨的工作和活動向社會公開。近些年,各級組織的黨務公開力度不斷加大,多個中共中央部門和單位都建立了新聞發言人制度。但總體來說,黨務公開的信息量還相對較少,信息種類相對單一。因此,儘管現在互聯網上已經有大量的信息,但黨內的很多信息仍然無法單純通過互聯網獲得,特別是一些規章制度、領導決策和相關統計數據。在遵守黨的紀律要求的同時,可以在黨內建立一個完整的數據信息庫,不僅涵蓋現在一些地區已經建立的黨員個人信息庫、領導幹部個人信息庫,還應該包括黨內決策、決策執行、黨內選舉、幹部選拔任用過程等多方面信息。從「大數據」的視角重新界定數據的含義,將原來被忽視的大量數據信息納入到資料庫之中,為提高黨的建設科學化水平提供更為全面的信息。當然,在保證數據全面充分的同時,數據的真實性和共通性也十分重要。數據的真實性是保證數據分析科學有效的基礎,因此在數據錄入的過程中要注重甄別,去偽存真。數據的共通性是節約數據分析成本的需要。當前,許多黨組織在信息共享方面還存在一些顧慮,不願意將所掌握的信息聯網,也不願意與其他地區、部門分享,不僅導致資料庫建設中重複投資的現象大量出現,而且使得部分資料庫信息不完整,無法正常啟用。未來要應用「大數據」,必須改變這一現狀,在黨內建立各地區、各級組織、各部門之間的信息互通和數據共享機制。
第二,注重數據來源的多元化,綜合使用網上信息抓取、實地調研、文獻收集等方法。目前,互聯網已經成為各類數據的主要來源,網上信息抓取也被視為大數據時代數據收集的主要方法。但網上的海量數據中存在很多無效數據、虛假數據,或者至少是不全面的數據。以黨員群體為例,年輕黨員的網路使用率遠遠大於老年黨員,發達地區黨員的網路使用率也往往大於欠發達地區的黨員,如果只參照特定程序設置下抓取到的網路信息,那麼得出的結論更多地適用於年輕黨員、發達地區黨員,並不能直接等同於全體黨員的狀況。因此,只依靠網路數據制定黨的建設的方針政策,很容易產生偏頗。為了避免這種情況出現,在應用大數據加強黨的建設的具體研判過程中,要將通過網路獲得的數據與通過實地調研、文獻收集等方法獲得的數據綜合起來,互相印證,構建出一個囊括多元化數據的資料庫,進而使用最新的分析技術得出全面、客觀的結論。只有以此為依據進行黨的建設的相關決策,才能真正提高黨的建設的科學化水平。
第三,建立完善的黨內信息使用規定,保護黨員、幹部的隱私。隨著「大數據」時代的到來,數據的價值進一步提升,黨內數據的安全問題對於執政黨來說日益重要。因此,要加強有關部門保護數據信息安全的技術能力,防止信息被損壞、篡改、泄露或被竊,保護黨的信息安全。與此同時,黨員、幹部個體的隱私保護也是十分重要的問題。作為一種有效的資源,大數據本身是沒有偏好抑或感情色彩的,但利用資源的人往往會帶有個人目的,甚至會將其所能使用的數據資源用於不正當的交易。隨著技術的發展,隱私保護的難度也不斷加大,「匿名化或者單純隱藏已經不再適用」,「即使是最無害的數據,只要被數據收集器採集到足夠的量,也會暴露出個人的身份」[3](P242)。這些都是「大數據」時代帶給人們的隱憂。在應用「大數據」加強黨的建設過程中,必須警惕這一點。因此,應當儘快制定完善的黨內信息公開和使用規定,在加強數據共享的同時,通過制度約束防止數據濫用現象的出現;明確黨內數據收集、使用的目的是為黨的建設工作服務,嚴禁出於個人目的利用黨內數據的情況;明確界定黨內數據使用的許可權和範圍,不斷增強數據使用者的責任意識,嚴格懲處侵犯黨員、幹部個體隱私的行為。
在構建黨建領域資料庫的同時,提升黨的建設研究者和具體工作者的數據挖掘能力也是十分必要的。所謂數據挖掘,又稱資料庫中的知識發現,即指從資料庫的大量數據中揭示出隱含的、具有潛在價值的信息的聚合、提煉的過程。[8]為了最大限度地發揮資料庫的作用,要對黨的建設研究者和具體工作者進行大數據方面的相關培訓,使他們不僅具有收集新型數據的思維和技術,同時具備對已經實現了基本用途或首要價值之後的黨建數據進行二次或多次開發利用以及將多個數據集綜合使用的意識和能力,挖掘黨建數據中隱藏的規律性認識,提升黨的建設的科學化水平。當然,數據不是萬能的。在應用大數據推動黨的建設科學化的進程中,黨的建設研究者和具體工作者對於黨建領域的重大問題要有自己的判斷,避免形成過於依賴「數據」的傾向。因為「大數據」是一種方便快捷的工具,但它無法預測黨在未來發展中所要遇到的所有問題;它所得出的結果也只是一種有依據的參考意見,而不是最終答案。
隨著大數據時代的到來,利用大數據摸索、總結黨的建設的規律性認識,提高黨的建設科學化水平,已經成為執政黨增強自身執政本領的必然要求。今後,黨的各級組織都應積極推動黨建領域大數據戰略的健康有序發展,並將其與我國的整體數據平台發展結合起來,互相促進、共同發展,使我國在新科學革命和新技術革命初見端倪的時候抓住發展機遇,佔領國際數據競爭的制高點。
參考文獻:
[1]丁健.淺析大數據對政府2.0的推進作用[J].中國信息界,2012, (9).
[2]鄔賀銓.大數據時代的機遇與挑戰[J].求是,2013, (4).
[3]維克托·邁爾-舍恩伯格,肯尼思·庫克耶.大數據時代:生活、工作與思維的大變革[M].杭州:浙江人民出版社,2013.
[4]許正中.「大數據」時代下的戰略突圍構想——重新審視中國經濟社會獨特性[J].人民論壇,2012, [14].
[5]CNNIC發布第33次《中國互聯網路發展狀況統計報告》[EB/OL].新華網.http://news.xinhuanet.com/tech/2014-01/16/c_126015636.html.
[6]推進黨務公開不能搞形式主義[EB/OL].人民網.http://dangshi.people.com.cn/GB/138903/138911/15051494.html.
[7]胡錦濤.堅定不移沿著中國特色社會主義道路前進 為全面建成小康社會而奮鬥——在中國共產黨第十八次全國代表大會上的講話[M].北京:人民出版社,2012.
[8]喻國明.大數據分析下的中國社會輿情:總體態勢與結構性特徵——基於百度熱搜詞(2009—2012)的輿情模型構建[J].中國人民大學學報,2013, (5).
推薦閱讀:
※Day9-《The Introduction of Statistical Learning》學習筆記
※黃金的基礎數據分析
※如何用表單收集高價值數據?
※從H1B中籤數據看什麼專業好留在美國(下)
※【剩者為王】科學數據告訴你剩女根本不用愁