政見訪談|Jennifer Pan:如何用大數據研究中國政治?

精彩觀點預覽

◆對於中國這樣的國家而言,問題的關鍵在於——激勵執政者的規則是什麼?這是中國研究中非常有趣的一點。我們可以從實際結果來探究他們究竟是採用何種策略來維持執政地位的。

◆至少目前來看,促進基層政府回應公民訴求的一項非常重要的原因,在於他們希望獲得上級的提拔——提拔標準會針對社會穩定做出要求,因而官員也希望達成這些要求。

◆中央政府作為委託人,當然希望干群矛盾得以化解,但其下轄的各個地方代理人在這一問題上的利益與委託人可能並不一致。換言之,地方有動機不去回應這種矛盾,而是通過壓制的方法求得短期的安寧。

◆大數據的確可以幫助我們設計更好的實驗——我們如果有效地使用匹配方法,就能找到更為精準的子總體——所以更多的數據對於社會科學家而言是一件好事。

◆當你完成了一項非常嚴謹的研究,卻聽到所有人都在說:「對呀,顯然是這樣,我們早就知道是這麼回事了。」 其實在我們從事嚴謹的研究前,常識只能給出很多互相矛盾的理論。只有在研究揭示了結論之後,人們才都會認為最終成立的那個假設是顯然的。

採訪、整理:曹起曈 / 政見觀察員

潘婕的英文名 Jennifer Pan 比她的中文名更廣為人知。很多人都是從三年前的一篇論文中得知這個名字的。當時,在哈佛大學就讀的潘婕和同學 Margaret Roberts 在她們的導師——校級教授加里?金(Gary King)的領導下,研究了互聯網審查。

這一研究之所以引人注目,不僅在於其話題和結論,還在於研究者使用了基於大數據分析的方法。他們統計了中國一千餘社交平台上的數百萬個網貼,龐大的樣本為結論提供了嚴謹的論據。

此後不久,潘婕同麻省理工學院政治系的徐軼青合作,用大數據研究了中國網民的意識形態傾向(詳情參見政見此前的介紹:中國人的「左」與「右」)。這一發現再次傳遍中國社交媒體,讓學界之外的讀者加深了對 Jennifer Pan 這個名字的印象。

潘婕的履歷充滿亮點,她從普林斯頓以最高榮譽獲得政治學本科學位以及東亞研究和中文的輔修證書後,在麥肯錫諮詢公司的紐約和北京辦公室工作了一段時間,又回歸學界,到哈佛政治系研習中國政治。

2015 年 9 月,她獲得博士學位後,接受了斯坦福大學的工作邀約,擔任傳播系助理教授以及政治系客座教授,繼續探究在中國的體制下,政府如何提高管理輿論、回應公眾需求、持續執政的能力。在這個 「大數據」 炙手可熱的時代,對於定量方法的熟練掌握,使她成為中國政治研究領域的新星。

2016 年 4 月初,政見觀察員與潘婕在斯坦福的辦公室進行了訪談,內容經過翻譯、整理和刪減,並經過潘婕本人審閱。

一、中國政府如何提高持續執政能力?

【政見CNPolitics】你最初是怎樣對中國的執政方式產生興趣的?

【潘婕】我對執政方式的興趣源於我對中國的興趣——中國的發展及其帶來的財富分配和不平等問題。但我的興趣集中於政治方面,因為我認為是政治構成了上述種種結果的基礎。而為了了解中國,我們也需要從更廣的角度思考像中國這樣的政體如何運作,以及關於這些政治體制的理論。

【政見CNPolitics】你覺得對於這一類政體的研究一般在多大程度上適用於中國的個案呢?

【潘婕】我認為,學界時常把所有不實行西方民主選舉的體制都歸位一類,但實際上這些政體間的差異非常明顯。所以我在自己的研究中,更傾向於關注那些一黨執政的政體,而不是個人專制、家族獨裁的體制或者多黨制的威權體制。

當然,這些體制之間的差異有時候比較模糊。比如說,俄羅斯的政體是一黨制呢,還是更具競爭性的威權體制呢?我覺得現在俄羅斯已經變得愈發一黨化了。總之,我在思考關於政體的理論時,基本上想的是與一黨制有關的部分。從這個角度說,我的確認為現有的研究成果中關於其它類似國家的討論也非常適用於中國。

【政見CNPolitics】你的關注重點在於研究像中國這樣的政體如何持續執政。不過,任何一種政體之下的政治家都希望可以延續其執政權。中國在這方面有哪些不同之處呢?

【潘婕】看待這一問題,我們可以有很多不同的視角。的確,所有的政治家都希望維持自己對權力的掌控,但在很多西方國家中,我們對於遊戲規則的了解要清楚得多——我們知道哪些制度會激勵政治家從事何種行為。換言之,這些國家的執政行為是由制度所約束的,而這一制度就是選舉。所以我們會了解政治家種種行為背後的規則。

而對於中國這樣的國家而言,問題的關鍵在於——激勵執政者的規則是什麼?在我看來,這是中國研究中非常有趣的一點。他們究竟是採用何種策略來維持執政地位的,我們可以從實際結果來探究。

二、中國政府為何要回應民眾訴求?

【政見CNPolitics】但我們也注意到,不同政體維持其執政權的策略中,也有一定的相同點。你的論文中提到的一點是 「回應性」(responsiveness),或者你稱之為 「接受性」(receptivity)。你覺得中國政府和西方國家的政府相比,在回應公民需求方面有什麼不同?

【潘婕】其實這就回到了我剛才指出的一點:很多不同種類的政體,如果其國家能力強大,政府官員就可能會回應公民的需求,或者願意將公民反饋納入政策考量。

但區別在於,在普選制度的政體下,我們非常清楚官員做出回應的動機——他們想要尋求連任,因而需要逐步在選民心中留下良好的印象。但在中國的情景下,官員為何要回應公民的訴求呢?是因為他們想獲得提拔嗎——也就是說,這是某種來自上級的要求?還是因為他們不想引發集體行動而導致社會不穩定?換言之,官員不僅希望得到提拔,還想要實現更好的治理效果?迄今為止,在對於中國的研究中,我們依然無法對這些不同動機進行梳理。

【政見CNPolitics】那基於你的研究,都有哪些原因促進了中國各級政府回應公民訴求呢

【潘婕】我的研究主要集中在基層,例如縣級和地市級的政府組織。我覺得,對這一問題,我們還沒有充分的解答,但至少目前來看,促進基層政府回應公民訴求的一項非常重要的原因,在於他們希望獲得上級的提拔——提拔標準會針對社會穩定做出要求,因而官員也希望達成這些要求。

基層官員不想見到自己的轄區發生大規模抗議事件,因為這些事件會損害其將來的仕途。即便他們並不認為自己有朝一日可能身居省委書記這樣的高位,對於提拔的考慮也很大程度上影響了官員的行為。

不過,我也在研究是否還有其它因素驅動了政府回應公民意願。例如,公民如果認為政府在傾聽自己的呼聲,就更願意分享自己對政策的看法。而政府對訴求進行回應,則是一種宣告自己的確在傾聽的信號。因而這樣的回應也可能是官員搜集信息的一種方式,而搜集更多的信息有助於政府持續執政。

另外,搜集信息也有助於實現更好的治理——為了加快經濟政治,政府會希望了解公民的想法,從而判斷當前的治理模式是否有效,是否高效。所以我對於探索官員行為背後除了促進自己獲得提拔之外的其它動機也非常感興趣。

三、內容過濾只為預防 「集體行動」?

【政見CNPolitics】你們在關於中國互聯網的那篇論文中提到,會受到干預的是可能催生集體行動的言論,而不是單純批評政府的言論。批評政府與受到干預與否並不顯著相關。你覺得這一結論適用於從上到下的各級政府嗎?

【潘婕】我們的研究中,絕大部分數據都來自於全國性的論壇,雖然也有很多數據來自地方論壇。在全國和地方論壇上,都有不少批評政府的言論未受影響。

當然,我們可以想見,如果一個市政府領導在該市的論壇上看到了批判自己的帖子,可能會希望刪除這樣的言論。但發帖的人同樣會意識到這一點,因而網民大概不會在市級論壇上批評市領導,而是會在省級論壇或是微博、微信和博客上發這樣的帖子。

總之,人們可能會選擇不受當地政府直接控制的平台來表達自己對本地官員的不滿。所以最終我們依然能在網上看見批評各級政府官員的信息。

【政見CNPolitics】你覺得那項研究中的發現只適用於當時的政治氛圍嗎?如今的輿論氛圍是否已經開始出現變化了呢?

【潘婕】我覺得人們應該進行更多的研究和觀察。就目前而言,很難說如今的情況究竟如何。我認為我們的研究反映了一點:大規模的數據可以揭示很多小範圍樣本無法撲捉到的模式和規律。比如說,如果只採訪一小部分網路審查員,未必能了解審查的總體趨勢究竟如何。

我知道許多人都認為現在對信息的管控發生了變化,但我們需要系統性地看待這一情況,才能判斷這些變化是否真的正在發生。

【政見CNPolitics】另外,不少國際媒體的網站和報道在中國無法訪問。但這些網站只是播報新聞,並沒有試圖激發集體行動。對此你怎麼看?

【潘婕】其實我覺得管理社交網站和管理網上新聞的邏輯可能不同,因為我曾跟很多在新聞網站工作的人談過,其中既包括進行獨立報道的網站,也包括新聞聚合類網站。這些新聞網站的工作人員和社交網站、論壇、博客的管理員同宣傳部門打交道的經歷很不相同。所以我覺得宣傳部門管理兩者的邏輯或許並不一致。

另外,很重要的一點是,我們所關注的只是中國互聯網管理體系中的一個部分。我們研究的是內容過濾機制,也就是在一個帖子已經發出後才被移除的情況。從某種層面上說,這是一種回溯性的機制。我們也知道,監管機構還實施了關鍵詞過濾、搜索過濾以及網站屏蔽等更為預防性的機制,所以從根本上驅動這些不同機制的邏輯可能並不相同。

【政見CNPolitics】如你所言,內容過濾只是互聯網管理的一種手段。從這一意義上說,互聯網管理也只是宣傳的一種手段。而目前,中國政府也逐步開始採用更為主動的網路宣傳方式,近來官方媒體和共青團對 「五毛」 和 「自干五」 也做了很多正面報道。你覺得這一手段對工作的政治態度會有什麼影響嗎?

【潘婕】加里(加里·金)、茉利(瑪格麗特·羅伯茨)和我正在撰寫一篇新論文,討論 「五毛」 現象及其言論特徵。其實我們又發現了一些與傳統認知不同的內容,所以請大家一定要關注這篇論文!我們現在對 「五毛」 的研究中發現的跡象,其實與之前對審查的結論非常互補。

我目前從事的研究一直在關注政府的各種策略,這自然而然就引發了下一個問題——這些策略對於公共輿論有怎樣的影響。當然,我主要關心政府為什麼要採取這些策略,以及這些策略彰顯了政府怎樣的目標。相比之下,我並沒有特別關注這些策略對個人或是公眾產生了哪些結果。雖然,我現在關於中國網民政治態度的研究也開始朝這個方向邁進了,不過那只是一個意外(笑)。總而言之,我不覺得現在有任何人能清楚地判斷互聯網管理和宣傳的影響。

【政見CNPolitics】那回應性又有哪些影響呢?您在研究中也指出,政府是否會回應網民訴求還與幹群關係緊張與否有關:官員如果嗅出了幹群關係緊張的情緒,則更不願回應訴求。但從持續執政的角度出發,政府難道不應更有動力來化解這種干群矛盾嗎?

【潘婕】的確,我們在研究中發現,地方政府官員在察覺到幹群關係緊張的情緒時,會傾向於更不願接受從互聯網渠道獲得的反饋。

你可以說,這樣的情況下,政府反而應該更為主動地回應網民訴求,以求化解干群矛盾。但這也可能反映了中央與地方之間 「委託-代理」 的關係問題——中央政府作為委託人,當然希望干群矛盾得以化解,但其下轄的各個地方代理人在這一問題上的利益與委託人可能並不一致。換言之,地方有動機不去回應這種矛盾,而是通過壓制的方法求得短期的安寧。

如此,各級政府的利益和目標可能並不一致,所以問題在於,如何促使代理人在這些更艱難的情況下回應民眾的訴求。

四、大數據與政治學的激情碰撞

【政見CNPolitics】我們知道,社科研究中採用統計方法的原因在於,我們無法直接得到所有的數據,因而必須通過樣本來估計總體情況。不過,近年來,大數據分析成為了當前的政治學研究(以及其它的社科研究)中的熱門話題。你的很多研究中也都採用了大數據分析的方法,但你也曾撰文指出,這一方法的問題在於,其數據點並非通過隨機樣本實驗收集得到。大數據如果不具有代表性,可能會給人們一種對整體情況的幻象嗎?

【潘婕】我當然認為獲得更多的數據有助於我們從事社科研究。但與此同時,無論是大規模的數據還是多維度的數據,其本身都不能解決因果推斷的基本問題。

大數據的確可以幫助我們設計更好的實驗——我們如果有效地使用匹配方法,就能找到更為精準的子總體——所以更多的數據對於社會科學家而言是一件好事。

有些人之所以表達對大數據分析的擔憂,是在回應「只要有更多數據就能解決所有問題」的觀點。這種觀點當然不準確。目前我們所能得到的數據大多依然是觀測性的,可能並不構成具備代表性的樣本。

所以社會科學家仍應保持高度謹慎,對待大數據要如同平時對待其它數據的態度一樣——如今我們能得到的數據更多了,這顯然是很好的資源,但我們也不能就此忽略通常使用的社會科學推斷方法。

【政見CNPolitics】這個問題在中國研究中可能更明顯——很難確保任何得到的數據沒有經過預先過濾。比如說,你和徐軼青關於中國網民政治態度的工作論文中,從 「坐標」(zuobiao.me)得到的數據樣本就未必是具有代表性的。

【潘婕】的確不是,我們的數據中,男性調查對象和大學教育程度的調查對象比例非常高,所以並不具備代表性。

但即便如此,我們依舊可以從數據中了解到有用信息,而這些信息有助於我們將來設計出在全國範圍內具備代表性的問卷,或是設計一個實驗來檢驗我們的發現是否正確。每一項研究都是建立在批評、改進、修正此前研究的基礎之上的。我覺得這些研究在促進我們對這些問題的思考上都很有意義。

所以,雖然我不認為我們獲得的數據是具備代表性的——我們在研究中沒有這麼說,因為參加關於政治坐標系的網上調查,本身就是一項自我選擇的行為。但是,我覺得這一點本身也有積極的一面:出於這種自我選擇,參加調查的網民非常積極,因而不太會以具有偏差的方式回答問題,例如基於社會期許偏誤而提供覺得他人可能更會認可的答案,而是更願意反映自己的真實想法。這就在很大程度上減小了我們的誤差。

還有一點也很重要,就是我們究竟想用這些數據說明什麼。我們只是在觀察數據中反映的潛在特徵,想了解不同方面的偏好是如何聯繫的。假使我們可以得到在全國範圍內具有代表性的數據,這種偏好間的聯繫當然會不同,但我們依然在有限的樣本中發現了一種重要的關聯。我們希望自己的發現可以促進更多關注這一領域的研究。

【政見CNPolitics】所以你自己接下來準備如何進一步研究這個問題呢?

【潘婕】首先我們要想辦法讓那篇論文得以發表(笑)!那篇論文還有一部分的工作沒有完成,但實際上我的一些同事現在已經開始在全國範圍內開展具有代表性的政治傾向問卷調查了,而這其中就有一部分問題來自 「坐標」 的問卷。

【政見CNPolitics】另外,不止是大數據,對於整個政治學研究的定量趨勢,很多學者也抱持不同看法。西北大學的一位教授就曾投書《紐約時報》指出,「政府在不成比例地支持利於統計分析和建模的研究,儘管所有人都知道,整潔的方程背後掩藏的是混亂的事實,而這些事實是無法用矯飾的數據和假設撲捉的」。你對於定性和定量的這種衝突怎麼看?

【潘婕】其實我認為這句話說得很對。每一種模型都是對現實世界的簡化。如果把人比作現實世界,那模型只是用木棍搭成的人形。但至少對我而言,我希望研究這個世界的運作方式,找尋可以推而廣之的真理,而推廣的結果就產生了簡化這個世界的模型,這些模型無法囊括所有現實世界中的細節,對此我覺得只能予以接受。

我也覺得如果想真正做好定量研究,尤其是當我們擁有的數據越來越多之後,掌握定量的理論知識其實非常重要——我們必須對自己研究的事物、地區、人、或是制度具備深層次的了解。

因為在大量的數據之下,我們能發現幾乎任何的模式,但除非我們具備理論或是直覺的指導,否則很難從這各式各樣的模式中找出正確的那一個。與此同時,這些理論本身也是對於現實世界的抽象描述,不過我認為對於社科學者而言,正是理論促進我們基礎知識的演進。當然,我覺得深入探尋各類細節的深層分析也很有價值,但那條研究道路並不是我所選擇踏上的旅程。

五、研究是為了嚴謹地理解這個世界

【政見CNPolitics】你對自己的研究時不時迸發的影響力怎麼看呢?所有社科學者都會盡量將其研究行為對研究對象的影響降到最低,但這一點在論文發表之後就很難控制了。

比方說,那篇關於中國互聯網審查的論文就在中文網路上引發了熱烈的反響。《環球時報》的一篇評論就認為,你們的結論 「基本等同於有學者通過調查發現,在推特或者其他美國的社交媒體上,可以公開發表對美國政府進行批評的文章,但不能發表號召採取特定行動,比如,不能發表類似於 『去佔領美國』 或者 『買個炸藥把白宮炸了』 的言論」……

【潘婕】咦,等一下,有人對推特做過這樣的研究嗎?

【政見CNPolitics】他們只是根據自己的想法做了一個大略的推測。不過,從某種程度上看,這也使得你們的研究結論成為了一個官方媒體為中國互聯網政策辯護的論點。所以,回到我們的問題上,你覺得自己關於中國政府如何持續執政的研究是否促進了中國政府持續執政呢?

【潘婕】站在學者的角度,很難回答這個問題。因為我們是在學術期刊上發表這些研究,而大多數的學術論文的受眾面並不廣泛,所以一般情況下,大概只有 20 多個恰好也在關心這一問題的人會閱讀我們的論文(笑)。

我覺得對我們社科學者而言,或者說,至少對我個人而言,我從事研究的目的,是以儘可能嚴謹的方法來理解這個世界的運轉方式。我只是試圖揭示發生的現象,然後測試我們各種基於常識的假設是否成立。

很多時候,當你完成了一項非常嚴謹的研究,得出了一個結論,卻聽到所有人都在說:「對呀,顯然是這樣,我們早就知道是這麼回事了。」 遇到這種局面當然很尷尬,不過我覺得,其實在我們從事嚴謹的研究前,常識只能給出很多互相矛盾的理論,而每一種理論都有很多人認同。只有在研究揭示了結論之後,人們才都會認為最終成立的那個假設是顯然的。即便如此,回過頭來看,我們仍然很難說明我們的研究是否帶來什麼影響。

但正如我所說的,我作為一個社科學者,希望能通過嚴謹的工作來理解這個世界。我期待其它的學者會讀我的論文,如果一些本科生也會讀我的論文,我就更開心了!但再往外推我就不奢望了。很難說廣大公眾會對什麼樣的研究感興趣,我們也不會單純為了吸引更多的讀者而改變自己的研究方向。

【政見CNPolitics】最後,我們向每一位採訪者都會提這個問題:推薦一個對你自己影響深遠的中國研究學者,或是一本著作。

【潘婕】這個問題實在是太難了!影響我的學者和著作太多了。有些作者對於中國朋友來說可能有些陌生, 所以我推薦查莫斯?約翰遜(Chalmers Johnson)對佃農民族主義的研究(Peasant Nationalism and Communist Power)。其實他還有很多著作,對於日本的經濟發展也著墨頗多(MITI and the Japanese Miracle )。他的研究在理論層面對我影響很深。

推薦閱讀:

意念打字、心靈控制、大腦永生…這不是科幻大片,這是過去一年「腦機介面」領域的重磅突破!
LOGO排版的秘密
幾個網站 · 美妙的樂音世界
Uber沒死,滴滴沒贏,出行市場好戲正當時
今年一次暴富的機會,很多人都錯過了!

TAG:互联网 | 新媒体传播 | 大数据 |