社會學研究哪家強?

創刊於1986年的《社會學研究》已經步入而立之年,經過三十年的發展,這本期刊已成為中國社會學界最權威的專業刊物。我對《社會學研究》上文章作者的所屬單位進行了分析,試圖構建一個綜合性的指標對各家單位社會學的研究能力進行一個排序。試看今日之群學,是誰家之天下?

數據來源於《社會學研究》官網和中國知網,通過網路爬蟲和知網的引文信息下載工具,我收集了《社會學研究》雜誌自創刊以來直至2016年發表的所有文章的基本信息,包括標題、摘要、作者、作者單位、年份、關鍵詞等等。為了清理和分析的方便,以下分析只統計第一作者的單位。

1. 時間分布

在剔除了卷首語、投稿指南、會議通知等文章後,1986年至2016年這31年間,《社會學研究》共刊登文章2705篇(包括會議綜述等)。我們把時間線拉長,看看這三十幾年裡,每一年有多少文章發表,每一年又有多少機構能在社研上發文。

2000年以前,期刊的文章篇數波動劇烈,且隨著時間的增長有明顯減少的趨勢,尤其是在1995-2000年這5年間,篇數遞年大幅下降,而到了2000年以後,波動明顯變小,並在近幾年趨於穩定,每年的文章數基本固定在60篇。這一變化應該是和期刊自身的發展與走上專業道路的時間有關。

相較而言,作者的單位個數則穩定得多,無論每年的文章多寡,發文單位基本在30個上下徘徊。需要注意的是,儘管單位數相對固定,但每年的文章並非是在這30個單位中均分,「雨露均沾」可不是那麼容易做到的。通過計算每一年各單位發文數量的標準差,可以發現文章在單位間分布的逐年差異。

通過添加一條擬合直線可以看到,隨著時間的增長,標準差有遞減的趨勢。在期刊早期,標準差較大,說明此時可能存在一家或幾家獨大的局面。這當然是可以理解的,期刊雜誌在起步階段,知名度相對較小,影響有限,所以稿件來源勢必會比較單一。而隨著知名度的增加,影響力擴大,稿件來源多樣化時,百家爭鳴、百花齊放的時代才到來,此時,每年發表文章在單位間分布的標準差應該逐年減小。

2. 社研發文哪家強

那這30年來,哪些單位在《社會學研究》上的發文量最大呢?且看下面這張詞雲圖。(能看出圖上這個大爺是誰嗎?)

單從發文量上統計,位次居前十的單位依次是:中國社會科學院、北京大學、中國人民大學、中山大學、南京大學、浙江大學、清華大學、上海大學、南開大學、復旦大學。

帕累托法則表明,在不平等的社會裡,20%的人佔有80%的財富。學術場也是應當符合這一法則的,學科實力強勁的單位自然有更多的發文機會,成為期刊中的常客,有更多的戲份,而學科實力較弱的機構或無緣現身於鏡頭前,或僅僅作為路人甲曇花一現。

當然,無論所屬單位戲份幾何,每一篇文章都是特別的,都有它存在的意義,都在為社會學的學科建設添磚加瓦(perhaps)。

上圖橫軸為各高校和研究機構,按發文量從左至右排列,縱軸表示累積百分比。研究機構之間的實力懸殊通過上圖可一目了然,發文量排在前17.1%的單位在《社會學研究》上的文章佔到文章總數的80%。

3. 空間分布

我們以第一作者的單位地址作為文章地址,將兩千多篇文章投影到地圖上,畫出文章的空間分布密度圖,據此探尋文章分布的空間差異(僅中國地區)。

作為宇宙中心的北京,在社會學領域自然也當仁不讓,且看紅得發亮的那一坨。京津地區高校林立,在科研方面,當然是風頭最盛。發文排行榜上前三甲都是來自北京,而前十名中有一半機構來自京津。

能與北方京畿之地並駕齊驅的便是江南了,以上海為中心的滬寧杭地區是僅次於京津的社會學研究重地,上海有兩所高校進入發文排行榜前十,南京和杭州各有一所。

珠三角也是在《社會學研究》上發文的熱點區域,廣州、香港大學林立,從區域發文總量上略遜於京津與滬寧杭,是名副其實的第三集團。

除以上三個地區之外,武漢與哈爾濱也表現不俗。總體而言,發文有明顯的集中化趨勢,並且東西部區域差距十分明顯。

4. 高校「名媛指數」

目前為止我們只統計了文章第一作者單位的信息,但並不是所有的文章僅僅只有一位作者,合寫文章是學術界十分普遍的一個現象。研究者之間的學術合作無形中也在各自供職單位之間構建了一張社會關係網。

我們借用社會網路分析中中間中心度這一指標來對這種合作關係進行量化。

在社會網路分析中,如果一個行動者處於許多其他兩點之間的路徑上,可以認為該行動者居於重要地位,因為他具有控制其他兩個行動者之間的交往能力。一個行動者在網路中佔據這樣的位置越多,就越代表它具有很高的中間中心性,就有越多的行動者需要通過它才能發生聯繫。所謂中間中心度,測量的是行動者對資源控制的程度。在實際操作中,即測量一個點在多大程度上位於圖中其他點的「中間」。

不用管那麼多,就簡單粗暴地理解成名媛指數即可。

從合作網路方面來考量,「名媛指數」位列前十的高校依次是:北京大學、中國社會科學院、中國人民大學、南京大學、中山大學、浙江大學、復旦大學、南開大學、上海大學、中國政法大學。

5. 搞個大新聞

現在有了發文量和「名媛指數」兩個評價指標,可以搞個聚類分析了吼。我們將兩個指標標準化,用K-means聚類演算法將樣本分成五個類別。這五個類別大致可以反映各高校在國內社會學領域的研究水平(吧?)。

我們以兩個指標分別作為坐標系兩軸,看看樣本中的高校和研究機構在圖中的分布(為了讓散點散得漂亮一點,作圖時數據取了對數,並且給散點增加了一點隨機擾動)。

聚類分析出來的五個類別即圖例所指五個梯隊,現將前三個梯隊的高校和研究機構羅列如下(排名分先後):

  • 第一梯隊:中國社會科學院、北京大學

  • 第二梯隊:中國人民大學、南京大學、中山大學

  • 第三梯隊:清華大學、復旦大學、南開大學、上海大學、浙江大學

6. 寫在後面

啪完了這篇文章,大概還有三件小事要說。主要是在你們把我批判一番之前,我先做個自我檢討。

一個,選取的樣本有限,畢竟只有《社會學研究》一本期刊,所以推斷的範圍也是有限的(我覺得是);第二個,把合作網路作為一個指標來聚類,免不了讓一直走獨立自主發文的作者撲街,我需要找點看起來高大上的理論來捍衛我的合法性(我覺得懸);第三個,不排除在數據收集和清理的過程中有錯漏之處(我覺得有)。

如果說還有什麼要批判的話,那就是用了「名媛」這個詞來形容聖潔無瑕的學術活動,但這應該是次要的,主要是以上三件小事。

很慚愧,一點微小的工作,謝謝大家。

其他回答:

大家用 R 語言做過哪些好玩的事情?

中國考取進士最多的地方竟然是! - 知乎專欄

—————————————————————————————————————————

當時還作了這三張圖,寫完之後發現並沒有什麼用,但既然畫了就找個地方塞進去吧。個別點的經緯度還是有誤的。


推薦閱讀:

LeCun 為什麼要卸任 FAIR(Facebook AI 實驗室)負責人,工程和研究的矛盾可調和嗎?
美國社會科學類博士生是怎麼上課的?

TAG:社会学 | 数据可视化 | 学术 |