tips及點的網路中心性分析實操--你值得擁有

tips及點的網路中心性分析實操--你值得擁有

來自專欄統計分析6 人贊了文章

齊照繼續鎮樓。今年最喜歡的CP,本命。

之前的時候,等不及下午回寢室,每周三都會用流量看完齊神,每個周就靠齊照糖活著了。齊神在第一季第二集對心美說過哦呼,第二季在心美為他而改變造型的時候說過哦呼,在《全班的災難》那一集說他和心美聯合就是無敵的,然後兩人一起破功,那時候就是因為喜歡心美吧~齊神為了心美而捨棄低調,心美為了齊神放棄完美。

求你們去結婚吧~~~

-------------------------------------照橋心美的災難------------------------------------------

其實這個操作很簡單,沒有po的必要。。但是,為了放我齊照圖,還是湊巴湊巴寫一下。

學習社會網路分析的理由

①在公共管理專業,社會網路分析常用於政策分析。在學校,研究生、博士生的課程上,社會網路分析是作為專業課來上的,足見對這門課的重視。但是,重大利好!!!國內用這個軟體寫論文的還不是很泛濫,所以說你用社會網路分析方法寫論文還是容易發表的。

②其次,現在的研究範式,當代的研究範式,趨勢是什麼?是大數據分析吶~~也是俗稱的「第四範式」。2007年圖靈獎獲得者吉姆·格雷(Jim Gray)指出,數據密集型科學正在從計算科學中分離出來,成為科學研究的第四範式。

圖靈獎得主吉姆·格雷以時間和研究工具兩個維度將歷史上的科學劃分為四大類型,進而歸納出科學研究的4個範式,分別是:經驗範式,描述自然現象,以觀察和實驗方法為基礎; 理論範式,使用模型或歸納方法進行科學研究;模擬範式,主要模擬複雜現象進行研究; 第四範式,對應於數據密集型科學。

我們社會網路分析就是大數據分析重要工具啊!!!!

③社會網路分析的工具很多的,但是數據可視化效果都很好,圖片看上去有逼格。

④ucinet這個軟體很友好的,操作很簡單

其他小tips(針對本專業)

①社會網路分析是研究各個變數之間關係的一種方法,所以看清楚數據的格式,各個變數之間要有關聯才分析。如果變數之間是獨立的,左轉去統計檢驗分析或計量分析。

②常應用於文本分析,是政策分析的不二利器。

③雖然截面數據分析效果也不錯,但是,面板數據分析起來效果會更好。尤其是政策分析的,都是10多年20多年的政策。

④數據一般比較容易得到,研究政策的去政府網站上看公開的,研究其他的去網站上面爬下來就行。

點的中心性分析--ucinet操作

中心性分析有網路中心性、點中心性、線中心性、圖中心性。這裡的操作僅為點(node)的中心性操作。其他的分析比較小眾,之後研究遇到了再補充。

中心性分析的指標有包括度數中心度(degree)、接近中心度(closeness)、中間中心度(betweeness)、流量(flow betweenness)、信息中心度(information centrallity)、特徵向量中心度(eigenvector centrality)、權力指數(power)和katz and hubbell測度等。

最常見的是:度數中心度(point centrality)、中間中心度(betweenness centrality)、接近中心度(closeness)

這三個分析都是在ucinet--centrality and power裡面,分析度數中心度就選擇第一個degree,分析接近中心度就選擇第二個closeness,分析中間中心度就選擇Freeman betweenness裡面的node betweenness。

並且這三個中心度在論文裡面都是同時分析,是不是hin簡單的。

都沒有必要寫教程的。

接下來我們一個一個的講解。

一、度數中心度

度數中心度是一個較簡單的指數。行動者的度數中心度(point centrality),可以分為絕對中心度和相對中心度

下面引用的是書上的內容,可以看一下,但是不用這麼複雜。

絕對度數中心度(CAD):點A的度數中心度就是與點A值直接相連的其他點的個數。一個點x的絕對數中心度的表達式為CAD(x)。如果某點具有最高的度數,則稱該點位居中心,很可能擁有最大的權力。由於度數中心度的測量根據的是與該點直接相連的點數,忽略了間接相連的點。因此,所測量出來的中心度可以稱為「局部中心度」(local centrality)。在有向圖中,每個點的度數可以分為點入度和點出度。

相對度數中心度:當圖的規模不同時,不同圖中點的局部中心度不可比較。為了彌補這個缺陷,弗里曼(Freeman, 1979)提出了相對度數中心度:點的絕對中心度與圖中點的最大可能的度數之比。在一個n點圖中,任何一點的最大可能的度數為n-1。因此在一個圖中,度數為m意味著相對中心度為m/(n-1)。相對中心度也可用於比較、測量有向圖中心度。

根據剛才ucinet的選擇,我們把第一個input network選入,就會自動生成兩個ucinet文件,名稱都是計算機自動命名的,第一個output就是絕對中心度和相對中心度,第二個output就是網路中心勢

打開第一個output文件,有2列,第一列就是絕對中心度,也就是這一個node與其他node連接的線條的次數,第二個就是相對中心度。拋開中心度不談,相對的概念很容易理解的,就是相對的大小、相對的多少。第二列的相對中心度也是這個道理,就是這個node在這一個網路中node中心度的相對大小,就是在自己的網路中比大小。

度數中心度很重要的,我們在做數據可視化的時候,常用degree加權畫點的大小!!

打開第二個output,只有這樣一個數據,就是網路的中心勢了。這個是6.9%。一般在論文裡面都是做好幾個網路,比較這些個網路的中心勢的大小,或者是做不同年份的網路中心勢比較,看網路中心勢的變化情況。

中心勢越高,說明中心度較大的node對其他節點有具有較強控制力,節點分布比較集中,有較強的信息傳遞能力。具體而言根據你的網路定義的信息進行解釋。

二、中間中心度

刻畫行動者個體中心度的指標是中間中心度,測量行動者對資源控制的程度,主要反映網路中某行動者作為其他行動者之間的橋樑作用。如果一個點處於許多其他點對的捷徑(最短途徑)上,我們就說該點具有較高的中間中心度。

中間中心度的測量

假設在一個點對(pair of points)X和Z之間存在n條捷徑。一個點Y相對於點對X和Z的中間度(betweenness)指的是該點處於此點對的捷徑上的能力。用中間性比例(betweenness proportion)來刻畫這種能力。

根據剛才ucinet的選擇,選入input的矩陣

打開output,中間中心度也是有2列,和剛才的點度中心度類似,第二列也稱為相對中間中心度,也可以稱之為「標準化的中間中心度」。一個意思。

點的中間中心度測量的是改點在多大程度上控制他人之間的交往。如果一個點的中間中心度為0(見下圖CL3等),意味著改點不能控制任何行動者,處於網路的邊緣;如果一個點的nbetweenness為1,意味著該點可以100%的控制其他行動者,該點處於網路的核心。

備註:nbetweeness和ndegree都是相對的概念,所以取值範圍是0-1,下圖CL7看上去nbetweeness好像是大於1,但其實你粘貼過去Excel會發現1.38-E這種格式,絕對會是小於1的。

這個nBetweenness,就比較好玩了,知乎上有這樣一個問題

鏈接:社會網路分析ucinet中nrmdegree 和nbetweenness 是freeman相對中心度?

回答:這個nbetweenness就是Freeman相對中心度,其實不僅僅是相對中心度,相對度數中心度也容易出現這問題。

這個是沒有問題的中間中心度

這個是有問題的中間中心度

如果發現問題了,應該怎麼辦??看log日誌呀!!!~~會報錯的

看日誌裡面的中間中心度有高達22的,

看圈起來的note,其實就是ucinet沒法識別中文,像我第一張圖,用英文編碼,出來的結果就沒有問題了。算degree的時候也要注意,不要直接用中文計算~

三、接近中心度

點x的接近中心度(closeness centrality)是一種針對不受他人控制的測度。Freeman根據點與點之間的距離(distance)來測量「接近中心度」。如果一個點與網路中所有的其他點的「距離」很短,則稱該點具有較高的整體中心度(接近中心度)。

測量:一個點的絕對接近中心度(closeness centrality)是改點與圖中所有其他點的捷徑距離之和(sum of distance)。

「接近中心度」考慮的是行動者在多大程度上不受其他行動者的控制。如果網路中的一個行動者在交易的過程中較少依賴於他人,此人就具有較高的中心度。一個點越是與其他點接近,該點就越不依賴於他人。

根據剛才ucinet的選擇,選入input的矩陣

看output,一共有三列,解釋見下,但我們需要的計算的值只有要第一列就夠了。

第一列是Freeman distance:就是改點與圖中其他點的捷徑測地距離( geodesic distances)之和。

第二列是Valente-Foreman,即反向距離的均值:反向距離即直徑減去第一列提到的測地距離。

第三列是reciprocal distances (倒數距離):倒數距離就是第一列提到的測地距離的倒數之和。

接近中心度顯示個體之間的緊密關係,如果一個節點與網路中所有其他點的距離都很短,則稱該節點具有較高的接近中心度。接近中心度反映某個node能否通過較短路徑與其他node相連,它是以距離為概念來計算一個節點的中心程度,與中心點距離最遠的行動者在信息資源、權力、聲望以及影響方面最弱。接近中心度的值越大,說明該點越不是網路的核心點。反之,node接近中心度值較小,能以最短的路徑到達其他點,在網路中處於比較核心的位置。

備註:接近中心性要求必須是完全相連的網路圖才能得出其結果,所以如果網路不滿足的話,很可能是得不出結果的。(羅家德. 社會網分析講義(清華社會學講義)[M]. 社科文獻出版社, 2005.)

結束。

搞科研還是挺好的,想買的書老闆出錢,不想買的書去圖書館借~幸福.jpg

齊照結尾。

推薦閱讀:

中間人分析
利用GooSeeker分詞、Ucient和NetDraw進行社會網路分析

TAG:社會網路分析 |