Arxiv網路科學論文摘要13篇(2018-06-01)

Arxiv網路科學論文摘要13篇(2018-06-01)

來自專欄網路科學研究速遞

  • 機器學習如何預測社交媒體用戶的人口統計特徵?;
  • 有噪音環境中具有異質節點影響的級聯中心性;
  • 分析出現模式並從手機數據中分割用戶位置;
  • 不合作社會的聯合促進合作的演變;
  • 大規模複雜網路中的高質量不相交和重疊社群結構;
  • QuickIM:十億級網路的高效,準確和魯棒影響最大化演算法;
  • 評估多路網路中的多樣性;
  • HOPF:深度協同分類的高階傳播框架;
  • 噪音中的結構:精神錯誤會產生事件的抽象表徵;
  • 排名演算法在成長網路中的長期影響;
  • 從邊緣網路社區看模因的起源;
  • 融合圖卷積網路;
  • 改劃選區指標的比較;

機器學習如何預測社交媒體用戶的人口統計特徵?

原文標題: How well can machine learning predict demographics of social media users?

地址: arxiv.org/abs/1702.0180

作者: Nina Cesare, Christan Grant, Quynh Nguyen, Hedwig Lee, Elaine O. Nsoesie

摘要: 社交媒體網站和其他數字技術的廣泛使用導致數字數據的前所未有的可用性被用於研究跨研究領域的人類行為。儘管在這些平台上提供了不請自來的意見和情緒,但通常會丟失人口統計信息。人口統計學信息在人口統計學和公共衛生等領域具有重要意義,在性別,種族和社會經濟群體中存在顯著差異。為了解決這個缺點,許多學術研究提出了使用諸如姓名,用戶名和網路特徵的細節來推斷社交媒體用戶的人口統計的方法。性別是準確推斷的最簡單特徵,在某些研究中準確性高於90%。種族,民族和年齡因各種原因而預測更具挑戰性,包括社交媒體對某些年齡段的新穎性以及種族和族裔群體中用戶細節缺乏顯著偏差。儘管預測用戶人口統計學的努力受到隱私和數據所有權方面的道德問題的困擾,但了解數據樣本中的人口統計數據有助於解決偏見和人口代表性問題,從而不會加劇現有的社會不平等現象。

有噪音環境中具有異質節點影響的級聯中心性

原文標題: Cascade Centrality with heterogeneous nodal influence in a noisy environment

地址: arxiv.org/abs/1805.1220

作者: Yan Leng, Yehonatan Sella, Alex Pentland

摘要: 中心性是網路分析的基本組成部分。現有的中心性測量重點關注網路拓撲,而不考慮節點特性。然而,如果級聯收益不與級聯的大小單調增長,這種無知是危險的。在本文中,我們提出了一個新的中心性度量Cascade Centrality,它集成了網路位置,擴散過程和節點特徵。它嵌套並跨越了程度,特徵向量,卡茨和擴散中心性之間的差距。有趣的是,當p lambda1?>1時,特徵向量,Katz和擴散中心性全部塌縮為級聯中心性,其中比例因子由特徵向量和節點影響向量的分布決定。此外,在社會網路中同態的存在使得對現實世界觀察的降噪成為可能。因此,我們提出了一個統一的框架,用迭代學習演算法同時學習實際的節點影響矢量和網路結構。綜合和實際數據的實驗表明,Cascade Centrality在產生級聯收益方面優於現有的中心性措施。此外,對於所提出的演算法,降噪中心性度量與實際級聯中心度之間的相關度高於僅從觀測值中計算的度量值。 Cascade Centrality可以捕捉網路中更複雜的行為和過程,並且對病毒式營銷和政治活動中影響力最大化和實際應用的理論研究具有重要意義。

分析出現模式並從手機數據中分割用戶位置

原文標題: Profiling presence patterns and segmenting user locations from cell phone data

地址: arxiv.org/abs/1805.1220

作者: Yan Leng, Haris Koutsopoulos, Jinhua Zhao

摘要: 通勤流量的動態監測對於改善全球快速發展城市的交通系統至關重要。然而,現有的推斷通勤起源和目的地的方法不得不依賴大規模的調查數據,這些數據實施本來就很昂貴,或者依賴於呼叫詳細記錄,但是基於特定的啟發式分配規則,這些規則基於給定的出現頻率位置。在本文中,我們提出了一種新方法,可以根據通話詳細記錄中推斷的個人時空模式,準確推斷通勤流量的起點和目的地。我們的項目顯著提高了文獻中普遍採用的啟發式分配規則的準確性。從一組個人的地理時間旅行模式的歷史數據開始,我們為每個人的位置創建一個概率分布向量,捕獲該人在特定時間段內出現在該位置的可能性。通過這種方式進行疊加,歷史地理時間數據的矩陣使我們能夠應用特徵分解,並使用無監督機器學習技術來為不同組的旅行者提供跨地點的共同點,最終使我們能夠進行推理並創建標籤,例如作為家庭和工作,在特定的地點。使用已知位置標籤測試真實世界數據的方法表明,我們的方法能夠以顯著的準確度識別家庭和工作場所,分別改進了文獻中最常用的方法79%和34%。最重要的是,我們的方法不會承擔任何重大的計算負擔,並且易於擴展,並且可以通過歷史跟蹤輕鬆擴展到其他實際數據。

不合作社會的聯合促進合作的演變

原文標題: Conjoining uncooperative societies facilitates evolution of cooperation

地址: arxiv.org/abs/1805.1221

作者: Babak Fotouhi, Naghmeh Momeni, Benjamin Allen, Martin A. Nowak

摘要: 社會結構影響合作的出現和維持。在這裡,我們研究了分散社會中合作的演變動態,並且表明,聯合分離的合作抑制組織如果做得好,就能拯救集體合作的命運。我們強調組間關係的重要作用,即將社會網路的補丁縫合在一起並促進合作。我們在實際環境中指出了這種現象的幾個例子。我們探索隨機和非隨機圖,以及經驗網路。在許多情況下,我們發現維持合作所需的關鍵成本/收益比顯著降低。我們的發現帶來了希望,即如果管理得當,日益增長的全球互聯互通能促進全球合作。

大規模複雜網路中的高質量不相交和重疊社群結構

原文標題: High-Quality Disjoint and Overlapping Community Structure in Large-Scale Complex Networks

地址: arxiv.org/abs/1805.1223

作者: Eduar Castrillo, Elizabeth León, Jonatan Gómez

摘要: 在本文中,我們提出了一種在大規模複雜網路中執行不相交社區檢測的凝聚層次聚類演算法的改進版本。改進後的演算法是在替換原始演算法中使用的局部結構相似性後,用最近提出的動態結構相似性來實現的。此外,改進的演算法擴展到檢測模糊和清晰的重疊社區結構。擴展演算法利用由其自身生成的不相交社區結構和動態結構相似性度量來計算定義模糊社區的提議的成員概率函數。此外,對參考基準圖進行實驗性評估,以便將所提出的演算法與現有技術進行比較。

QuickIM:十億級網路的高效,準確和魯棒影響最大化演算法

原文標題: QuickIM: Efficient, Accurate and Robust Influence Maximization Algorithm on Billion-Scale Networks

地址: arxiv.org/abs/1805.1232

作者: Rong Zhu, Zhaonian Zou, Yue Han, Sheng Yang, Jianzhong Li

摘要: 影響最大化(IM)問題的目的是在網路中尋找k個種子頂點,從這種影響可以最大程度地擴散到網路中。在本文中,我們提出QuickIM,第一種多用途IM演算法,它可以同時獲得實用的IM演算法的所有理想屬性,即高時間效率,良好的結果質量,低內存佔用量和高穩健性。在現實世界的社會網路上,QuickIM實現了$ Omega(n + m)$時間複雜度下限和$ Omega(n)$空間複雜度,其中nm是頂點和邊的數量在網路中,分別。我們的實驗評估驗證了QuickIM的優越性。首先,QuickIM比現有技術的IM演算法快1-3個數量級。其次,除了EasyIM,QuickIM需要比最先進的演算法少1-2個數量級的內存。第三,QuickIM總是產生與最先進的演算法一樣優質的結果。最後,QuickIM的時間和記憶性能與影響概率無關。在包含超過36億條邊的實驗中使用的最大網路上,QuickIM能夠在不到4分鐘的時間內找到數百種有影響力的種子,而所有最先進的演算法無法在一個小時內終止。

評估多路網路中的多樣性

原文標題: Assessing diversity in multiplex networks

地址: arxiv.org/abs/1805.1235

作者: L.C. Carpi, T.A. Schieber, P.M. Pardalos, G. Marfany, C. Masoller, A. Díaz-Guilera, M.G. Ravetti

摘要: 多樣性被理解為廣泛系統具有的各種不同元素或配置,這是一個關鍵特性,它允許在不斷變化的環境中維護系統的功能,因為在這種環境中,故障,隨機事件或惡意攻擊往往是不可避免的。儘管在生態學,生物學,交通運輸,財政等方面保留了多樣性的相關性,但對多樣性作出更大貢獻的要素或配置往往是未知的,因此它們不能被保護以防止失敗或環境危機。這是由於沒有通用框架可以確定哪些元素或配置在保持系統多樣性方面起著至關重要的作用。現有方法將系統的異質性水平視為其多樣性的度量,當系統由大量具有不同屬性和不同類型的交互作用的元素組成時,不適用。此外,在資源有限的情況下,需要找到最佳的保存策略,即需要解決優化問題。這裡我們旨在通過在標記圖之間開發一個度量來計算系統的多樣性,從而根據它們對全球多樣性價值的貢獻來確定最相關的組件。所提出的框架適用於大型多路復用結構,其由一組表示為節點的元素構成,其具有不同類型的交互,表示為層。所提出的方法使我們能夠在遺傳網路(HIV-1)中找到具有最高多樣性價值的元素,而在歐洲的航空公司網路中,我們系統地確定了最大化(以及不那麼妥協)的公司連接不同機場的路線選項。

HOPF:深度協同分類的高階傳播框架

原文標題: HOPF: Higher Order Propagation Framework for Deep Collective Classification

地址: arxiv.org/abs/1805.1242

作者: Priyesh Vijayan, Yash Chandak, Mitesh M. Khapra, Balaraman Ravindran

摘要: 給定一個圖,其中每個節點都有與其相關的某些屬性,並且一些節點具有與它們相關聯的標籤,集合分類(CC)是使用來自節點及其鄰居的信息為每個無標籤節點分配標籤的任務。通常情況下,一個節點不僅受到它的直接鄰居的影響,而且受到它的高階鄰居的影響,多跳一跳。 CC最近的最先進模型使用Weisfeiler-Lehman內核的不同變體來聚合多跳鄰居信息。然而,在這項工作中,我們表明這些模型遭受節點信息變形的問題,其中當考慮多跳時,節點的信息變形或被其鄰居的信息淹沒。此外,由於存儲器和計算需求隨著所考慮的跳數而呈指數增長,所以現有模型不可擴展。為了規避這些問題,我們提出了一種通用的高階傳播框架(HOPF),其包括(i)可微分節點信息保持(NIP)內核和(ii)可擴展的迭代學習和推理機制,用於聚集更大跳躍中的信息。我們使用來自不同領域的11個數據集進行了廣泛的評估,並表明,與現有的CC模型不同,我們的NIP模型在所有數據集中都具有強大的迭代推斷能力,並且可以以可擴展的方式處理更大的鄰域。

噪音中的結構:精神錯誤會產生事件的抽象表徵

原文標題: Structure from noise: Mental errors yield abstract representations of events

地址: arxiv.org/abs/1805.1249

作者: Christopher W. Lynn, Ari E. Kahn, Danielle S. Bassett

摘要: 人類善於揭露他們周圍世界的複雜關聯,但潛在的機制仍然知之甚少。直觀地說,學習統計關係的高階結構應該涉及複雜的心理過程,耗費寶貴的計算資源。在這裡我們提出一個相互競爭的觀點:高階協會實際上是由學習中的自然錯誤引起的。結合資訊理論和強化學習的思想,我們推導出一種新的最大熵模型,即人們對有序事件序列的轉換結構的內部期望。重要的是,我們的模型分析地解釋了以前無法解釋的網路對人類預期的影響,並定量描述了概率順序運動任??務中的人類反應時間。此外,我們的模型聲稱,人類的期望應該嚴格依賴於轉換網路中不同的拓撲尺度,這是我們隨後在新穎實驗中測試和驗證的預測。一般來說,我們的結果突出了心理錯誤在塑造抽象表徵中的重要作用,並直接激發了新的人為行為的物理動機模型。

排名演算法在成長網路中的長期影響

原文標題: The long-term impact of ranking algorithms in growing networks

地址: arxiv.org/abs/1805.1250

作者: Shilun Zhang, Matú? Medo, Linyuan Lü, Manuel Sebastian Mariani

摘要: 當我們在網上搜索內容時,我們經常暴露於排名。例如,網路搜索結果顯示為排名,在線書店通常會向我們顯示暢銷書籍的列表。雖然流行度和基於網路的排名指標如學位和Google的PageRank已在以前的文獻中得到廣泛研究,但我們仍然缺乏對採用不同排名演算法的潛在系統性後果的清晰認識。在這項工作中,我們通過引入網路增長模型填補了這一空白,其中節點獲得新連接的可能性取決於其當前的排名位置和其內在質量。該模型使我們能夠量化排名演算法檢測和促進高質量內容的能力,以及由此產生的內容流行度分布的異質性。我們表明,通過糾正排名指標的無所不在的時間偏差,所得到的網路在節點的質量和長期受歡迎度之間展現出明顯更大的一致性,以及更大的人氣多樣性。我們的研究結果將邁向基於模型的流行度度量長期影響的第一步,並可用作設計改進的信息過濾工具的信息工具。

從邊緣網路社區看模因的起源

原文標題: On the Origins of Memes by Means of Fringe Web Communities

地址: arxiv.org/abs/1805.1251

作者: Savvas Zannettou, Tristan Caulfield, Jeremy Blackburn, Emiliano De Cristofaro, Michael Sirivianos, Gianluca Stringhini, Guillermo Suarez-Tangil

摘要: 互聯網模因越來越多地被用來影響和可能操縱公眾輿論,從而促使人們研究它們在網路上的傳播,演變和影響。在本文中,我們使用基於知覺散列和聚類技術的處理流程以及來自Twitter,Reddit,4chan的Politically Incorrect董事會收集的來自2.6B帖子的160M圖像的數據集,檢測和測量多個Web社區中的模因的傳播/ pol /)和Gab在13個月的過程中。我們將張貼在邊網路社區(/ pol /,Gab和The_Donald subreddit)上的圖像分組為群集,使用從Know Your Meme獲得的meme元數據對它們進行注釋,並將來自主流社區(Twitter和Reddit)的圖像映射到群集。我們的分析提供了在每個社區範圍內流行度和多樣性的評估,例如,顯示種族主義模因在邊網路社區中非常普遍。我們還在主流和邊網路社區發現了大量與政治有關的模因,支持媒體報道說模因可能被用來增強或傷害政治家。最後,我們使用霍克斯過程來模擬Web社區之間的相互作用並量化它們的相互影響,發現/ pol /顯著影響了模因生態系統和它生成的模因數量,而The_Donald將它們推向其他社區的成功率更高。

融合圖卷積網路

原文標題: Fusion Graph Convolutional Networks

地址: arxiv.org/abs/1805.1252

作者: Priyesh Vijayan, Yash Chandak, Mitesh M. Khapra, Balaraman Ravindran

摘要: 半監督節點分類涉及學習對給定部分標記圖的未標記節點進行分類。在轉導式學習中,所有未分類的待分類節點在訓練和歸納學習期間均被觀察到,預測將針對在訓練中未看到的節點進行。在本文中,我們關注屬性圖中節點分類的這些設置,即節點具有附加功能的圖。用於這種屬性圖的節點分類的最先進的模型使用可微分遞歸函數。這些可區分的遞歸函數實現了對來自多跳(深度)的鄰域信息進行聚合和過濾。儘管功能強大,但它們能夠有效地組合來自不同啤酒花的信息的能力有限。在這項工作中,我們分析了遞歸圖函數在表示能力方面的局限性,以有效捕獲多跳鄰居信息。此外,我們提供了一個簡單的融合組件,它在數學上有動機去解決這個限制,並改進現有的模型以明確地了解來自不同跳躍的信息的重要性。這個提出的機制被證明可以改善8個來自不同領域的流行數據集的現有方法。具體而言,我們的模型改進了圖卷積網路(GCN)和Graph SAGE的一個變體,顯著提高了競爭力,提供了極具競爭力的最新結果。

改劃選區指標的比較

原文標題: A comparison of gerrymandering metrics

地址: arxiv.org/abs/1805.1257

作者: Gregory S. Warrington

摘要: 我們比較和對比了為量化黨派改劃選區目的而提出的12個函數。我們認為這些職能不是檢查地區的形狀,而是僅利用地區間的黨派投票分配:黨派偏見;效率差距及其幾個變體;平均中值差和等投票權重測量;赤緯和一個變體;和不平衡測試。我們確定哪些歷史選舉被視為每種措施下最極端的異常值。作為這次考試的一部分,我們強調選舉,其中各種措施得出了截然不同的結論。我們還比較了這些措施對一些假設選舉的評估。

聲明:Arxiv文章摘要版權歸論文原作者所有,由本人進行翻譯整理,未經同意請勿隨意轉載。本系列在微信公眾號「網路科學研究速遞」(微信號netsci)和個人博客 https://www.complexly.me (提供RSS訂閱)進行同步更新。

推薦閱讀:

去中心化的區塊鏈社交,會顛覆現有社交網路嗎?
Dynamic Network Embedding by Modeling Triadic Closure Process 閱讀筆記
二三言
社交的尺度——社交齋戒報告全程實錄
Arxiv網路科學論文摘要13篇(2018-05-01)

TAG:複雜系統 | 複雜網路 | 社交網路 |