Arxiv網路科學論文摘要12篇(2018-02-14)
- 人機融合時代的全球治理體系;
- 測量機器人和人類行為動態;
- 用於Bot檢測的深度神經網路;
- 政治操縱的數字痕迹分析:2016年俄羅斯干擾Twitter活動;
- 保留譜特性的網路摘要;
- 通過似然優化進行社區檢測:尋找合理的模型;
- 用於函數最大化的基於圖的上升演算法;
- 涉及Facebook討論組的攻擊策略和時間分析;
- 用一般營銷策略實現可擴展影響最大化;
- DyPerm:最大限度地延長動態社區檢測的持久性;
- 多於兩種選項的投票動態共識時間尺度分析;
- 利用媒體分組進行弱化監督集體特徵學習;
人機融合時代的全球治理體系
原文標題: Systems of Global Governance in the Era of Human-Machine Convergence
地址: http://arxiv.org/abs/1802.04255
作者: Eugenio Maria Battaglia, Jie Mei, Guillaume Dumas
摘要: 技術正在日益塑造我們的社會結構,並正在成為改變人類生物學的驅動力。此外,人類活動已經證明會對地球系統產生重大影響,從而在社會和生態系統之間產生複雜的反饋循環。此外,由於我們的物種從小群狩獵採集者向大型和技術密集的城市群發展相對較快,因此人類社會的主要機構不再適合應對當前的複雜性並不令人驚訝。在本文中,我們將繪製神經生理系統和ICT支持的社會系統之間的基本對應關係,討論植根於生物學和物理學的框架如何為設計與政治和經濟相關的演化系統提供啟發式價值。在這方面,我們強調新興技術(即納米技術,生物技術,信息技術和認知科學)的管理以及氣候變化兩者目前面臨著一系列相關挑戰。特別是:歷史上的高度不平等;在空前連通的世界中不斷增長的多極文化系統的共存;所需的機構協議不太可能達到偏離異常發展軌跡所需的程度。我們認為,對這些相互關聯的問題的明智的通用解決方案應該嵌入對如何在地球系統的社會經濟子系統中引起相互激勵的深刻理解,以便共同贊同全球效用函數(例如避免行星界限的到達和普遍社會動蕩)。關於技術社會系統如何能夠有效地學習和適應我們對地緣政治複雜性的理解,我們留下了一些開放性問題。
測量機器人和人類行為動態
原文標題: Measuring bot and human behavioral dynamics
地址: http://arxiv.org/abs/1802.04286
作者: Iacopo Pozzana, Emilio Ferrara
摘要: 機器人,社交媒體賬戶由軟體而不是人類控制,最近因其與各種形式的在線操縱的關聯而備受關注。到目前為止,很多工作都集中在社交機器人檢測上,但很少關注機器人的行為和活動的定性和度量,而不是人類。多年來,機器人變得更加複雜,並且能夠反映一些短期行為,模擬人類用戶的行為。本文的目標是研究機器人在一次活動過程中表現出的行為動態,並強調這些動作是否以及如何與人類活動簽名不同。通過使用與最近的政治事件相關的大型Twitter數據集,我們首先分離機器人和人類,然後隔離他們的活動會話。我們編製一系列量度量表,如用戶參與社交互動或製作內容的傾向。我們的分析強調了人類短期行為趨勢的存在,這種趨勢可能與認知起源有關,在機器人中缺乏,直觀地由於其自動化活動。這些研究結果最終被編纂為創建和評估機器學習演算法,以檢測機器人和人類產生的活動會話,以允許更多細微的機器人檢測策略。
用於Bot檢測的深度神經網路
原文標題: Deep Neural Networks for Bot Detection
地址: http://arxiv.org/abs/1802.04289
作者: Sneha Kudugunta, Emilio Ferrara
摘要: 檢測殭屍程序的問題,自動社交媒體帳戶由軟體管理,但偽裝成人類用戶,這具有強烈的影響。例如,殭屍已被用於通過歪曲在線話語,操縱股票市場或推動引發健康流行病的反疫苗陰謀理論來影響政治選舉。目前提出的大多數技術都是通過處理大量社交媒體帖子,並利用網路結構,時間動態,情感分析等信息來檢測帳戶級別的殭屍工具。本文中,我們提出了一種基於上下文冗長的深度神經網路短期記憶(LSTM)體系結構,它利用內容和元數據在推特層次上檢測殭屍程序:從用戶元數據中提取上下文特徵,並將其作為輔助輸入提供給處理推文文本的LSTM深層網路。我們提出的另一個貢獻是提出一種基於合成少數過採樣的技術,從少量標記數據(大約3000個複雜的Twitter機器人示例)中生成一個適用於深度網路訓練的大型標記數據集。我們證明,從僅僅一條推文中,我們的架構可以實現將機器人與人分離的高分類準確率(AUC> 96%)。我們將相同的體系結構應用於帳戶級別的機器人檢測,實現了近乎完美的分類準確性(AUC> 99%)。我們的系統優於先前的技術水平,同時利用了一小部分可解釋的功能,但只需要最少的培訓數據。
政治操縱的數字痕迹分析:2016年俄羅斯干擾Twitter活動
原文標題: Analyzing the Digital Traces of Political Manipulation: The 2016 Russian Interference Twitter Campaign
地址: http://arxiv.org/abs/1802.04291
作者: Adam Badawy, Emilio Ferrara, Kristina Lerman
摘要: 直到最近,社交媒體才被視為促進關於社會和政治問題的民主話語。然而,這個強大的溝通平台已經受到審查,允許敵對行為者利用在線討論來操縱公眾輿論。一個很好的例子就是正在進行的美國國會對俄羅斯干涉2016年美國競選活動的調查,俄羅斯指責使用巨魔(惡意賬戶操縱)和機器人傳播錯誤信息和政治偏見信息。在這項研究中,我們探討了這一操縱活動的效果,仔細研究了美國國會調查公開披露的俄羅斯巨魔賬戶在Twitter上分享職位的用戶。我們收集了一個數據集,其中包含2016年9月16日至10月21日在Twitter上分享的超過4300萬選舉相關帖子,大約有570萬不同用戶。這個數據集包括與被識別的俄羅斯巨魔相關的賬戶。我們使用標籤傳播來根據所分享的新聞來源推斷所有用戶的意識形態。這種方法使我們能夠將大量用戶分類為自由或保守,準確率高達90%以上。保守派轉推俄羅斯巨魔的頻率比自由主義者多出31倍,併產生36倍多的推文。此外,大部分troll內容轉發源自南部的兩個州:田納西州和德克薩斯州。使用最先進的機器人檢測技術,我們估計約有4.9%和6.2%的自由和保守用戶是機器人。對巨魔分享內容的文本分析表明,他們有一個最保守的,親特朗普的議程。儘管在2016年美國總統大選前,一群意識形態廣泛的Twitter用戶曾接觸過俄羅斯巨魔,但主要是保守派幫助擴大了他們的信息。
保留譜特性的網路摘要
原文標題: Network Summarization with Preserved Spectral Properties
地址: http://arxiv.org/abs/1802.04447
作者: Yu Jin, Joseph F. JaJa
摘要: 大規模網路廣泛用於表示許多現實世界應用中的對象關係。大規模網路的出現對處理,分析和提取來自這些網路的信息提出了重大的計算挑戰。網路匯總技術通常用於減少計算負荷,同時試圖維持原始網路的基本結構特性。以前的工作主要集中在某些類型的網路分區策略和依賴於應用程序的規則化,通常導致強連通的集群。在本文中,我們基於譜圖論的概念,介紹了一個關於網路摘要問題的新觀點。我們提出了一種新的距離測量來表徵原始和粗化網路之間的譜差異。我們用交錯定理和隨機塊模型的結果嚴格證明了譜距離的合理性。我們提供了一種有效的演算法來生成最大程度地保留原始網路譜特性的粗化網路。我們提出的網路摘要框架允許靈活地生成一組粗糙網路,其具有與原始網路的不同方面保存的顯著不同的結構,這將我們的工作與其他方面區分開來。我們對各種大型網路進行了廣泛的實驗測試,包括實際應用和隨機圖模型。我們表明,與以前的網路摘要演算法相比,我們提出的演算法在譜測量和運行時間方面始終如一地執行更好的結果。
通過似然優化進行社區檢測:尋找合理的模型
原文標題: Community detection through likelihood optimization: in search of a sound model
地址: http://arxiv.org/abs/1802.04472
作者: Liudmila Ostroumova Prokhorenkova, Alexey Tikhonov
摘要: 社區檢測最近成為網路分析中最重要的問題之一,並提出了許多演算法來解決這個問題。其中,基於統計推斷的方法具有特別的意義:這種演算法在數學上是合理的,並且被證明可以提供高質量的分區。統計推斷方法的主要成分是假設一些潛在的隨機圖模型,然後通過最大化可能性將該模型擬合到觀察圖。這種基礎模型(也稱為空模型)的選擇對於這種方法是非常重要的,這種選擇是當前研究的焦點。我們提供了一個廣泛的理論和實證分析來比較幾個模型:隨機區塊模型,它是目前最廣泛使用的似然優化模型;最近提出了這個模型的度數修正修正,以及一個新的具有一些理想統計特性的單參數零模型。我們還開發並比較了兩種適用於所考慮空模型的可能性優化演算法。對各種數據集進行廣泛的實證分析表明,與合成數據集相比,現實世界網路具有多樣性,並且沒有適合所有數據集的模型。
用於函數最大化的基於圖的上升演算法
原文標題: Graph-Based Ascent Algorithms for Function Maximization
地址: http://arxiv.org/abs/1802.04475
作者: Muni Sreenivas Pydi, Varun Jog, Po-Ling Loh
摘要: 我們研究在連通圖的節點上找到定義的函數的最大值的問題。目標是確定函數獲得最大值的節點。我們專註於局部迭代演算法,它沿著路徑遍歷圖的節點,並且從當前迭代的鄰居中選擇下一個迭代,其中概率分布由當前迭代中的函數值及其鄰居來確定。我們研究了對應於具有不同過渡內核的Metropolis-Hastings隨機遊走的兩種演算法:(i)第一種演算法是由參數 gamma控制的指數加權隨機遊走。 (ii)關於圖拉普拉斯運算元和平滑參數k定義第二演算法。我們從總變差距離和命中時間的角度推導出兩種演算法的收斂速度。作為圖函數平滑性的函數,我們還提供了模擬,顯示我們的演算法與無偏隨機遊走相比的相對收斂速度。我們的演算法可以被歸類為圖的節點上用於函數最大化的一類新的「基於下降」的方法。
涉及Facebook討論組的攻擊策略和時間分析
原文標題: Attacking Strategies and Temporal Analysis Involving Facebook Discussion Groups
地址: http://arxiv.org/abs/1802.04500
作者: Chun-Ming Lai, Xiaoyun Wang, Yunfeng Hong, Yu-Cheng Lin, S. Felix Wu, Patrick McDaniel, Hasan Cam
摘要: 在線社會網路(OSN)討論組正在對政治對話產生重大影響。在沒有訪問控制機制的情況下,任何用戶都可以貢獻給任何OSN線程。個人可以利用這一特性來執行有針對性的攻擊,從而增加後續惡意行為(如網路釣魚和惡意軟體分發)的可能性。這些行動也將破壞媒體,政治家和他們的選民之間的橋樑。對於安全管理的關注,將惡意網路攻擊與在線社交互動混合在一起引發了一個全新的挑戰。在本文中,我們描述了我們提出的一種新方法,用於研究和理解攻擊者在Facebook討論組中使用惡意URL進行傳播的策略。我們定義和分析了與預測針對新聞媒體組織創建的主題的攻擊可能性有關的問題。我們使用宏觀靜態特徵和帖子和線程的微動態演變組合來識別可能的目標,其準確度高於90%。我們的第二個目標之一是在短時間(10分鐘)內做出這樣的預測。我們希望本文中提供的數據和分析能夠更好地理解攻擊者的策略和腳印,從而開發新的系統管理方法來處理社會網路中的網路攻擊。
用一般營銷策略實現可擴展影響最大化
原文標題: Scalable Influence Maximization with General Marketing Strategies
地址: http://arxiv.org/abs/1802.04555
作者: Ruihan Wu, Zheng Yu, Wei Chen
摘要: 在本文中,我們研究了用一般營銷策略(IM-GMS)來影響最大化的可伸縮演算法,其中營銷策略組合被建模為一個向量$ mathbf {x} =(x_1, ldots,x_d)以概率$ h_v( mathbf {x})$激活社會網路中的節點$ v $。 IM-GMS問題是尋找最佳策略組合$ mathbf {x} ^ * $,以最大化由於受激活種子的影響傳播而引起的影響擴散,受到預算約束$ sum_ {j in [d ]} x_j le k $。我們調整可擴展的反向影響採樣(RIS)方法,並設計一個可擴展的演算法,提供$(1-1 / e - varepsilon)$近似解(對於任何$ varepsilon> 0 $),運行時間接近線性在網路大小。我們進一步擴展IM-GMS以允許分區預算約束,並證明我們的可擴展演算法在這種情況下提供了$(1 / 2- varepsilon)$解決方案。通過廣泛的實驗,我們證明了我們的演算法比基於蒙特卡羅模擬的爬山演算法快幾個數量級,並且還優於文獻中提出的其他基線演算法。
DyPerm:最大限度地延長動態社區檢測的持久性
原文標題: DyPerm: Maximizing Permanence for Dynamic Community Detection
地址: http://arxiv.org/abs/1802.04593
作者: Prerna Agarwal, Richa Verma, Ayush Agarwal, Tanmoy Chakraborty
摘要: 在本文中,我們提出了DyPerm,這是第一種動態社區檢測方法,它優化了一種稱為永久性的新型社區評分指標。 DyPerm通過更新已執行節點和邊的編輯的社區,遞增地修改社區結構,從而保持網路的其他部分不變。我們提出了強有力的理論保證,以顯示現有社區結構的更新如何/為什麼導致動態網路中的永久性最大化,從而大大降低了計算複雜度。對具有給定的地面實況社區結構的合成網路和六個真實世界網路的實驗表明,與四種基線方法中的最佳方法相比,DyPerm實現(平均)35%的準確度增加(基於NMI)。 DyPerm的結果也比靜態對象快15倍。
多於兩種選項的投票動態共識時間尺度分析
原文標題: Analysis of Time Scale to Consensus in Voting Dynamics with more than Two Options
地址: http://arxiv.org/abs/1802.04654
作者: Degang Wu, K.Y.Szeto
摘要: 我們將自適應網路上的二元多數票模型推廣到其多元票對應模型,並且在選民給予兩個以上選項時分析時間尺度達到共識。當意見在初始狀態下的選民人口中均勻分布時,我們發現從數值模擬和使用三態多項投票模型的主方程的數學分析,到共識的時間尺度比二元投票模型要短。當干預如認為轉換是允許的,如因任何原因選民的心態突然變化的情況下,在熱力學極限的共識狀態推零散三認為人口所需要的努力,在最少的干預成本計量,比同性戀的程度(p)低於0.8時所需的數量少於將兩極分化的兩極群體推到共識狀態所需的數量。對於有限制的系統,與兩極分化人口相比,分散的三意見人口將自發地達到共識狀態,達成共識的時間更快,範圍廣泛的p $。
利用媒體分組進行弱化監督集體特徵學習
原文標題: Weakly supervised collective feature learning from curated media
地址: http://arxiv.org/abs/1802.04668
作者: Yusuke Mukuta, Akisato Kimura, David B Adrian, Zoubin Ghahramani
摘要: 當前最新的特徵學習依賴於監督學習由目標內容項目及其各自類別標籤組成的大規模數據集。但是,構建這種大規模完全標記的數據集通常需要費力的手動工作。解決此問題的一個可能方法是將社區貢獻的文本標籤用作弱標籤,但是,單個文本標籤的基本概念很大程度上取決於用戶。相反,我們通過充分利用社會網路服務(SNS)上的人員策略過程,提出了一種學習歧視性特徵的新範式。在內容管理的過程中,SNS用戶從各種來源手動收集內容項目並按照上下文進行分組,這些都是為了他們自己的利益。由於這個過程的本質,我們可以假設:(1)同一組中的內容項共享相同的語義概念;(2)共享相同圖像的組可能具有相關的語義概念。通過這些見解,我們可以將人為策劃的組定義為弱標籤,從中我們提出的框架可以學習歧視性特徵作為用戶在創建組時所用的語義概念空間中的表示。我們表明,這種特徵學習可以表示為節點對應於內容項目和人類策劃組的二部圖的鏈路預測問題,並且提出了一種基於稀疏編碼或網路微調的新穎特徵學習方法。
聲明:Arxiv文章摘要版權歸論文原作者所有,由本人進行翻譯整理,未經同意請勿隨意轉載。本系列在微信公眾號「網路科學研究速遞」(微信號netsci)和個人博客 https://www.complexly.me (提供RSS訂閱)進行同步更新。
推薦閱讀:
※機器也要搞社交網路?AI+機器社交網路——這家公司欲讓智能物聯網成真
※產品經理常見問題
※了解3個人脈原則,走出舒適圈---社交達人就是你
※互聯網上的強關係、弱關係
※如何利用社交數據,快速打通營銷場景的「任督二脈」?