Arxiv網路科學論文摘要26篇(2018-02-13)
- 利用感染級聯重建網路;
- 相互依存系統中的級聯失效:度變化和依賴的影響;
- WhatsApp使用模式和無信息內容預測模型研究;
- 從熟人到永遠的好朋友:對社交關係強度的穩健和細粒度推斷;
- 軍事和國家安全垃圾新聞:針對美國軍人和退伍軍人的社交媒體宣傳活動;
- 美國大選期間的社交媒體,新聞和政治信息:極化內容集中在搖擺州?;
- 追隨者計數謬誤:用操縱追隨者數檢測Twitter用戶;
- 網路上的權力分配博弈:一個悖論;
- 動態網路演化的潛在空間模型;
- 人工智慧遇到少數博弈:朝著最優資源分配;
- 由於大規模攻擊導致網路過載;
- 社會擴散的連續到不連續的過渡;
- 從結構的差異到差異的結構;
- 在多元集合種群網路中傳播流行病的框架;
- SPINE:結構身份保持誘導網路嵌入;
- GEMSEC:自聚類圖嵌入;
- 從發射事件中推斷大規模計算機網路的時變功能連接;
- 物聯網時代的廣告:願景與挑戰;
- Tagvisor:用於共享Hashtags的隱私顧問;
- 政策眾包的基本原理;
- Twitter上垃圾郵件發送者的集體分類:基於層次元路徑的方法;
- 通過類似群集的系統中的迭代邊去除來進行網路社區檢測;
- 多輪影響最大化(擴展版);
- 貨物檢驗中多原子伽馬射線照相術有效原子序數識別的實驗驗證;
- 用比特幣購買咖啡:真實世界部署比特幣銷售點終端;
- DiSLR:有限冗餘的分散式採樣,用於圖流中的三角形計數;
利用感染級聯重建網路
原文標題: Network reconstruction from infection cascades
地址: http://arxiv.org/abs/1609.00432
作者: Alfredo Braunstein, Alessandro Ingrosso, Anna Paola Muntoni
摘要: 訪問傳播動態擴散的網路對理解和控制網路至關重要。在少數情況下,這些信息可以通過直接實驗或傳播數據的特性獲得。然而,在大多數情況下,有關網路的可用信息是間接的,並且來自對動態的部分觀察,使得網路重構成為基本的逆向問題。在這裡我們表明,可以重構交互網路的整體結構並且同時推斷激活擴散的完整時間過程,僅依賴於單個時期(即,快照)或少量活動級聯的時間分散觀察。我們提出的方法建立在信念傳播近似上,在各種相關案例中顯示出令人印象深刻的準確性,並且能夠通過提供詳細的後驗分布建模來推斷存在不完整時間序列數據的交互作用軌跡適應觀測。此外,我們通過實驗表明,完整級聯的信息內容比稀疏觀察或單個快照的信息內容要小。
相互依存系統中的級聯失效:度變化和依賴的影響
原文標題: Cascading Failures in Interdependent Systems: Impact of Degree Variability and Dependence
地址: http://arxiv.org/abs/1702.00298
作者: Richard J. La
摘要: 我們研究了包含相互依存的網路/系統的系統中的級聯故障,其中節點依賴於同一系統和其他系統中的其他節點來執行其功能。節點之間的(相互)依賴性使用依賴圖來建模,其中節點的度向量通過前述依賴性確定其可能潛在地導致每個系統中的其他節點的數量。具體而言,我們檢查節點度的可變性和依賴屬性對級聯失敗概率的影響。我們表明節點度的較大變化阻礙了系統中的廣泛故障,從隨機故障開始。類似地,節點度數的正相關性使得難以引發失敗的流行,從而使系統對隨機故障更有力。
WhatsApp使用模式和無信息內容預測模型研究
原文標題: A Study of WhatsApp Usage Patterns and Prediction Models without Message Content
地址: http://arxiv.org/abs/1802.03393
作者: Avi Rosenfeld, Sigal Sina, David Sarne, Or Avidov, Sarit Kraus
摘要: 互聯網社會網路已經成為一種無處不在的應用程序,允許人們輕鬆共享文本,圖片和音頻和視頻文件。流行的網路包括WhatsApp,Facebook,Reddit和LinkedIn。我們對WhatsApp社會網路的使用情況進行了廣泛的研究,該網路是一種快速取代SMS消息的互聯網消息應用程序。為了更好地了解人們對網路的使用情況,我們提供了來自100多個用戶的超過600萬條消息的分析,其目標是使用活動數據構建人口統計預測模型。我們對數據進行了廣泛的統計和數值分析,發現不同性別和年齡人群的WhatsApp使用情況存在顯著差異。我們還將數據輸入到Weka數據挖掘軟體包中,並研究從決策樹和貝葉斯網路演算法創建的模型。我們發現不同性別和年齡人群在幾乎所有消息和群組屬性中的使用習慣存在顯著差異。我們還注意到用戶群體行為的差異,並創建了預測模型,包括給定群組可能擁有相對較多的文件附件的可能性,如果一個群體包含更多參與者,活動頻率更高,響應時間更短以及信息更短。我們成功量化和預測用戶的性別和年齡人口。同樣,我們能夠預測不同類型的組使用情況。所有模型都是在不分析消息內容的情況下構建的我們詳細討論了所有預測模型中包含的特定屬性,並根據這些結果提出了可能的應用。
從熟人到永遠的好朋友:對社交關係強度的穩健和細粒度推斷
原文標題: From acquaintance to best friend forever: robust and fine-grained inference of social tie strengths
地址: http://arxiv.org/abs/1802.03549
作者: Florian Adriaens, Tijl De Bie, Aristides Gionis, Jefrey Lijffijt, Polina Rozenshtein
摘要: 社會網路往往只能提供一個關於社交關係的二元視角:兩個人是否連接在一起。雖然有時外部信息可以用來推斷社會關係的強度,但獲取這些信息可能受到限制或不切實際。 Sintos和Tsaparas(KDD 2014)首先建議通過利用 strong {三重封閉(STC)}屬性來從單獨的網路拓撲中推斷社會聯繫的強度。 %---假定在社會網路中舉行? cite {sim:08}。 STC財產規定,如果人員A與人員B $和$ C $有強烈的社會聯繫,則B $和C必須彼此相連(無論是弱者還是強者)。 Sintos和Tsaparas利用這種方法將社會關係強度推斷為NP-hard優化問題,並提出了兩種近似演算法。我們通過開發一系列線性鬆弛的問題來完善和改進這個裡程碑式的論文,這個問題可以用多項式時間精確地解決。有用的是,這些放鬆會推斷更細粒度的綁定強度(超越強和弱),這也可以避免在網路拓撲結構提供不確定的證據時,做出任意強/弱的強度分配。其中一种放松同時推斷出現有限數量的STC違規。廣泛的理論分析導致兩種有效的演算法方法。最後,我們的實驗結果闡明了所提出的方法的優點,並在實踐中揭示了STC性質的有效性。
軍事和國家安全垃圾新聞:針對美國軍人和退伍軍人的社交媒體宣傳活動
原文標題: Junk News on Military Affairs and National Security: Social Media Disinformation Campaigns Against US Military Personnel and Veterans
地址: http://arxiv.org/abs/1802.03572
作者: John D. Gallacher, Vlad Barash, Philip N. Howard, John Kelly
摘要: 社交媒體為現役軍人和退伍軍人提供政治新聞和信息。我們分析了Twitter和Facebook用戶的小組,他們花費時間從美國軍事人員和退伍軍人的網站上發布垃圾消息,提供有關陰謀論,錯誤信息和其他形式的有關軍事和國家安全問題的垃圾消息。 (1)通過Twitter,我們發現現任和前任軍事人員之間存在著重要且持續的相互作用,並且有廣泛的極端主義,俄羅斯和國際陰謀分組網路。 (2)在Facebook上,我們發現軍事和退伍軍人以及致力於政治陰謀的分組和公共頁面之間的重要且持續的相互作用,以及政治範圍的雙方。 (3)在Facebook上,對陰謀論和政治權利最感興趣的用戶似乎散發著最多的垃圾新聞,而無論是軍人還是退伍軍人的用戶都是最成熟的新聞消費者之一,通過網路的小垃圾新聞。
美國大選期間的社交媒體,新聞和政治信息:極化內容集中在搖擺州?
原文標題: Social Media, News and Political Information during the US Election: Was Polarizing Content Concentrated in Swing States?
地址: http://arxiv.org/abs/1802.03573
作者: Philip N. Howard, Bence Kollanyi, Samantha Bradshaw, Lisa-Maria Neudert
摘要: 美國選民通過鏈接俄羅斯,維基解密和垃圾新聞來源的內容,分享了大量的政治新聞和信息。這些低質量的政治信息是否均勻分布在全國各地,還是集中在搖擺州和全國特定地區?在這份數據備忘錄中,我們應用了一份經過測試的關於政治新聞和信息的字典,這些信息是在2016年總統選舉周圍的10天內通過Twitter分享的。使用自我報告的位置信息,我們將三分之一的用戶按州分類,並為全國各地的偏振內容分布創建一個簡單的索引。我們發現(1)在全國範圍內,Twitter用戶比專業製作的新聞獲得更多的錯誤信息,極化和陰謀內容。 (2)有些州的用戶比其他州的用戶分享更多的政治新聞和信息。 (3)即使在每個州的用戶人口的相對規模加權時,揮杆狀態下的錯誤信息的平均水平高於無爭議狀態。我們總結了一些關於戰略傳播的極化信息對公共生活影響的觀察結論。
追隨者計數謬誤:用操縱追隨者數檢測Twitter用戶
原文標題: The Follower Count Fallacy: Detecting Twitter Users with Manipulated Follower Count
地址: http://arxiv.org/abs/1802.03625
作者: Anupama Aggarwal, Saravana Kumar, Kushagra Bhargava, Ponnurangam Kumaraguru
摘要: 在線社會網路(OSN)越來越多地被用作有效溝通的平台,與其他用戶互動,並通過喜歡,追隨者和分享數量創造社交價值。這些衡量指標和眾包評級為OSN用戶提供了一種社會聲譽感,她試圖保持並提高其影響力。用戶通過黑市Web服務人為地提升了他們的社交聲譽。在這項工作中,我們確定用戶使用無監督的局部鄰域檢測方法來操縱他們的預測跟隨者數量。我們基於一組強大的特徵來識別用戶的鄰居,這些特徵反映了用戶在預期跟隨者計數方面的相似性。我們顯示使用我們的方法的跟隨者計數估計具有84.2%的準確度和低的錯誤率。另外,我們通過從Twitter的大型隨機樣本中找出其鄰域來估計被懷疑的用戶的跟隨者數量。我們表明我們的方法對合成操縱追隨者的能力非常強。利用顯示計數的預測隨從計數的偏差,我們還能夠以高達98.62%的精度檢測客戶,
網路上的權力分配博弈:一個悖論
原文標題: The Power Allocation Game on A Network: A Paradox
地址: http://arxiv.org/abs/1802.03669
作者: Yuke Li, A. Stephen Morse
摘要: 擁塞博弈中眾所周知的Braess悖論指出,為交通網路增加額外的道路可能會增加總行程時間,從而降低整體效率。受此啟發,本文提出了一種悖論,即從網路上另一種分散式資源分配博弈出現的類似精神,即在 cite {分配}中開發的國家之間的權力分配博弈。矛盾的是,通過讓更多的朋友實際上可以減少一個國家的平衡總福利。也出現了這種悖論發生的條件以及一些無政府狀態結果的價格。
動態網路演化的潛在空間模型
原文標題: Evolving Latent Space Model for Dynamic Networks
地址: http://arxiv.org/abs/1802.03725
作者: Shubham Gupta, Gaurav Sharma, Ambedkar Dukkipati
摘要: 在社會網路,協作網路等現實世界中觀察到的網路展現出時間動態,即節點和邊隨時間出現和/或消失。在本文中,我們提出了一個生成的,基於潛在空間的統計模型(稱為動態網路)。我們考慮節點數量固定的情況,但邊的存在會隨時間而變化。我們的模型允許網路中的社區數量在不同的時間步驟有所不同。我們使用基於神經網路的方法在所提出的模型及其簡化版本中執行近似推斷。在合成和現實世界的網路上進行社區檢測和鏈路預測任務的實驗證明了我們的模型與其他類似的現有方法相比的實用性和有效性。據我們所知,這是第一個將動態網路的統計建模與深入學習以進行社區檢測和鏈路預測的工作。
人工智慧遇到少數博弈:朝著最優資源分配
原文標題: Artificial intelligence meets minority game: toward optimal resource allocation
地址: http://arxiv.org/abs/1802.03751
作者: Si-Ping Zhang, Jia-Qi Dong, Li Liu, Zi-Gang Huang, Liang Huang, Ying-Cheng Lai
摘要: 資源分配系統為現代社會的正常運作和福祉提供了基本支持,並且可以模仿為少數博弈。一個無處不在的動態現象是放牧的出現,絕大多數用戶集中在少量資源上,導致資源分配效率低下。因此設計防止放牧的策略因此具有高度的興趣。以前的作品集中在依賴外部干預的控制策略上,比如在一部分用戶被迫選擇特定動作的情況下進行固定控制。沒有任何外部控制,是否有可能消除放牧?本文的主要觀點是通過利用人工智慧(AI)來提供肯定的答案。特別是,我們證明,當代理人被授權加強學習時,他們逐漸熟悉未知的博弈環境,並試圖提供最佳行動以最大化回報,可以有效地消除放牧。計算揭示了一個驚人的現象,即不管初始狀態如何,系統都會持續不斷地向所有資源得到有效利用的最佳狀態演變。然而,演變的過程並非沒有中斷:有很大的波動發生,但只是間歇性地發生。發現兩次連續波動事件之間的時間的統計分布取決於演變的奇偶性,即它們之間的時間步數是奇數還是偶數。我們開展物理分析並導出平均場方程,以了解這些現象。由於少數博弈動態和放牧現象在社會,經濟和政治系統中很常見,而且由於人工智慧越來越普遍,我們期望我們的人工智慧強化少數博弈系統具有廣泛的應用。
由於大規模攻擊導致網路過載
原文標題: Network Overload due to Massive Attacks
地址: http://arxiv.org/abs/1802.03901
作者: Yosef Kornbluth, Gilad Barach, Mark Tuchman, Benjamin Kadish, Gabriel Cwilich, Sergey V. Buldyrev
摘要: 我們研究由於過載引起的網路級聯故障,使用節點的中間中心性作為衡量Motter和Lai模型的負載的度量。我們研究了在級聯pf結束時存活節點的比例,作為初始攻擊強度的函數,用節點p的比例來度量,這個節點在不同的容忍值 alpha在隨機正則和Erd os-Renyi圖中,我們發現在p? alpha平面上存在一階相變線$ p_t( alpha)$,這樣如果$ p p_t $,$ p_f $很大並且網路的巨大組件仍然存在,恰好在$ p_t $函數$ p_f(p)$經歷了一階不連續性,我們發現$ p_t( alpha)$行在臨界點$(p_c, alpha_c)$結束,其中級聯失敗被一秒我們通過分析找到初始攻擊前後不同程度的節點的平均介數,研究它們的作用在級聯失敗中,找到$ p_t( alpha)$的下限。我們還研究了本地攻擊和隨機攻擊之間的區別。
社會擴散的連續到不連續的過渡
原文標題: From continuous to discontinuous transitions in social diffusion
地址: http://arxiv.org/abs/1802.03951
作者: Paula Tuzón, Juan Fernández-Gracia, Víctor M. Eguíluz
摘要: 社會傳播模型反映了人口中新產品,創意或行為的流程。作為控制參數的函數,這些模型通常導致採用者數目的連續或不連續的相變。我們探索了一個簡單的社會採用模型,其中代理可以處於兩種狀態,不管是採用者還是非採用者,並且可以在這兩種狀態之間通過網路與其他代理進行交互。代理從非採用者轉換到採用者的概率取決於其網路鄰居中採用者的數量,採用閾值T和採用係數a,這兩個參數定義了Hill函數。相比之下,從採用者到非採用者的過渡是自發的,一定比例為 mu。在平均場方法中,我們推導出控制常微分方程,並且表明全球非採納和全球採用制度之間過渡的性質主要取決於與一個和兩個採納者採用的可能性之間的平衡。通過超臨界干叉分叉,該過渡從連續,經由跨臨界分叉變為不連續,經由鞍結和跨臨界分叉的組合。我們表徵完整的參數空間。最後,我們將我們的分析結果與退火和淬火度規則網路上的蒙特卡洛模擬進行了比較,表明退火情況下的更好的一致性。我們的結果顯示了一個簡單的模型如何能夠捕捉兩種看似非常不同的過渡類型,即連續和不連續,從而統一了不同系統的底層動態。此外,這裡採用的採納概率的形式是基於經驗測量。
從結構的差異到差異的結構
原文標題: From the difference of structures to the structure of the difference
地址: http://arxiv.org/abs/1802.03966
作者: Massimiliano Zanin, Ernestina Menasalvas, Xiaoqian Sun, Sebastian Wandelt
摘要: 在處理演化或多維複雜系統時,網路理論提供了通過分別時變和多層複雜網路描述其構成組件的優雅方式。儘管如此,分析這些組件如何相關仍然是一個懸而未決的問題。我們在這裡提出了一個分析(複雜)系統演化的框架,通過描述由多個網路之間的差異通過信息內容度量來創建的結構。與其他方法相反,例如使用全局重疊或熵,提議的方法允許了解觀察到的變化是由於隨機雜訊還是由於結構(目標)修改造成的。我們通過一組合成網路以及代表真正的技術,社會和生物演化系統的網路來驗證框架。我們進一步提出了一種重建網路相關圖的方法,它可以將系統的演變轉換到頻域。
在多元集合種群網路中傳播流行病的框架
原文標題: A framework for epidemic spreading in multiplex networks of metapopulations
地址: http://arxiv.org/abs/1802.03969
作者: David Soriano-Pa?os, Laura Lotero, Jesús Gómez-Garde?es, Alex Arenas
摘要: 我們提出了一個理論框架,研究結構性人群中的流行病,異質性因子,受到複發性流動模式的影響。我們建議將複合群體的組成中的異質性表示為多路復用網路中的層,其中節點將對應於地理區域並且層對相同類別的代理的移動性模式進行解釋。我們分析了該框架內的經典易感染 - 易感染易感染和易感染 - 感染 - 去除流行模式,並將擴散過程的宏觀和微觀指標與廣泛的蒙特卡羅模擬進行了比較。我們的結果與模擬結果非常吻合。我們還從這個總體框架得出了流行病門檻的確切表達,揭示了對流動性參數的非平凡依賴。最後,我們用這種新的形式主義來解決實際城市疾病的傳播,特別是在哥倫比亞麥德林市,這個城市的人口分為六個社會經濟階層,每個階層都有一個這種多元化形式主義的層次。
SPINE:結構身份保持誘導網路嵌入
原文標題: SPINE: Structural Identity Preserved Inductive Network Embedding
地址: http://arxiv.org/abs/1802.03984
作者: Junliang Guo, Linli Xu, Enhong Chen
摘要: 網路嵌入領域的最新進展表明,低維網路表示在網路分析中起著關鍵作用。大多數現有網路嵌入方法編碼節點的本地接近度,例如一階和二階近似。雖然效率很高,但這些方法缺乏利用彼此遠離的節點之間的全局結構信息。另外,大多數現有的方法學習嵌入在單個固定網路上,因此不能被推廣到看不見的節點或網路而沒有再訓練。在本文中,我們介紹SPINE,一種可以在任何距離共同捕獲本地鄰近和鄰近的方法,同時可以有效地處理看不見的節點或網路。具體而言,我們根據名為Rooted PageRank的網路的高階鄰近度,確定每個節點的結構身份,然後是一種新穎的有偏離的Skip-Gram Negative Sampling演算法和精心設計的目標函數,以編碼局部近似和全局結構身份節點同時。基準數據集上的廣泛的實驗結果證明了所提出的框架相對於現有技術的優越性。
GEMSEC:自聚類圖嵌入
原文標題: GEMSEC: Graph Embedding with Self Clustering
地址: http://arxiv.org/abs/1802.03997
作者: Benedek Rozemberczki, Ryan Davies, Rik Sarkar, Charles Sutton
摘要: 現代圖嵌入過程可以從具有數百萬個節點的圖中有效地提取節點的特徵。這些功能稍後將用作下游預測任務的輸入。在本文中,我們提出了GEMSEC的圖嵌入演算法,它可以同時學習節點的聚類並計算它們的特徵。該過程將節點放置在抽象特徵空間中,其中頂點特徵使保存採樣頂點鄰域的負對數似然性最小化,而節點聚集到該空間中的固定數量的組中。 GEMSEC是該領域早期工作的普遍擴展,因為它是基於序列的圖嵌入過程的核心優化問題的增強,並且不受鄰域採樣策略的影響。我們展示GEMSEC在真實世界的社會網路上提取高質量的群集,並與其他社區檢測演算法相競爭。我們證明聚類約束對表示質量具有積極影響,並且我們的過程學習以強健和可擴展的方式共同嵌入和聚類圖。
從發射事件中推斷大規模計算機網路的時變功能連接
原文標題: Inferring the time-varying functional connectivity of large-scale computer networks from emitted events
地址: http://arxiv.org/abs/1802.04036
作者: Antoine Messager, George Parisis, Istvan Z Kiss, Robert Harper, Phil Tee, Luc Berthouze
摘要: 我們考慮從其節點發出的稀疏時間序列事件推斷大規模計算機網路的功能連通性的問題。我們在以下三個領域特定的約束條件下這樣做:(a)由於網路中未知的時間變化導致的功能連接的非平穩性,(b)限制經典相關性的時間序列事件的稀疏性, (c)缺乏描述事件如何通過網路傳播的顯式模型。在假定兩個節點在功能上連接的概率與它們各自事件之間的平均延遲相關的情況下,我們開發了一種推理方法,其輸出是一個無向加權網路,其中兩個節點之間的邊的權重表示這些節點的可能性功能連接。使用開窗和卷積的組合在每個時間窗計算一個量化一對節點快速連續發射事件的可能性的分數,我們開發了一個時變連接模型,其參數通過最大化模型的預測能力來確定時間窗口到下一個。為了評估我們的推理方法的有效性,我們構建了可以得到地面實況的合成數據,並使用這些數據來針對我們的方法與三種最先進的推理方法進行對比。我們通過討論它在真實世界的大型計算機網路中的應用來得出結論。
物聯網時代的廣告:願景與挑戰
原文標題: Advertising in the IoT Era: Vision and Challenges
地址: http://arxiv.org/abs/1802.04102
作者: Hidayet Aksu, Leonardo Babun, Mauro Conti, Gabriele Tolomei, A. Selcuk Uluagac
摘要: 物聯網(IoT)擴展了將計算機互連到眾多不同設備(統稱為智能設備)的想法。這些都是物理項目,即「物品」 - 例如可穿戴設備,家用電器和車輛,充實了計算和網路功能。由於涉及大量設備 - 因此,它的普遍性 - 物聯網是一個很好的平台,可用於構建新的應用程序和服務或擴展現有的應用程序和服務。在這方面,將在線廣告擴展到物聯網領域是一個未被充分調查但前景看好的研究方向,特別是考慮到傳統的互聯網廣告市場已經價值數千億美元。在本文中,我們首先提出一個受傳統互聯網廣告所基於的著名商業生態系統啟發的物聯網廣告平台架構。此外,我們還討論實施此類平台的關鍵挑戰,特別關注與架構,廣告內容交付,安全性和用戶隱私相關的問題。
Tagvisor:用於共享Hashtags的隱私顧問
原文標題: Tagvisor: A Privacy Advisor for Sharing Hashtags
地址: http://arxiv.org/abs/1802.04122
作者: Yang Zhang, Mathias Humbert, Tahleen Rahman, Cheng-Te Li, Jun Pang, Michael Backes
摘要: Hashtag已經成為一種廣泛使用的流行文化和活動的概念,但其對人們隱私的影響迄今尚未被調查。在本文中,我們首先系統地分析由標籤引起的隱私問題。我們特別關注位置,這是互聯網時代公認的關鍵隱私問題之一。通過依賴隨機森林模型,我們顯示我們可以根據城市,從精確度為70%到76%的主題標籤推斷用戶的精確位置。為了彌補這種情況,我們引入了一個名為Tagvisor的系統,如果用戶選擇的話題構成對位置隱私的威脅,系統地建議替代主題標籤。 Tagvisor通過三種概念上不同的混淆技術和一種基於語義的度量標準來測量隨之而來的效用損失。我們的調查結果顯示,混淆至少兩個主題標籤已經為我們的數據集中的隱私和效用提供了近乎最佳的折衷。這尤其使Tagvisor具有高度的時間效率,因此在實際環境中很實用。
政策眾包的基本原理
原文標題: The Fundamentals of Policy Crowdsourcing
地址: http://arxiv.org/abs/1802.04143
作者: John Prpic, Araz Taeihagh, James Melton
摘要: 眾包決策研究的現狀是什麼?本文開始回答這個問題,收集,分類和設置一個廣泛的現有研究調查政策眾包,在一個新的框架內建立在每個領域的基本類型上。我們首先定義了三種通用眾包技術(虛擬勞動力市場,比賽眾包,開放式合作)的七個普遍特徵,以檢驗每種模式的相對權衡。然後,我們將這三種類型的眾包與政策周期的不同階段進行比較,以確定跨越兩個領域的文獻。最後我們討論公眾政策眾包的研究趨勢,並突出文獻中的研究差距和重疊。關鍵詞:眾包,政策周期,眾包交易,政策流程,政策階段,虛擬勞動力市場,比賽眾包,開放式合作
Twitter上垃圾郵件發送者的集體分類:基於層次元路徑的方法
原文標題: Collective Classification of Spam Campaigners on Twitter: A Hierarchical Meta-Path Based Approach
地址: http://arxiv.org/abs/1802.04168
作者: Srishti Gupta, Abhinav Khattar, Arpit Gogia, Ponnurangam Kumaraguru, Tanmoy Chakraborty
摘要: 網路犯罪分子利用在線社會網路上大量用戶群的普及,通過傳播網路釣魚URL,附加惡意內容等來傳播垃圾郵件活動。然而,另一種使用電話號碼的垃圾郵件攻擊最近在OSN上盛行,垃圾郵件發布者電話號碼以吸引用戶的注意力,並說服他們撥打這些電話號碼。由於與電話號碼相關的內在信任,基於電話號碼的垃圾郵件的動態不同於基於URL的垃圾郵件。雖然以前的工作提出了緩解基於URL的垃圾郵件攻擊的策略,但基於電話號碼的垃圾郵件攻擊收到的關注較少。在本文中,我們旨在檢測使用電話號碼推廣Twitter上的廣告系列的垃圾郵件發送者。為此,我們收集了670251個用戶傳播的3,370個廣告系列的相關信息。我們通過利用數據集中存在的不同類型節點之間的各種互連,將Twitter數據集建模為異構網路。特別是,我們做出以下貢獻:(i)我們提出了一種簡單而有效的度量標準,稱為分級元路徑分數(HMPS),用于衡量未知用戶與其他已知垃圾郵件發送者的接近程度。 (ii)我們設計了一個基於反饋的主動學習策略,並表明它明顯優於垃圾郵件檢測任務的三個最先進的基線。與最佳基線方法相比,我們的方法分別高出F1和AUC分別高出6.9%和67.3%。 (iii)為了克服監督學習訓練實例較少的問題,我們表明,我們提出的反饋策略比其他過採樣策略分別提高了25.6%和46%的F1分數和AUC。最後,我們進行案例研究,以展示我們的方法如何將用戶檢測為尚未被Twitter(和其他基線)暫停的垃圾郵件發送者。
通過類似群集的系統中的迭代邊去除來進行網路社區檢測
原文標題: Network community detection via iterative edge removal in a flocking-like system
地址: http://arxiv.org/abs/1802.04186
作者: Filipe Alves Neto Verri, Roberto Alves Gueleri, Qiusheng Zheng, Junbao Zhang, Liang Zhao
摘要: 我們提出了一種網路社區檢測技術,該技術基於自然啟發的粒子對齊系統中出現的屬性。最初,每個頂點被分配一個隨機方向單位矢量。建立一個非線性動力學規律,以便相鄰頂點試圖彼此對齊。經過一段時間後,系統停止並且連接最少對齊頂點對的邊被移除。然後,演變開始,沒有刪除的邊,並經過足夠的刪除輪次後,每個社區成為一個連接組件。所提出的方法使用廣泛接受的基準和實際網路進行評估。實驗結果表明,該方法是健壯的,擅長各種網路。而且,對於大型稀疏網路,邊去除過程以準線性時間運行,這使得可以在大規模網路中進行應用。
多輪影響最大化(擴展版)
原文標題: Multi-Round Influence Maximization (Extended Version)
地址: http://arxiv.org/abs/1802.04189
作者: Lichao Sun, Weiran Huang, Philip S. Yu, Wei Chen
摘要: 在本文中,我們研究多輪影響最大化(MRIM)問題,其中影響在多個回合中獨立於可能不同的種子集進行傳播,目標是為每個回合選擇種子以最大化期望的被激活的節點數量至少在一輪中。 MRIM問題模擬了廣告客戶進行多輪病毒式營銷以推廣一種產品的病毒式營銷方案。我們考慮兩種不同的設置:1)非自適應MRIM,其中廣告商需要首先確定用於所有輪次的種子集合,以及2)自適應MRIM,其中廣告商可以基於傳播自適應地選擇種子集合導致前幾輪。對於非自適應設置,我們設計了兩種演算法,這兩種演算法在效率和有效性之間展現出一個有趣的折衷:一種跨全局貪婪演算法,可在全局水平上選擇種子並實現1/2? varepsilon近似比率,圓周貪婪演算法,它可以一輪一輪地選擇種子,並實現$ 1 -e ^ { - (1-1 / e)} - varepsilon approx 0.46 - varepsilon $近似比率,但將運行時間減少一個與輪數相關的因子。對於自適應設置,我們設計一個自適應演算法,保證自適應最優解的$ 1-e ^ { - (1-1 / e)} - varepsilon $近似。在所有情況下,我們進一步設計基於反向影響採樣方法的可擴展演算法,並實現接近線性的運行時間。我們在幾個真實世界的網路上進行實驗,並證明我們的演算法對於MRIM任務是有效的。
貨物檢驗中多原子伽馬射線照相術有效原子序數識別的實驗驗證
原文標題: Experimental Demonstration of Multiple Monoenergetic Gamma Radiography for Effective Atomic Number Identification in Cargo Inspection
地址: http://arxiv.org/abs/1802.04225
作者: Brian S. Henderson, Hin Y. Lee, Thomas D. MacDonald, Roberts G. Nelson, Areg Danagoulian
摘要: 通過國際邊界走私特殊核材料(SNM)可能導致核恐怖主義,並對全球安全構成重大威脅。本文介紹了一種用於推斷商業貨物集裝箱中物質的密度和類型的新型射線照相技術的實驗演示,以此作為檢測這些威脅的手段。與傳統的使用能量連續分布的bre致輻射光子源的技術不同,該技術利用來自核反應的單能光子,特別是來自11 B(d,n gamma)的4.4和15.1 MeV光子, 12 C反應。通過在這兩個比能量下利用光子相互作用截面的Z - 依賴性,可以同時確定面積密度和有效原子序數作為被掃描物體的2D投影的位置的函數。從使用和檢測特定能量的光子獲得的附加信息大大增加了不同材料之間的分辨能力。本文介紹了模擬貨物材料成像的結果,範圍從Z approx5 text?92,展示了整個範圍內材料的有效原子序數和面密度的精確重建。特別是,該系統能夠區分純物質,例如鉛和鈾 - 這是設計用於檢測SNM的系統的關鍵要求。這種方法可用於區分大多數良性材料與SNM,如鈾和鈈,從而將假陽性降低到可接受的速度。
用比特幣購買咖啡:真實世界部署比特幣銷售點終端
原文標題: Buy your coffee with bitcoin: Real-world deployment of a bitcoin point of sale terminal
地址: http://arxiv.org/abs/1802.04236
作者: Shayan Eskandari, Jeremy Clark, Abdelwahab Hamou-Lhadj
摘要: 在本文中,我們將討論比特幣支付的現有方法,適用於小額交易的小企業。我們利用安全性,可用性,可部署性標準開發評估框架,檢查幾個現有的系統和工具。遵循需求工程方法,我們設計,實施了一個新的銷售點(PoS)系統,該系統在我們的評估框架內滿足了一套最佳標準。自2014年10月以來,我們的開源系統Aunja PoS已部署在現實世界的咖啡廳。
DiSLR:有限冗餘的分散式採樣,用於圖流中的三角形計數
原文標題: DiSLR: Distributed Sampling with Limited Redundancy For Triangle Counting in Graph Streams
地址: http://arxiv.org/abs/1802.04249
作者: Kijung Shin, Euiwoong Lee, Jinoh Oh, Mohammad Hammoud, Christos Faloutsos
摘要: 給定一個隨時間增長的網路規模圖,如何在多台機器上存儲和處理其邊以便快速準確地估計三角形的數量?在許多應用中,三角形(即三號的派系)的數量已被證明是有用的,包括異常檢測,社區檢測和鏈接推薦。對於大型和動態圖中的三角形計數,最近的工作主要集中在流演算法和分散式演算法。為了實現這兩種方法的優點,我們提出了DiSLR,這是一種分散式流式演算法,用於估算與每個節點相關的全局三角形和局部三角形的數量。通過輸入流,DiSLR可以仔細處理並將邊存儲在多台機器上,從而最大限度地減少對計算和存儲資源的冗餘使用。與其最優秀的競爭對手相比,DiSLR具有以下特點:(a)準確:最高可減少39倍的估計誤差;(b)快速:高達10.4倍;與輸入流中的邊線性成比例;(c) :隨著機器數量的增加,產生無偏估計,並且差異越快越快。
聲明:Arxiv文章摘要版權歸論文原作者所有,由本人進行翻譯整理,未經同意請勿隨意轉載。本系列在微信公眾號「網路科學研究速遞」(微信號netsci)和個人博客 https://www.complexly.me (提供RSS訂閱)進行同步更新。
推薦閱讀:
※Arxiv網路科學論文摘要9篇(2018-02-16)
※Arxiv網路科學論文摘要11篇(2018-02-02)
※Arxiv網路科學論文摘要10篇(2018-02-07)
※23rd International Symposium on Mathematical Theory of Networks and Systems (MTNS2018) 徵稿啟事
※Arxiv網路科學論文摘要12篇(2018-02-14)