Arxiv網路科學論文摘要12篇(2018-08-28)
來自專欄網路科學研究速遞3 人贊了文章
- 網路中的多核心-邊緣結構;
- 理論驅動的自殺推文自動內容分析:使用基於典型的LDA數據集分類;
- 在公用設施線路中斷數據中發現Zipf分布和級聯傳播度量;
- 表徵社交媒體用戶用於諷刺檢測;
- 時間依賴分組觀測的網路推斷;
- 當事實無效:社會網路中的偏見,兩極分化和真實;
- 突然投票中社交媒體用戶的立場:希臘公投的案例;
- 基於提升低秩矩陣逼近的多層網路嵌入;
- 用於從帶干擾的實驗估算全局治療效果的回歸調整;
- 具有恢複數據的大規模空間中的人類遷移模式;
- R0無法預測存在自然增強免疫力情況下的爆發潛力;
- 開放心智模仿可以實現接近最佳的疫苗接種覆蓋率;
網路中的多核心-邊緣結構
原文標題: Multicores-periphery structure in networks
地址: http://arxiv.org/abs/1605.03286
作者: Bowen Yan, Jianxi Luo
摘要: 許多現實世界的網路呈現出多核外圍結構,在多個核心中具有密集連接的頂點,由稀疏連接的頂點的一般外圍圍繞。識別多核 - 外圍結構可以提供新的透鏡來理解各種現實世界網路的結構和功能。本文定義了多核外圍結構,並介紹了一種演算法,用於識別一般網路中多核和外圍的最佳劃分。我們通過將其應用於眾所周知的社會網路和專利技術網路來證明我們的演算法的性能,其最佳特徵在於多核 - 外圍結構。分析還揭示了我們的多核 - 外圍檢測演算法與用於檢測單核 - 外圍結構和群落結構的兩種最先進演算法之間的差異。
理論驅動的自殺推文自動內容分析:使用基於典型的LDA數據集分類
原文標題: Theory-Driven Automated Content Analysis of Suicidal Tweets : Using Typicality-Based Classification for LDA Dataset
地址: http://arxiv.org/abs/1808.08331
作者: Joon-Mo Park, Chul-joo Lee, Yunseok Jang
摘要: 本研究為計算機根據計划行為理論的變數對推文進行分類提供了一種方法框架。我們提出了一個自動文本分析的順序過程,它結合了監督方法和無監督方法,以使計算機檢測每個推文中的一個TPB變數。我們進行了潛在Dirichlet分配(LDA),最近鄰,然後評估新標記的推文的「典型性」,以預測分類邊界。此外,這項研究報告了自殺相關推文的內容分析結果,該推文識別了Twitter中信息環境的特徵。與現存的關於自殺報道的文獻一致,調查結果表明,推文通常包含的信息可以促使人們對自殺行為進行控制,但很少提供有關自殺的信息。最後,我們強調了對方法學進步和經驗理論研究的啟示。
在公用設施線路中斷數據中發現Zipf分布和級聯傳播度量
原文標題: Finding a Zipf distribution and cascading propagation metric in utility line outage data
地址: http://arxiv.org/abs/1808.08434
作者: Ian Dobson
摘要: 觀察到的傳輸線中斷數據被分組為連續的幾代事件。級聯中的世代數的經驗分布遵循Zipf分布,其意味著隨著級聯的進展而增加的傳播。 Zipf分布的斜率給出系統事件傳播斜率指數(SEPSI)。該新指標量化級聯傳播,按預期變化,並確定小,中和大級聯的概率。
表徵社交媒體用戶用於諷刺檢測
原文標題: Representing Social Media Users for Sarcasm Detection
地址: http://arxiv.org/abs/1808.08470
作者: Y. Alex Kolchinski, Christopher Potts
摘要: 我們探索了兩種在文本諷刺檢測環境中表示作者的方法:貝葉斯方法直接表示作者的諷刺傾向,以及密集的嵌入方法,可以學習作者和文本之間的相互作用。使用Reddit注釋的SARC數據集,我們表明用這些表示來增強雙向RNN可以提高性能;貝葉斯方法在均勻上下文中就足夠了,而密集嵌入的附加功率在更多樣化的方面證明是有價值的。
時間依賴分組觀測的網路推斷
原文標題: Network Inference from Temporal-Dependent Grouped Observations
地址: http://arxiv.org/abs/1808.08478
作者: Yunpeng Zhao
摘要: 在社會網路分析中,觀察到的數據通常是一些社會行為,例如群體的形成,而不是明確的網路結構。 Zhao和Weko(2017)提出了一種基於模型的方法,稱為中心模型,用於從分組觀察中推斷隱式網路。中心模型假定組之間的獨立性,有時在實踐中無效。在本文中,我們將中心模型的概念概括為具有時間依賴性的分組觀測的情況。與中心模型一樣,我們假設每個時間點的組由一個領導者收集。與中心模型不同,組長不是獨立採樣,而是遵循馬爾可夫鏈,相鄰組中的其他成員也可以相關。針對該模型開發了期望最大化(EM)演算法,並且針對E步驟提出了多項式時間演算法。在不同的模擬設置下評估新模型的性能。我們將此模型應用於Kibale Chimpanzee項目的數據集。
當事實無效:社會網路中的偏見,兩極分化和真實
原文標題: When facts fail: Bias, polarisation and truth in social networks
地址: http://arxiv.org/abs/1808.08524
作者: Orowa Sikder, Robert E. Smith, Pierpaolo Vivo, Giacomo Livan
摘要: 在線社交媒體為用戶提供了前所未有的機會來參與各種意見。同時,它們允許個人通過主動(確認偏見)和被動(個性化新聞演算法)自我強化機制自我選擇他們想要接觸的敘述來傳播錯誤信息。對這種權衡的精確理論理解仍然在很大程度上缺失。我們引入了一個程式化的社交學習模型,網路中的大多數參與者基於新信息的到來,無偏見地更新他們的信念,而一小部分參與者顯示確認偏差,使他們能夠拒絕與其先前存在的信念不一致的新聞。我們表明,這種簡單的確認偏差機制可以產生永久的意見極化。此外,該模型導致無偏見的代理人表現出「好像」他們有偏見的狀態,因為他們的偏見鄰居有效地充當了看門人,限制了他們獲取自由和多樣化的信息。我們得出了個體代理人信念分布的分析結果,明確地證明了上述在確認偏差和社會連通性之間的權衡,我們進一步驗證了美國縣級數據,即互聯網接入對全球信仰形成的影響。變暖。我們的研究結果表明,通過保留社會網路中的信息多樣性,小劑量的確認偏差實際上可以提高個體的準確性。然而,結果還表明,當確認偏差超過最佳值時,準確度會下降,因為有偏見的代理人會限制信息流向子組。我們討論了模型的政策含義,突出了揭穿策略的缺點,並提出了對比錯誤信息的替代策略。
突然投票中社交媒體用戶的立場:希臘公投的案例
原文標題: Nowcasting the Stance of Social Media Users in a Sudden Vote: The Case of the Greek Referendum
地址: http://arxiv.org/abs/1808.08538
作者: Adam Tsakalidis, Nikolaos Aletras, Alexandra I. Cristea, Maria Liakata
摘要: 在社交媒體中對用戶投票意圖進行建模是一個重要的研究領域,應用於分析選民行為,在線政治競選和廣告。以前的方法主要側重於預測全國大選,這些大選是定期安排的,並且可以獲得過去結果和民意調查的數據。但是,沒有證據表明在時間緊迫的情況下突然投票期間這些模型將如何表現。與傳統選舉相比,這帶來了更具挑戰性的任務,因為它具有自發性。在本文中,我們關注2015年希臘救助公投,旨在每天預測2,197名Twitter用戶的投票意向。我們提出了一種半監督的多卷積核學習方法,利用時間敏感的文本和網路信息。我們在實時模擬框架下的評估證明了我們的方法對競爭基線的有效性和穩健性,與僅基於文本的模型相比,F分數顯著增加了20%。
基於提升低秩矩陣逼近的多層網路嵌入
原文標題: Multi-Level Network Embedding with Boosted Low-Rank Matrix Approximation
地址: http://arxiv.org/abs/1808.08627
作者: Jundong Li, Liang Wu, Huan Liu
摘要: 與手動特徵工程相比,繁瑣且難以擴展,網路表示學習吸引了大量研究興趣,因為它自動化了圖上的特徵學習過程。所學習的低維節點向量表示是可推廣的,並且通過使得能夠直接應用各種現成的機器學習工具來簡化圖上的知識發現過程。最近的研究表明,過去十年的網路嵌入方法要麼明確地分解精心設計的矩陣以獲得低維節點向量表示,要麼與隱式矩陣分解密切相關,其基本假設是分解節點連接矩陣低 - 秩。儘管如此,當分解矩陣對複雜節點交互進行編碼時,全局低秩假設不一定成立,並且所得到的單個低秩嵌入矩陣不足以捕獲所有觀察到的連接模式。在這方面,我們提出了一種新穎的多級網路嵌入框架BoostNE,它可以學習從粗到細的不同粒度的多個網路嵌入表示,而不會強加普遍的全局低秩假設。所提出的BoostNE方法也與集成學習中成功的梯度增強方法一致,因為多個弱嵌入導致更強和更有效的嵌入。我們通過將其與各種數據集上現有的最先進的網路嵌入方法進行比較來評估所提出的BoostNE框架的有效性,並且實驗結果證實了所提出的BoostNE網路嵌入框架的優越性。
用於從帶干擾的實驗估算全局治療效果的回歸調整
原文標題: Regression Adjustments for Estimating the Global Treatment Effect in Experiments with Interference
地址: http://arxiv.org/abs/1808.08683
作者: Alex Chin
摘要: 在存在干擾的情況下,全球平均治療效果的標準估計可能存在偏差。本文提出了回歸調整估計器,用於消除伯努利隨機實驗中由於干擾引起的偏差。我們使用擬合模型來預測全球控制和全球治療的反事實結果。我們的工作與標準回歸調整的不同之處在於調整變數是根據治療分配向量的函數構建的,我們允許研究人員使用與響應相關的任何函數的集合,將檢測干擾的問題轉化為特徵工程問題。我們在線性模型設置中表徵所提出的估計器的分布,並將結果與??SUTVA下的回歸調整的標準理論聯繫起來。然後,我們提出了一種估計器,允許靈活的機器學習估計器用於擬合非線性干涉函數形式,借鑒雙機學習文獻中的思路。我們建議通過自舉和重採樣方法進行統計推斷,這使我們能夠迴避干擾所隱含的複雜依賴性,而是依賴於經驗協方差結構。這種方差估計依賴於外生假設,類似於觀察研究中引用的標準無混淆假設。在模擬實驗中,我們的方法比基於鄰域暴露建模的現有反向傾向加權估計更好地進行偏差估計。我們用我們的方法重新分析了一項關於中國農村一系列村莊採用天氣保險的實驗。
具有恢複數據的大規模空間中的人類遷移模式
原文標題: Human migration patterns in large scale spatial with the resume data
地址: http://arxiv.org/abs/1808.08741
作者: Qi Nie, Jian-Jun Wu, Xiao-Yong Yan, Jin-Hu Liu, Jun Wang
摘要: 人類流動性研究在很多方面都取得了很大進展,但由於難以獲取家庭數據,長期和遠程遷移行為缺乏深入而廣泛的研究。在本文中,我們使用簡曆數據來發現大規模範圍內的人類遷移行為。研究發現,反映人口競爭影響的流動結構的不對稱性是由城市間的吸引力差異引起的。該流動結構可以通過空間經濟學的引力模型近似描述。此外,引力模型中距離函數的比例指數值小於短期旅行行為的值。這意味著,與短期旅行行為相比,長期的人類遷移行為不那麼敏感。此外,研究了引力模型中每個變數的尺度係數。結果表明,經濟水平是移民的主要因素。
R0無法預測存在自然增強免疫力情況下的爆發潛力
原文標題:
fails to predict the outbreak potential in the presence of natural-boosting immunity
地址: http://arxiv.org/abs/1808.08749
作者: Yukihiko Nakata, Ryosuke Omori
摘要: 由於減弱和增強免疫力,宿主在個體水平上隨時間變化的易感性已經引起疾病傳播動力學的豐富的長期行為。同時,儘管大量可用的流行病學數據是短期流行病,但主觀易感性的時變異質性對流行病的射擊期行為的影響尚未得到充分研究。在這裡,我們構建了一個簡約的數學模型,描述短期傳遞動力學,考慮到通過再感染提高自然增強免疫力,並獲得了我們模型的顯式解決方案。我們發現我們的系統顯示「流行病延遲」,流行病在流行病初始階段流行曲線的負斜率後起飛,此外還有標準SIR模型中的常見分類,即「無流行病」為 mathcal {R} _ {0} leq1 或正常流行為 mathcal {R} _ {0}> 1 。使用顯式解決方案,我們得出每個分類的條件。
開放心智模仿可以實現接近最佳的疫苗接種覆蓋率
原文標題: Open-minded imitation can achieve near-optimal vaccination coverage
地址: http://arxiv.org/abs/1808.08789
作者: Ying Xin, David Gerberry, Winfried Just
摘要: 理性個體對自願接種決策的研究預測,人口將達到納什均衡,疫苗接種覆蓋率低於社會最優。人類決策涉及除自身利益的理性計算之外的機制,例如模仿成功的其他人。以前的研究表明,單靠模仿無法取得更好的效果。在參數的現實選擇下,它可能導致平衡疫苗接種覆蓋甚至低於納什均衡。然而,這些發現依賴於廣泛接受的Fermi函數用於模擬轉換到另一策略的概率。我們在這裡考慮切換概率的更一般的功能形式。它與在廣泛引用的心理學實驗中最符合經驗數據的函數一致,並涉及一個額外的參數 alpha 。這個參數可以被寬泛地解釋為一種開放的程度。我們通過模擬和分析發現,足夠高的 alpha 值將使平衡疫苗接種覆蓋率任意接近社會最優。
聲明:Arxiv文章摘要版權歸論文原作者所有,由本人進行翻譯整理,未經同意請勿隨意轉載。本系列在微信公眾號「網路科學研究速遞」(微信號netsci)和個人博客 https://www.complexly.me (提供RSS訂閱)進行同步更新。複雜系統
推薦閱讀:
※node2vec: Scalable Feature Learning for Networks文章閱讀
※Arxiv網路科學論文摘要6篇(2018-07-31)
※Arxiv網路科學論文摘要6篇(2018-07-04)
※Arxiv網路科學論文摘要8篇(2018-04-20)
※複雜網路綜述1——簡介