Arxiv網路科學論文摘要7篇(2018-05-07)
來自專欄 網路科學研究速遞
- tau輕粒子分支比是否服從本福德定律?;
- 書面文本句子長度的穩健性;
- 奧運比賽的引力模型;
- SURREAL:子圖穩健的表示學習;
- 分層網路和網路的網路的滲流;
- 局部疫苗接種和疫苗數量有限情況時流行病傳播中的多次爆發;
- 當政治家談論政治:識別巴西國會議員的政治推文;
tau輕粒子分支比是否服從本福德定律?
原文標題: Do tau lepton branching fractions obey Benfords law?
地址: http://arxiv.org/abs/1709.09823
作者: Aisha Dantuluri, Shantanu Desai
摘要: 根據本福德定律,許多數據集中最重要的數字不是均勻分布的,而是服從一個明確定義的冪律分布,而更小的數字更經常出現。在眾多可用的粒子物理數據集之一中,我們發現 tau lepton分支分數的前十進位數字與Benford分布預期的對數行為顯示邊界不一致。我們使用對二項數據有效的 chi2函數來量化與Benford定律的偏差,並且獲得九個自由度的16.9的 chi2值,其給出p -value約5 %,對應於1.6 sigma分歧。我們還檢查了在擴大分支比例的情況下分歧依然存在,並且通過用基數不同於10的數字系統重新進行分析。在所有數字中,「9」表示最大差異超過4美元/西格瑪$。這種差異是因為對於三組不同的相關模式重複數字「9」,每組有兩或三個頻率,導致重複計數。如果我們只計算一組相關模式一次,這個數字的差異也會消失,並且我們會與本福德分布得到原始的一致。
書面文本句子長度的穩健性
原文標題: Robustness of sentence length measures in written texts
地址: http://arxiv.org/abs/1805.01460
作者: Denner S. Vieira, Sergio Picoli, Renio S. Mendes
摘要: 書面文本中的隱藏結構模式在過去幾十年中一直是相當大的研究課題。特別是,將文本映射為句子長度的時間序列是調查文本結構的一種自然方式。通常,通過使用基於單詞數量和字元數量的量度來對句子長度進行量化,但是其他變體也是可能的。為了量化不同句子長度量度的穩健性,我們分析了一個包含約五百本英文書籍的資料庫。對於每本書,我們提取了六種不同的句子長度度量,包括字數和字元數(考慮到詞形和停用詞的刪除)。我們通過使用i)Pearson係數來調查每一本書的這六個度量來調查線性相關性; ii)Kolmogorov - Smirnov檢驗比較分布;和iii)去趨勢波動分析(DFA)來量化自相關。我們發現,所有六個措施都表現出非常相似的行為,這表明句子長度是與文本結構有關的強有力措施。
奧運比賽的引力模型
原文標題: Gravity model for dyadic Olympic competitions
地址: http://arxiv.org/abs/1805.01488
作者: Hyeseung Choi, Hyungsoo Woo, Ji-Hyun Kim, Jae-Suk Yang
摘要: 在奧運會上,代表國家的專業運動員不分經濟,政治和文化差異而競爭。在這項研究中,我們應用引力模型來觀察特徵,以夏季奧運期間直接相互競爭的國家之間的距離來表示。我們使用由1952年至2016年奧運會獎牌獲勝國組成的二元數據。為了比較冷戰期間和之後的動態變化,我們將數據分為兩個時間段(1952-1988年和1992-2016年)。我們的研究與以往的研究有所不同,我們在觀察奧運動態時重新引入了引力模型的應用。我們的研究結果表明,在整個研究期間,參加奧運會決賽比賽的國家在經濟規模上趨於相似。冷戰後,更頻繁競爭的國家對往往在遺傳起源上相似。
SURREAL:子圖穩健的表示學習
原文標題: SURREAL: SUbgraph Robust REpresentAtion Learning
地址: http://arxiv.org/abs/1805.01509
作者: Saba A. Al-Sayouri, Danai Koutra, Evangelos E. Papalexakis, Sarah S. Lam
摘要: 圖嵌入或節點表示學習在各種下游任務(如節點分類,鏈路預測和推薦系統)中的成功導致其近年來受到歡迎。表示學習演算法旨在通過識別節點鄰域概念來保持局部和全局網路結構。然而,許多現有的演算法生成的嵌入不能適當地保留網路結構,或者導致由於隨機過程(例如隨機遊走產生上下文)而導致不穩定的表示,並且因此不能產生多圖問題。在本文中,我們提出了一個使用連接子圖演算法的穩健圖嵌入演算法,題為SURREAL,一種新穎的穩定圖嵌入演算法框架。 SURREAL通過使用圖與電路的類比來學習使用連接子圖的圖表示。它保留了本地和全球連接模式,並解決了高度節點的問題。此外,它利用弱基線和被基線忽略的元數據的優勢。實驗表明,SURREAL在多標籤分類問題上的性能優於最新演算法,最高可達36.85%。此外,與基線相反,SURREAL是確定性的,是完全穩定的。
分層網路和網路的網路的滲流
原文標題: Percolation of Hierarchical Networks and Networks of Networks
地址: http://arxiv.org/abs/1805.01522
作者: Louis M. Shekhtman, Shlomo Havlin
摘要: 許多工作致力於在不同程度的故障下研究網路和互相依賴的網路的滲透。研究人員已經考慮了許多不同的現實網路結構,但迄今為止還沒有研究將許多網路的分層結構結合起來。例如,跨城市的基礎設施可能會被分配,使得節點在小型社區內緊密連接,整個城市的連接稍差,並且城市之間的連接更少。此外,雖然以前的工作確定了互聯節點,但是這些節點與鄰近區域之外的鏈接更容易受到攻擊,這裡我們有各種級別的互連(鄰居之間,城市之間等等)。我們認為最高級別互連的節點最有可能受到攻擊,其次是那些互連級別較高的節點,等等。我們為這種結構的單個和相互依賴的網路開發了一個分析解決方案,並通過模擬來驗證我們的理論。我們發現,根據層次結構中層次的數量,巨型組件(互連節點的一部分)中可能存在多個轉換,因為網路在各個層次分離。我們的結果表明,這些多跳是分層網路的一個特徵,並且可能會影響基礎架構網路的脆弱性。
局部疫苗接種和疫苗數量有限情況時流行病傳播中的多次爆發
原文標題: Multiple outbreaks in epidemic spreading with local vaccination and limited vaccines
地址: http://arxiv.org/abs/1805.01564
作者: M. A. Di Muro, L. G. Alvarez-Zuzek, S. Havlin, L. A. Braunstein
摘要: 如何預防人類疾病的傳播對科學界來說是一個巨大的挑戰,迄今為止已有許多研究開發了免疫策略。然而,這些策略通常不認為醫療機構可??能有限的疫苗資源。在這份手稿中,我們探討了採用局部動態疫苗接種的易感染 - 感染復原(SIR)模型,並考慮了有限的疫苗。在這個模型中,與感染者接觸的易感者以概率 omega接種疫苗,然後以概率 beta感染。但是,當免疫個體的部分達到閾值VL?時,接種停止,之後只有感染是可能的。在穩定狀態下,除了臨界點 betac?和 omegac?,它們將非流行病與流行病相區分開來以外,我們還發現了另一個Vβ的變化點 beta?> betac?和 omega?< omegac?,這對應於一種新穎的不連續相變。這個臨界值將疫苗數量充足的階段與疾病強度足以用盡所有疫苗接種單位的階段分開。對於固定 beta的疾病,可以控制疫苗接種概率 omega,以便大幅度減少受感染個體的數量,從而有效利用可用疫苗。此外,系統的時間演變接近 beta?或 omega?,表明在感染高峰後,系統進入准靜止狀態,只有少數感染病例。但是如果沒有更多的疫苗,這些少數感染者可能會發起第二次爆發,以第二次感染高峰為代表。這種明顯的冷靜狀態可能是危險的,因為它可能導致誤導性的結論並放棄控制疾病的策略。
當政治家談論政治:識別巴西國會議員的政治推文
原文標題: When Politicians Talk About Politics: Identifying Political Tweets of Brazilian Congressmen
地址: http://arxiv.org/abs/1805.01589
作者: Lucas S. Oliveira, Pedro O. S. Vaz de Melo, Marcelo S. Amaral, José Ant?nio. G. Pinho
摘要: 自2013年6月,當巴西面臨一代人中最大規模和最重要的群體抗議活動時,政治危機正在發生。在這場危機中,巴西政客利用社交媒體與選民溝通,以保留或增加其政治資本。問題在於許多有爭議的話題正在過程中,議員可能更願意在他們的信息中避免這些主題。為了表徵這種行為,我們提出了一種方法,可以準確識別發布它的代理商和發布時間的政治和非政治推文。此外,我們收集了所有在Twitter上活躍並在2013年10月至2017年10月期間在巴西議會工作的議員的推文。為了評估我們的方法,我們使用了詞雲和主題模型來確定主要的政治和非政治潛在主題在議會的推文。這兩個結果都表明我們的提案能夠準確區分政治和非政治推文。此外,我們的分析顯示了一個顯著的事實:巴西代表發布的信息中超過一半是非政治性的。
聲明:Arxiv文章摘要版權歸論文原作者所有,由本人進行翻譯整理,未經同意請勿隨意轉載。本系列在微信公眾號「網路科學研究速遞」(微信號netsci)和個人博客 https://www.complexly.me (提供RSS訂閱)進行同步更新。
推薦閱讀:
※為什麼你的善良,有時得不到別人的善良
※4· |網路新生時代俗稱自己為「寶寶們」
※這些生活常識,你肯定不知道!
※音樂是秘密,你已經暴露了自己
※產品經理常見問題