Arxiv網路科學論文摘要16篇(2018-04-10)

  • 大型田野調查中的班級出勤率、同輩相似度和學習成績;
  • 激勵社會網路真相而非假新聞的傳播;
  • Quootstrap:利用自助法無監督可擴展地提取大型新聞語料庫中引言-發言人組合;
  • 通過一種新方法探索Lent對婚姻和生育的影響;
  • 起點-終點信息對疫情傳播的影響;
  • 滲透社會網路:背後的問題;
  • 在真實世界的擴散網路中定位源頭;
  • 我們可以依靠社交媒體指標嗎?對社會化媒體活躍學術使用的第一個見解;
  • 自動整合一個學術領域的全面普查;
  • 基於開源軟體社區網路成長模型的社區分析;
  • 肥胖和糖尿病推特話語中的信息來源和需求;
  • 個性化的PageRank維度和演算法影響;
  • 指數增長網路中相關性的衰減;
  • 低電壓需求的短期負荷預測和天氣的影響;
  • 綜合複雜網路中多態過程的近似主方程;
  • 弱雜訊限制下的平均場博弈:福克-普朗克方程的WKB方法;

大型田野調查中的班級出勤率、同輩相似度和學習成績

原文標題: Class attendance, peer similarity, and academic performance in a large field study

地址: arxiv.org/abs/1702.0126

作者: Valentin Kassarnig, Andreas Bjerre-Nielsen, Enys Mones, Sune Lehmann, David Dreyer Lassen

摘要: 識別決定學業成績的因素是教育研究的重要組成部分。現有研究表明,班級出勤率是後續課程成績的有用預測指標。然而,大多數文獻都是基於調查和自我報告的方法,這些方法具有眾所周知的系統偏見,導致對結論和普遍性的限制以及實施成本高昂。在這裡,我們提出了一種測量班級出勤率的新方法,通過使用從智能手機感測器收集的位置和藍牙數據來克服這些限制。根據近1000名本科生的出勤率數據,我們證明早期和一致的班級出勤與學業成績密切相關。此外,我們的新穎數據集使我們能夠確定社交同伴之間的出勤率是基本相關的($> 0.5美元),表明或者是重要的同伴效應,或者與出席率相同。

激勵社會網路真相而非假新聞的傳播

原文標題: Incentivizing the Dissemination of Truth Versus Fake News in Social Networks

地址: arxiv.org/abs/1804.0250

作者: Abbas Ehsanfar, Mo Mansouri

摘要: 作為一種公共物品的真理概念是一種集體理解的產生,這種理解來源於複雜的社會互動網路。社會網路最近對塑造政治領域真相感受的影響表明,這種看法如何得到在線用戶的共同確認和確立。然而,考慮到大量的在線信息,用於發現真相的調查性新聞報道是一個昂貴的選擇。在某些情況下,記者和在線用戶都選擇不調查他們收到的新聞的真實性,因為他們認為網路的其他角色承擔了驗證費用。因此,新的「假新聞」現象已經出現在社會網路的背景下。在線社會網路與系統系統類似,導致新興性質,鑒於多種來源的可用性,這使得認證過程變得困難。在這項研究中,我們展示了如何將這種衝突模擬為志願者的困境。我們還展示了通過新聞訂閱(共享獎勵)的公眾貢獻如何影響網路中虛假新聞的真相優勢。

Quootstrap:利用自助法無監督可擴展地提取大型新聞語料庫中引言-發言人組合

原文標題: Quootstrap: Scalable Unsupervised Extraction of Quotation-Speaker Pairs from Large News Corpora via Bootstrapping

地址: arxiv.org/abs/1804.0252

作者: Dario Pavllo, Tiziano Piccardi, Robert West

摘要: 我們從大型新聞語料庫中提出Quootstrap,一種提取引文的方法,以及發表他們的發言人的名字。儘管之前的工作主要是通過有監督的機器學習來解決這個問題,但我們的方法遵循完全無監督的引導範例。它利用了大型新聞語料庫中存在的冗餘,更確切地說,在稍有不同的情況下,多條新聞文章中經常會出現相同的引語。從少數種子模式開始,如[「Q」,S表示),我們的方法提取一組引用 - 說話者對(Q,S),這些對又被用於發現表達相同引用的新模式;然後用較大的圖案集重複該過程。我們的演算法具有高度可擴展性,我們通過在大型ICWSM 2011 Spinn3r語料庫上運行該演算法進行演示。驗證我們的結果與眾包的地面真相對比,我們使用單種子模式在40%的召回率下獲得90%的精確度,對於更頻繁報道(因此可能更有趣)的報價,具有顯著更高的召回值。最後,我們通過分析我們提取的報價中表達的情緒,展示了我們的演算法輸出對於計算社會科學的有用性。

通過一種新方法探索Lent對婚姻和生育的影響

原文標題: The influence of Lent on marriages and conceptions explored through a new methodology

地址: arxiv.org/abs/1804.0257

作者: Claudiu Herteliu, Peter Richmond, Bertrand M. Roehner

摘要: Herteliu等人(2015)在其他地方分析了宗教節日對羅馬尼亞出生的影響。在這裡,我們通過研究Lent對婚姻和出生的影響(ii),通過分析其他一些國家允許與非正統國家進行比較來拓寬分析。我們還引入了一種新方法,通過這種方法可以將分析從與出生和婚姻的季節模式有關的偏差中解放出來。對婚姻和概念的影響之間的比較似乎特別令人感興趣,因為它可以一方面評估社會壓力的重量,另一方面評估個人傾向。我們的分析揭示了Lent對婚姻的強烈影響,東正教國家減少了80%,西歐天主教和新教國家減少了40%。由於Lent對概念的影響不受任何形式的直接社會控制的影響,人們可能會認為影響要小得多。以百分比計,它比婚姻效應大約小10倍。目前的方法為準確調查其他流動宗教時期(如齋月)對各種社會現象(如自殺)的影響開闢了道路。

起點-終點信息對疫情傳播的影響

原文標題: Impact of origin-destination information in epidemic spreading

地址: arxiv.org/abs/1804.0258

作者: Sergio Gómez, Alberto Fernández, Sandro Meloni, Alex Arenas

摘要: 聯絡網路的結構形成了流行過程的擴散。網路理論的最新進展提高了我們對大規模流行病學過程的理解。但是,在疫情傳播研究中還有幾個需要評估的問題仍然需要進行評估。其中一個考慮因素是考慮到流行病攜帶者流入中的起源地和目的地模式的影響。在這裡,我們計算與航空運輸網路中粗顆粒物流經驗數據相符的原點 - 目的地模式。我們研究流行病流行病的發生率,考慮流行病知識的不同選擇。考慮到來源和目的地流量的估算數據驅動情景與評估流行病在微觀層面上的影響(在我們的情景中,哪些人群受到感染)相關,而在考慮宏觀發生率時卻是不相關的(分數的感染人群)。這些結果有助於實施更好的計算平台來預測流行病的發病率。

滲透社會網路:背後的問題

原文標題: Penetrating a Social Network: The Follow-back Problem

地址: arxiv.org/abs/1804.0260

作者: Fanyu Que, Krishnan Rajagopalan, Tauhid Zaman

摘要: 現代威脅來自社會網路的盛行。敵對行為體,如極端主義團體或外國政府,利用這些網路開展不同目標的宣傳活動。對於極端主義者來說,這些活動旨在招募新成員或煽動暴力。對於外國政府來說,其目的可能是在競爭國家造成不穩定。正確的社會網路對策是抵制這些威脅所必需的。在這裡我們提出一個重要的對策:滲透社會網路。這意味著要讓目標用戶連接或關注社會網路中部署的代理。一旦與目標建立了這種聯繫,代理就可以通過分享影響活動的內容來影響他們。在這項工作中,我們研究如何滲透社會網路,我們稱之為後退問題。這裡的目標是找到一個最大化跟隨代理的目標數量的策略。我們進行實證研究以了解行為和網路特徵對代理之後目標的可能性有何影響。我們發現目標的程度和網路中代理和目標的相互鄰居的大小會影響這個概率。根據我們的實證研究結果,我們然後提出了一個模型,用於跟蹤代理人的目標使用這個模型,我們在有向無環圖上精確地解決後續問題,並導出一個閉包表達式,以表示代理在最優策略下接收到的期望數量。然後,我們將任意圖上的後續問題作為整數程序來制定。為了評估我們基於整數規劃的策略,我們在Twitter上對真實的社會網路拓撲進行了模擬。我們發現,我們的政策導致更有效的網路滲透,並且代理之後的預期目標數量顯著增加。

在真實世界的擴散網路中定位源頭

原文標題: Locating the Source in Real-world Diffusion Network

地址: arxiv.org/abs/1804.0272

作者: Shabnam Behzad, Arman Sepehr, Hamid Beigy, Mohammadzaman Zamani

摘要: 近年來,基於有限觀測確定傳播源的問題近年來得到了重大研究,因為它可以幫助減少不需要的感染造成的損害。在本文中,我們提出了一種有效的方法來查找最初將一條信息引入網路的節點,並推斷它啟動的時間。在受限觀察中將感染節點標記為觀察節點,將其他節點標記為隱藏節點,我們首先估計每個傳播跡線的隱藏節點與觀察節點之間的最短路徑。然後通過優化平方損失函數,找到隱藏節點中最好的節點作為源節點。本文介紹的方法基於更真實的情況,比以前的作品更容易和更實用。我們通過網路對現實世界的傳播進行的實驗表明,我們的方法在檢測真實來源方面的優越性,將最先進的方法的前十個精度從不到10%提高到約30%。另外,我們觀察到我們的源識別方法運行速度比以前的工作快10倍。

我們可以依靠社交媒體指標嗎?對社會化媒體活躍學術使用的第一個見解

原文標題: Can We Count on Social Media Metrics? First Insights into the Active Scholarly Use of Social Media

地址: arxiv.org/abs/1804.0275

作者: Maryam Mehrazar, Christoph Carl Kling, Steffen Lemke, Athanasios Mazarakis, Isabella Peters

摘要: 衡量研究影響力對於在學術搜索引擎和研究評估中對出版物進行排名很重要。社交媒體指標或信息量度衡量基於社交媒體活動的科學工作的影響。 Altmetrics與傳統的基於引用的度量標準是互補的。允許評估尚未提供引文的新出版物。儘管altmetrics越來越重要,但它們的特徵還沒有得到很好的理解:直到現在還沒有研究過哪些研究人員正在積極使用哪些社交媒體服務以及為什麼 - 這是科學影響預測的重要問題。根據對3,430位科學家的調查,我們發現了社交媒體服務之間以前未知和顯著的差異:我們確定分別吸引年輕和有經驗的研究人員的服務,並檢測使用動機的差異。我們的發現對未來的科學影響預測的信息量度的設計具有直接影響。

自動整合一個學術領域的全面普查

原文標題: Automatically assembling a full census of an academic field

地址: arxiv.org/abs/1804.0276

作者: Allison C. Morgan, Samuel F. Way, Aaron Clauset

摘要: 科學勞動力的組成構成了科學研究的方向,直接通過挑選問題進行調查,並間接通過其對未來科學家培訓的影響。然而,在大多數領域,難以獲得完整的人口普查信息,使研究勞動力動態和政策效應的努力複雜化。計算機科學尤其如此,因為它沒有一個單一的,包羅萬象的目錄或專業組織。全面的計算機科學普查將為許多目的服務,其中最重要的是更好地理解計算中不平等代表的趨勢和原因。先前的學術普查工作依賴於狹義或有偏見的樣本,或專業社會成員名單。全面的人口普查可以直接從在線的部門教員目錄中構建,但是手動這樣做是非常昂貴和耗時的。在這裡,我們介紹一個主題網路爬蟲,用於自動收集來自網路部門名錄的教員信息,並在美國和加拿大的205個博士授予計算機科學系展示由此產生的系統。這種方法可以在幾分鐘內完成對該領域的完整普查,並且達到99%以上的精確度和召回率。我們通過將2017年人口普查結果與手工策劃的2011年人口普查結果進行比較,以量化計算機科學尤其是女性教師的流動率和留存率,從而展示通過自動化人口普查建設實現的分析類型。

基於開源軟體社區網路成長模型的社區分析

原文標題: Analysis of the Social Community Based on the Network Growing Model in Open Source Software Community

地址: arxiv.org/abs/1804.0282

作者: Takumi Ichimura, Takuya Uemoto

摘要: 開源軟體開發者中的社區社區具有複雜的網路結構。網路結構代表軟體開發人員社區中項目與工程師之間的關係。一個項目組成一些由工程師組成的團隊,這些團隊由一些任務組組成。 Source Forge是眾所周知的開源網站之一。網路結構中的節點和弧代表SourceForge中的工程師及其工程師之間的連接。在之前的研究中,我們發現,根據參與項目的開發人員數量,項目的成長過程變得強勁。在成長階段,我們發現代理人數量和生產項目之間存在一些特徵模式。通過這樣的觀察,我們開發了一個執行項目成長過程的模擬模型。在本文中,我們將陸軍螞蟻模型中顯示的利他行為引入到軟體開發人員的模擬模型中。通過一些實驗模擬結果來研究軟體開發過程的效率。

肥胖和糖尿病推特話語中的信息來源和需求

原文標題: Information Sources and Needs in the Obesity and Diabetes Twitter Discourse

地址: arxiv.org/abs/1804.0285

作者: Yelena Mejova

摘要: 肥胖和糖尿病流行分別影響到美國人口的三分之一和十分之一,引起了國家和機構的關注。社交媒體為個人和衛生組織之間的溝通提供了一個公開的論壇,這個論壇很容易被各方尋求從中獲利。在本文中,我們檢查了150萬條關於肥胖和糖尿病的推文,以評估(1)本次會話中流傳的信息的質量,以及(2)參與其中的用戶的行為和信息需求。對頂級域名的分析表明,與肥胖和50%糖尿病樣本中41%沒有隸屬於政府或學術機構的健康信息源相比,包含這些域名的推文更多地被轉發的信息超過了信譽良好的域名源。在用戶方面,我們估計超過四分之一的非信息性肥胖話語含有脂肪羞辱 - 一種羞辱和批評超重個體的做法 - 一些自我指向作家本身。我們還發現這些數據集中提出的問題存在很大差異,包括肥胖定義為疾病,社會規範和政府政策。我們的研究結果表明需要解決社交媒體上健康信息的質量控制問題,以及需要圍繞這些疾病進行一種局部多樣的,心理層面的討論。

個性化的PageRank維度和演算法影響

原文標題: Personalized PageRank dimensionality and algorithmic implications

地址: arxiv.org/abs/1804.0294

作者: Daniel Vial, Vijay Subramanian

摘要: 包括互聯網,社會網路和電網在內的許多系統都可以用圖表來表示。在分析圖時,計算描述節點之間相對重要性或距離的分數通常很有用。一個例子是Personalized PageRank(PPR),它為每個節點賦值v一個向量,其i -th條目從v的角度描述了i -th節點的重要性。 PPR在許多應用中被證明是有用的,例如推薦誰應該在社會網路上跟隨誰(如果這個i -th條目很大,v可能有興趣跟隨i -th用戶)。不幸的是,計算n這樣的PPR向量(其中n是節點的數量)對於許多感興趣的圖是不可行的。在這項工作中,我們認為情況並非如此糟糕。我們的主要結果表明,PPR向量集的維度以高概率在n中次線性地進行尺度,對於某類隨機圖和維度類似於秩的概念。換句話說,我們認為,儘管包含這些向量的矩陣的排名為n,這個集合的有效維數遠小於n。此外,我們顯示這個維度測量與Jeh和Widom提出(但未分析)的PPR估計方案的複雜性密切相關。這使我們可以爭辯說,準確地估計所有n PPR向量就等於計算n2向量元素的一個消失部分(當我們的主要結果的技術假設得到滿足時)。最後,我們憑經驗證明,儘管假設我們的理論不成立,但在考慮真實世界網路時仍然存在類似的結論。

指數增長網路中相關性的衰減

原文標題: Decay of Relevance in Exponentially Growing Networks

地址: arxiv.org/abs/1804.0295

作者: Jun Sun, Steffen Staab, Fariba Karimi

摘要: 我們提出了一種新的基於附件的網路增長模型,以解釋增長網路的兩個性質:(1)節點度的冪律增長和(2)節點相關性的衰減。在優先連接模型中,節點獲取鏈接的能力受到其程度,適應度以及其相關性的影響,而該相關性通常會隨時間而衰減。在回顧了現有的模型之後,我們認為他們不能同時解釋上述兩個屬性(1)和(2)。我們發現,除了在許多系統中經驗觀察,隨著時間的推移,網路規模的指數增長是維持節點相關性衰減時節點度數的冪律增長的關鍵。因此,我們在模型中明確區分了事件時間和物理時間,並且表明在假設節點的相關性隨其年齡 t衰減的情況下,存在衰減函數$ f_R的解析解$,格式為$ f_R( tau)= tau ^ { - 1} $。正如我們的實驗所支持的,真實網路的其他性質,如冪律相似度分布仍然可以保留。這使得我們的模型有助於解釋和分析許多真實的系統,例如引用網路。

低電壓需求的短期負荷預測和天氣的影響

原文標題: Short Term Load Forecasts of Low Voltage Demand and the Effects of Weather

地址: arxiv.org/abs/1804.0295

作者: Stephen Haben, Georgios Giasemidis, Florian Ziel, Siddharth Arora

摘要: 短期負荷預測將在實施智能電網中發揮關鍵作用。他們需要優化低壓(LV)電網上廣泛的潛在網路解決方案,包括集成低碳技術(如光伏技術)和利用電池存儲設備。儘管需要準確的LV水平負荷預測,但以前的研究主要集中在使用智能儀錶數據預測個人住戶或建築物水平。在這項研究中,我們使用來自100個真實LV供料器的數據,在點和概率預測精度方面提供了各種方法的詳細分析。此外,我們調查溫度(實際和預測)對負荷預測精度的影響。我們介紹了LV預測精度驅動因素的一些重要結果,這些對LV網路的管理至關重要,並對預測措施進行了實證比較。

綜合複雜網路中多態過程的近似主方程

原文標題: Lumping the Approximate Master Equation for Multistate Processes on Complex Networks

地址: arxiv.org/abs/1804.0298

作者: Gerrit Gro?mann, Charalampos Kyriakopoulos, Luca Bortolussi, Verena Wolf

摘要: 複雜網路在人類社會和自然界中發揮著重要作用。隨機多態過程提供了一個強大的框架來模擬各種新興現象,例如流行病的動態或複雜網路上信息的傳播。近年來,平均場類型近似值作為分析和理解複雜網路動力學的工具而受到廣泛關注。他們通過假設具有相似本地結構的所有節點表現相同來減少模型的複雜性。在這些方法中,近似主方程(AME)通過考慮節點的整個鄰域來提供複雜網路動態的最準確描述。典型網路的大小雖然呈現出多態AME不可行的數值解。在這裡,我們提出了一種有效的AME數值解法,它利用結構相似的節點組的微分方程之間的相似性。我們將大量類似的方程聚集在一起,並且每個聚類只解決單個集總方程。我們的方法允許將AME應用於真實世界的網路,同時保持其在計算全球網路屬性估計值時的準確性,例如給定時間的狀態中節點的比例。

弱雜訊限制下的平均場博弈:福克-普朗克方程的WKB方法

原文標題: Mean Field Games in the weak noise limit : A WKB approach to the Fokker-Planck equation

地址: arxiv.org/abs/1804.0309

作者: Thibault Bonnemain, Denis Ullmo

摘要: 通過研究被稱為「研討會問題」的平均場博弈玩具模型,我們考慮了特定漂移場的小雜訊體系中的Fokker-Planck方程。這使我們有機會討論WKB方法「a la Maslov」的擴散問題的應用,使得以特別透明的方式直接解決時間相關問題成為可能。

聲明:Arxiv文章摘要版權歸論文原作者所有,由本人進行翻譯整理,未經同意請勿隨意轉載。本系列在微信公眾號「網路科學研究速遞」(微信號netsci)和個人博客 https://www.complexly.me (提供RSS訂閱)進行同步更新。

推薦閱讀:

人人羅胖的跨年演講,你怎麼看?
調查報告:34%的美國Z世代年輕人正在遠離社交網路
機器也要搞社交網路?AI+機器社交網路——這家公司欲讓智能物聯網成真
好姑涼,不將就,不回頭。
Facebook為什麼要收購圖片社交應用Instagram?

TAG:複雜系統 | 複雜網路 | 社交網路 |