Arxiv網路科學論文摘要12篇(2018-04-09)
- 雙向流中的行人旋轉測量;
- 尋找社區族譜:新社區如何從舊社區湧現;
- 適用於規模化圖學習的自適應擴散;
- 使用遞歸神經網路在非同步社交媒體流中建模流行性;
- 使用鏈接的開放數據識別來自Micropost集合的主題;
- 外匯交易和Twitter:垃圾郵件,機器人和信譽操縱;
- 基於維基百科的社交媒體活動分析方法;
- 一個破壞數字社區的簡單招數;
- 莫蘭過程的相變和演算法結果;
- 字元限制如何影響Microposts的風格和成功:Twitter從140字切換到280字的情況;
- 從比特幣到比特幣現金:網路分析;
- 面向複雜系統的信息幾何表徵/分類:II. 來自(c,d)流形的臨界參數值;
雙向流中的行人旋轉測量
原文標題: Pedestrians rotation measurement in bidirectional streams
地址: http://arxiv.org/abs/1610.07185
作者: Claudio Feliciani, Katsuhiro Nishinari
摘要: 這項研究提出了一個實驗測量行人在雙向流動中的身體旋轉。使用放置在方位角位置的攝像頭監控模型走廊,用於研究行人在單向和雙向流動中的行為。此外,商用平板電腦被固定在樣本行人的胸部,以檢查他們的身體旋轉(或偏航),這是單獨使用位置跟蹤無法獲得的。記錄角速度並同時使用無線網路存儲在中央位置,從而以高採樣率和有限的延遲分析身體運動。為了研究主要/次要流量比(流量比)對雙向流的影響,測試了兩種不同的情況:平衡配置(兩個方向上流量相等)和不平衡配置(不同主要和次要流量)。結果清楚地表明,與雙向情況相比,單向流動更穩定,需要更少的時間穿過實驗部分並且在整個實驗期間顯示非常少量的旋轉。兩種雙向配置均顯示身體旋轉的高值,特別是在車道形成和溶解過程中。最後,通過分析行人的軌跡,直接測量行人身體的旋轉角度與間接獲得的旋轉角度進行比較。比較表明,至少從定性的角度來看,兩種方法是一致的,因此表明甚至只能通過運動感測來測量的性質可以通過軌跡分析間接獲得。總而言之,有人認為,儘管巷道有助於平滑雙向流動,但與單向情況相比,可觀察到更大的不穩定性。因此需要泳道分離和/或適當的指導。
尋找社區族譜:新社區如何從舊社區湧現
原文標題: Tracing Community Genealogy: How New Communities Emerge from the Old
地址: http://arxiv.org/abs/1804.01990
作者: Chenhao Tan
摘要: 新社區出現的過程是社會科學中的一個中心研究問題。雖然越來越多的研究通過研究個人之間的社會網路來分析單個社區的形成,但我們引入了一種以社區為中心的新視角。我們強調一個事實,即新社區出現的背景包含了許多現有的社區。我們通過追蹤其早期成員以前的社區成員來揭示社區的新興過程。我們的測試平台是Reddit,一個由數萬個用戶創建的社區組成的網站。我們分析一個跨越十年的數據集,其中包括從Reddit開始到2017年4月的Reddit上用戶的發布歷史。我們首先提出了一個用於在社區之間構建族譜圖的計算框架。我們介紹這樣的譜系圖的第一次大規模描述。令人驚訝的是,儘管社區數量隨著時間的推移迅速增加,但基本圖屬性(如父母數量和父母最大權重)會很快收斂。此外,我們調查了社區的起源與未來增長之間的關係。我們的研究結果表明,強大的父母關係與未來的社區發展息息相關,這證實了現有社區結構對新社區的重要性。最後,我們轉向個人層面,考察早期成員的特徵。我們發現,現有社區的多元化投資組合是成為新社區早期成員的最重要的預測指標。
適用於規模化圖學習的自適應擴散
原文標題: Adaptive Diffusions for Scalable Learning over Graphs
地址: http://arxiv.org/abs/1804.02081
作者: Dimitris Berberidis, Athanasios N. Nikolakopoulos, Georgios B. Giannakis
摘要: 基於擴散的分類器(例如那些依賴個性化PageRank和Heat內核的分類器)在適度的計算要求下享有卓越的分類準確性。然而,它們的性能受所選擴散捕獲通常未知的標籤傳播機制的程度的影響,其可能特定於底層圖,並且對於每個類可能不同。目前的工作引入了一種訓練有素,數據有效的方法來學習適用於底層網路拓撲的特定於類的擴散函數。這種新穎的學習方法利用了類特定的隨機遊走的「著陸概率」概念,可以有效地計算這些概念,從而確保大圖的可伸縮性。嚴格分析模型的屬性以及所提出的演算法可以支持這一點。此外,即使在嘈雜的環境中,分類器的強大版本也有助於學習。真實網路上的分類測試表明,將擴散函數與給定圖表和觀察標籤相匹配,顯著改善了固定擴散的性能;達到 - 並且多次超越 - 依賴於節點嵌入和深度神經網路的計算量更大的現代競爭方法的分類準確性。
使用遞歸神經網路在非同步社交媒體流中建模流行性
原文標題: Modeling Popularity in Asynchronous Social Media Streams with Recurrent Neural Networks
地址: http://arxiv.org/abs/1804.02101
作者: Swapnil Mishra, Marian-Andrei Rizoiu, Lexing Xie
摘要: 了解和預測在線項目的受歡迎程度是社交媒體分析中一個重要的公開問題。最近在數據驅動預測方面取得了很大進展,並將人氣與外部促銷聯繫起來。然而,現有方法通常關注單一來源的外部影響,而對於YouTube視頻或新聞文章等多種類型的在線內容,注意力是由多個不同來源同時驅動的 - 例如,微博或傳統媒體報道。在這裡,我們提出RNN-MAS,一種用於建模非同步流的遞歸神經網路。它是一個序列發生器,通過聯合推理連接多個不同粒度的流。我們展示RNN-MAS不僅要超過目前最先進的Youtube流行預測系統17%,還要捕捉複雜的動態,如季節性的未知影響趨勢。我們定義了兩個新指標:促銷評分量化Youtube視頻的一個促銷單元的受歡迎程度;響度級別捕捉特定用戶對視頻進行推特的效果。我們使用響度水平來比較一個受到高度關注的用戶(前1%的最受關注用戶)推動的視頻的效果,而不是由一群中期關注的用戶推廣。我們發現結果取決於正在推廣的內容類型:超級用戶在推廣Howto和Gaming視頻方面更為成功,而常規用戶隊列對Activism視頻更具影響力。這項工作提供了更準確和可解釋的流行預測,以及內容製作商和營銷商為促銷活動分配資源的計算工具。
使用鏈接的開放數據識別來自Micropost集合的主題
原文標題: Identifying Topics from Micropost Collections using Linked Open Data
地址: http://arxiv.org/abs/1804.02158
作者: Ahmet Y?ld?r?m, Suzan Uskudarli
摘要: 社交媒體廣泛用於分享和獲取信息,導致主題檢測模型的發展,以促進理解大量的短期和分散式職位。概率主題模型(如潛在狄利克雷分配)將主題表示為對許多自動過程有用的術語集。然而,確定一個話題是關於什麼是留給進一步的任務。或者,產生摘要的技術是人類可以理解的,但不太適合自動化處理。本工作提出了一種利用鏈接開放數據(LOD)資源從微博集合中提取語義表示主題的方法。所提出的方法利用實體鏈接從微博識別主題的元素。這些元素通過共現圖相關聯,這些圖被處理以產生主題。這些主題使用為此目的而引入的本體來表示。該方法的原型用於確定11個數據集中的主題,包括在各種事件期間從Twitter收集的超過100萬個帖子,如2016年美國大選辯論和Carrie Fisher的死亡。該方法的特點和超過5000個生成的主題進行了詳細描述。從30個隨機選擇的時間間隔對人物進行評估,結果精度為81.0%,F1得分為93.3%。此外,它們與具有兩種不同主題模型的相同數據集生成的主題進行比較。揭示信息的語義主題的潛力,這是不容易觀察到的,用各種複雜性的語義查詢來證明。
外匯交易和Twitter:垃圾郵件,機器人和信譽操縱
原文標題: Forex trading and Twitter: Spam, bots, and reputation manipulation
地址: http://arxiv.org/abs/1804.02233
作者: Igor Mozeti?, Peter Gabrov?ek, Petra Kralj Novak
摘要: 貨幣交易(外匯)是成交量最大的世界市場。我們分析三年期間歐元兌美元貨幣對的交易和推特。首先,手動標記大量推文,並構建推特姿態分類模型。然後,模型根據交易立場信號對所有推文進行分類:買入,持有或賣出(歐元兌美元)。通過應用金融經濟學中眾所周知的事件研究方法,Twitter的立場與實際貨幣匯率進行比較。事實證明,Twitter用戶群體分布和潛在交易收益存在很大差異:交易機器人,垃圾郵件發送者,貿易公司和個人交易者。此外,我們觀察到通過post ttstum刪除具有較差預測的推文來消除名譽操作的嘗試,以及刪除/重新發布相同的推文,以增加可見性而不會污染Twitter的時間表。
基於維基百科的社交媒體活動分析方法
原文標題: A Wikipedia-based approach to profiling activities on social media
地址: http://arxiv.org/abs/1804.02245
作者: Christian Torrero, Carlo Caprini, Daniele Miorandi
摘要: 在線用戶分析是一個非常活躍的研究領域,催化科學家和從業者的極大興趣。在本文中,我們特別關注能夠挖掘用戶的社交媒體活動以創建豐富的用戶配置文件的方法。我們看一下這樣的情況,其中分析旨在沿著一組預定義的維度(我們稱之為分類)表徵用戶的興趣。傳統的方式是使用語義分析技術來(i)從用戶的在線對話中提取相關實體(ii)將所述實體映射到預定義的感興趣類別。雖然實體提取是一個很好理解的主題,但映射部分缺少參考標準化方法。在本文中,我們建議在維基百科樹上使用圖導航技術來實現這樣的映射。提供了一個原型實現,並報告了一些初步結果。
一個破壞數字社區的簡單招數
原文標題: This One Simple Trick Disrupts Digital Communities
地址: http://arxiv.org/abs/1804.02251
作者: Philip Feldman, Aaron Dant, Wayne Lutters
摘要: 本文描述了一個基於智能體的模擬,用於模擬信念空間中的人類活動,信念空間是與意見相關的信息空間的高維子集。利用動物集體行為的見解,我們能夠模擬和識別類似於游牧,群集和動物群體的動物模式的行為模式。這些行為在人際交往中具有類似的表現形式,作為孤獨的探索者,時尚意識和極化回聲室的成員出現。我們證明,廣泛遍歷信仰空間的一小部分游牧代理可以破壞更多的踩踏代理人。擴展模型,我們引入敵對行動的概念,不良行為者可以利用技術媒介溝通的屬性來人為地創造自我維持的失控極化。我們稱這種情況為皮什金效應,因為它回想起美國原住民獵人可能創造的大規模水牛踩踏事件。然後,我們討論系統設計的機會,可以利用識別這些消極模式的能力,並討論可能會破壞自然和故意回聲室形成的可供性。
莫蘭過程的相變和演算法結果
原文標題: Phase Transitions of the Moran Process and Algorithmic Consequences
地址: http://arxiv.org/abs/1804.02293
作者: Leslie Ann Goldberg, John Lapinskas, David Richerby
摘要: 莫蘭過程是一個隨機演算法,通過圖來模擬基因突變的擴散。如果圖連接,過程最終達到「固定」,其中每個頂點都是突變體,或「消失」,其中沒有頂點是突變體。我們的主要結果是演算法的預期運行時間幾乎很緊。對於所有epsilon> 0,我們表明在n個頂點圖上的預期運行時間是o(n ^(3 + epsilon))。事實上,我們證明它至多是n ^ 3 * exp(O((log log n)^ 3)),並且存在一個圖表族,它是Omega(n ^ 3)。在證明我們的主要結果的過程中,我們還建立了固定概率的相變,取決於突變的適應度參數r。我們表明,對於有向圖,沒有類似的相變發生,其中已知預期的運行時間也可以是指數的。最後,我們給出了一個改進的FPRAS來逼近固定概率。當最大度數有界時,其運行時間與圖的大小無關。
字元限制如何影響Microposts的風格和成功:Twitter從140字切換到280字的情況
原文標題: How Character Limits Affect the Style and Success of Microposts: The Case of Twitters Switch from 140 to 280
地址: http://arxiv.org/abs/1804.02318
作者: Kristina Gligori?, Ashton Anderson, Robert West
摘要: 人們經常認為,制約因素在形式和質量方面都會影響創意生產。在線社交媒體平台經常對用戶可以製作的內容施加限制,限制了可能的貢獻範圍。這些限制是否會促使創作者生產更多或更少的成功內容?創作者如何調整自己的貢獻以適應社交媒體平台所施加的限制?在這項工作中,我們進行了匹配的觀察研究來回答這些問題。 2017年11月7日,Twitter將推文的最大允許長度從140改為280,大大改變了它的簽名限制。在我們的研究中,我們比較了在更改後發布相同長度的推文之前,近似或剛好有140個字元的推文。這種設置使我們能夠描述用戶如何改變他們的推文以適應約束,以及這會如何影響他們的推文成功。我們發現,為了響應長度限制,用戶寫得更簡潔,使用更多的縮寫和縮略形式,並使用更少的定冠詞。此外,儘管總體推文成功率隨著長度的增加而增加,但我們發現最初的證據表明,推薦符合140個字元約束的推文比刪除約束時編寫的類似長度的推文更為成功,這表明長度約束提高了推文質量。
從比特幣到比特幣現金:網路分析
原文標題: From Bitcoin to Bitcoin Cash: a network analysis
地址: http://arxiv.org/abs/1804.02350
作者: Marco Alberto Javarone, Craig Steven Wright
摘要: 在過去的幾年裡,比特幣和區塊鏈技術受到了不同科學界的廣泛關注。值得注意的是,由於廣泛的工業應用和加密貨幣的不斷推出,即使是輿論也越來越關注這一領域。這些技術的基本結構構成了他們的核心概念之一。特別是,它們基於對等網路。因此,所有節點都處於同一水平,因此沒有特權參與者的地位,例如傳統金融網路中的銀行機構。在這項工作中,我們對兩個網路進行了初步調查,比如比特幣網路和比特幣現金網路。值得注意的是,我們的目標是分析其全球結構,並評估它們是否提供了小世界的行為。結果表明,被稱為「適者生存」的原則,加上連接的不斷增加,可能構成了導致這些網路達到目前結構的機制。此外,進一步的觀察為通向這個方向的新調查打開了通路。
面向複雜系統的信息幾何表徵/分類:II. 來自(c,d)流形的臨界參數值
原文標題: Towards an Information Geometric characterization/classification of Complex Systems. II. Critical Parameter values from the (c,d)-manifold
地址: http://arxiv.org/abs/1804.02384
作者: Demetris P.K. Ghikas, Fotios D. Oikonomou
摘要: 在我們先前的論文(I)中,我們用Hanel和Thurner(2011)的兩個參數廣義熵導出了信息幾何對象,使用c,d參數作為相應流形的標籤。在這裡,我們採用完全不同的方法,將這些參數作為我們信息流形的坐標。這提供了一個易於操作的易於管理的二維流形,但最重要的是它提供了一對c,d值對的複雜系統的直接表徵。因此,我們可以從標量曲線中獲得某些特徵值,我們可以推測它們代表具有特定行為的複雜系統。進一步觀察到,表徵Hanel-Thurner分類的c,d參數的邊界值在某種意義上是單一的。這就要求我們試圖建立一個正規化計劃。
聲明:Arxiv文章摘要版權歸論文原作者所有,由本人進行翻譯整理,未經同意請勿隨意轉載。本系列在微信公眾號「網路科學研究速遞」(微信號netsci)和個人博客 https://www.complexly.me (提供RSS訂閱)進行同步更新。
推薦閱讀:
※Arxiv網路科學論文摘要26篇(2018-02-13)
※Arxiv網路科學論文摘要5篇(2018-02-08)
※Arxiv網路科學論文摘要4篇(2018-02-12)
※Arxiv網路科學論文摘要10篇(2018-03-07)
※Arxiv網路科學論文摘要6篇(2018-03-30)