Arxiv網路科學論文摘要15篇(2018-04-13)

  • 向量空間模型作為文本分類的認知空間;
  • 基於流和批數據語義的社交媒體分析;
  • 用結構和動態信息預測個體之間的相互作用;
  • 學習電影,演員和文學角色的聯合高斯表示法;
  • 從社交媒體數據中自動推斷人的特質和行為;
  • 仇恨Lingo:基於目標的社交媒體仇恨言語分析;
  • Cashtag捎帶:在Twitter上發現股票微博的垃圾郵件和機器人活動;
  • 我會在你身邊:一個團中的六個朋友;
  • FIFA和UEFA比賽預選賽的策略證明;
  • 社會推廣員評分(SPS)和評論網路:一種預測網上購物品牌財務狀況的方法和工具;
  • 用於本地網路社區檢測的生成模型;
  • 潛在幾何啟發的圖不相似性增強了複雜網路中的親和性傳播群落檢測;
  • 個性化的模糊過程;
  • 一種新的圖生成統計模型:潛在序邏輯(LOLOG)模型;
  • 對等仇恨:仇恨言論煽動者及其目標;

向量空間模型作為文本分類的認知空間

原文標題: Vector Space Model as Cognitive Space for Text Classification

地址: arxiv.org/abs/1708.0606

作者: Barathi Ganesh HB, Anand Kumar M, Soman KP

摘要: 在這個數字化時代,了解用戶的社交方面已經成為構建用戶特定推薦系統的基本特徵。可以通過在社交媒體和評論中以文本形式挖掘用戶的語言共享來發現這些社交選擇方面。本文介紹了在PAN Author Profiling 2017共享任務中執行的實驗。任務的目標是從用戶的推文中找出用戶的社交方面。在這個實驗中考慮的社會因素方面是用戶的性別和母語信息。在這裡,用與母語不同的語言編寫的用戶推文表示為以文檔頻率為約束條件的文檔 - 術語矩陣。使用支持向量機進行進一步的分類,將性別和母語作為目標類別。本次實驗的性別預測平均準確率為73.42%,本土語言識別任務平均準確率為76.26%。

基於流和批數據語義的社交媒體分析

原文標題: Social Media Analysis based on Semanticity of Streaming and Batch Data

地址: arxiv.org/abs/1801.0110

作者: Barathi Ganesh HB

摘要: 不同地區的人們所分享的語言根據其口音,發音和詞語用法而有所不同。在這個時代,語言共享主要通過社交媒體和博客進行。為了從中提取知識,存在這樣一個微型帖子的每一秒擺動,這導致需要處理這些微型帖子。知識提取在認知科學研究為同樣的需要提供必需品的應用方面有所不同。這項工作通過在名稱實體識別和作者概況分析等應用程序中提取流和批處理數據的語義信息,進一步推進這項研究。在命名實體識別的情況下,利用了單個微型帖子的背景,並利用了位於微型帖子池中的背景來確定這些微型帖子作者的社會選擇方面。在這項工作中,條件隨機場已經被用來進行實體識別,並且已經提出了一種新穎的方法來找到作者的社會學方面(性別,年齡組)。

用結構和動態信息預測個體之間的相互作用

原文標題: Predicting interactions between individuals with structural and dynamical information

地址: arxiv.org/abs/1804.0146

作者: Thibaud Arnoux, Lionel Tabourier, Matthieu Latapy

摘要: 捕獲交互的結構和時間方面對許多真實世界的數據集非常重要,例如個人之間的聯繫。我們使用鏈接流形式來捕獲系統的動態,我們解決鏈接流中活動預測的問題,也就是說預測給定時間段內發生的鏈接數量,並提出一個利用時間和結構信息包含在鏈接流中。使用監督式學習方法,我們能夠對我們系統的動態進行建模以改進預測。我們調查我們的演算法的行為和影響預測的關鍵因素。通過引入不同類別的節點對,我們可以提高質量並增加預測的多樣性。

學習電影,演員和文學角色的聯合高斯表示法

原文標題: Learning Joint Gaussian Representations for Movies, Actors, and Literary Characters

地址: arxiv.org/abs/1804.0416

作者: Hannah Kim, Denys Katerenchuk, Daniel Billet, Haesun Park, Boyang Li

摘要: 對敘事內容的理解已成為越來越受歡迎的話題。然而,由於文本,事件,人物類型和流派等多重敘述方面的影響緊密交織,故敘事語義構成了困難的挑戰。我們提出了一個聯合表示學習框架,用於將演員,文學角色,電影,流派和描述性關鍵詞嵌入到高斯均值上作為高斯分布和平移向量。高斯方差自然對應演員的多功能性,這是行動的中心概念。我們對演員多功能性的估計與65.95%的領域專家的排名一致。據我們所知,這是估計這種語義概念的第一種計算技術。此外,該模型在預測演員投選選擇上大大優於TransE基準。

從社交媒體數據中自動推斷人的特質和行為

原文標題: Automatically Infer Human Traits and Behavior from Social Media Data

地址: arxiv.org/abs/1804.0419

作者: Shimei Pan, Tao Ding

摘要: 考慮到人類頭腦的複雜性和他們的行為靈活性,它需要複雜的數據分析來篩選大量的人類行為證據來模擬人類頭腦並預測人類行為。人們目前在Twitter和Facebook等社交媒體上花費大量時間。因此,他們的生活和行為的許多方面都被數字化地捕捉並不斷存檔在這些平台上。這使得社交媒體成為大量豐富多樣的人類行為證據的重要來源。在本文中,我們調查了最近應用機器學習從社交媒體數據推斷人類特徵和行為的工作。我們也會指出幾個未來的研究方向。

仇恨Lingo:基於目標的社交媒體仇恨言語分析

原文標題: Hate Lingo: A Target-based Linguistic Analysis of Hate Speech in Social Media

地址: arxiv.org/abs/1804.0425

作者: Mai ElSherief, Vivek Kulkarni, Dana Nguyen, William Yang Wang, Elizabeth Belding

摘要: 雖然社交媒體賦予言論自由和個人聲音自由,但它也可以實現反社會行為,網上騷擾,網路欺凌和仇恨言論。在本文中,我們通過關注仇恨言論的一個很大程度上被忽視但至關重要的方面來加深我們對在線仇恨言論的理解 - 其目標:或者是針對特定的個人或實體,或者是「泛化」為一群人分享一個共同的保護特性。我們對這兩種形式的仇恨言論進行了第一次語言學和心理語言學分析,並揭示了區分這些仇恨言論類型的有趣標記的存在。我們的分析表明,有向仇恨言論除了更個人化和更直接,更加非正式,更加憤怒,並且通常會用更少的分析辭彙和更多的話來建議權威和影響力,從而明確地攻擊目標(通過名稱調用)。另一方面,廣義的仇恨言論則以宗教仇恨為主,其特點是使用殺人,殺滅和殺戮等致命辭彙;和數量等字如百萬和許多。總之,我們的工作提供了一個數據驅動的分析網上仇恨言論的細微差別,不僅能夠加深對仇恨言論及其社會影響的理解,而且能夠發現它。

Cashtag捎帶:在Twitter上發現股票微博的垃圾郵件和機器人活動

原文標題: Cashtag piggybacking: uncovering spam and bot activity in stock microblogs on Twitter

地址: arxiv.org/abs/1804.0440

作者: Stefano Cresci, Fabrizio Lillo, Daniele Regoli, Serena Tardelli, Maurizio Tesconi

摘要: 微博日益被用於預測金融市場中股票的價格和交易量。然而,已經證明,微博平台中共享的大部分內容是由機器人和垃圾郵件發送者創建和公布的。然而,以前從未系統地研究過假冒股票微博的存在(或缺乏)以及影響。在這裡,我們研究了與美國5個主要金融市場股票相關的9M條推文。通過比較推文和Google財經的財務數據,我們強調了Twitter股票微博的重要特徵。更重要的是,我們發現了一些機器人協作組織所實施的惡意做法,並可能通過利用高價值機器的普及來促進低價值股票。我們的研究結果要求在利用用戶生成的內容來預測股票市場的所有研究和應用中採用垃圾郵件和機器人檢測技術。

我會在你身邊:一個團中的六個朋友

原文標題: I will be there for you: six friends in a clique

地址: arxiv.org/abs/1804.0440

作者: Ana L. C. Bazzan

摘要: 網路科學在分析幾個領域的社會網路的結構和動態方面已被證明是有用的。本文旨在分析著名情景喜劇「朋友」中人物的關係。特別是,不僅研究靜態結構和因果關係,而且還研究時間方面。畢竟,這個節目被播出了十年,因此角色和角色之間的友誼模式似乎已經改變。此外,這部情景喜劇經常與區分事實相關聯,例如:所有六個角色同樣顯著;它沒有占統治地位的故事情節;和作為代孕家庭的友誼。本文使用網路理論中的工具來檢查這些和其他事實是否可以被量化和證明是正確的,特別是考慮到時間方面,即情景喜劇隨著時間發生了什麼。主要研究結果是:表示表演不同時間片變化的圖表模式;總的來說,六個朋友的程度確實差不多;然而,在不同的情況下(如圖),度數中心性的大小確實會改變;中介中心性對於每個角色顯著不同,因此一些角色比其他角色更好;六位朋友和其他角色的度數差異很大,這表明了一個集中式網路;有強烈的跡象表明,這六位朋友是家庭的一部分。

FIFA和UEFA比賽預選賽的策略證明

原文標題: The strategy-proofness of FIFA and UEFA tournament qualifiers

地址: arxiv.org/abs/1804.0442

作者: László Csató

摘要: 比賽組織者應該設計一些規則,這樣一個團隊不會因為努力工作而變得更好。據顯示,2018年FIFA世界盃的歐洲資格賽在這個意義上說並不符合策略:在小組賽中贏得最後一場比賽的隊伍可能會被淘汰,而通過抽籤前提是所有其他結果保持不變。這種情況可能發生在2017年10月,所有比賽的五分之四已經打完。提出了一個理論模型,並確定了最近FIFA世界盃和歐洲聯盟錦標賽的九個激勵不相容的預選賽。我們建議一個公平的機制,以防止在類似的基於群體的資格制度中操縱。

社會推廣員評分(SPS)和評論網路:一種預測網上購物品牌財務狀況的方法和工具

原文標題: Social Promoter Score (SPS) and Review Network: A Method and a Tool for Predicting Financial Health of an Online Shopping Brand

地址: arxiv.org/abs/1804.0446

作者: Supriyo Mandal, Abyayananda Maiti

摘要: 總結網上購物品牌產品的客戶評論評級或情緒的傳統方式不足以評估該品牌的財務狀況。它忽視了個人客戶的社會地位和影響力。在本文中,我們提出了一個名為Review Network的工具,用于衡量Amazon.com等在線商品網站的客戶影響力。利用這種衡量的影響力,我們提出了一種方法,根據他們的評級和從在線商品網站收集的評論情緒來評估品牌顧客的忠誠度。一個品牌的評論網路是根據該品牌中節點是顧客的所有產品的所有評論構建的,並且如果顧客成為另一個顧客編寫的評論的潛在讀者,則創建邊。顧客在該評論網路中的中心地位代表了她的影響力。我們提出的方法被稱為社會推動者分數,它結合了品牌所有客戶的忠誠度和中心性。我們已經將我們的方法與基於Net Promoter Score概念的基準方法進行了比較。我們已經在亞馬遜網站上應用社交推廣者評分評估了一些知名品牌的數據集。結果顯示,社會推動者分數預測未來銷售額的品牌財務狀況比基準方法好得多。我們已經注意到,社交促銷員分數的總體影響反映了在一到五個月內的產品銷售情況。

用於本地網路社區檢測的生成模型

原文標題: Generative models for local network community detection

地址: arxiv.org/abs/1804.0446

作者: Twan van Laarhoven

摘要: 本地網路社區檢測旨在在大型網路中查找單個社區,同時只檢查給定種子節點周圍的一小部分網路。這比找到網路中的所有社區便宜得多。大多數用於本地社區檢測的方法都被制定為特別優化問題。在這項工作中,我們從具有社區結構的網路的生成模型開始。通過假設網路是統一的,我們可以近似網路中未被觀察的部分的結構,以獲得用於本地社區檢測的方法。我們將這種局部逼近技術應用於隨機塊模型的兩個變體。據我們所知,這導致了第一個基於概率模型的本地社區檢測方法。有趣的是,在極限中,擬議的近似值之一對應於電導,這是該領域常用的度量。與最先進的本地社區檢測演算法相比,真實和合成數據集上的實驗顯示出可比或改進的結果。

潛在幾何啟發的圖不相似性增強了複雜網路中的親和性傳播群落檢測

原文標題: Latent Geometry Inspired Graph Dissimilarities Enhance Affinity Propagation Community Detection in Complex Networks

地址: arxiv.org/abs/1804.0456

作者: Carlo Vittorio Cannistraci, Alessandro Muscoloni

摘要: 親和性傳播是高維特徵空間中數據聚類最有效的演算法之一。然而,在真實的複雜網路中測試其社區檢測性能的眾多嘗試已經取得了非常遠離Infomap和Louvain等現有技術方法的結果。然而,所有這些研究一致認為,關鍵問題是將網路拓撲轉換為「足夠智能」的不相似矩陣,能夠正確解決親和傳播聚類背後的消息傳遞過程。在這裡我們討論如何利用網路潛在幾何概念來設計親緣傳播社區檢測的不相似矩陣。我們的研究結果表明,我們設計的不相似性度量帶來的親和力傳播優於現有的社區檢測方法,不僅在幾個原始的真實網路上,而且當它們的結構被人為地由缺失或虛假連接引起的雜訊破壞時。

個性化的模糊過程

原文標題: A fuzzy process of individuation

地址: arxiv.org/abs/1804.0456

作者: Juliano C. S. Neves

摘要: 它表明,個性化過程的一個方面可以被認為是一個模糊集合。個體化過程被解釋為哲學史上的一個二值問題。在這項工作中,我打算表明,這個過程在心理社會方面可以更好地理解為一個模糊集合,其特徵是一個連續的隸屬函數。根據這種觀點,物種及其成員呈現出不同程度的個性和歸屬感。這種程度是從個體化的社會心理過程的隸屬函數來衡量的。因此,通過在人類社會中使用這種方法建議進行社會分析。

一種新的圖生成統計模型:潛在序邏輯(LOLOG)模型

原文標題: A New Generative Statistical Model for Graphs: The Latent Order Logistic (LOLOG) Model

地址: arxiv.org/abs/1804.0458

作者: Ian E. Fellows

摘要: 完全概率模型對於複雜網路的統計建模是至關重要的,然而通用的,靈活的和廣泛適用的生成方法卻很少。我們提出了一個由網路增長理念驅動的概率模型家族,我們稱之為Latent Order Logistic(LOLOG)模型。 LOLOG是一個完全一般的框架,能夠描述圖配置的任何概率分布,儘管並非所有的分布都可以很容易地表達或估計為LOLOG。我們開發基於蒙特卡羅方法的矩量推廣程序,廣義矩方法和變分推理。為了展示模型框架的靈活性,我們展示了如何通過優先連接將所謂的無標度網路建模為LOLOGs。舉例說明了LOLOG在避免簡併性,取樣方便性和模型靈活性方面的優勢。與流行的指數族隨機圖模型(ERGM)的連接也被探討,我們發現它們在二元獨立的情況下是相同的。最後,我們將該模型應用於公司律師事務所內的合作社會網路,青少年學生之間的友誼網路以及在線社會網路中的友誼關係。

對等仇恨:仇恨言論煽動者及其目標

原文標題: Peer to Peer Hate: Hate Speech Instigators and Their Targets

地址: arxiv.org/abs/1804.0464

作者: Mai ElSherief, Shirin Nilizadeh, Dana Nguyen, Giovanni Vigna, Elizabeth Belding

摘要: 雖然社交媒體已成為個人聲音和言論自由的授權代理人,但它也有助於反社會行為,包括在線騷擾,網路欺凌和仇恨言論。在本文中,我們介紹了Twitter上仇恨言論煽動者和目標用戶的第一次比較研究。通過多步分類過程,我們策划了一個全面的仇恨言語數據集,可以捕捉各種類型的仇恨。我們研究仇恨煽動者和他們的個人資料自我介紹,活動和在線知名度的目標的顯著特點。我們發現仇恨煽動者針對更受歡迎和高調的Twitter用戶,並且參與仇恨言論可能導致更大的在線可見度。我們對仇恨煽動者和目標進行個性分析,並顯示這兩個群體都具有不同於一般Twitter人口的怪異人格特徵。我們的結果推動了對在線仇恨言論交流的理解。

聲明:Arxiv文章摘要版權歸論文原作者所有,由本人進行翻譯整理,未經同意請勿隨意轉載。本系列在微信公眾號「網路科學研究速遞」(微信號netsci)和個人博客 https://www.complexly.me (提供RSS訂閱)進行同步更新。

推薦閱讀:

基於社交網路分析演算法(SNA)的反欺詐(二)
如何看待陌陌凈營收暴增現象?
從零開始做社交功能
我在積目乾的都是正經事,我沒約過P

TAG:複雜系統 | 複雜網路 | 社交網路 |