Arxiv網路科學論文摘要13篇(2018-02-15)

02-18

祝大家新春快樂！

從科研檔案預測下一次職業變動;
引用和讀者是否確定了重要的出版物？;
MemeSequencer：用於嵌入圖像宏的稀疏匹配;
二分網路及其投影的度分布;
目的地選擇博弈：人類流動的空間交互理論;
「走出壁櫥」：文學小說的科學作者和知識轉移;
Facebook在歐洲使用敏感數據進行廣告宣傳;
網路結構抑制重尾社會網路中的信息級聯;
理解Goodreads的圖書流行度;
他們為什麼不再關注我？ Twitter上掉粉的早期檢測;
空間優先附著模型的聚類性質;
金融危機中銀行間市場的多重核心-邊緣分析的結構性變化;
幫派地盤的對流-擴散模型;

從科研檔案預測下一次職業變動

原文標題： Prediction of next career moves from scientific profiles

地址： http://arxiv.org/abs/1802.04830

作者： Charlotte James, Luca Pappalardo, Alina Sirbu, Filippo Simini

摘要：不斷變化的機構是科學家的重要職業決策，在教育，科學生產力和科學知識的產生中發揮著重要作用。然而，我們對影響搬遷決定的因素的理解非常有限。在本文中，我們調查科學家的科學概況如何決定他們的決定（即改變機構）。為此，我們通過三個主要方面描述科學家的概況：科學家最近的科學事業，科學環境的質量和科學合作網路的結構。然後，我們設計和實施一個兩階段預測模型：首先，我們使用數據挖掘來預測哪一位研究人員將根據他們的科學概況在明年進行移動;第二，我們通過使用傳統的人類流動引力模型的新穎社會引力模型來預測他們將選擇哪個機構。對大量科學出版物數據集的實驗表明，我們的方法在兩個階段都表現良好，相對於最先進的方法，預測誤差減少了85％。

引用和讀者是否確定了重要的出版物？

原文標題： Do Citations and Readership Identify Seminal Publications?

地址： http://arxiv.org/abs/1802.04853

作者： Drahomira Herrmannova, Robert M. Patton, Petr Knoth, Christopher G. Stahl

摘要：在本文中，我們顯示引文計數在區分優秀研究方面比隨機基線（10％的邊際）更好，而Mendeley閱讀器計數並不比基線更好。具體而言，我們研究這些指標的潛力，以區分導致研究領域發生變化的出版物與未發表的出版物。該實驗已經在稱為TrueImpactDataset的文獻計量學研究的新數據集上進行。 TrueImpactDataset是兩種類型的研究出版物的集合 - 研究論文，這些論文被認為是他們所在領域的開創性著作，以及提供研究領域文獻綜述的論文。我們提供數據集的概覽統計數據，並建議使用它來驗證研究評估指標。使用數據集，我們進行了一系列實驗，以研究引文和讀者計數如何區分這些出版物類型，然後引入領域變化的直覺表示研究貢獻。我們發現引文數量有助於區分那些強烈影響後期發展的研究與主要以一定準確度（63％，即隨機基線的10％）討論當前藝術水平的作品。在所有設置中，Mendeley閱讀器計數表現比隨機基線更差。

MemeSequencer：用於嵌入圖像宏的稀疏匹配

原文標題： MemeSequencer: Sparse Matching for Embedding Image Macros

地址： http://arxiv.org/abs/1802.04936

作者： Abhimanyu Dubey, Esteban Moro, Manuel Cebrian, Iyad Rahwan

摘要：對互聯網上社交媒體內容的創造，變異和傳播的分析是計算社會科學中的一個基本問題，影響從營銷到政治動員等領域。理解在線圖像演變的第一步是分析快速修改和傳播的模因圖像或「模因」。然而，進行此類調查的一個陷阱是當前無法為這種圖像產生強大的語義空間，能夠理解圖像宏中的差異。在這項研究中，我們通過提出一種基於稀疏表示和深度學習的演算法來解析這些圖像中的各種類型的內容併產生豐富的語義嵌入，為互聯網上圖像演化的系統研究提供了第一步。我們展示了我們的方法在與模因和圖像宏有關的各種任務（如圖像聚類，圖像檢索，主題預測和病毒傳播預測）方面的優勢，超越了各自的現有方法。除了它在量化任務上的實用性之外，我們的方法還有可能獲得對模因圖像演變和傳播的第一次大規模的理解。

二分網路及其投影的度分布

原文標題： Degree distributions of bipartite networks and their projections

地址： http://arxiv.org/abs/1802.04953

作者： Demival Vasques Filho, Dion R.J. ONeale

摘要：雙模式（雙模式）網路在分析社會和經濟系統時非常重要，因為它們明確顯示了不同類型實體之間的概念聯繫。但是，這種網路的應用通常與原始雙邊網路的投影（單模式）版本一起工作。投影網路的拓撲結構以及發生在其上的動力學高度依賴於來自原始二分結構的兩種不同節點類型的程度分布。迄今為止，雙方網路的度分布與其單模投影之間的相互作用僅在少數情況下或者對於滿足一組限制性假設的網路而言是很好理解的。在這裡，我們展示了一個更廣泛的分析，以填補以前的研究留下的空白。我們使用生成函數的形式來證明原始二分網路中兩種節點類型的度分布都會影響投影版本中的度分布。為了支持我們的分析，我們使用配置模型來模擬幾種類型的合成二分網路，其中節點度由特定的概率分布分配，從峰值分布到重尾分布。我們的研究結果表明，當將雙向網路投影到一組特定的節點上時，所得到的單模網路的度分布遵循投影到的節點的分布，但只要相反的集合的度分布節點沒有較重的尾部。此外，我們表明，與文獻中通常描述的相反，二分度分布並不是驅動投影網路拓撲形成的唯一特徵。

目的地選擇博弈：人類流動的空間交互理論

原文標題： Destination Choice Game: A Spatial Interaction Theory on Human Mobility

地址： http://arxiv.org/abs/1802.04966

作者： Yan Xiao-Yong, Zhou Tao

摘要：在移民預測，全球疾病緩解，城市規劃和許多其他方面具有顯著的意義，一個令人震驚的挑戰是預測任何兩個地點之間的人員流動通量。針對上述挑戰提出了多種方法，包括介入機會模型，引力模型，輻射模型，人口加權機會模型等。儘管他們理論上的優雅，但所有模型忽略了個人決定去哪裡的直覺和重要因素，也就是可能的擁堵和目的地的擁擠。在這裡我們提出了一個基於移動性決策的微觀機制，稱為目的地選擇博弈（DCG），它考慮到個體間空間相互作用導致的擁擠效應。與最先進的模型相比，目前的模型可以更準確地預測從城市間行程到城際間行程以及進一步到內部遷移的大範圍遷移流量。眾所周知的引力模型恰好是一個退化的DCG的均衡解決方案，忽略了目的地的擁擠效應。

「走出壁櫥」：文學小說的科學作者和知識轉移

原文標題： Getting out of the closet: Scientific authorship of literary fiction and knowledge transfer

地址： http://arxiv.org/abs/1802.05012

作者： Joaquín M. Azagra-Caro, Anabel Fernández-Mesa, Nicolás Robinson-García

摘要：一些科學家在業餘時間撰寫文學小說書籍。如果這些書包含科學知識，文學小說就成為知識轉移的機制。在這種情況下，我們可以將文學小說理解為非正式的知識轉移。我們通過文學小說將知識轉移模型化為科學家類型（學術或非學術）和他/她的科學領域的函數。學術科學家是那些在學術界和公共研究機構工作的學者，而非學術科學家是那些在其他領域具有科學背景的科學家。我們還區分直接知識轉移（本書包括科學家的研究主題），間接知識轉移（科學作者與文化代理人談論他們的研究）和逆向知識轉移（文化代理給科學家未來研究的想法）。通過混合研究方法和來自西班牙的樣本，我們發現科學著作占所有文學小說作者的相當比例。學術科學家不像非學術科學家那樣直接傳授知識，但前者比後者更頻繁地參與間接和反向轉移知識。來自歷史和哲學的科學家在直接的知識轉移中脫穎而出。我們提出關於學術邏輯和科學領域在通過文學小說進行知識轉移方面的作用的命題。我們就文學作品的科學著作權作為有價值的知識轉移機制提出了一些初步結論。

Facebook在歐洲使用敏感數據進行廣告宣傳

原文標題： Facebook Use of Sensitive Data for Advertising in Europe

地址： http://arxiv.org/abs/1802.05030

作者： José González Caba?as, ángel Cuevas, Rubén Cuevas

摘要：即將出台的歐洲通用數據保護條例（GDPR）禁止處理和利用某些類別的個人數據（健康，政治取向，性取向，宗教信仰，族裔出身等），因為隱私風險可能來源於惡意使用這種類型的信息。這些類別被稱為敏感個人數據。 Facebook最近在西班牙被罰款120萬歐元，用於收集，存儲和處理用於廣告目的的敏感個人數據。本文將歐盟（EU）Facebook用戶的部分量化，這些用戶被標記為與敏感個人數據相關的利益。我們的研究結果顯示，Facebook將73％的歐盟用戶標註為敏感興趣。這相當於整個歐盟人口的40％。我們還估計，惡意第三方可能會以低至每用戶0.015歐元的成本揭露已分配敏感興趣的Facebook用戶的身份。最後，我們建議並實施一個網頁瀏覽器擴展程序，以向Facebook用戶通知Facebook分配給他們的敏感興趣。

網路結構抑制重尾社會網路中的信息級聯

原文標題： Network structure inhibits information cascades in heavy-tailed social networks

地址： http://arxiv.org/abs/1802.05039

作者： Caitlin Gray, Lewis Mitchell, Matthew Roughan

摘要：信息和想法遍布社會網路，在線社交媒體平台是加速信息流動的強大媒介。表徵和理解網路結構對這種信息流的作用在許多領域中都很重要，但受限於具有一系列結構特性的網路數據的可用性。因此，使用具有可調參數的數學網路模型來充分發掘信息級聯現象至關重要。我們通過對一系列網路類型的數值模擬來展示底層圖結構同時影響信息級聯的可能性和探索這些級聯的性質。在模擬隨機網路中使用信息級聯的典型閾值模型，我們顯示網路局部性增加了連接節點的脆弱性，並因此增加了全局級聯的可能性。相反，我們發現在重尾網路中，全局級聯概率由於高度連接的阻塞節點的存在而降低。

理解Goodreads的圖書流行度

原文標題： Understanding Book Popularity on Goodreads

地址： http://arxiv.org/abs/1802.05057

作者： Suman Kalyan Maity, Ayush Kumar, Ankan Mullick, Vishnu Choudhary, Animesh Mukherjee

摘要： Goodreads自2009年以來推出了讀者選擇獎，用戶可以提名/投票自己選擇的書籍，並在特定年份發布。在這項工作中，我們質疑是否可以根據Goodreads上各種實體的特徵來預測一本書將獲得的票數（也就是該書的受歡迎程度）。我們成功地預測了具有高預測準確度（相關係數?0.61）和低RMSE（?1.25）的書籍的流行度。發現用戶參與度和作者的聲望是書籍受歡迎程度的關鍵因素。

他們為什麼不再關注我？ Twitter上掉粉的早期檢測

原文標題： Why Did They #Unfollow Me? Early Detection of Follower Loss on Twitter

地址： http://arxiv.org/abs/1802.05091

作者： Suman Kalyan Maity, Ramanth Gajula, Animesh Mukherjee

摘要：在最近的社交媒體和微博社區中，擁有更多的追隨者已經成為一種常態。這場戰鬥從Twitter的早期形成。儘管追隨者競爭激烈，但許多Twitter用戶不斷失去追隨者。這項工作解決了識別Twitter用戶數量下降的原因的問題。作為第一步，我們通過分析由一直失去追隨者的Twitter用戶發布的帖子內容來提取各種功能。然後，我們利用這些功能來及早檢測追隨者的損失。我們提出了各種模型，並以高精度和召回產生73％的總體準確度。我們的模型比基線模型優勝19.67％（準確率為w.r.t），33.8％（精確度為w.r.t）和14.3％（回收率為w.r.t.）。

空間優先附著模型的聚類性質

原文標題： Clustering Properties of Spatial Preferential Attachment Model

地址： http://arxiv.org/abs/1802.05127

作者： Lenar Iskhakov, Bogumil Kaminski, Maksim Mironov, Liudmila Ostroumova Prokhorenkova, Pawel Pralat

摘要：在本文中，我們研究由Aiello等人引入的Spatial Preferential Attachment（SPA）模型的聚類特性。在2009年。這種模式自然結合幾何和優先連接使用影響力的概念。先前在幾篇研究論文中顯示，SPA模型生成的圖在許多方面與現實世界的網路相似。例如，頂點度分布顯示遵循冪定律。在本文中，我們研究C（d）的行為，這是d度頂點的平均局部聚類係數。這個特性以前沒有在SPA模型中分析過。然而，從經驗上可以看出，在現實世界中，C（d）通常隨著d ^ { - a}下降，對於一些α> 0，並且經常觀察到a = 1。我們證明在SPA模型C（d）下降為1 / d。此外，我們還可以證明，如果d足夠大，不僅d的頂點v的平均值而且單個局部聚類係數表現為1 / d。所獲得的結果用模擬圖進行了大量實驗。

金融危機中銀行間市場的多重核心-邊緣分析的結構性變化

原文標題： Structural changes in the interbank market across the financial crisis from multiple core-periphery analysis

地址： http://arxiv.org/abs/1802.05139

作者： Sadamori Kojaku, Giulio Cimini, Guido Caldarelli, Naoki Masuda

摘要：銀行間市場通常以核心 - 外圍網路結構為特徵，高度相互關聯的銀行核心將市場聯繫在一起，銀行的外圍主要與核心而非內部相連。這種模式最近面臨短時間尺度的挑戰，銀行間市場似乎更好地表現為具有比核心內部更多的核心 - 外圍連接的雙邊結構。通過在eMID銀行間市場上使用新穎的核心 - 邊檢測方法，我們通過展示網路實際上具有多個核心 - 外圍對的特徵來豐富這一圖像。此外，通過縮短數據聚集的時間尺度，發生了從核心 - 邊到雙邊結構的轉變。我們進一步展示了全球金融危機如何改變市場，就核心 - 外圍對的組成，多樣性和內部組織而言。通過揭示這樣一個細緻的組織和銀行間市場的轉型，我們的方法可以找到重要的應用，以理解如何在金融網路上傳播痛苦。

幫派地盤的對流-擴散模型

原文標題： A Convection-Diffusion Model for Gang Territoriality

地址： http://arxiv.org/abs/1802.05149

作者： Abdulaziz Alsenafi, Alethea B. T. Barbaro

摘要：我們提出了一個基於主體的模型來模擬由二維離散格子上的塗鴉標記激發的幫派領土發展。為了簡單起見，我們假設存在兩個對立的幫派，他們爭奪領土。在這種模式中，代理人代表幫派成員，並根據有偏見的隨機行走進行移動，在移動時增加塗鴉的概率，並優先避免其他幫派的塗鴉。所有的代理交互都是間接的，通過塗鴉欄位進行交互。我們用數字表示，隨著參數的變化，在混合良好的狀態和良好分離的狀態之間發生相變。數值結果表明系統質量，衰減率和塗鴉率對臨界參數有影響。從離散模型中，我們導出了一個用於區域發展的對流擴散方程的連續體系。使用連續方程，我們執行線性穩定性分析以確定平衡解的穩定性，並且我們發現我們可以確定參數空間中相變的精確位置，作為系統質量和塗鴉創建和衰減率的函數。

聲明：Arxiv文章摘要版權歸論文原作者所有，由本人進行翻譯整理，未經同意請勿隨意轉載。本系列在微信公眾號「網路科學研究速遞」（微信號netsci）和個人博客 https://www.complexly.me （提供RSS訂閱）進行同步更新。