Arxiv網路科學論文摘要5篇(2018-02-19)

02-24

用變分自編碼器設計隨機圖模型及其在化學設計中的應用;
通過最小化演算法信息誤差實現無參數網路稀疏化和數據壓縮;
引文網路拓撲的多樣性;
計算推斷的家譜網路揭示了門當戶對的長期趨勢;
Any-k：標籤圖中給定時間的Top-k樹模式檢索;

用變分自編碼器設計隨機圖模型及其在化學設計中的應用

原文標題： Designing Random Graph Models Using Variational Autoencoders With Applications to Chemical Design

地址： http://arxiv.org/abs/1802.05283

作者： Bidisha Samanta, Abir De, Niloy Ganguly, Manuel Gomez-Rodriguez

摘要：深度生成模型因其學習圖像，文本和音頻的平滑潛在表示的能力而受到稱讚，這些模式可用於生成新的合理數據。然而，當前的生成模型由於其獨特的特性而不能與圖一起工作 - 它們的基礎結構不是歐幾里德或網格狀的，它們在節點標籤的排列下仍然是同構的，並且它們具有不同數量的節點和邊。在本文中，我們提出了一種圖的變分自動編碼器，其編碼器和解碼器是專門設計的，通過多項技術創新來解決上述特性。此外，解碼器能夠保證生成的圖中的一組局部結構和功能屬性。實驗表明，我們的模型能夠學習和模仿幾個眾所周知的隨機圖模型的生成過程，並且可以比幾種最先進的方法更有效地創建新的分子。

通過最小化演算法信息誤差實現無參數網路稀疏化和數據壓縮

原文標題： Parameter-free Network Sparsification and Data Reduction by Minimal Algorithmic Information Loss

地址： http://arxiv.org/abs/1802.05843

作者： Hector Zenil, Narsis A. Kiani, Jesper Tegnér

摘要：大型複雜數據集或大數據的研究已經成為大多數科學技術領域面臨的主要挑戰之一。生物學中的細胞和分子網路就是最好的例子之一。此後，已經開發了一些用於降低數據維數的技術，特別是在網路環境中。然而，目前的技術需要一個預定義的度量來減小數據的大小。下面我們就介紹一個家庭的基礎上（演算法），資訊理論，旨在盡量減少任何（枚舉可計算）的損耗特性有助於對象的演算法內容無參數的演算法，因此重要的數據降維時的過程中保留迫使該演算法首先刪除最不重要的特徵。獨立於任何特定的標準，它們在基本的數學意義上是普遍的。使用次優近似的有效（多項式）估計，我們演示了如何保留網路性能優於其他（領先的）演算法以減少網路維數。我們的方法保留了度量分布，聚類係數，邊介數，度和特徵向量集中度等所有測量的圖論指標。我們的結論和數字證明我們的無參數，最小信息損失稀疏化（MILS）方法是強大的，具有最大化的數據和網路上的所有遞歸可枚舉的保存功能的潛力，並實現平等比其他數據減少到顯著更好的結果和網路稀疏方法。

引文網路拓撲的多樣性

原文標題： Diversity from the Topology of Citation Networks

地址： http://arxiv.org/abs/1802.06015

作者： Vaiva Vasiliauskaite, Tim S. Evans

摘要：我們研究有向無環圖中的傳遞性及其在捕獲節點時的有用性，節點充當這種網路中更密集互連部分之間的橋樑。在傳遞簡化的引文網路中，中心性可以用來衡量跨學科性或多樣性。我們研究了度量在隨機有向無環圖和引用網路中捕獲「多樣」節點的能力。我們表明，傳遞減少度中心性能夠捕捉「多樣」節點，因此這種措施可以是一個及時的替代文本分析技術檢索論文，在各種研究領域的影響力。

計算推斷的家譜網路揭示了門當戶對的長期趨勢

原文標題： Computationally Inferred Genealogical Networks Uncover Long-Term Trends in Assortative Mating

地址： http://arxiv.org/abs/1802.06055

作者： Eric Malmi, Aristides Gionis, Arno Solin

摘要：系譜學網路也被稱為家族樹或種群譜系，通常由希望了解其祖先的譜系學家研究，但它們也為諸如數字人口統計學，遺傳學和計算社會科學等學科提供了有價值的資源。這些網路通常是通過非常耗時的過程手動構建的，這需要手動比較大量的歷史記錄。我們開發用於自動推斷大規模家譜網路的計算方法。與人工構建網路的比較證明了所提出的方法的準確性。為了證明推斷的大規模譜系網路的適用性，我們對網路中觀察到的交配模式進行縱向分析。這種分析表明，人們選擇一個具有相似社會經濟地位的配偶的趨勢一直存在，這種現象稱為門當戶對。有趣的是，我們並沒有觀察到這種趨勢在150年的研究時間內持續下降（或增加）。

Any-k：標籤圖中給定時間的Top-k樹模式檢索

原文標題： Any-k: Anytime Top-k Tree Pattern Retrieval in Labeled Graphs

地址： http://arxiv.org/abs/1802.06060

作者： Xiaofeng Yang, Deepak Ajwani, Wolfgang Gatterbauer, Patrick K. Nicholson, Mirek Riedewald, Alessandra Sala

摘要：推薦系統，社會網路分析，語義搜索和分散式根本原因分析等多個領域的許多問題可以模擬為標記圖（也稱為「異構信息網路」或HIN）上的模式搜索。給定一個具有節點和邊標籤約束的大圖和查詢模式，一個根本的挑戰是根據邊和節點權重的排序函數找出最前k個匹配。對於用戶來說，選擇k值很困難。因此，我們提出了任意-k排序演算法的新概念：對於給定的時間預算，儘可能多地返回排名最高的結果。然後，如果有更多時間，還可以快速生成下一個較低排名的結果。它可以隨時停止，但可能必須繼續，直到返回所有結果。本文重點討論任意標記圖上的非循環模式。我們感興趣的是有效利用（1）異構網路屬性的實用演算法，特別是對標籤的選擇性約束，以及（2）用戶經常只探索一小部分排名最高的結果。我們的解決方案KARPET小心地集成了利用查詢的非循環特性的積極修剪和增量引導式搜索。它使我們能夠證明強大的非平凡時間和空間保證，對於這種類型的圖搜索問題，這通常被認為是非常困難的。通過實驗研究，我們發現KARPET可以在具有數百萬個節點和邊的大型網路上以樹毫秒為單位實現運行時間。

聲明：Arxiv文章摘要版權歸論文原作者所有，由本人進行翻譯整理，未經同意請勿隨意轉載。本系列在微信公眾號「網路科學研究速遞」（微信號netsci）和個人博客 https://www.complexly.me （提供RSS訂閱）進行同步更新。