Arxiv網路科學論文摘要24篇(2018-03-28)

04-22

焦慮，酒精和學術：學生Facebook自白的大規模文本分析;
推測潛在位置估計同質社會網路中的因果同伴影響;
熟悉的陌生人：人類行為的集體規律;
在Twitter上表徵和檢測心懷仇恨的用戶;
社會空間自組織映射：利用社交媒體評估相關地理位置對社會過程的暴露;
在邊和頂點驗證各種三角形統計的大規模圖生成;
由人口景觀輻射模型解釋的引力模型;
通過引用網路的PageRank來衡量學術聲譽;
組織的社會媒體分析：美國東北部公共和州圖書館案例研究;
表徵同性戀用戶的推文中的疾病和障礙;
具有度規則社區的網路的複製方程;
網路考古學：網路歷史可恢復性的相變;
二維意見動態：領域粗化導致穩定的雙極化和異常尺度指數;
圖關聯矩陣的稀疏恢復：多項式時間保證和位置相關性能;
未來高度可再生的歐洲電力系統的成本最優情景：探索天氣數據，成本參數和政策約束的影響;
在書和推文中的英文動詞規則化;
基於人群的多元謂詞篩選文獻綜述;
科學網路中的整合;
網路科學方法模擬供應網路的出現和拓撲穩健性：回顧與展望;
相關無序外擾下網路的意見動力學;
AgeGuess資料庫：一個關於年齡在3-100歲之間的實際年齡和感知年齡的在線資源;
熱力學極限下合作的湧現;
Facebook的廣告平台：新的攻擊媒介和干預需求;
你是你的元數據：使用元數據信息識別和混淆社交媒體用戶;

焦慮，酒精和學術：學生Facebook自白的大規模文本分析

原文標題： Anxiety, Alcohol, and Academics: A Large-scale Textual Analysis of Student Facebook Confessions

地址： http://arxiv.org/abs/1506.05193

作者： Soubhik Barari

摘要：自白網頁在Facebook上很受歡迎，特別是在美國本科社區。這些頁面允許用戶匿名提交有關大學經驗的招供信息，隨後在公共論壇上播放。在本文中，我們分析了在線學生懺悔行為的幾個解釋性因素。總結近3萬年的近20萬份供稿信息，我們通過Mechanical Turk將潛在狄利克雷分配（LDA）與人體驗證結合起來，從而可擴展地識別我們口供中的主題。在可能的情況下，我們還會將帖子與從Twitter分析的真實世界新聞事件進行匹配。我們發現，提供社會經濟學和精神/身體健康的口供更常見於頂級，昂貴的私立本科院校，然而在學費和社會經濟話語程度之間沒有明顯的趨勢。雖然大學生最喜歡與學校相關的時間事件，但學生的確有意義地發布美國/世界新聞和政治事件。我們的研究結果表明，來自不同校園的本科生對不同的專題有不同的披露，而總體而言，隨著時間的推移會以相似的模式發布，並獲得關於精神健康和社會經濟地位等限制性話題的口供支持。

推測潛在位置估計同質社會網路中的因果同伴影響

原文標題： Estimating Causal Peer Influence in Homophilous Social Networks by Inferring Latent Locations

地址： http://arxiv.org/abs/1607.06565

作者： Cosma Rohilla Shalizi, Edward McFowland III

摘要：社會影響無法從純粹的社會網路觀測數據中識別出來，因為這種影響一般與同質潛伏相混淆，即節點的網路夥伴對節點的屬性及其行為都有信息。我們表明，如果網路根據社區（隨機塊）模型或連續的潛在空間模型增長，那麼潛在的同質性屬性可以從全球社會關係模式中持續估計。此外，這些估計信息足夠豐富，控制它們可以對加性模型中的社會影響效應進行無偏且一致的估計。對於社區模型，我們還提供了有限樣本偏差的界限。這些是在存在潛在同質性的情況下一致估計社會影響效應的第一個結果，我們討論推廣它們的前景。

熟悉的陌生人：人類行為的集體規律

原文標題： Familiar Strangers: the Collective Regularity in Human Behaviors

地址： http://arxiv.org/abs/1803.08955

作者： Yan Leng, Dominiquo Santistevan, Alex Pentland

摘要： 1972年斯坦利·米爾格拉姆通過小規模實驗確定了熟悉陌生人的社會現象。然而，關於在社會範圍內揭示這一現象並同時調查熟悉的陌生人之間的社會關係的研究有限。在大型手機記錄的幫助下，我們憑經驗顯示了安道爾在該國的關係。建立在時間和空間分布上，我們調查機制，尤其是引發這種現象的集體時間規律和空間結構。此外，我們探討了通信網路上的社交距離與遭遇次數之間的關係，並且表明，較大數量的遭遇表示社會網路中較短的社交距離。對物理相遇網路的理解可能對理解流行傳播和信息傳播等現象具有重要意義。

在Twitter上表徵和檢測心懷仇恨的用戶

原文標題： Characterizing and Detecting Hateful Users on Twitter

地址： http://arxiv.org/abs/1803.08977

作者： Manoel Horta Ribeiro, Pedro H. Calais, Yuri A. Santos, Virgílio A. F. Almeida, Wagner Meira Jr

摘要：表徵和檢測仇恨言論的大多數方法都集中在在線社會網路中發布的 textit {content}。由於OSN文本的不完整性和喧囂以及仇恨言論的主觀性，他們面臨收集和詮釋仇恨言論的缺陷。這些限制通常是以過分簡化問題的約束為限，例如僅考慮包含仇恨相關單詞的推文。在這項工作中，我們通過將重點轉向 textit {users}來部分解決這些問題。我們開發並採用了一種強大的方法來收集和注釋仇恨用戶，這些用戶不直接依賴詞典，而且用戶在整個個人檔案中注釋了用戶。這導致Twitter的轉推圖樣本包含100,386用戶，其中4,972被注釋。我們還收集在數據收集之後的三個月內被禁止的用戶。我們表明，可恨的用戶在其活動模式，用詞以及網路結構方面與普通用戶不同。我們獲得了類似的結果，比較了鄰居的正常用戶的仇恨和鄰居，並暫停用戶與活躍用戶，增加了我們分析的穩健性。我們觀察到可恨用戶是密集連接的，因此將仇恨言語檢測問題作為半監督學習的圖表任務，利用Twitter上的連接網路。我們發現利用圖結構的節點嵌入演算法優於基於內容的方法來檢測可惡（95％ AUC vs 88％ AUC）和暫停用戶（93％ AUC vs $ 88 ％$ AUC）。總而言之，我們提出了一個以用戶為中心的仇恨言論觀點，為更好地發現和理解這一相關且具有挑戰性的問題鋪平了道路。

社會空間自組織映射：利用社交媒體評估相關地理位置對社會過程的暴露

原文標題： Socio-spatial Self-organizing Maps: Using Social Media to Assess Relevant Geographies for Exposure to Social Processes

地址： http://arxiv.org/abs/1803.09002

作者： Kunal Relia, Mohammad Akbari, Dustin Duncan, Rumi Chunara

摘要：社交媒體為衡量種族主義和恐同症等態度提供了一個獨特的窗口，這可能是人體免疫缺陷病毒（HIV）風險的相關社會決定因素。然而，單獨的推文可能會很嘈雜，並且測量的風險暴露的現有地區，例如郵政編碼，在管理上定義的邊界的平均值，限制使用與社交媒體相關的精確地理信息。因此，我們需要一種方法來確定相關的，同質的社會態度。為了解決這個問題，我們增加傳統的自組織映射（SOMs），拓撲約束聚類，並返回受控數量的非重疊聚類。我們的方法（稱為社會空間SOMs，「SS-SOMs」）使用神經嵌入來進行文本分類和神經網路聚類，從而在語義和地理上最好地識別一致的社會態度區域。我們發現與傳統的SOM和Zip代碼相比，SS-SOM產生了均勻的，明確定義的和更加局部相似的區域，並且對缺失數據很有效。我們證明了這種新方法的空間代表社會態度的影響，它使用來自HIV高危人群的流動性數據，發現他們使用SS-SOM測量的種族主義和同性戀恐懼症的暴露程度相差高達42％使用基於郵編的措施。

在邊和頂點驗證各種三角形統計的大規模圖生成

原文標題： On Large-Scale Graph Generation with Validation of Diverse Triangle Statistics at Edges and Vertices

地址： http://arxiv.org/abs/1803.09021

作者： Geoffrey Sanders, Roger Pearce, Timothy La Fond, Jeremy Kepner

摘要：開發分散式圖分析演算法實現的研究人員需要圖發生器，該圖發生器通過有效地計算所需輸出的地面真值解來生成圖，以分享真實世界圖（小世界，無標度，重拖尾分布）的具有挑戰性的特性。基準測試中使用的電流發生器的重複性在這方面有些欠缺，因為它們具有隨機性：所需圖分析的輸出只能與預期值進行比較，而不是確切的基本事實。非隨機Kronecker產品圖滿足這些設計標準以進行多個圖分析。在這裡，我們展示了在生成Kronecker產品圖時，可以便宜地計算出許多三角形參與的風味。給定兩個具有鄰接矩陣A和B的中等規模無標度圖，它們的Kronecker產品圖具有鄰接矩陣C=A otimesB。這樣的圖是高度可壓縮的：∣ calE∣邊被表示在$ { cal O}（| { cal E} | ^ {1/2}）$內存中，並且可以在分散式設置從小數據結構，使它們容易以壓縮形式共享。許多有趣的圖計算具有最壞情況下的複雜性界限$ { cal 0}（| { cal E} | ^ p）$，並且通常這些被減少到$ { cal O}對於Kronecker乘積圖，當可以推導克羅內克公式時，根據$ A $和$ B $的相關計算得出對$ C $的尋求計算。我們重點推導三角形參與頂點的公式，$ { bf t} _C $，一個存儲每個頂點參與的三角形數量的向量，以及三角形邊參與量$ Delta_C $，一個稀疏矩陣存儲每邊的三角形數量。

由人口景觀輻射模型解釋的引力模型

原文標題： Gravity model explained by the radiation model on a population landscape

地址： http://arxiv.org/abs/1803.09067

作者： Inho Hong, Woo-Sung Jung, Hang-Hyun Jo

摘要：了解人員流動模式背後的機制對於提高我們優化和預測流量的能力至關重要。兩種代表性的流動模型，即輻射模型和引力模型，已經被廣泛地相互比較，並與各種經驗數據集進行了比較，但其基本關係遠未得到充分理解。為了研究這種關係，我們首先通過生成場地的分形幾何模型來對異質人口景觀進行建模，然後通過為每個場地分配一個獨立於冪律分布的人口。然後，將該人口景觀的輻射模型與引力模型進行比較，根據人口景觀的特性推導出引力模型中的距離指數，這通過數值模擬得到了證實。因此，我們根據異質人口景觀的特性為距離指數的起源提供了可能的解釋，使我們能夠更好地理解受旅行距離約束的移動模式。

通過引用網路的PageRank來衡量學術聲譽

原文標題： Measuring the academic reputation through citation networks via PageRank

地址： http://arxiv.org/abs/1803.09104

作者： Francesco Alessandro Massucci, Domingo Docampo

摘要：對學術機構威望的客觀評估是一項困難而激烈的辯論任務。在過去幾年中，不同類型的大學排名被提出來量化世界上不同研究機構的卓越性。儘管在某些情況下遇到了批評，但大學排名的相關性正在得到越來越多的認可：事實上，排名對機構和政府層面的研究政策設計產生了重大影響。然而，對什麼排名進行衡量的爭論是持久的。在這裡，我們通過衡量一個給定機構學術聲譽的定量和可靠代理並評估其與不同大學排名的相關性來解決這個問題。具體而言，我們在五個不同科學Web科目類別中研究大學之間的引文模式，並在所得到的五個引文網路上使用 pr_演算法。我們工作背後的基本原理是，科學引用是由參考文獻的聲譽驅動的，因此預計PageRank演算法的排名可以反映學術機構在特定領域的聲譽。我們的研究結果允許僅基於硬文獻計量數據來量化某一研究領域中一組機構的威望。鑒於所分析數據的數量，我們的調查結果具有統計上的穩健性，並且不易出現偏差，與排名機構經常採用的特別調查不相符，以獲得類似的結果。因為我們的發現與ARWU學科排名非常相關，所以我們在論文中提出的方法可能會打開新的「學術排名」方法論的大門，這種方法超越了目前的方法，通過調整Academic Prestige的定性評估與其定量測量出版物影響。

組織的社會媒體分析：美國東北部公共和州圖書館案例研究

原文標題： Social Media Analysis For Organizations: Us Northeastern Public And State Libraries Case Study

地址： http://arxiv.org/abs/1803.09133

作者： Matthew Collins, Amir Karami

摘要：像Twitter這樣的社交網站為公共圖書館等組織提供了一個很好的機會來傳播用於公共關係目的的信息。但是，有必要分析大量的社交媒體數據。這項研究提出了一種計算方法，以探索由美國東北部9個公共圖書館發布的推文內容。 2017年12月，這項研究從7個州圖書館和兩個城市公共圖書館的Twitter賬戶中提取了超過19,000條推文。應用計算方法收集推文並發現有意義的主題。本文展示了圖書館如何使用Twitter代表他們的服務，並為不同組織提供評估其公共推文主題的起點。

表徵同性戀用戶的推文中的疾病和障礙

原文標題： Characterizing Diseases and disorders in Gay Users tweets

地址： http://arxiv.org/abs/1803.09134

作者： Frank Webb, Amir Karami, Vanessa Kitzie

摘要：缺乏關於經常被排除在國家人口統計學評估，健康研究和臨床試驗之外的女同性戀，雙性戀，變性人和酷兒（LGBTQ）人群的健康問題的信息。因此，醫學專家和研究人員對這些人群面臨的健康差距缺乏全面的了解。幸運的是，公共可用的社交媒體數據（如Twitter數據）可用於支持公共衛生決策者和管理人員就LGBTQ人員做出的決策。本研究採用計算方法從同性戀用戶那裡收集有關健康相關主題的推文，並對這些主題進行建模。為了確定Twitter上男男性接觸者與健康相關信息的性質，我們收集了來自177個活躍用戶的數千條推文。我們使用可在未來研究中應用於其他LGBTQ子群體的框架對這些推文進行採樣。我們根據ICD 10發現了7種類型的11種疾病，這些與已發表的研究和官方報告一致。

具有度規則社區的網路的複製方程

原文標題： Replicator equation on networks with degree regular communities

地址： http://arxiv.org/abs/1803.09146

作者： Daniele Cassese

摘要：複製子方程是研究混合種群中演化動力學的基本工具之一。本文對演化圖論的文獻做出了貢獻，為具有社區的連通網路家族提供了一個複製方程式的版本，同一社區中的節點具有相同的程度。這個複製方程適用於不同類型博弈的研究，探索圖結構對演化動力學平衡的影響。

網路考古學：網路歷史可恢復性的相變

原文標題： Network archaeology: phase transition in the recoverability of network history

地址： http://arxiv.org/abs/1803.09191

作者： Jean-Gabriel Young, Laurent Hébert-Dufresne, Edward Laurence, Charles Murphy, Guillaume St-Onge, Patrick Desrosiers

摘要：網路增長過程可以理解為複雜網路結構和歷史的生成模型。這種觀點自然會導致網路考古學的問題：從網路結構中重構網路的所有過去狀態---一個困難的排列推理問題。在本文中，我們引入了貝葉斯網路考古學的表述，並將優先依戀的概括作為我們的生成機制。我們開發了一個順序重要性抽樣演算法來評估這個模型的後驗平均值，以及一個在線性時間內揭示網路歷史的高效啟發式演算法。當這些方法應用於模型本身生成的人工網路時，我們使用這些方法來識別和描述重建歷史質量的相變。儘管存在一個沒有恢復的階段，但我們發現在參數空間的大部分以及經驗數據中可能存在非平凡推論。

二維意見動態：領域粗化導致穩定的雙極化和異常尺度指數

原文標題： Opinion dynamics in two dimensions: domain coarsening leads to stable bi-polarization and anomalous scaling exponents

地址： http://arxiv.org/abs/1803.09363

作者： Fátima Velásquez-Rojas, Federico Vazquez

摘要：我們研究了一個觀點動態模型，該模型探討了在二維正方點陣上的最近鄰居相互作用試劑群體中說服與妥協之間的競爭。每個代理人可以持有積極或消極的意見導向，並可以有兩個級別的強度 - 中等和極端主義。當兩個相互作用的代理人具有相同的方向時，會成為說服概率為p的極端主義者，而如果他們具有相反的方向，則會變為溫和的，折中概率為q。這些更新規則導致形成具有粗糙動態的相同意見域，其取決於比率r=p/q。人口最初演變為一個小r的中央集權國家，其中領土由中等代理人組成，粗化不存在表面張力，並且形成一個雙極化狀態的大r，其中領域由極端主義代理人和粗化由曲率驅動。極端意見上的共識最終在人口規模為N和r為 t simeq r ^ { - 1} ln N $的小型$ r $和$ tau sim r ^ 2 N ^ {1.64} $大$ r $。當系統落入條紋狀態時，雙極化可能非常穩定，其中藥劑組成單一水平，垂直或對角線條帶。分析條紋動態趨向一致性可以獲得$ tau $的近似表達式，這表明$ 1.64 $指數是條紋界面擴散和粗糙度屬性的結果。

圖關聯矩陣的稀疏恢復：多項式時間保證和位置相關性能

原文標題： Sparse Recovery over Graph Incidence Matrices: Polynomial Time Guarantees and Location Dependent Performance

地址： http://arxiv.org/abs/1803.09631

作者： Mengnan Zhao, M. Devrim Kaba, René Vidal, Daniel P. Robinson, Enrique Mallada

摘要：稀疏恢復中的經典結果保證了在字典上假設太強或NP難以檢查的假設下精確重構稀疏信號。而且，這種結果在實踐中可能過於悲觀，因為它們是基於最壞情況的分析。在本文中，我們考慮在圖上定義的信號的稀疏恢復，字典採用關聯矩陣的形式。我們證明在這種情況下，可以根據圖的循環的屬性導出必要和充分的條件，這可以在多項式時間中檢查。我們的分析進一步使我們能夠得出與恢復有關的位置相關條件，而這些條件僅取決於與此支持相交的圖表循環。最後，我們利用測量上的稀疏性屬性來實現一種超越標準 ell1最小化的專門的基於子圖的恢復演算法。

未來高度可再生的歐洲電力系統的成本最優情景：探索天氣數據，成本參數和政策約束的影響

原文標題： Cost optimal scenarios of a future highly renewable European electricity system: Exploring the influence of weather data, cost parameters and policy constraints

地址： http://arxiv.org/abs/1803.09711

作者： David P. Schlachtberger, Tom Brown, Mirko Sch?fer, Stefan Schramm, Martin Greiner

摘要：從高度可再生的電力系統模型導出的成本最優情景取決於具體的輸入數據，成本假設和系統約束條件。考慮到風能，太陽能，水力發電，天然氣發電，輸電和不同儲能選項的容量投資和運營，我們使用技術經濟優化模型為30個歐洲國家的聯網系統研究這種影響。我們觀察到總體系統成本相對於輸入天氣數據具有相當的穩健性，並且適中地改變了成本假設。我們表明，圍繞成本最優化配置的優化環境中的平坦方向經常允許系統規劃者在不增加總成本的情況下在不同技術選項之間進行選擇，例如在公共接受問題的情況下通過在海上替換海上風力發電能力。探索一系列二氧化碳排放限值表明，對於傳輸擴展適度的情景，與1990年的水平相比，減少約57％已經是成本最優的。對於更嚴格的CO 2 _2 $限制，燃氣輪機產生的電力首先由增加的可再生能力所代替。非水力發電能力僅適用於低排放情景，以便提供必要的靈活性以滿足剩餘負荷峰值。

在書和推文中的英文動詞規則化

原文標題： English verb regularization in books and tweets

地址： http://arxiv.org/abs/1803.09745

作者： Tyler J. Gray, Andrew J. Reagan, Peter Sheridan Dodds, Christopher M. Danforth

摘要：英語在其整個生命周期中都發生了戲劇性的演變，現代演講者的古英語在沒有翻譯的情況下會變得無法理解。這個過程的一個具體指標是從動詞過去式不規則到規則（-ed）的形式。在這項研究中，我們使用兩個截然不同的數據集來量化動詞正則化的程度：（1）谷歌（2003--2008）掃描六年出版的書籍;（2）發布到Twitter的十年社交媒體消息（2008- -2017）。我們發現，在整個推特上，動詞正規化的程度要大於英文小說書籍。對於美國相對於美國英語書籍的地理標記來說，規則化也更大，但對於英國相對於英國英語書籍的地理標記而言，情況正好相反。我們還發現美國各縣在正規化方面有意義的區域差異。但是，一旦解釋了人口差異，我們就沒有發現與社會人口學變數（如教育或收入）之間的強相關性。

基於人群的多元謂詞篩選文獻綜述

原文標題： Crowd-based Multi-Predicate Screening of Papers in Literature Reviews

地址： http://arxiv.org/abs/1803.09814

作者： Evgeny Krivosheev, Fabio Casati, Boualem Benatallah

摘要：系統文獻評論（SLR）是最常見和最有用的科學研究和出版形式之一。每年發布數以萬計的單反，並且這個速度在所有科學領域都在增長。然而，執行一個準確，完整和公正的單反是一項艱巨和昂貴的努力。對於文獻綜述的所有階段，特別是在紙質篩選階段，通常都是如此，其中作者根據一些排除標準篩選了一組潛在的範圍內的論文。為了解決這個問題，近年來，研究界開始探索人群的使用，以便更快，更準確，更廉價和無偏見地篩選論文。初步結果表明，即使對於相對複雜的評論，眾包也是有效的。在本文中，我們推導和分析了一套基於人群篩選的策略，並且顯示了一種自適應策略，該策略不斷重新評估問題的統計特性，以最小化為每篇論文作出決策所需的投票數量，在成本和準確性方面勝過了一些非適應性方法。我們通過一系列眾包實驗驗證了方法的適用性和結果，並討論了我們認為通常對分類問題感興趣的問題和演算法的性質，其中物品通過一系列連續測試進行分類（因為它經常發生在醫學上）。

科學網路中的整合

原文標題： Conformity in Scientific Networks

地址： http://arxiv.org/abs/1803.09905

作者： James Owen Weatherall, Cailin OConnor

摘要：科學家一般都會受到社會壓力，包括與社區中其他人相一致的壓力，這些壓力會影響其認知目標的實現。在這裡，我們分析一個網路認識論模型，在這個模型中，代理人，其他所有人都是平等的，更願意採取符合他們鄰居的行動。這種符合性偏好與代理人關於兩種可能行為中的哪一種產生更好結果的信念相互作用。我們發現了一系列可能的結果，包括信念和行動中的穩定極化。模型結果對網路結構高度敏感。但總的來說，一致性對社區達成關於世界的準確一致的能力有負面影響。

網路科學方法模擬供應網路的出現和拓撲穩健性：回顧與展望

原文標題： Network Science approach to Modelling Emergence and Topological Robustness of Supply Networks: A Review and Perspective

地址： http://arxiv.org/abs/1803.09913

作者： Supun Perera, Michael Bell, Michiel Bliemer

摘要：由於全球供應鏈網路（SCN）的日益複雜和相互關聯的性質，最近的一系列研究已經將網路科學方法應用於SCN增長建模，並隨後分析了各種拓撲特徵，如魯棒性。本文提供了：（1）全面回顧了文獻中用於建模SCN的拓撲結構和魯棒性的方法; （2）各種數據驅動研究中報告的現實世界SCN的拓撲特徵總結; （3）討論現有網路增長模型的局限性，以實際表示所觀察到的SCN的拓撲特徵。最後，通過基於適應度的生成網路模型，提出了一種新穎的觀點來模擬實證研究中報告的SCN拓撲結構。

AgeGuess資料庫：一個關於年齡在3-100歲之間的實際年齡和感知年齡的在線資源

原文標題： The AgeGuess database: an open online resource on chronological and perceived ages of people aged 3-100

地址： http://arxiv.org/abs/1803.10063

作者： J. A. Barthold Jones, U. W. Nash, J. Vieillefont, K. Christensen, D. Misevic, U. K. Steiner

摘要：在許多發達國家，人類預期壽命在過去的180年中從40年增加到80年左右。這一巨大進步的基礎是改變我們的年齡，但我們對這一改變的理解仍然有限。在這裡，我們提供了一個獨特的資料庫，豐富了研究人類衰老過程的可能性：http://AgeGuess.org資料庫關於人們的感知和時間年齡。感知年齡（即人們對其他人看起來有多大）與生物年齡相關，這是衡量一個人健康狀況的指標，與同齡同齡人的平均值相比較。確定生物學年齡通常涉及複雜的分子和細胞生物標誌物。相反，將感知年齡作為生物學年齡的生物標誌物，使我們能夠通過公民科學項目收集大量有關生物學年齡的數據，人們可以通過這個http URL上傳他們自己的圖片並猜測其他人的年齡，並且還可以收集數據回顧性的，因為人們可以上傳他們年輕時的照片或他們的父母和祖父母的照片。因此，我們可以研究感知年齡與年齡之間差距的時間變化，以解決問題，比如我們現在是否變老，或者是否延緩老齡化。這裡介紹的感知年齡數據涵蓋了從1877年到2014年的出生隊列。自2012年以來，該資料庫增長到現在包含大約20萬個認知年齡猜測。來自120多個國家的4000多名公民科學家上傳了約5000張面部照片。我們詳細介紹了如何收集數據，可以免費下載數據的位置以及所包含的變數。除了老化研究之外，數據還提供了大量可能性來研究人類如何猜測年齡，並將這些知識用於推進和測試新興的人工智慧和深度學習演算法應用。

熱力學極限下合作的湧現

原文標題： Emergence of Cooperation in the thermodynamic limit

地址： http://arxiv.org/abs/1803.10083

作者： Shubhayan Sarkar, Colin Benjamin

摘要：預測合作行為如何在熱力學極限中出現是演化博弈論中的一個突出問題。對於雙人博弈，合作很少是納什均衡。然而，在熱力學極限合作中，無論我們是處理人類還是動物，合作都是自然的追求。在這項工作中，我們使用與Ising模型的類比來預測熱力學極限中的合作是如何產生的。

Facebook的廣告平台：新的攻擊媒介和干預需求

原文標題： Facebooks Advertising Platform: New Attack Vectors and the Need for Interventions

地址： http://arxiv.org/abs/1803.10099

作者： Irfan Faizullabhoy, Aleksandra Korolova

摘要：通過引入新工具（如自定義受眾群體，行為定位和Audience Insights），廣告定位功能變得越來越強大。雖然這對企業有利，因為它可以讓人們接收更多相關的廣告，但這些工具的力量有其不足之處。在本文中，我們著重討論三個缺點：隱私侵犯，微小目標（即，能夠在沒有明確知識的情況下觸及特定個人或個人，他們是廣告唯一達到的人），並容易接近邊化群體。使用Facebook的廣告系統作為案例研究，我們證明了這些缺點的可行性。然後，我們討論Facebook對調查結果負責任披露的回應，並呼籲開展額外的政策，科學和工程工作，以保護消費者適應快速發展的廣告定位生態系統。

你是你的元數據：使用元數據信息識別和混淆社交媒體用戶

原文標題： You are your Metadata: Identification and Obfuscation of Social Media Users using Metadata Information

地址： http://arxiv.org/abs/1803.10133

作者： Beatrice Perez, Mirco Musolesi, Gianluca Stringhini

摘要：元數據與我們在數字世界的日常互動和交流中產生的大部分信息相關聯。然而，令人驚訝的是，元數據通常仍然是非敏感的。事實上，過去，研究人員和從業人員主要關注從消息內容中識別用戶的問題。在本文中，我們使用Twitter作為案例研究來量化元數據與用戶身份之間關聯的唯一性，並了解潛在混淆策略的有效性。更具體地說，我們分析元數據中的原子欄位，並系統地將它們組合起來，努力將新推文歸類為屬於使用不斷增加的複雜性的不同機器學習演算法的賬戶。我們證明，通過監督學習演算法的應用，我們能夠以大約96.7％的準確度識別10,000組中的任何用戶。而且，如果我們擴大搜索範圍並考慮10個最有可能的候選者，那麼我們將模型的準確性提高到99.22％。我們還發現，對於這種類型的數據，數據混淆是困難的和無效的：即使在擾亂了60％的訓練數據之後，仍然有可能以高於95％的準確度對用戶進行分類。這些結果對於元數據混淆策略的設計具有強烈的影響，例如對於數據集發布而言，不僅對Twitter而言，而且對於大多數社交媒體平台來說更普遍。

聲明：Arxiv文章摘要版權歸論文原作者所有，由本人進行翻譯整理，未經同意請勿隨意轉載。本系列在微信公眾號「網路科學研究速遞」（微信號netsci）和個人博客 https://www.complexly.me （提供RSS訂閱）進行同步更新。