每日文摘 | 2018年09月11日
來自專欄生物解碼1 人贊了文章
How AI technology can tame the scientific literature | Nature
Iris.ai是一個由人工智慧(AI)驅動的文獻探索工具。使用對研究人員問題的300到500字的描述,或現有論文的URL,一個位於柏林的伺服器可以返回數千個匹配文檔,按主題進行可視化分組。結果提供了對某個研究問題相關文獻的快速而準確的概述。Iris.ai是眾多基於人工智慧的新搜索工具之一,提供有針對性的知識導航。這些工具包括由華盛頓州西雅圖的Allen Institute for Artificial Intelligence和Microsoft Academic開發的Semantic Scholar。儘管每種工具都有特定的定位,但它們都為科學家提供了與PubMed和Google Scholar等傳統工具不同的科學文獻搜索。許多人正在幫助研究人員驗證現有的科學假設。有些人通過揭示文獻之間隱藏的聯繫,甚至可以提出新的假設來指導實驗。
原文連接
Integrative detection and analysis of structural variation in cancer genomes | Nature Genetics
結構變體(structural variants, SV)可通過多種機制促使腫瘤發生。儘管很重要,但在癌症基因組中鑒定結構變體仍然非常具有挑戰性。研究人員提出了一個框架,集成了光學圖譜、高通量染色體構象捕獲(high-throughput chromosome conformation capture, Hi-C)和全基因組測序,以系統地檢測各種正常或癌症樣本和細胞系中的結構變體。他們確定了每種方法的獨特優勢,並證明只有綜合使用才能全面識別基因組中的結構變體。通過結合Hi-C和光學圖譜,它們可以解析複雜的SV並將多個SV事件分析為單個單倍型。此外,他們觀察到影響非編碼序列功能的廣泛結構變異,包括遠端調控序列的缺失,DNA複製時間的改變,以及新的三維染色質結構域的產生。
論文連接
AI Can Recognize Images. But Can It Understand This Headline? | Wired
最近來自fast.ai,OpenAI和Allen Institute for AI的研究帶來了一個自然語言理解的新突破,更強大的語言模型可以幫助研究人員解決一系列尚未解決的問題。到目前為止,最為廣泛測試的模型是嵌入式語言模型(Embeddings from Language Models, ELMo)。今年春天Allen Institute發布的ELMo在多項任務中超越了現有結果,比如閱讀理解,人工智慧回答SAT式問題,以及情感分析。使用ELMo方法可將多種基準測試結果提高25%。自然語言處理的ImageNet時刻已經到來。
原文連接 | 相關文章連接
推薦閱讀:
※神聖的NLP!一文理解詞性標註、依存分析和命名實體識別任務
※信息量與信息熵
※基於語義的智能Web挖掘技術研究
※一文介紹3篇無需Proposal的實例分割論文
※【線上直播】NLP的未來—語義落地 (Semantic Grounding)