2018人工智慧技術十大趨勢是什麼 普華永道的這份報告值得你一看
以下內容來自普華永道,版權歸普華永道所有。
我們身處一個巨變的時代,毋庸置疑,人工智慧已經成為科技前沿之一,將給許多行業帶來顛覆性的影響,也有可能在未來重塑公司的人才戰略、運營模式以及與客戶的合作模式。商業領袖都已未雨綢繆,著手研究人工智慧將如何影響他們的商業戰略,以防被第四次工業革命的浪潮甩在身後。
事實上,深度學習與增強學習在日常生活中的應用很多。例如,機器翻譯是對文本數據的處理;Siri等是對語音數據的處理;自動駕駛是對視頻數據的處理;人臉識別則是對圖像數據的處理。許多美顏APP都具備給圖片添加可愛貼畫的功能,這即是對圖像進行識別,自動甄別出用戶面部器官,用戶即可隨意處理圖片,達到美化或娛樂的效果。
但是目前實驗室又在發生什麼呢?可以預見的是,那裡的研究人員的發現將會決定人工智慧未來一段時間的發展進程。普華永道人工智慧加速器 (AI Accelerator) 研究團隊和諸多技術專家及商業領袖一樣,正密切關注人工智慧技術的領先發展。
下面將闡述該研究團隊發布的2018年人工智慧技術十大趨勢。
1,深度學習:揭秘神經網路的工作原理。
簡述:模仿人類大腦的深度神經網路展示了它們可以從圖像、音頻和文本數據中「學習」的能力。然而, 即使應用已超過十年,關於深度學習我們仍然有很多不明白的地方,包括神經網路如何學習、為什麼它們的表現如此出色等。現在,這種狀況有可能會改變,這要歸功於將信息瓶頸理論應用於深度學習的新理論。信息瓶頸理論認為,深度神經網路在學習過程中像把無用信息從瓶頸中擠壓出去一般,去除噪音信息,而只保留這些噪音所表達的真正信息。
意義:精確地理解深度學習的工作原理,將有助於使其得到更大的發展和應用。例如,深度學習可以為網路設計優化和架構選擇提供參考。可以肯定的是,通過探索深度學習理論,更多的場景應用能夠被激發,並應用到其他類型的深度神經網路和深度神經網路設計中。
2,膠囊網路:模擬大腦的視覺處理優勢。
簡述:膠囊網路是一種新型的深度神經網路架構,它能夠用與大腦相同的方式處理視覺信息,這意味著它可以識別特徵之間的邏輯和層次結構關係。這一特性與卷積神經網路形成鮮明對比。卷積神經網路是最廣泛使用的神經網路之一,但它不能考慮簡單和複雜特徵之間的重要空間關係,導致錯誤率較高並經常出現誤分類現象。
意義:對於典型的圖像識別任務,膠囊網路通過減少誤差,保證了50%的較高準確性,同時膠囊網路也不需要那麼多的訓練樣本數據。預期可以看到膠囊網路在多個問題領域和深度神經網路架構中得到廣泛的使用。
3,深度增強學習:交互型問題解決之道。
簡述:深度增強學習是一種通過觀察、行動和獎勵來與環境互動,從而進行學習的神經網路演算法。它已被用於遊戲攻略等,如雅達利 (Atari) 和圍棋,包括擊敗人類冠軍的著名的「阿爾法狗」(AlphaGo) 等。
意義:獲得深度增強學習能力是人工智慧應用商業化的重要指標項之一,與其他技術相比,它只需要更少的數據來培訓其模型。更強大的是,它可以通過模擬獲得訓練,完全不需要標籤化數據。鑒於這些優勢,預計未來一年將誕生更多將深度增強學習和基於智能體模擬相結合的商業應用。
4,生成對抗網路:網路配對促進訓練,減輕處理負擔。
簡述:生成對抗網路是一種由兩個互相競爭的神經網路組成的無監督的深度學習系統——「生成網路」 產生看上去很像真實數據集的假數據,「判斷網路」吸收真實和合成的數據。隨著時間的推移,每個網路都會得到改進,從而使兩個網路都能夠學習到給定數據集的整個分布情況。
意義:生成對抗網路進一步拓展了深度學習,使其能夠處理更大範圍的無監督任務,這些任務的標籤化數據要麼不存在,要麼過於昂貴而很難獲得。生成對抗網路也減少了深度神經網路所需的負載,因為負載由兩個網路共同承擔。預期可以看到更多的商業應用,例如使用生成對抗網路技術來做網路探測等。
5,精簡和增強數據學習:解決數據標籤化挑戰。
簡述:機器學習(尤其是深度學習)遇到的最大挑戰是需要大量使用標籤化數據來訓練系統。目前有兩種廣泛使用的技巧可以幫助解決這個問題:(1)合成新的數據;(2)將一個任務或領域的訓練模型遷移到另一個,例如「遷移學習」的技巧(把從一個任務/領域學到的經驗遷移到另一個任務/領域),或 「一次學習」的技巧(極端化遷移學習,僅僅通過一個例子或沒有相關例子的學習),由此使它們成為 「精簡數據」學習技巧。同樣的,通過模擬或內插合成新的數據有助於獲取更多的數據,從而擴大現有數據來改善學習。
意義:使用這些技巧,我們可以解決更多的問題,尤其是在歷史數據較少的情況下。預期可以看到精簡和增強數據的更多變種,以及適用於更廣泛商業問題的不同類型的學習技巧。
6,概率編程:便於模型開發的語言。
簡述:概率編程是一種高級編程語言及建模框架,它能讓開發人員便捷地設計概率模型,並且自動求解這些模型。概率編程語言可以讓我們重複使用模型庫,支持互動式建模以及認證,並提供必要的抽象層來更廣泛和有效地推論通用模型組。
意義:概率編程框架適合的場景包括在商業領域內極為常見的不確定和不完整信息的情況。未來,我們會看到這些語言得到更廣泛地應用,並期望它們也用於深度學習。
7,混合學習模式:結合演算法優勢解決不確定性問題。
簡述:不同類型的深度神經網路,譬如生成對抗網路和深度增強學習,在它們的效果和結合不同類型數據的廣泛應用方面顯示出巨大的前景。不過,深度學習模型不能為不確定性的數據場景建模,而貝葉斯概率方法卻能夠做到。混合學習模式結合了這兩種方法,且能夠充分利用每一種方法的優勢。混合模型的一些例子包括貝葉斯深度學習,貝葉斯生成對抗網路和貝葉斯條件生成對抗網路等。
意義:混合學習模式將商業問題的種類擴大到對不確定性進行深度學習。這可以幫助我們獲得更佳效果,提高模型的可解釋性,從而鼓勵更廣泛的應用。我們將看到更多能夠媲美貝葉斯法的深度學習方法,以及概率編程語言能夠更好地與深度學習相融合。
8,自動機器學習:無需編程即可創建模型。
簡述:開發機器學習模型是一項耗時長且必須由專家驅動的工作,包括數據準備、特徵選擇、模型或技術選擇、訓練和調試等。自動機器學習旨在使用多種不同的統計學和深度學習演算法來自動化這項工作。
意義:自動機器學習被視為人工智慧工具「民主化」的一個部分,用戶可以藉助它在沒有高級編程技能的情況下開發機器學習模型。這將加快數據科學家創建模型的速度。我們將看到更多的商業化自動機器學習包,以及自動機器學習與更廣泛的機器學習平台的整合。
9,數字孿生體:超越工業應用的虛擬複製品。
簡述:數字孿生體是一種虛擬模型,用於物理或心理系統的詳細分析和監測。數字孿生體的概念起源於工業界,廣泛用於分析和監測諸如風電場或工業系統等。現在,通過使用基於智能體的建模(用於模擬自動智能體的行為和交互的計算模型)和系統動態學(計算機輔助的策略分析和設計方法)等,數字孿生體被廣泛應用於非物理對象和流程管控中,例如預測客戶行為等。
意義:數字孿生體可以幫助促進物聯網 (IoT) 的發展和更廣泛的應用,為預測性診斷和維護物聯網系統提供了一種方法。展望未來,有望在實體系統和消費者選擇建模中看到更多數字孿生體的使用。
10,可解釋的人工智慧:打開黑匣子。
簡述:目前,有許多機器學習演算法正在使用中,它們可以在各種不同的應用場合中感知、思考和行動。然而,其中許多演算法被認為是「黑匣子」,人們對於它們是如何計算出結果幾乎是一無所知。可解釋的人工智慧意在進一步開發機器學習技巧,在產生更多可解釋的模型的同時保持人工智慧預測的準確性。
意義:可解釋、可證明且透明的人工智慧對建立技術信任至關重要,這會促進更廣泛地採用機器學習技巧。我們預測,在開始大規模採用人工智慧之前,企業可能會將可解釋的人工智慧作為一項要求或者最佳實踐,與此同時,政府可能會將可解釋的人工智慧作為未來的一項法規要求。
推薦閱讀: