第四次產業革命源於人工智慧(趨勢解讀20k字)

第四次產業革命源於人工智慧(趨勢解讀20k字),附「數據簡化DataSimp」技術描述、學會及社區1k字。歡迎關注、收藏、轉發新媒體「數據簡化DataSimp、科學Sciences」微信號、頭條號,轉載請寫出處:秦隴紀10「數據簡化DataSimp、科學Sciences」公眾號、頭條號譯編,投稿QinDragon2010@qq.com也歡迎加入。

目錄

A. 第四次產業革命:始於人工智慧(6.7k字)

B. 人工智慧將帶來第四次產業革命(3.3k字)

C. 人工智慧2.0時代序幕開啟書(6.5k字)(略)

D. 第四次產業革命之人工智慧常識、機遇和挑戰(4.8k字)

E. 數據簡化DataSimp技術描述、學會及社區(1k字)

本文通過對第四次產業革命、人工智慧概念常識、應用類型、產業智能化的概述,讓大家認識到當今之趨勢,以及人工智慧細分領域和機遇所在。文末附秦隴紀10數據簡化DataSimp技術描述、學會及社區。

A. 第四次產業革命:始於人工智慧(6.7k字)

文章摘要:谷歌首席執行官桑達爾?披猜去年底說「最近十年,我們一直在建立一個移動優先(mobile-first)的世界,而接下來的十年里,我們的將轉向人工智慧優先(AI-first)的世界。」原文作者:David Kelnar,譯者:徐婧欣,標籤:深度學習、機器學習、人工智慧。

「最近十年,我們一直在建立一個移動優先(mobile-first)的世界,而接下來的十年里,我們的將轉向人工智慧優先(AI-first)的世界。」(Google CEO Sundar Pichai,2016年10月)

從Amazon和Facebook到Google和Microsoft,世界上最具影響力的技術公司的領導者都在表現出了對人工智慧(AI)極大的熱愛。那麼什麼是AI?為什麼如此重要?為什麼會在現在成為熱點?雖然人們對於AI越來越感興趣,但是只有專家才能真正能夠理解這個領域。我們的目標是使更多人接觸到這個重要領域。

首先我們要解釋AI以及「機器學習」等關鍵術語的含義,闡述成果最豐富的AI領域「深度學習」是如何運作的,並對AI解決的問題及為什麼這些問題很重要進行探索。我們還會分析,為什麼二十世紀五十年代發明的AI技術會在今天迎來它的時代。

作為風險投資人,我們一直在尋找能夠為客戶和公司創造價值的新潮流。我們相信AI會是一種比移動化和雲計算更重要的變革。Amazon的CEO Jeff Bezos表示,「很難說在接下來的20年,AI會對社會造成怎樣的影響。」無論你是客戶、行政人員、企業家還是投資人,我們希望這篇文章能夠不同於那些天花亂墜的宣傳,真正為你解釋為什麼這個新型潮流對我們來說如此重要。

一、什麼是AI?

人工智慧:關於智能程序的科學。

1956年,達特茅斯學院的助理教授John McCarthy創造了「人工智慧」(AI)一詞,指那些能夠表現出智能行為的硬體和軟體,用John McCarthy的話說,就是「製造智能機器,尤其是智能計算機程序的科學和工程。」

基礎的「AI」已經存在了幾十年,在特定環境下通過基於一定規則的程序呈現基本的智能行為。但是取得的成績是有限的,因為用於處理很多現實世界問題的演算法是很難人工進行編程的。

在進行醫療診斷、預測機器故障或是測定特定資產的市場價值等複雜活動時,會涉及到上千個數據組和變數之間的非線性關係。在這些情況下,我們很難用現有的數據得到「最佳」預測結果。而在其他領域,包括在圖像中識別目標和語言翻譯等,我們甚至無法創建規則來描述我們尋求的特徵。我們怎麼可能編寫一組適用於所有情形的程序,來描述一隻小狗的外貌呢?

進行數據優化和功能特徵等複雜的預測時會遇到一些困難,假使我們將這種困難由程序員那裡轉移到程序呢?這就是現代人工智慧的責任。

機器學習也屬於AI技術,所有機器學習都屬於AI,但AI並不只是機器學習(見表一)。從人們對AI的興趣可以看出對機器學習的熱情,這一領域的發展非常迅速並且意義重大。

有些問題對於人類來說非常複雜,而機器學習可以幫助我們將一部分負擔轉移給演算法,來解決這些問題。1959年,AI的先驅Arthur Samuel曾經寫道,機器學習是「一種賦予計算機無需明確編程就能學習的能力的研究領域」。

大部分機器學習的目標都是針對特定使用情況開發預測引擎。演算法會接收到某一領域(比如一個人在過去看過的電影)的信息,對投入進行權衡,做出有用的預測(一個人在未來喜歡不同電影的可能性)。通過賦予「計算機學習的能力」,可以利用演算法完成最優化的任務,最優化也就是通過衡量可用數據中的變數,對未來進行準確預測。我們還可以更進一步,將特徵詳述的任務也交給程序來做。

機器學習演算法要經過訓練。演算法首先接收到例子,並且已知這些例子的輸出,記錄下預測輸出與真實輸出的差距並調整輸入的權重提高預測的準確性,直到得出最優值。因此,機器學習演算法最典型的特徵就是,預測的質量會隨著經驗的豐富而提升。我們提供的數據越多(一定程度上),預測引擎能得出的結果就越優化。(見圖二、圖三,需要的數據集的規模非常依賴於環境,從以下例子中我們無法籠統概括。)

機器學習的方法有超過15種,每一種都使用不同演算法結構,依據得到的數據實現預測最優化。「深度學習」是其中一種方法,在新的領域取得了突破性成果,我們將在下文中對此方法進行探索。此外一些沒有受到很多關注的技術也很有價值,它們適用於更廣泛的使用情形。除了深度學習外,「隨機森林」也是一種最有效率的機器學習演算法,可以創造很多決策樹,使預測最優化;

「貝葉斯網路」使用概率性方法分析變數及各變數之間的關係;在支持向量機中輸入的是類別化的案例,它可以創造模型,把新的輸入分配到各個類別中。

每一種方法都有優勢和不足,所以要結合起來使用(一種組合方法)。哪種演算法會被選擇出來解決某一特定問題,取決於可用數據集等因素的性質。實踐中,開發者傾向於通過實驗觀察哪些演算法是有效果的。

機器學習的使用案例根據我們的需求和想像而不同。擁有正確的數據後,我們可以建立演算法實現各種目的:根據某人之前的購買記錄推薦購買產品;預測汽車裝配線上的機器何時會發生故障;預測電子郵件地址是否錯誤;估計信用卡交易欺詐行為的可能性;還有很多其他目的。

深度學習:將特徵詳述工作交給演算法

即使使用隨機森林、貝葉斯網路、支持向量機等普通機器學習方法,也很難編寫出能很好地完成特定任務的程序,從理解語音到識別圖像中的對象。因為我們無法以實際、可靠的途徑來詳述特徵。例如,如果想要編寫計算機程序來識別汽車的形象,我們無法在演算法中詳述汽車的特徵,來確保在所有情況下都能準確識別。汽車的形狀、大小和顏色多種多樣,位置、方向和形態也有所不同。背景、燈光和很多其他因素都會影響對象的外表。一組規則中需要包含的變數太多了,即使我們能夠全部包含進去,這種解決方案也不具備延展性。我們需要為每種需要識別的對象都編寫一組程序。

深度學習(DL)已經徹底改變了人工智慧世界。有超過15種實現機器學習的方法,深度學習就是其中一種,所有深度學習都屬於機器學習,但是機器學習並不只是深度學習。(圖4)

通過深度學習,程序員可以不必完成特徵詳述(根據數據定義需要分析的特徵)或最優化(如何權衡數據以實現準確預測)的任務,而是全部交給演算法來完成。

那麼如何實現這些呢?深度學習的突破點在於模擬大腦,而不是模擬世界。我們的大腦會學習做有難度的事情,比如理解話語和識別物體,而且並不是通過詳盡的規則而是通過時間和反饋來學習。小的時候我們體驗這個世界(比如看見一張汽車的圖片),做出預測(汽車!)然後收到反饋(沒錯!)。我們沒有通過一組詳盡的規則,而是通過訓練進行學習。

深度學習使用的就是這種方法。將人造的、以軟體為基礎的計算器連接在一起,類似於大腦中的神經元。它們組成了一個「神經網路」,接收輸入並進行分析、作出判斷,如果判斷正確,就做出通知,如果輸出是錯誤的,演算法就會對神經元之間的聯繫做出調整,改變未來的預測。最初網路會出現很多次錯誤,但隨著我們輸入數以百萬計的例子,神經元之間的聯繫就會得到調整,最終幾乎在所有情形下,神經網路都會做出正確的判斷,這也就是熟能生巧。

通過這個過程,我們現在可以:

識別圖片中的元素;

實時語言翻譯;

語音控制設備(通過 Apple Siri、Google Now、Amazon Alexa 以及 Microsoft Cortana);

預測基因變化會對 DNA 轉錄產生怎樣的影響;

分析客戶反饋中的情感;

通過醫學影像探測腫瘤。

深度學習並不能用於解決所有問題,其通常會需要利用大型數據集進行訓練,需要廣泛的處理能力來訓練和運行神經網路。「可解釋性」也是一個問題,要知道神經網路如何實現預測是非常困難的。但是深度學習使程序員從複雜的特徵詳述工作中解放出來,為一系列重要問題提供成功的預測機制。深度學習最終會成為AI開發者的強大工具。

二. 深度學習是如何工作的?

既然深度學習如此重要,了解其工作的基本要素也是非常有價值的。深度學習需要使用一個人工「神經網路」,即一組相互連接的「神經元」(基於軟體的計算器)。

一個人工神經元至少會接收一個輸入,其會以此為基礎進行數學計算,得到輸出結果。輸出結果會依賴於每個輸入的權重和神經元中的「輸入-輸出函數」的結構(圖 5)。輸入-輸出函數會發生變化,神經元可能是:

一個線性單元(輸出與總加權輸入成一定比例);

一個闕值單元(輸出可分為兩個等級,根據總輸入是否高於特定值確定其等級);或者 Sigmoid 單元(輸出不斷變化,與輸入變化不成線性關係)。

當神經元相互連接時就會產生神經網路,一個神經元的輸出會成為另一個神經元的輸入(圖 6)。

神經網路會組成多層神經元(所以會有「深度」學習)。「輸入層(input layer)」接收信息,如一組圖片,網路會對此進行處理。「輸出層(output layer)」負責提供結果,多數活動都發生在輸入層和輸出層之間的「隱層(hidden layers)」上。神經網路上每一層的每個神經元的輸出都是下一層的一個神經元的輸入(圖7)。

下面就以一個圖像識別演算法為例,在圖像中識別人臉。將數據輸入神經網路,由第一層來識別局部對比的模式等「低等級」特點,如輪廓。圖像穿過網路後,會逐漸提取其中的「高等級」特點,從輪廓到鼻子,再到面部。(圖8)

在輸出層,通過訓練神經網路會得出關於圖片屬於某一類的可能性(人臉:97%;氣球:2%;樹葉:1%)。

訓練神經網路的方式就是將大量帶有標記的例子展現在它們面前,可以檢測出來錯誤,演算法也會對神經元之間聯繫的權重進行調整,來完善結果。多次重複這個優化過程,就可以部署系統並對未標記的圖像進行評估。

以上是一個簡單的神經網路,但是結構可以變化,且多數比較複雜。變數包括同層神經元之間的連接;區別每層神經元的數量;神經元之間的聯繫向上一等級網路輸出(遞歸神經網路)。

設計和完善神經網路需要大量的技能,步驟包括為特定應用組織網路、提供合適的訓練數據集,根據進展調整網路結構,以及結合多種方法。

三.AI為什麼很重要?

AI要處理的是非常有深度的難題,因此非常重要,這些問題的解決方案可以應用於那些對人類幸福感非常重要的部門,從健康、教育和商業到交通、公共事業和娛樂。二十世紀五十年代起,AI研究就關注了五個領域:

推理:通過邏輯推理解決問題的能力。

知識:表現關於世界知識的能力。(理解世界上的一些特定實體、事件和狀況;具有某些特性的要素;可分類的要素。)

計劃:制定和實現目標的能力(世界的未來有一種特定狀態是我們所期待的,可以通過一系列的活動影響到通向這種狀態的過程)。

交流:理解書面和口頭語言的能力。

感知:根據視覺影像、聲音和其他感官輸入對與世界有關的事情進行推理的能力。

AI的價值可以體現在很多方面,這些能力的進步帶來的不只是發展而是變革。AI的應用事例包括以下方面:

推理:法律評定;金融資產管理;財務應用處理;遊戲;自主武器系統。

知識:醫療診斷;藥品研發;媒體推薦;購買預測;金融市場貿易;欺詐防範。

計劃:物流;行程安排;導航;物理和數字網路優化;預見性維護;需求預測;庫存管理。

交流:聲音控制;智能代理,助理及客戶支持;書面及口頭語言實時翻譯;實時轉錄。

感知:自動駕駛;醫療診斷;監控。

接下來幾年,幾乎所有部門都會在更多流程中應用機器學習。比如簡單的企業功能,如一家公司中的人力資源(HR),就即將應用機器學習;

員工招聘可以更有目標性,可以使用智能工作匹配和部分自動化評估功能;

通過人員需求和缺席的預測性計劃可以強化員工管理;

如果能夠推薦更適合員工的學習內容,員工學習也會更有效果;

通過對員工離職風險的預測可以減少人員變動。

機器學習將變得正規化,成為開發人員標準工具的一部分,能夠完善並重塑現有流程。

機器學習的後續影響會超越即時影響。深度學習促進了計算機視覺的發展,例如可以實現車輛(轎車和卡車)自動駕駛。那麼其又會帶來哪些影響呢?目前在英國有 90% 的人和 80% 的貨物是通過公路運輸的,如果使用自動駕駛車輛會產生以下影響:

安全(90% 的交通事故是由駕駛員的疏忽引起的)

僱傭(英國有220萬運輸及物流行業的員工,年薪約為570億英鎊)

保險(Autonomous Research預計,之後英國的汽車保險費用將下降63%)

部門經濟(客戶將使用按需交通服務,代替自己的汽車);

汽車生產能力;城市計劃;規則及其他。

四. 為什麼現在會是AI的時代?

AI研究始於二十世紀五十年代,為什麼在經歷了多次失敗以後,現在迎來了轉折點?新演算法的產生、數據通知能力的提升、更好的訓練演算法的硬體以及促使開發者使用AI技術的雲服務。

1.經過改進的演算法

儘管深度學習並不是新技術,首個有效多層神經網路的詳細說明發佈於1965年,但是在過去十年里演算法的發展確實對深度學習產生了很大影響。

由於卷積神經網路(CNN)的發展,我們在圖像中識別物體的能力也得到了提高(圖9)。受到動物視覺皮質的啟發,神經網路中的每一層都是特定模式存在的過濾器。2015年,微軟的基於 CNN 的計算機視覺系統(準確度:95.1%)在圖片中識別物體的能力超過了人類(準確度:94.9%)。「據我們所知」,他寫道,「我們的成果的表現首次超過了人類。」CNN 更加廣泛的應用還包括視頻和語音識別。

同時,遞歸神經網路(RNNs)出現後,語音和字跡的識別能力也在迅速提高(圖10)。RNNs的反饋聯繫能夠確保數據進入一個循環,這不同於只能正向輸送的常規神經網路。有一種強大的新型RNN叫做「長短時記憶(LSTM)」模型。通過附加的聯繫和存儲單元,RNN能夠記憶幾千個步驟之前看見的數據,並通知以下解釋,這對於語音識別來說非常有價值,對下一個詞的解釋可以從前面的單詞那裡得知。2012年開始,Google 開始使用LSTM來支持Android系統中的語音識別,僅六周前,微軟的工程師宣布,他們的系統誤字率為5.9%,這是首次大致等同於人類的水平。

2. 專門化硬體

繪圖處理器(GPUs)是專門的電子電路,極大削減了深度學習所需的訓練神經網路的時間。

訓練神經網路廣泛應用了矩陣計算方法。所以對3D遊戲有用的GPUs非常適合加速深度學習的發展,一個簡單的GPU就能夠將訓練效率提升5倍,在較大的問題上,收穫或許增加了不只10倍。如果結合上那些為了廣泛使用深度學習框架而調整的軟體開發裝備,訓練速度會有更大的提升。(圖11)

3. 大規模數據

用於深度學習的神經網路通常都需要利用大型數據組進行訓練,從幾千個例子到幾百萬個例子。幸運的是,數據的創造和可用性在以指數方式增長。現在,隨著進入數據的「第三次浪潮」,人類每天會產生2.2艾位元組(23億千兆位元組)的數據;世界上所有數據中有90%都產生於過去的24個月。

數據創造的「第一次浪潮」開始於二十世紀八十年代,涵蓋文檔和交易數據,可以聯網的台式PC的普及也加速了這次浪潮。接下來是數據的「第二次浪潮」,是非結構化媒體(電子郵件、照片、音樂和視頻)的一次爆發,普及化的智能手機聯網後會產生網頁數據和元數據。現在我們正在邁入數據的「第三時代」,工業和家中都可以部署機器感測器,創造額外的監控、分析和元數據。

假定今天我們創造出的大量數據都是通過互聯網傳送的,膨脹的網路交通就會成為大量增長的數據量的防火牆。1992年,人類每天傳送100GB的數據,而到了2020年,我們每秒就將傳送61,000GB 數據(圖12)。

我們能夠使用的通用數據越來越多,專業數據資源加速了機器學習的進程。例如ImageNet,是一個可以自由使用的資料庫,擁有超過一千萬個帶標籤的圖像。這個資料庫加速了對象分類深度學習演算法的發展。

4. 雲服務

行業內頂尖的雲計算供應商會提供雲端的機器學習基礎架構及服務,能夠促進開發者對機器學習的使用。

Google、Amazon、Microsoft和IBM都會通過提供雲端基礎架構(建模和迭代環境、可擴展的「GPUs即服務」和相關託管服務)來降低開發機器學習功能的成本和難度。

此外,他們提供的雲端機器學習服務(從圖像識別到語言翻譯)範圍也在擴大,開發人員可以直接在自己的應用中使用這些服務。Google機器學習提供了一些很容易獲得的服務,包括視覺(物體識別、明確內容檢測、人臉檢測和圖像情感分析);語音(語音識別和語音文字轉換);文本分析(實體識別、情感分析、語言檢測及翻譯);以及求職(列舉工作機會以及資格匹配)。Microsoft Cognitive Services 能夠提供超過21種視覺、語音、語言、知識和搜索領域的服務。

5. 利益和創業

在過去五年里AI領域的公共利益增長了六倍(圖 13),風投公司對AI公司的投資也大幅增加(圖14)。我們已經進入了一個良性循環,機器學習領域的進步正在吸引投資、創業以及注意力。而後者又會反過來加速機器學習的發展。

五. 前景如何?

機器學習能帶來的利益是無窮的,我能夠看到的就包括從無人駕駛汽車到人機互動的新途徑。還有很多利益沒有這麼明顯,但是能夠提供日常的業務流程和客戶服務的能力和效率。

有時我們的期望過高,超出了短期的發展潛力,我們希望未來能夠真正認識AI,隨著機器學習被用於改善和重新設想現有的系統,希望我們能夠認識到AI的價值。

歷史上,產業革命會通過新的能量來源和傳動裝置改變生產和交流方式。18世紀80年代,第一次產業革命通過蒸汽動力實現了生產自動化。19世紀70年代,第二次產業革命通過電力實現了大量生產。20世紀70年代以來,第三次產業革命通過電子工業和軟體技術實現了生產及通訊的自動化。現在,軟體遍布整個世界,信息處理成為了價值創造的首要來源。機器學習使我們的世界更加智能化,將產生歷史性的利益。

B. 人工智慧將帶來第四次產業革命(3.3k字)

(本文來源:網易科技報道2016-04-28 15:27:49,責任:丁鈺明_NT2591,網址http://tech.163.com/16/0428/15)

網易科技訊2016年4月28日消息,一年一度的GMIC大會於今日開幕,在下午的全球智能機器人大會上,地平線機器人技術創始人兼CEO余凱發表了開場演講,認為人工智慧將成就第四次產業革命。余凱稱人工智慧將成為世界上的新物種,人類花3到6個月可以學到的技能,在未來5到10年都會被人工智慧取代。

余凱稱,過去人類所有的進展實際上都是以人為中心,包括用技術去延展你的體力、腦里,使人走得更快,看得更遠。但是今天AlphaGo是跟你下棋,它是自主做決策,是一個自助行為的實體。所以說,像AlphaGo這樣的人工智慧是一個新的物種,它的一個核心特徵就是這種自主決策的行為。

另外,人工智慧也會逐步替代人的一些簡單的工作。在取代人類工作方面,余凱認為如果是一個人大概花3個月到6個月的時間能夠學習到的技能,在未來5到10年的時間都會被機器所替代,比如說駕駛。

余凱認為,大腦系統是未來機器的關鍵,它需要有感知的能力,需要有認知的能力,需要有決策的能力,這些核心離不開的是演算法。在一個深度學習的演算法框架下面,我們看到很多人工智慧的能力,機器所具備的能力,在過去的十年來都發生著翻天覆地的變化,從語音到圖像,甚至到決策的控制,包括語意的理解。余凱稱,宇宙中最聰明的智能設備是人類的大腦,如果從機器的角度想去實現這樣一個能力,你會看大腦是什麼樣子,從基本的神經原到感知肌,到更加複雜的網路結構,到我們今天深度的神經網路。目前,人類已經在深度學習上取得了很大的進展。(小羿)以下為演講實錄:

余凱:大家下午好!我們很多人說這次可能是一個新的產業革命,第四次產業革命,從蒸汽機時代到電器時代到信息時代,我們這次是人工智慧時代。為什麼說這是一次新的產業革命呢?我們覺得回顧過去十幾年的歷史,從PC互聯網到移動互聯網,到我們現在比如說我們叫AR、VR的時代,我們看到很多的信息、內容、服務,包括物理世界所存在的這些實體,比如說嘀嘀打車把每個計程車什麼司機,是哪個車號,現在在哪個地方,往哪個地方走都線上化了。所謂物理世界和虛擬世界的界限也比較的虛化了。

比如說我們思考阿爾法狗(AlphaGo)這件事情,它跟我們以前技術的進展很大的不一樣是說,過去所有的進展實際上都是以人為中心,去延展你的體力、腦里,使你走得更快,看得更遠。但是今天阿爾法狗是跟你下棋,它是自主做決策,這樣一個自助行為的實體。這樣的話是一個新的物種,它的一個核心特徵就是這種自助決策的行為。它會在生活、生產很多的方面,它在逐步替代人的一些簡單的工作。比如說我們會看到,如果是一個人大概花3個月到6個月的時間能夠學習到的技能,這樣的技能在未來5到10年的時間都會被機器所替代,比如說駕駛,過去可能少數人具有一個專車司機,未來每個人都會等效的有一個專車司機,因為每一個車在15年到20年的時間裡面應都是自動駕駛的。

我們把Robot翻譯成機器人,你在這個機器後面承載的一個人的概念,這個概念它實際上跟Robot的本意有可能不一樣。比如說我們查劍橋的辭典,我們查Robot這個詞講的是什麼意思?講的是它可以自動完成一定任務計算機控制下面的機器。所以Robot講的是智能機器,它跟人這個詞並沒有一個必然的關聯。

我們想有沒有機器人這樣一個詞?其實是有的,我相信在座的各位用的是手機的操作系統是安卓的,我們查安卓這個詞,意思是長得像人的Robot。安卓是一個人形機器人,它實際上在一個很寬泛概念裡面非常小的一個例子,但是在更寬廣的語境下面講的是智能機器,智能機器當然有各種各樣的多樣化的。在中國的語境下面有的時候你會問這樣一個問題,這個是Robot?這個它當然是一個機器人,它可以自助的跟你交互。長城會的兄弟們放了一個機器人在我們公司調戲了它一個禮拜,如果你在它周圍走動的時候,它眼睛會一直看著你,跟著產生很有意思的互動。它顯然是機器人,它也是Robot。

我問大家這個問題,這個是不是一個Robot?這個是不是一個安卓的?我記得日本的石黑浩教授每年都會來我們這個會場,至少一次,帶著他的美女機器人,我們很多的記者也會去報道,說日本的機器人技術怎麼樣怎麼樣了。我在這裡面想澄清一點,就是我們有一些媒體記者需要他們的知識,如果你稍微了解一下,實際上在台的後面的某一個小房間裡面,有一個小女生坐在電腦面前,它實際上所有的交互都是這個小女生來控制的。它的語音識別,甚至它的反饋,都是後面的小女生來完成的。所以這樣的一個形態的東西,它完完全全是一個木偶。

這些機器人它沒有人的形狀,但是它們能和你交互,可能成為你生活中的陪伴,或者是家庭裡面的一個中控。這樣一個智能交互的設備它當然是Robot,但是它不是安卓的。

我們看這些玩具,這些所有的品類在生活中無處不在它們今天只是我們叫功能型,但是未來它應該是變成它們裝上感測器,配上演算法,有控制系統,它可以自助的行為決策。未來所有這些品類,它們都會變成Robot,都會變成無處不在的自助的機器。所以這是一個大的趨勢。在移動互聯網以後,比移動互聯網更大的未來,是無處不在的萬物互聯,無處不在的萬物智能。所以AIInside它將無處不在。

這樣兩個圖像放在一起,你們有什麼感想?在幾個星期前有一個新聞,當然全世界都在關注,就是關於阿爾法狗,在那個禮拜關於同一家公司谷歌有另外一個新聞,在座的各位可能也關注到了,谷歌在考慮把他們的一個公司給賣掉,谷歌為什麼會做出這樣的選擇?我們比較這兩個圖像,另外一邊是人類的近親,它的谷歌,它的肌肉,它更強大,更靈活,但是它還在叢林裡面找香蕉吃。人類已經征服太空。人類有非凡的大腦,使人類變得卓越,變得不同。

大腦的系統無疑是未來Robot的關鍵,它需要有感知的能力,需要有認知的能力,需要有決策的能力。這些核心實際上離不開的是演算法。在一個深度學習的演算法框架下面,我們看到很多人工智慧的能力,機器所具備的能力,在過去的十年來都發生著翻天覆地的變化,從語音到圖像,甚至到決策的控制,包括語意的理解。宇宙中最聰明的智能設備是人類的大腦,如果從機器的角度想去實現這樣一個能力,你會看大腦是什麼樣子,從基本的神經原到感知肌,到更加複雜的網路結構,到我們今天深度的神經網路。

深度學習的演算法和傳統的AI的演算法一個很大的不同,AI的演算法到了數據大到一定程度的時候,不一定效果不斷的變好,但是深度神經網路的演算法,你可以看到它不斷的提升。比如手阿爾法狗它產生數千萬盤棋局的數據,通過它不斷的學習深度神經網路,從職業的二段也不知道到職業的多少段,據說是職業13段這樣的水平,它的水平在不斷的提高,這就是大數據和深度結合所帶來的變化。

我們看到因為深度學習的發展,過去在圖像領域,在語音領域所引領的,不斷去突破它的極限,使它的識別錯誤率不斷的降低。這是語音識別深度神經網路代替深學模型。後來端到端的學習帶來語音識別率繼續的提升。這是我們看到最近在端到端的深度神經網路在語意的處理和理解上面所取得的進展。

我們最近看到,前面我們看到很多感知方面的進展,從阿爾法狗我們看到,從感知到行為決策,深度學習,進入後一個十年發展的趨勢,如果你只是感知,不做任何決策,其實你並不改變這個世界,只有在環境中不斷的做決策,去調整,去優化你長期的收益,這個機器才能變成自主行為,並且改變世界的技術。

同樣的技術不光是在棋的對局,自動駕駛可以看作是汽車和環境的博弈。這樣一個博弈你在每時每刻在連續的做決策,比如說你是加速,你是左還是右,因為你每一次決策,你周圍的環境會發生改變,這些你需要連續做決策,最後優化的是一個長期的收益,就是從A地到B地足夠的高效,足夠的安全。

未來機器人大腦的構架,一種想法完全在雲端處理,但是這樣會帶來問題,比如一個汽車在行使過程中突然有小孩橫穿馬路,你把數據傳導雲端,雲端處理來回來,如果這個網路不穩定怎麼辦?說到這種實現和處理,我們自然會想到用什麼樹立起。我們手機和電腦上都有CPU,我們剛才講的無處不在的人工智慧所需要的這些感知、認知和控制,它需要這些東西是些專用的處理器。你會問,你這個問題有點奇怪,人類的大腦看起來是一個通用的處理器,在座的各位我不知道多少會認為大腦是通用還是專用處理器?認為大腦是通用處理器的舉個手?是專用處理器的舉個手?就更少了。

D. 第四次產業革命之人工智慧常識、機遇和挑戰(4.8k字)

1、人工智慧概念和價值

人工智慧(Artificial Intelligence)英文縮寫為AI,是研究、開發用於模擬、延伸和擴展人的智能的理論、方法、技術及應用系統的一門新的技術科學。人工智慧是計算機科學的一個分支,它企圖了解智能的實質,並生產出一種新的能以人類智能相似的方式做出反應的智能機器,該領域的研究包括機器人、語言識別、圖像識別、自然語言處理和專家系統等。1956年夏季,麥卡賽、明斯基、羅切斯特和申農等年輕科學家在美國DARTMOUTH學會共同研究和探討用機器模擬智能的問題,首次提出「人工智慧」這一術語,名稱來源於雨果·德·加里斯的著作。

人工智慧是對人的意識、思維的信息過程的模擬。人工智慧不是人的智能,但能像人那樣思考、也可能超過人的智能。人工智慧的定義可以分為兩部分,即「人工」和「智能」。「人工」是人力所能及製造的,或者人自身的智能程度有沒有高到可以創造人工智慧的地步,「人工系統」就是通常意義下的人工系統。「智能」涉及到諸如意識(CONSCIOUSNESS)、自我(SELF)、思維(MIND)(包括無意識的思維(UNCONSCIOUS_MIND))等問題。尼爾遜教授「人工智慧是關於知識的學科――怎樣表示知識以及怎樣獲得知識並使用知識的科學。」另一個美國麻省理工學院溫斯頓教授「人工智慧就是研究如何使計算機去做過去只有人才能做的智能工作。」這些說法反映了人工智慧學科的基本思想和基本內容,即人工智慧是研究人類智能活動的規律,構造具有一定智能的人工系統,研究如何讓計算機去完成以往需要人的智力才能勝任的工作,也就是研究如何應用計算機的軟硬體來模擬人類某些智能行為的基本理論、方法和技術。

人工智慧科學極富挑戰性,研究使計算機來模擬人的某些思維過程和智能行為(如學習、推理、思考、規劃等)的學科,人工智慧是一門邊沿學科,屬於自然科學、社會科學、技術科學三向交叉學科。AI涉及學科:哲學和認知科學,數學,神經生理學,心理學,計算機科學,資訊理論,語言學、控制論,不定性論、仿生學,社會結構學與科學發展觀等十分廣泛的科學,它由不同的領域組成,如機器學習,計算機視覺等。其研究範疇:自然語言處理,知識表現,智能搜索,推理,規劃,機器學習,知識獲取,組合調度問題,感知問題,模式識別,邏輯程序設計軟計算,不精確和不確定的管理,人工生命,神經網路,複雜系統,遺傳演算法等。

人工智慧研究目標是使機器能夠勝任一些通常需要人類智能才能完成的複雜工作。但不同的時代、不同的人對這種「複雜工作」的理解是不同的。[1]AI是計算機學科分支,稱為二十世紀七十年代世界三大尖端技術(空間技術、能源技術、人工智慧),二十一世紀三大尖端技術(基因工程、納米科學、人工智慧)之一。近三十年來,AI迅速發展,在很多學科領域都獲得了廣泛應用和豐碩成果,已逐步成為一個獨立分支,在理論和實踐自成一個系統。我國AI已經上升為和計算機科技、軟體工程並列的一級學科,在計算機領域、在機器人、經濟政治決策、控制系統、模擬系統中得到應用。

2、人工智慧科學發展階段

1956年,在美國達特茅斯(Dartmouth)學院,約翰·麥卡錫(John McCarthy,1971年度圖靈獎獲得者)、馬文·李·閔斯基(Marvin Lee Minsky,1969年度圖靈獎獲得者)、克勞德·艾爾伍德·香農(Claude Elwood Shannon,信息理論之父)、納撒尼爾·羅徹斯特(Nathaniel Rochester,IBM第一代通用計算機701主設計師)四位學者發起舉行「人工智慧夏季研討會」,指出「人工智慧」研究目標是實現能模擬人類的機器,該機器能使用語言,具有概念抽象和理解能力,能夠完成人類才能完成的任務並不斷提高機器自身。從1956年「美國達特矛斯會議(DARTMOUTH CONFERENCE)」提出人工智慧學科算起,61年來發展成為一門廣泛的交叉和前沿科學。全世界幾乎所有大學計算機系都有人研究這門學科,學習計算機的大學生也必須學習這樣一門課程。北大清華甚至有人工智慧系,但是效果並非很好。

DARTMOUTH會議後的7年中,AI研究開始快速發展.雖然這個領域還沒明確定義,會議中的一些思想已被重新考慮和使用了。CARNEGIE MELLON大學和MIT開始組建AI研究中心。研究面臨新的挑戰:下一步需要建立能夠更有效解決問題的系統,例如在"邏輯專家"中減少搜索;還有就是建立可以自我學習的系統。

1957年AI程序"通用解題機"(GPS)第一個版本進行了測試。這個程序是由製作"邏輯專家"的同一個組開發的。GPS擴展了WIENER的反饋原理,可以解決很多常識問題。兩年以後,IBM成立了一個AI研究組。HERBERT GELERNETER花3年時間製作了一個解幾何定理的程序。

1958年,當越來越多AI程序湧現時,MCCARTHY宣布了他的新成果:LISP語言,成為AI史上的突破。LISP到今天還在用,LISP意思是"表處理"(LIST PROCESSING),它很快就為大多數AI開發者採納。

1963年MIT從美國政府得到一筆220萬美元的資助,用於研究機器輔助識別.這筆資助來自國防部 高級研究計劃署(ARPA),已保證美國在技術進步上領先於蘇聯.這個計劃吸引了來自全世界的計算機科學家,加快了AI研究的發展步伐。

AI測試競賽:LOEBNER(人工智慧類):1991年美國科學家兼慈善家勒布納設立的對圖靈測試的第一種實踐,分金銀銅三等獎,用文本、音頻、視頻模仿人類迷惑人類裁判。大多數都不能成功欺騙多名人類裁判。以人類的智慧創造出堪與人類大腦相平行的機器腦(人工智慧),對人類來說是一個極具誘惑的領域,人類為了實現這一夢想也已經奮鬥了很多個年頭了。

以後幾年出現了大量程序。"SHRDLU"是"微型世界"項目的一部分,包括在微型世界(例如只有有限數量的幾何形體)中的研究與編程。在MIT由MARVIN MINSKY領導的研究人員發現,面對小規模的對象,計算機程序可以解決空間和邏輯問題。60年代末STUDENT解決代數問題,"SIR"可以理解簡單的英語句子.這些程序的結果對處理語言理解和邏輯有所幫助。

70年代專家系統可以預測在一定條件下某種解的概率。由於當時計算機已有巨大容量,專家系統有可能從數據中得出規律。專家系統的市場應用很廣。十年間,專家系統被用於股市預測,幫助醫生診斷疾病,以及指示礦工確定礦藏位置等。這一切都因為專家系統存儲規律和信息的能力而成為可能。

70年代許多新方法被用於AI開發,如MINSKY的構造理論。另外DAVID MARR提出了機器視覺方面的新理論,例如,如何通過一副圖像的陰影,形狀,顏色,邊界和紋理等基本信息辨別圖像。通過分析這些信息,可以推斷出圖像可能是什麼。1972年同時期另一項成果是提出PROLOGE語言。

80年代期間AI前進更為迅速,並更多地進入商業領域.1986年,美國AI相關軟硬體銷售高達4.25億美元。專家系統因其效用尤受需求,象數字電氣公司這樣的公司用XCON專家系統為VAX大型機編程.杜邦,通用汽車公司和波音公司也大量依賴專家系統。為滿足計算機專家的需要,一些生產專家系統輔助製作軟體的公司,如TEKNOWLEDGE和INTELLICORP成立了。為了查找和改正現有專家系統中的錯誤,又有另外一些專家系統被設計出來。

美國人工智慧協會基金會、私人公司研究人員熱潮。150多所像DEC(它雇了700多員工從事AI研究)這樣的公司共花了10億美元在內部的AI開發組上。其它AI領域也在80年代進入市場。其中一項就是機器視覺。MINSKY和MARR的成果如今用到了生產線上的相機和計算機中,進行質量控制。儘管還很簡陋,這些系統已能夠通過黑白區別分辨出物件形狀的不同。到1985年美國有一百多個公司生產機器視覺系統,銷售額共達8千萬美元。

80年代AI工業不全是好年景。86-87年AI系統需求下降,業界損失近5億美元。像TEKNOWLEDGE和INTELLICORP兩家共損失超過6百萬美元,大約佔利潤的三分之一巨大的損失迫使許多研究領導者削減經費。另一個令人失望的是國防部高級研究計劃署支持的所謂"智能卡車"。這個項目目的是研製一種能完成許多戰地任務的機器人。由於項目缺陷和成功無望,PENTAGON停止了項目的經費。

1996年2月10~17日,GARRY KASPAROV以4:2戰勝「深藍」(DEEP BLUE)。但是,到了1997年5月3~11日,GARRY KASPAROV以2.5:3.5輸於改進後的「深藍」。IBM公司研製的深藍(DEEP BLUE)計算機戰勝了國際象棋大師卡斯帕洛夫(KASPAROV)。計算機以它的高速和準確為人類發揮著它的作用。人工智慧始終是計算機科學的前沿學科,計算機編程語言和其它計算機軟體都因為有了人工智慧的進展而得以存在。

2003年2月GARRY KASPAROV 3:3戰平「小深」(DEEP JUNIOR)。

2003年11月GARRY KASPAROV 2:2戰平「X3D德國人」(X3D-FRITZ)。

2016年4月AlphaGo戰勝人類圍棋手。12月底到2017年1月,AlphaGo升級版戰勝108名世界圍棋手。

3、人工智慧應用領域(機遇與挑戰)

人工智慧的研究範疇:自然語言理解、語言的學習與處理,知識獲取表示、知識處理系統,自動推理和搜索方法、智能搜索,推理,規劃,機器學習,組合調度問題,感知問題,模式識別、邏輯程序設計、自動程序設計,軟計算,不精確和不確定的管理,人工生命,計算機視覺、神經網路,智能機器人、複雜系統,遺傳演算法人類思維方式等方面。最關鍵難題是機器的自主創造性思維能力的塑造與提升。

人工智慧實際應用領域主要有:專家系統、機器翻譯、智能控制、定理證明、博弈、自動程序設計,自動規劃、智能搜索引擎、機器人學,語言和圖像理解,遺傳編程,計算機視覺和圖像處理、機器翻譯和自然語言理解、機器視覺,指紋識別、人臉識別、視網膜識別、虹膜識別、掌紋識別,數據挖掘和知識發現、遺傳編程機器人工廠、自動程序設計、航天應用、龐大的信息處理、儲存與管理、執行化合生命體無法執行的或複雜或規模龐大的任務等等。

機器翻譯:是人工智慧的重要分支和最先應用領域,機譯系統的譯文質量離終極目標仍相差甚遠;而機譯質量是機譯系統成敗的關鍵。中國數學家、語言學家周海中教授曾在論文《機器翻譯五十年》中指出:要提高機譯的質量,首先要解決的是語言本身問題而不是程序設計問題。人類尚未明了大腦是如何進行語言模糊識別和邏輯判斷,故而機譯很難達到「信、達、雅」的程度。智能家居之後,人工智慧成為家電業的新風口,而長虹正成為將這一浪潮掀起的首個家電巨頭。[3]

模式識別:採用$模式識別引擎,分支有2D識別引擎,3D識別引擎,駐波識別引擎以及多維識別引擎;2D識別引擎已推出指紋識別,人像識別,文字識別,圖像識別,車牌識別;駐波識別引擎已推出語音識別;3D識別引擎已推出指紋識別玉帶林中掛(玩游智能版1.25)。

自動工程:自動駕駛(OSO系統)、印鈔工廠(¥流水線)、獵鷹系統(YOD繪圖)。

知識工程:以知識本身為處理對象,研究如何運用人工智慧和軟體技術,設計、構造和維護知識系統;

智能模擬:機器視、聽、觸、感覺及思維方式的模擬:指紋識別,人臉識別,視網膜識別,虹膜識別,掌紋識別,專家系統,智能搜索,定理證明,邏輯推理,博弈,信息感應與辨證處理。

AI實現方法:一種是工程學方法(ENGINEERING APPROACH),這種方法用傳統編程技術,使系統呈現智能的效果,不考慮所用方法是否與人或動物機體所用的方法相同。它已在一些領域內作出了成果,如文字識別、電腦下棋等。另一種是模擬法(MODELING APPROACH),不僅要看效果,還要求實現方法也和人類或生物機體所用的方法相同或相類似。如遺傳演算法(GENERIC ALGORITHM,簡稱GA)和人工神經網路(ARTIFICIAL NEURAL NETWORK,簡稱ANN)均屬此類型。

AI規劃問題:智能AGENT必須能夠制定目標和實現這些目標。他們需要一種方法來建立一個可預測的世界模型(將整個世界狀態用數學模型表現出來,並能預測它們的行為將如何改變這個世界),這樣就可以選擇功效最大的行為。

情感計算等社交:KISMET具有表情等社交能力的機器人,情感和社交技能對於一個智能AGENT是很重要的。首先,通過了解他們的動機和情感狀態,代理人能夠預測別人的行動(這涉及要素 博弈論、決策理論以及能夠塑造人的情感和情緒感知能力檢測)。此外,為了良好的人機互動,智慧代理人也需要表現出情緒來。至少它必須出現禮貌地和人類打交道。至少,它本身應該有正常的情緒。

機械學習:從使用者和輸入數據等處獲得知識,從而可以解決問題減少錯誤,提高解決問題的效率。對於人工智慧來說,機械學習從一開始就很重要。1956年,在最初的達特茅斯夏季會議上,雷蒙德索洛莫諾夫寫了一篇關於不監視的概率性機械學習:一個歸納推理的機械。

自然語言處理:自然語言處理如翻譯、應答、聊天機器人、客服等。

機器感知、計算機視覺和語音識別:機器感知指能夠使用感測器所輸入的資料(如照相機,麥克風,聲納以及其他的特殊感測器)然後推斷世界的狀態。計算機視覺能夠分析影像輸入。另外還有語音識別、人臉辨識和物體辨識。

E. 數據簡化DataSimp技術描述、學會及社區(1k字)

1、數據簡化DataSimp技術描述(4b字)

數據簡化DataSimp合伙人或XX崗位(研發崗參考本蚊及文本分析一文的二級標題)。

1)技術研發部(重點收簡歷):核心的數據分析DA、NLP、DL開發技能,Windows/Linux/Android/iOS平台、OA、App軟體開發基礎,熟練的Java/C++/Python編程技能和Github/Git協作編程與同行審核習慣;

2)市場客服部(研發部兼職):搜集客戶資料、面見客戶、形成客戶需求分析文檔,跟蹤反饋,面談、電郵、電話、郵寄溝通服務;

3)行政後勤部(合伙人兼職):高級的全系列文檔搜集整理技能,OA軟體界面和操作體驗實驗,公司法律財會物業文書基礎。

投遞簡歷前,如果對編程目標不清楚,可以參考上圖6,或實用文本分析工具▼http://ictclas.nlpir.org/nlpir/網站,我們需要實現一個功能集合大於此網站的應用程序系統。願景①是跨平台的分析系統,先開發文本的明文分析系統(後續開發加密文本分析系統),實現輸入需要分析的文本、文檔、文件夾,就可以得到可選定的分析結果,使用極其簡單、功能極其強大。這也是當前數據簡化DataSimp籌備收簡歷的主要方面,合伙人和員工均可。

2、數據簡化DataSimp學會及社區(6b字)

籌備之數據簡化DataSimp學會及社區。數據簡化DataSimp學會分多個專業領域組,由普通會員和會士組成。會士則由資深數據分析專家組成學會分組委員會,會士認證採用「場景-方案-答辯制」2年一次,以推動全領域數據簡化工作的有序進行。數據簡化DataSimp社區由學會和貢獻者共同維護,包括:學會版塊、開源社區、活動版塊。

●學會版塊:數據簡化DataSimp學會各領域工作組的主要版塊,發布工作動態和成果。未來擇優出版為期刊。工作組主要有:社會信息簡化需求大組、數據簡化需求大組、技術實現與分析評估組(分為文本簡化、圖像簡化、音頻簡化、視頻簡化、機器數據簡化、過程式控制制邏輯簡化等數據簡化小組)、系統與哲學思維簡化大組等。

●開源社區:由數據簡化DataSimp學會資深程序員貢獻運維,使得社會信息簡化技術人員可以熟練掌握各類大數據組件、系統、工具在數據簡化方面的原理、架構、部署、應用場景、維護、應用和開發技巧等。。數據簡化DataSimp愛好者可以自助提交並發起討論,以推動程序簡化技術、提高數據簡化效率。旨在通過詳細講解和實戰演練,能夠幫助企業技術人員掌握最有效的數據簡化技能。

●活動版塊:數據簡化DataSimp學會線上線下發起的講座、問答、競賽、考察、管理等活動。

當今社會信息爆炸、數據爆炸、垃圾信息和數據爆炸,請大家行動起來,加入我們數據簡化學會和社區,一起為人類社會的信息世界和數據世界優化、簡化、提高效率做貢獻。詳情落地前發文宣傳,敬請期待。

QinDragon2010@DataSimplification and Sciences,Wechat and Toutiao Public Account,2017.02.16Thu-26Sun:

LIFE

Life begins at the end of your comfort zone. -- Neale Donald Walsch

THE DAY

The strength of purpose and the clarity of your vision,along with the tenacity to pursue it,is your underlying driver of success. -- Ragy Tomas


推薦閱讀:

美麗鄉村建設的四種模式對比及建設經驗
評論:金融業要阻斷產業空心化
生豬產業陷五大弊端 散養戶難逃此劫?
從第二屆中國域名節的成功,看域名的想像力在哪
小額信貸產業化前景美妙

TAG:人工智慧 | 智慧 | 趨勢 | 革命 | 解讀 | 產業 | 人工 |