源碼資本投資合伙人張宏江博士:AI的本質與機遇

源碼資本在2017年碼會上宣布,前金山CEO張宏江博士加盟源碼資本任投資合伙人。張宏江博士在2017年碼會上分享了重磅觀點「AI的本質與機遇」。

張宏江博士曾為前微軟亞太研發集團首席技術官、微軟亞洲工程院院長、金山軟體CEO,是世界多媒體研究領域一流的科學家,是計算機視頻檢索研究領域的「開山鼻祖」,獲得過IEEE(美國電氣和電子工程協會)和ACM(美國計算機協會)兩大計算機專業協會頒發的重大獎項,是第一位也是迄今為止唯一同時獲此殊榮的華人科學家。

張宏江博士在2017年碼會的演講全文:

今天,我們從AlphaGo講起。我們的議題包括這一波AI潮流的原因是什麼,機器學習的驅動燃料——大數據的發展,深度學習的基本原理,AI技術的發展給我們的日常生活,給我們的創意以及工作帶來什麼樣的影響。最後是投資AI領域有什麼樣的機會以及陷阱,尤其是陷阱我會多講。

一、從AlphaGo說起AI潮流:演算法+計算力+大數據

  1. 典型的深度學習演算法就是深層的神經網路;

  2. AlphaGo在一場比賽中消耗的能量是人的300倍;

  3. 數據爆炸在過去十年改變了我們的生活。

這一波人工智慧的熱潮其實是從去年AlphaGo與圍棋大師李石世對決開始的;雖然我從來不會下圍棋,但我下了賭注賭AlphaGo會贏。

為什麼我會下這個賭注?我們讀過關於AlphaGo的文章,其實它是一個典型的深度學習的系統,它用了深度的神經網路,還用了深度學習裡面的強化學習,半監督學習,還用了蒙特卡洛搜索的方法。

整體來說是經典的技術和新的機器學習演算法結合在一塊,從而能夠提高演算法的性能,使它的學習能力更強。通過增加深度學習網路的隱層神經元數目從而建立起很好的學習能力,吸收知識的能力。這是演算法上。

其實在這個背後還有非常重要的兩條,這是過去幾十年計算機發展帶來的結果。

第一條,互聯網過去20年的發展帶來了大數據,而且是高質量的大數據。以AlphaGo為例,在它跟李世石對局之前已經跟人類六到九段的棋手對決過一萬六千多次,這個中間他獲得了超過3000萬的布局點,這個對於它的能力提高非常重要。它跟自己下棋的過程中又獲得了3000多萬個布局點,同時形成它的決策網路。這是我今天講的重點,就是高質量大數據這一塊。

第二條,高性能的計算資源。如果我們看一下最終AlphaGo拿出來跟李世石對局系統用了1920個CPUs,超過280個GPUs。這是什麼意思?我們知道一個衡量圍棋大師的標準是一到九段,而更細的平級是用ELO這個數。

用了1920個CPU,280個GPU以後AlphaGo的能力,ELO數,從一開始兩千多到了三千多,我們看李世石的數字是3500個,其實已經相當接近了。正是因為有了高質量的大數據,有了高性能的計算資源,有了新的學習方法,使得AlphaGo能夠輕鬆地戰勝了圍棋大師。而且我們說到一點是,當李世石艱苦贏了第四局之後,這個時候AlphaGo當天晚上又自己跟自己下了一百萬次。

為什麼這次AI的浪潮跟前兩次不太一樣?今天我們談的AI其實談的是大數據小的新的演算法。計算資源這些年發展下來,隨著摩爾定律的指引,計算性能增加是快速的成指數的增加,同時計算的成本也是隨著指數往下走的,計算資源越來越強,價格越來越便宜,從而我們可以廉價地利用大量計算資源。

過去十年的另外一個根本性的變化,就是如果你自己不想買計算設備,你可以用雲計算。我們看雲那一塊,大數據的處理能力在雲計算的平台上已經以標準雲服務的方式提供給大家,大家可以很方便低成本地使用。這是另外一個在計算方面的進步,根本改變了在機器學習只是在大公司來做的狀態,今天小公司可以用雲計算來做了。

回頭來講數據,這是我特別喜歡的題目。在AlphaGo之前,我就一直跟大家講大數據,當然心裏面是想推廣金山雲。但是大數據確實在過去十年內改變我們的工作、改變了我們的生活,改變了我們的思考。

IDC有過一個報告指出,在2013年的人類產生數據是4.4個ZB,到了2020年的話這個數字將會增加到44個ZB,增加10倍,年增長率是40%。今天每4小時沃爾馬用戶產生數據超過2.5PB,每天Twitter產生推文有5億條,今天今日頭條的用戶請求超過60億次,每天頭條處理數據量超過6.3PB,這是每天人們產生的數據。假如說這些數據又有很好的跟蹤和標註,這些數據可以驅動人工智慧,驅動人工智慧的演算法。

二、大數據:機器學習的驅動燃料

  1. 人臉資料庫的進步大大提高了計算精度;

  2. Jim Grey的科研四範式:從觀察、實驗到計算模型,到數據推動的模型;

  3. 大數據正在成為企業AI的標配。

講一個人臉識別的例子。

今天大家覺得人臉識別已經過關了,一系列的公司在人臉識別上做的比人的識別率還要高。這個功能在手機上也已經做的非常好。之前一個人拍了很多照片,開始找這些照片的時候就發現比較麻煩了,但現在你想找某一個人,可能需要記住什麼時候照的照片。但更方便的是記住了和哪些人照的照片,通過識別人臉能使得找照片變得非常容易。這種功能是我們20多年前的夢想,今天在手機上就可以做成了。

這是我手機上的一個屏幕,我自己的照片,我太太的照片,小孩的照片都在這兒。以前我工作的老闆雷軍照片也在上面。我一點,所有雷軍照片全都出來了。我想看某一個具體的照片,這是雷軍和戴爾電腦創始人Michael Dell的合影,還有和Dell團隊的其他人的合影。我們看到手機把這些人名字自動標出來了,這個人是誰,那個人是誰,以後他所有的照片進來就全部能夠識別了。這個在今天的品牌手機上都提供了這種功能。

我20年前在惠普實驗室申請過一個美國專利。這個專利的內容恰恰就是我剛才所說的那個整個流程:拍了新的照片以後把它的資料庫照片進行比較,從而識別出這個人是誰。在20年前我們很清楚移動設備計算能力有限,我們覺得這個處理的能力應該是分散式的計算,今天我們叫做雲。20年過去,現在恰恰把20年前的事情變成現實,這個中間可以說是演算法的進步,也可以說是計算資源的進步。

我實際上想跟大家說是人臉資料庫的進步。

在20年前做人臉的時候,我們手裡面拿到幾百個標準的照片,今天我們拿到上億張的照片。最早90年代的時候你只有幾百個人,幾百張照片的資料庫,90年代末2000年的時候到了上千張、上萬張照片,從而可以看到識別率的提高。到了工業時代,也就是5、6年前谷歌、Facebook分別用深度學習的方法做人臉識別,做訓練的數據量比以前增加了非常多,使識別精度增加。

當用戶的數據大量增長的時候,同一個演算法的識別的精度也在快速的成長。而且當我用的計算量,CPU用得多的時候。性能也有快速的提高。所以這再次證明了剛才的觀點,數據本身可能比演算法還要重要。或者說沒有這麼多數據的時候根本不可能想像深度的神經網路。

再難的事情到了中國人手裡面就有改善,世界上沒有任何一個地方像中國有如此多的攝像頭,如此多的頭像和身份證的照片,就形成了中國的優勢。今天不是兩億張照片,是幾十億張的照片,上億被標註的人。只有有了大量數據之後你才可以用深度神經網路,才可以把這些內容、這些信息提取出來。

今天人臉識別的這些公司已經遠遠超過了人眼識別率,而且在世界上走在前列。當你在一張照片跟資料庫進行比較這個人是不是你的時候,這種精度已經到了萬率級的誤差。基本上用攝像頭以及演算法,在中國最好什麼壞事都不要做,哪怕在你的汽車裡面,在加油站的時候拍了一張你的手放在不該放的地方,很快就會被傳播出來,識別精度如此之準確的。

一年多以前微軟亞洲研究院的孫劍帶領著團隊用了152層的神經網路作出了超過人類的圖象識別精度的演算法。再次想跟大家驗證的是,當我們模型複雜度剛剛開始增加,從8層到152層的時候,我們看到計算量增加,看到持續的訓練數據的增加。在2012年8層神經網路的時候,相應的神經元超過65萬個,連接超過6億。152層網路的時候神經元到了2200萬,因為有新的演算法,但參數調整更加準確,因為它的連接可以看到有113億,我們大腦裡面神經元的突觸鏈接應該是一百萬億的。

人工智慧的進展在很大意義上是從原來的傳統建模、制定規則到今天依賴於數據機器學習的根本轉變。這種轉變恰恰是因為我們今天有了數據,覆蓋度越來越好,精度越來越高,從而我們對模型的依賴比較低了,或者是說再複雜的模型都有足夠數據訓練。

過去的傳統AI的演算法或者是神經網路之所以不能夠達到今天的精度,很大程度上是因為我們沒有非常好的數據,從而依賴於某種模型,依賴於某種演算法。在今天,我們已經在很大程度上覆蓋整個樣板空間的時候,我們數據如此之大,從而使得我們原來非常困難的問題,今天解決的非常好。

不同的演算法的性能會隨著數據量變化產生的變化,當數據量增加的時候它的精度也在迅速提高。但是你可能會問一個問題,是不是現在我們有足夠多的數據,從而我們人工智慧就能夠覆蓋所有的場景?去年發生第一起特斯拉傷人的事件,說明即使特斯拉這樣每天有幾十萬輛車在路上跑,但是數據依然不夠,依然在有些情況下出現死人的事故。

如果做資料庫的人不知道Jim Grey,那基本上不應該跟別人說是做資料庫的。Jim Grey他在十多年前就提出了人類在做科研的四個不同的範式。過去最早的純粹基於觀察和實驗,百年前的理論模型,幾十年前開始的計算模型,到今天數據推動的模型。過去十年大數據進展非常快,大數據已經開始在企業裡面大規模的進行運用了。

美國一個諮詢公司調查了300家3000人以上的公司,基本上60%的IT公司都在使用大數據了,只是說使用層次不一樣。最早期是統計發生了什麼,後來分析發生的事情,到今天預測怎麼樣發生。未來,大數據將洞察什麼樣的決策是好的商業決策,再進一步的認知真正落實到行動上,也就是自我學習的能力了。

英特爾這樣老牌的公司今天在瘋狂併購做AI或者創作數據的公司,比如說兩個月以前以天價併購了一家以色列公司Mobileye。原因很簡單,英特爾認為汽車其實是人類生活中能產生大量數據的設備,這些數據能夠幫助數據使用者給人畫像、判斷一些商業應用。而這一切產生的過程、處理的過程由英特爾控制,這意味著它控制了另外一個新的平台,這是為什麼英特爾在這方面投入這麼大的資本。

講完了計算和大數據。再回到一開始的所說的演算法的進展。

三、深度學習的基本原理

  1. 大數據驅動的深度學習方式,是機器自主學習;

  2. 深度學習第三次浪潮的特徵:大數據+強計算+新演算法。

AI做了60年,終於迎來了第三次浪潮,這次浪潮看起來比前面兩次浪潮來得更猛烈,而且解決的問題比以前更多。很重要的是,我們用的深度學習的方式與傳統的專家系統方式有很大的不一樣。專家系統的方式是人總結規則,然後把規則交給機器,機器來開始利用這個規則面對使用場景。深度學習方式,大數據來驅動的是機器自己來學習的。好處是機器本身具有學習能力,所以可以較容易地從一個應用擴展到另外一個應用。

過去的十年,恰恰是深度學習迅速發展的十年。2006年Hinton在Nature發表文章,標誌了深度學習這個詞誕生。2010年隨著大數據的爆發,深度學習熱潮開始興起。2012年Hinton這個團隊用CNN模型以超過第二名10個百分點的成績奪得當年競賽冠軍。到了2016年的AlphaGo,人們對深度學習的能力沒有懷疑了,深度學習將會改變人類,這是一個新的時代的到來。

深度學習,到底是什麼樣的東西?神經網路這件事其實在第二次浪潮(80-90年代)就已經開始了,大家已經用過了,80年代-90年代初,神經網路泛濫的一塌糊塗。那個時候數據量不夠,就是輸入層、輸入層、隱含層。另外一個根本改變是今天的設備、速率如此之強大。

為什麼深度學習方法不一樣了?首先是一開始的原理就是神經網路,類似大腦的思考原理。人類大腦大概有1000億個神經元,在這些神經元之間有超過一百萬億的連接。神經元的數字還有連接的數字,是人智力很重要的標誌。一個具體的神經元就是有一個核加上一個突觸鏈,我們根據這種原理做模擬神經元。並且將它跟別的神經元的連接。經過一個非線性的函數,從而轉成一個輸出。輸出的信號就是你所需要的結果。當神經元多了的時候,或者層數多的時候顯然需要的訓練數據就要更多。

為什麼大數據實際上是深度學習驅動力?以前模擬系統來做的神經元,用物理模擬機器來做這個複雜度,不可能做到一億的神經元,不可能做到一百萬億的連接。但是今天我們用計算機能夠做到。深度學習是什麼意思?很簡單,深度學習就是層數比較多的神經網路。每一次訓練你輸出一系列的數據,當實際輸出和目標函數有一定的差距,這個差距反饋回去再進行訓練,這是整個循環的過程。

四、AI的發展與影響

  1. AI的應用與未來:輔助人,代替人,超越人;

  2. 機器將造成未來社會出現90%的閑人,但機器難以替代資本家、藝術家和手藝人;

  3. 機器在感知上超越了人類,但在認知上還要5-10年。

講完深度學習,我們可以想像當神經網路增加到152層的時候它的複雜性是什麼樣的增長。這種增長使得今天的AI,今天的機器學習不光是能夠輔助人,而且很大程度上會代替人,未來還會在很大程度上超過我們。也許這是我們今天不願意接受的。

未來AI會超過我們。到底怎麼樣超過?其實我們想像一下人工智慧今天確實能夠做很多人類能夠做的事情。原因是為什麼?人類可以像AlphaGo一樣一晚上下一百萬盤棋嗎?能夠像特斯特收上百輛的車同時收集數據並進行同時學習嗎?這做不到。同樣今天人類不可能對遍佈於全國各個火車站,各個機場的數據同時進行處理,也就是說規模你也比不上。

人工智慧會代替人、超越人是時間問題。不光是這樣,機器學習在一些場景做的比人還好,因為人通過觀察、通過思考判斷出來的東西,人工智慧通過學習很大程度上比你做得快。AlphaGo已經完全展示出了,人們在圍棋這一點上是已經被人工智慧打敗了。

投資決策、政策、規劃、戰爭沙盤推演這些很大程度都是靠經驗的。今天從AlphaGo上看到的,人工智慧在這些場景里都會超過人類,這是因為機器本身的自我學習的能力已經非常強大。像開車、滑雪、畫畫、拉提琴這些不可能通過看手冊就能學會的事情,人工智慧也已經超過了人類。其實我們自以為很了不起的東西,人工智慧看的比我們要透徹。

前一段AlphaGo隱姓埋名跟人類下棋,世界排名第一名的柯潔下輸了後感慨地說人類三千年的圍棋文化只是接觸了圍棋的皮毛。我們以前下圍棋,人類的思考實際上只是看到一個本地的最優解,不可能翻山越嶺去看,但是AlphaGo可以看到山外還有山。是因為它的數據處理能力比我們強,所以它學到了這一點。人類以後再也不可能贏AlphaGo了。這就是殘酷的現實。

舉一個微軟研究院的例子。在這個例子里,機器看到Stop Sign標誌,會描述出這是在一個城市邊上有這樣一個標誌,有紅色,立柱,與交通相關等等標籤。這個系統希望能看圖講故事,不是看圖識字,是識圖講故事。

這裡有另外一個例子:這幅照片是一位婦女在廚房準備食物。第一個描述是一個婦女在廚房準備食物。第二個描述寫的是,一個婦女在廚房水台邊上準備一份午餐或者早餐。第一個是機器學的,在這一點上機器已經超過了人。你可以說這個人不會講故事,但是至少機器能夠講出比他還好的故事。當然了,這還是屬於探索的階段。

據說在AI的浪潮下最安全是考古學家。可是這個社會上考古學家也不需要太多,工資也不會太高。男怕入錯行,女怕嫁錯郎。隨著這些的變化,未來哪些工作會被AI取代,社會將是什麼樣的?

全球化是在全球範圍內尋找最廉價完成某一項製造的過程,於是全球化導致了兩級分化,導致了跨國企業效率不斷提高,也導致了包括美國在內發達國家藍領工人的失業。AI是否會加劇這個趨勢?

未來可能會有兩種人,一種叫神人,一種叫閑人。問題是90%以上的是閑人,這怎麼辦?其實去年瑞士的國家有一個議員提出了,不管工作不工作每個人先發三千法郎,工作再拿另外的錢。瑞士人還是比較冷靜,全民公投沒有通過。未來可能只有三種人能夠對抗AI,資本家是沒有問題的,未來仍需要資本運作。另外就是藝術家和手藝人,這類技能機器暫時不能學過來的。當然大部分人很難做到這三種人。

人工智慧的局限在哪兒?強AI(GAI)依然道路漫長。機器在感知上已經超過了人,但是認知可能還有5-10年甚至更長的路要走。

深度學習的方式,有沒有問題?其實有一個很大的問題,事實上是人們給自己創造出來的一個問題。人工智慧或者機器智能是機器通過觀察體驗來學習,機器本身可以對自己進行編程,程序員不再需要寫命令解決問題,而程序會根據示例數據和期望輸出生成自己的演算法。

今天在很多領域已經往這些目標行進,第一個案例,比如Nvidia無人駕駛車,不是靠程序員指令走的,完全靠觀察人的行為,觀察人們開車的行為來確定自己駕車方法。第二個案例,在紐約一家醫院開發了一套系統,叫做Deep Patient,醫院只給了它70萬個病例,然後這個系統從70萬的病例中學習,通過數據發現規律,總結出了非常強的疾病預測能力,尤其患精神分裂症的預測能力遠遠超過了大夫。第三個案例,美國軍方大量投入機器學習,為車輛和飛行器導航確定攻擊目標,在大量數據中間挖掘出恐怖分子的一些信息,都已經遠遠超出了人們一開始的預期。深度學習已經具備了這樣的能力,但是深度學習依然沒有能夠解釋自己的行為。還是黑匣子。

人類歷史上從來沒有創造過這樣一個機器,這個機器的行為和判斷連人類都不能完全理解。今天我們創造了深度學習的機器不能判斷和解釋自己的行為,這就是今天我們感覺到不舒服的。人們反而問自己,我們自己作出了很多判斷我們自己能夠說清楚為什麼做的嗎?可是人類可以容忍自己的這種情況,但是不能容忍機器的這種情況。美國國防部就將機器學習的不可解釋性定性為「關鍵的絆腳石」。

當然未來一定是說,人們需要跟機器不斷合作。我們看動物到人的進化,其實智力進化的本質特徵是進化到一個系統,這個系統連創造者都無法解釋。今天我不敢保證上帝理解我們今天做的這麼多的事情。為了這個擔心,研究人員已經開始在進行一些分析,來試圖理解或者跟蹤這種決策的過程。

終級目標,機器和人到底有什麼區別?

它比你來得快,比你大,某些能力比你還強。它和人類區別在哪兒?

求生本能,對於死亡的恐懼,這是機器沒有的,這是定義出人和機器一個根本性的區別。人和動物的演化速度,一系列的求生本能,被打了會跑,避免疼痛,會食色,會有歸屬感。人類做壞事也是因為對死亡的恐懼,對慾望的驅動。機器本身目前為止因為它不懼怕死亡,所以也沒有感情,沒有感情是不是就不能說有智能呢?這是一個宗教問題,不是一個科學問題。

講完了機器學習我們到此打住,我時間到了,很快講一下AI投資的判斷。

五、AI投資的機會與陷阱

  1. 在對AI投資的判斷中,產業鏈包含:基礎,技術,應用;

  2. 基礎被巨頭控制,技術層面能否出來一些公司依然存疑;

  3. 應用層要尋找能夠大量產生數據的產業。

過去經驗也告訴大家,每一波科技浪潮中會有一些平台性的公司。我們談AI投資,到底投什麼?就像我們談PC的投資,談互聯網的投資我們是談生態鏈。

在對AI投資的判斷中,產業鏈包含基礎、技術,應用。基礎這個層面已經被巨頭控制了,基礎層有兩大塊:基本計算能力和數據。基本計算能力無論是谷歌還是微軟,包括中國百度都已經把它作為SaaS服務提供出來了。技術這一塊,沒有數據能否成為一個平台?。在SaaS這一塊,不是通用的SaaS,也許在SaaS應用這一塊能夠出來一些公司?這也是一個非常大的問號。

應用層中,AI其實是AI+這個場景,它是一種生產力提高的工具,會讓所有以前的應用變得更加有效,當然你要找比較容易突破的。顯然這個錢多和數據多的行業是最早發揮功效的地方。所以我們要找這個產業是不是大量產生數據,是否有這個數據能夠不斷拓展,不斷創造價值,從而使得我們能夠在這一裡面把原有的生態進行改變。

如果說上一波是互聯網,這一波是AI。大家要注意AI跟互聯網的區別。最簡單的可以說,AI發展到一年多以後我們就發現實際上是智能+。AI技術驅動,更加從垂直開始。因為技術本身發展的太快了,而互聯網是商業模式創新,是全新的應用,贏家通吃在AI那一塊未必行得通。

根據這個觀察可以看一下今天AI投資的情景,今天AI顯然是有很多泡沫,最大的泡沫我覺得是在估值公司。你去你找一家公司談,每一家公司都說我自己是AI公司。真正看這家公司是不是AI公司,更重要的是它要有數據。能夠不斷有數據,它能夠不斷搶佔數據的高低,這是我們的核心。

今日頭條這家公司,之所以能夠站穩,在過去五年之間突然出現,有它一個根本的原因,那就是信息的獲取這個大的需求。今日頭條在人工智慧開始使用的時候迅速佔領高地,它第一個用搜索的方法做了新聞推薦,從而它本身這個系統就是一個很大的學習網路,使得今天能夠不斷的演化,推薦的能力不斷增強,從而在這個基礎上對核心的能力進行突破。我們完全可以預測未來的今日頭條就是一個超級的智能系統,同樣我們看到了它的數據量是如此之大,它已經遠遠超過了一開始的文字到今天走向圖象,走向論壇,走向直播,它其實所具備是不斷增加的數據。

最後,AI的投資。如果你記住我剛剛所說的話就是三個投資點,第一是「智能+」,所有公司都應該具備的一種能力,而這個能力是它核心競爭力。第二,AI產業,包括自主開發、諮詢服務、人工智慧即服務AI-aas。第三,要有數據和人才。

人才、數據是核心,投演算法本身就是投人,我前面談到深度學習的訓練需要人對於這個演算法的理解並且掌握的訓練的技巧,懂演算法還要懂應用的人才是非常有價值的。另外,數據實際上是AI公司最終的護城河。

最後一點,給大家一個信息,就是AI這個領域裡面中國人才是非常多的。高盛的一個AI報告指出,在過去的五年裡面發表的跟神經網路和機器學習相關的文章裡面,中國人作者的數量已經超過了美國,而且還持續增長。在引用的文章裡面中國作者的數量也超過了美國,而且還在持續增長。所以至少我們在這個是裡面中國人不少,數量多了之後以後自然就有強人。在人才這一塊中國不差。

另外,中國發生的數據如此的巨大。也就是說中國有人才、有數據。所以AI這一塊一定是中國創新和投資的新希望。謝謝大家。


推薦閱讀:

獨家對話CMU德撲AI賭神團隊:解密1+2技術架構,不攻反而不敗
前沿 | AI人工智慧可準確預測化學反應產率,有望用於新葯研發
人工智慧會毀滅人類嗎?
【願景學城】24小時AI熱點新聞的匯總(2018/04/9)
TensorFlow 1.0 發布

TAG:風險投資VC | 人工智慧 | 人工智慧公司 |