翊翎資本范維肖:想投資人工智慧?這些需要知道

本文系根據健一會(ID:jianyihui2011)沙龍第181位主講人范維肖CC(翊翎資本合伙人)在人工智慧沙龍上的精彩分享整理而成。根據嘉賓意見,分享內容已刪去部分敏感觀點及內部信息。

文/范維肖CC(翊翎資本合伙人)

我們基金的名字叫翊翎資本,從2016年2月開始,翊翎資本著手在人工智慧領域進行布局。

以下是我個人在人工智慧投資過程中的一些心得。

演算法、數據、算力:人工智慧的「三駕馬車」

追根溯源,數據是人工智慧的基礎。

早期,人類經歷了數據的採集、清洗、標記、存儲、計算,經歷了大數據的代際。通過數據,人類知曉過去發生什麼,還知曉發生的原因。

藉助於人工智慧對數據的增力作用,人類又知曉未來發生了什麼,還能對未來做自動優化。

從最早的「基礎 激活」到「分析 人工決策」,未來的自動決策、自動控制是個更重要的過程。看待整個人工智慧發展史,現在是非常重要的時間點,要清醒地識別一個邊界,判斷其屬於過去還是未來。我們應該在這個邊界線的附近尋找更多機會。

人工智慧有三個支撐基礎:演算法、數據和算力。演算法是核心。

我們見過很多所謂的黑科技。為什麼叫黑科技?因為它跟當下保持一定距離。黑科技如果距離當下過遠,往往可能是跨過了科技樹的發展過程,跟產業沒有融合,就會產生大問題,比如說不能產生有效數據,不能進行有效判斷。

數據用來訓練演算法,我們通常把這個過程叫「喂數據」,把數據叫「奶媽」。沒有數據,再好的演算法也很難進行有效升級。在過去幾年中,我們特別幸福地經歷了大數據時代。現在的特徵是,各個行業大量數據沉澱積累,數據開始與科技產生碰撞。過去我們不遺餘力、不擇手段地去獲取數據,而在數據紅利期,數據極大豐富,精度提高,這也是大數據時代留給我們的一個最好的基礎。

目前的算力是基於GPU的計算效率。與傳統CPU時代相比,GPU有了大幅提升,以前算一個東西需要2-3年,迭代效率太低,GPU出現之後,像亞馬遜便開始提供硬體工廠,讓大家通過租用方式去構建集群,節省了人力和硬體成本。算力提速,AI的產出就刺激很多商業領域進行革新,這些革新反過來又驅動數據和演算法的持續提升。

演算法、數據、算力相互促進,它們所帶來的紅利現在來看還是不明顯。2016年Facebook、Google一起將這些東西以開源方式奉獻給社會,降低了AI行業的進入門檻。

如何尋找人工智慧產業鏈的投資邏輯

如何投人工智慧項目?我們總結出了一個稜鏡法則。

稜鏡法則涉及到光的色散原理。透過一個形狀為等邊三角形的玻璃稜鏡,白色的光從左側照進來,通過兩次折射產生光譜。這個折射過程很好地透視了我們翊翎資本的一種投資邏輯,有助於我們較為容易地剝開演算法、科學、技術、產品的外衣,看到人工智慧產業鏈的投資邏輯。

從春運看碎片化數據的價值

人工智慧發揮價值過程中的第一個推進器叫數據增益。

人工智慧僅用於有數據的行業。這個行業積累的數據是否全?精度是否夠高?是否願意拿出來被用?這幾點是決定著我們判斷人工智慧產品能否有效果的第一個推進器。

現在是一個大數據極大豐富的年代,「極大豐富」說的不是量,而是指利用率,這是數據本身的核心之一。很多業務場景都是基於現有數據去構建上游業務場景,業務場景引來新數據的產生。

我們發現,數據孤島化和碎片化的情況越來越嚴重,一家大廠商去融合各種各樣數據的可能性太低。我有數據,不會給別人;數據越多,我越不會給別人。

數據碎片化過程中有很多機會,也有很多商業領域的正向循環,這是我們最為關注的。能否在我們所投的大數據公司乃至整個數據產業鏈條里找到現有數據對於AI技術有增益的方向,這個對我們來說很重要。

用大數據展示春運遷徙路線。圖片來自百度。

舉個例子。

春運是全國性大難題,春運本身邏輯不在於我們怎麼去優化運輸環節,春運的本質問題是運力不足,解決這個問題需要修建更多軌道、投放更多火車,但在非繁忙閑置時間,這些投入造成的浪費究竟有多大?

還有個問題是,春運系統越優化,春運就越擁堵。為什麼?大家24小時不停地往回趕,每個人都想回家,這些底層的訴求都不會因為技術和數據的變化而變化,這是問題的核心邏輯。

所以有時候,那些所謂「極大豐富」的客流數據在春運領域裡作用真不大。但這些數據放到地方是有用的。諸如山東這樣的省份,一個城市裡高達11.7%的人口都在外地務工,為了應對這些人在春節集中返鄉,這些地區水電使用量等數據的早期預測很重要。也就是說,春運數據用在其他領域反而是合適的。

但春運數據怎麼公開?這個事就變得非常非常折騰,理論上是公開不了的,特別是關係到隱私問題。

現在中國數據開放程度在全球排名很靠後,排到八九十位,美國排在第八位。數據的開放程度與對人權及對個人的隱私的尊重成正比。只有保護隱私才能夠去開放。這一點從側面說明了數據碎片化一定會越來越加重。

場景增益要做頂層機構調整

第二個推進器叫場景增益。

移動互聯網領域有著嚴重的To C邏輯,而To C消費類互聯網服務講究沉浸感,大家絞盡腦汁為了增強用戶體驗而完善產品,比如幫助用戶查詢時間縮減一秒,幫助用戶在使用APP時少翻頁、少點擊,獲取更準確結果。這些都是產品的提升。但AI正處於嬰兒階段,現在就進入商業環境,對場景的增益有多強?這個問題值得認真思考。

場景增益決定光譜的價值。

還有一個需要理解的場景叫馬賽克。我們用一個比較污的話題來講這件事兒。

現在有很多人在做圖片鑒黃,一個國家部門找我們諮詢,說有人在做圖片鑒黃,識別率是98%,這種技術該花多少錢去買?合不合適?

利用人工智慧的深度學習技術來鑒黃。圖片來自投資界。

98%是什麼概念?是給你100張色情圖片,有兩張檢測不出來。假如說新華網用這樣的技術,它一定要保證它的網站內容絕對不會出現任何差錯。所以98%的識別率在這種場景下沒有用。

反過來,另一家小公司也做圖片鑒黃,給它100張圖片,能識別出3張來,保證這3張圖片100%一定是黃色圖片,人工只需要鑒定其餘的97張就好了。

場景落地的時候,企業端看的是投入產出比。我投入極低價格,幫我解決一部分價值,對我來講就是個極大效益。

所以到了場景增益的時候,我們要做的是頂層結構的調整,這個頂層結構的調整從兩邊來講,一邊是做AI的公司,一邊是應用AI的公司。

早期AI公司都是To B的增益,我們一定要去理解產業上的一些問題,知道產業癥結在哪兒,進去之後能夠對這件事有極大增益作用,我才能去拿到數據,持續在上面做學習和改進。

AI應用型公司也是一個投資方向,看哪些產品可以去附著到AI上來變成增益。在這個過程中我們需要不斷切換,從一級市場、二級市場、一級半市場三個部分去切換著看這件事兒,不同事情在不同市場下一定是不同的。

我個人估計,一級市場和二級市場的收益差在逐漸降低,這個數據一旦加速,迭代周期就會縮短。所以在這個時候要找到需求側的投資,因為它會在場景落地時產生極大的項目價值。

無人駕駛:換一種思路

底層結構的更改方面,我們在去投資一些AI類、技術類公司時,一定要看到它在商業上的一些思考和方式。

這裡舉一個相對比較集中的例子:無人車自動駕駛。

從傳統意義上來講,我們對於無人車的認知已經不再僅限於怎麼躲避障礙路、怎麼躲避行人、遇到緊急情況時怎麼保證駕駛人和行人安全。現代自動駕駛裡邊應用最成熟的是uber,它去年收購了一家公司叫otto,專門研究貨車的無人駕駛。他們的思路是要把無人駕駛變成火車:前邊一個駕駛員開車,後邊八輛無人駕駛大卡車全都跟著,這也是為什麼現在大家都說這家無人駕駛公司做的科技叫跟隨式技術,它根本不是自動駕駛,而是跟隨。

跟隨其實是沒有錯的,這就是頂層結構性調整推動事物回到底層做重新認知,再把它推到商業環境中來。

我們研究自動駕駛,如果都考慮讓它像人一樣學駕駛,是一種思路,但這種東西的研究可能會非常非常的慢。實際應用過程中,落地場景會遇到各種障礙。做無人車很難,但是做火車就簡單多了,鋪一條軌道就可以。

傳統人類駕駛用的是地圖。無人駕駛項目的核心投資點也應該在地圖上。這種技術在國內被稱為高精地圖,在國外叫Mapping。Mapping製圖技術更重要一些,因為無人車駕駛是基於這種軌道的方式來思考。

技術服務化,服務商品化,服務組合共振化

現在很多大公司都在把AI服務化,比如百度就把很多關於圖片鑒黃、語音識別、自然源處理等技術以API的方式開放,任何人只要會寫幾行代碼,就可以將其調用出使用。在這個代際過程中,慢慢會出現技術服務化、服務商品化和服務組合共振化的現象。

比如現在很多公眾號都變成機器人,用戶可以通過語音形式跟服務號說打車,當他按住語音鍵說「我要打輛車去東直門」時,後台要經歷哪些過程呢?

  • 第一層叫語音識別,它要把語音識別成文本。

  • 第二層是自然源處理的過程,通過理解這個語言,來判斷打車從這兒要到東直門的這件事。

  • 第三層是要跟用戶做更多交互過程,比如是否通過技術化手段自動叫輛滴滴專車過來,然後告訴用戶車來了。

  • 當下的市場環境推動了越來越多人出來在AI領域創業,所涉及領域也越來越細分,創業者在AI應用方面既可以只選一家,還可以選擇多家,組合出一套解決方案,通過組合,以解決C端消費者的需求。

    底層數據不共享,前端入口不開放,中間層協同效應很重要

    百度不可能開放底層數據出來給任何人用。騰訊也是如此,前端的入口不開放。現在騰訊拿著微信架在大家前邊,在上一代社交網路的這一波浪潮裡邊,大家都明白,做產品做C端產品一定要往前做,更靠近用戶端。

    跑在所有人的產品前面,這是在做To C類產品的時候的相對比較重要的一個法則。已經把C端用戶牢牢抓住的人,在前端入口上也不會去開放出來的。我們看微信這幾年產品變化的節奏,也能清晰認識到這一點。

    在中間的協同效應過程中,我們能夠把數據從其他地方匯合過來,利用技術的方式去不斷產品化,利用不同產品組合,變成一個解決方案,然後再打向用戶。所以中間的這個過程我認為是一個比較大的投資空間。

    「雲」引入的平台機會

    聚合AI服務的平台很有可能出現有價值的投資標的。

    首先,這類平台能夠更方便地讓應用層把更多AI技術服務以更低成本匯過來。

    做過企業的都知道,企業做大了之後,最關心對於複雜度的控制。而複雜度不會平白無故地降低,只能把全部精力都放在「有效的控制複雜度快速增長」這一點上面。各種AI和數據的引入有助於提升企業內部服務,但成本非常高。而聚合AI服務的平台可以讓企業以更低成本快速嫁接AI服務,應用到企業的落地產品中來。

    其次,這類平台給了企業一個選擇,方便企業數據可以更方便地在雲與雲之間遷移。這些都是未來AI服務不斷向密集化、碎片化方向發展過程中出現的平台機會。

    這類平台可能跟AI關係不大,跟數據關係也不大,它是一個綜合體。

    這是我們認為的另一個投資方向,在過程中找到這個中間層的空間,在這個空間層裡邊去找每一類企業。

    SoC:算力前置帶來的投資機會

    過去這些年,看來看去,大疆也好,機器人也好,都有很硬的應用場景,SoC是這個窄小領域裡邊很重要的一點。所謂SoC,可以理解為具有計算能力的晶元。

    舉個例子。

    我們投資的公司里有一家是基於人臉識別的技術做會員信息採集,客戶一進到房間里,藥房助理通過人臉識別,就可以完全知道客戶信息。

    這樣的場景用起來,會有一個問題:企業所使用的人臉識別技術來自於第三方公司,第三方公司在雲端,通過攝像頭採集完數據要回到雲端,雲端再把計算結果回過來,這就導致至少一兩秒的時間延遲。

    還有個問題是:同樣一個客戶,如果在攝像頭前面反覆出現10次,就必須要為這10次遠程服務的調用付出成本,因為攝像頭沒有任何計算能力,每次都要跑到後端計算,這是一個很大的資源浪費。

    後來技術方就拿一塊價值一千多塊錢的平板電腦,在裡面寫一個程序,將其架在攝像頭後邊,才算把這個問題解決了。但如果安一個晶元,五六塊錢就可以解決。晶元還能做計算加速,我們將其叫做算力前置。

    新交互可能是最大的投資機會

    《三體》裡邊有個很著名的法則叫「黑暗森林」。黑暗森林理論認為,稀缺資源是安全的,不要暴露給別人。在新的AI代際裡邊,我個人認為,新交互是稀缺資源。2016年,微軟、Facebook、谷歌、蘋果都對這類交互類平台做了投資布局。

    我們經歷了人跟PC的交互,後來變成人跟移動設備的交互,未來我們將通過屏幕去進行交互。

    新的交互方式沒有明確界面,張嘴開聊就能解決問題。而解決問題的通道和能夠解決的能力是兩回事。比如說我們現在在辦公室里放個音響,它背後能幫我們打車、訂酒店、訂機票,但是接觸的可能是不同服務商。所以這個音響是個入口,背後由多種服務來組合而成,前邊的入口為後邊導流,自己能做就做,不能做給別人,以共贏方式去打造一個比較密集的服務矩陣。

    Facebook也在嘗試去開放廣告的介面SDK等,這些方式現在沒有一個明確的產品場景,無法直接讓人看懂,但對於早期投資方來說,這個交互有可能是最大的機會。

    關於作者:

    范維肖CC,翊翎資本合伙人。擁有10 年互聯網研發經驗,前微軟最有價值專家,曾任中國移動飛信SNS業務的首席架構師。曾作為co-founder &CTO先後打造「你聽音樂」、「節操精選」、數字音樂版權交易雲「DMC」等。在消費升級、大數據、企業級服務等領域有豐富的實踐經驗,致力於挖掘和服務於富有創新能力的開拓者,一起創造價值。

    推薦閱讀:

    投資之前,你應該了解什麼
    值得價值投資者閱讀的100本書
    自動化理財?弄不懂?讓我們來深挖學習,Wealthfront終極評測
    歲運食神旺,梟神不敵食,盲目投資而損財
    山東中通巨龍股權定增

    TAG:投資 | 人工智慧 | 投資人 | 智慧 | 資本 | 知道 | 人工 |