深度 | 鮑捷:人工智慧的可演進性,要從小事做起
職人社 × 愛因互動聯合主辦的「 AI 時代的產品經理 」活動上,我們邀請了愛因互動創始人 CEO 王守崑,文因互聯 CEO 鮑捷以及 S 先生創始人 Mingke 三位老師,分享交流了人工智慧在怎樣影響業態,真正的 AI 產品經理的角色,產品的對話式交互( CUI,Conversation UI )特性以及產品經理在 AI 時代下技能邊界在哪裡等話題。
鮑捷博士有十餘年的人工智慧研究經驗,研究領域有神經網路、知識表現與推理、語義網、機器學習、自然語言處理等。中國中文信息學會語言與知識計算專委會委員。歷任美國三星研發中心研究員,連續創業者。也曾是 MIT (麻省理工學院)訪問研究員,BBN 訪問研究員,RPI 博士後,Iowa State University 博士,W3C Web 本體語言工作組成員,國際語義網會議 ISWC組委會和程序委員會成員。
文因互聯脫胎於一個矽谷車庫創業公司 Memect。2013 年,鮑捷和一些人工智慧研究者一起,開始探索如何把知識圖譜技術應用於日常生活。文因互聯的初始願景是「互聯世界的記憶」( Memory Connected,也就是 Memect 這個縮寫詞的來源),也就是為每一個人管理自己的「第二記憶」以彌補生物記憶的不足。
Memect 先是為程序員管理「記憶」,做出了 10W+ 用戶的 AI 產品「好東西傳送門」。後來落地到金融領域,面向投資經理、研究員,開發了彌補人力在金融決策過程中的效率有限、經驗不足問題的一款產品。現在,文因互聯為銀行、券商和投資基金提供取代傳統低效的人工勞動的金融分析工具和解決方案。
以下是鮑捷老師分享內容的編輯整理,關注職人社(微信:zhirent 有個t)然後回復關鍵詞「文因互聯」四個字可以獲得鮑捷老師的分享完整 PPT。
「我有一個好想法,就差一個 AI 了」 ▼
今天我特別想跟大家分享一下,人工智慧產品在「演進」上的一些體會。
人工智慧產品一個核心特點就是「演進」。也就是說「你很難一下子達到那個地方」,這可能是與傳統的互聯網產品很不一樣的地方。
互聯網已經存在很多年了,在產品經理的人才積累上大概已經過 10 萬的數量級了吧。對比國內人工智慧的導師儲備也不過數百人,國內人工智慧相關專業出來的研究生可以估算不會太多。這裡面有多少會成為人工智慧工程師呢?人工智慧產品經理就更少了。
所以,在中國現在做人工智慧的產品,跟我們以前做互聯網的產品很不一樣。單從人才供給來說,無論是產品經理、工程師,還是往上一層的架構層面的人,都只是傳統互聯網 1/10 到 1/100 這樣的數量級。
工程領域有一個原則,任何系統的架構你設計得再好,當系統面對的問題規模的數量級上升,或者下降,這個架構就會出問題。那麼,我們互聯網、移動互聯網上的產品設計經驗是為過去的規模的問題所設計的,我們現在碰到了新問題,還可以用原來的方法來做嗎?我覺得肯定是不一樣的。今天就來探討幾個不一樣的地方。
現在很多人在傳播這種焦慮感——人工智慧要顛覆這個、要顛覆那個。我昨天看到微軟 AI 負責人沈向陽老師在說計算機視覺識別系統要在 10 年之內識別所有的東西。過去我們常說「我有一個好想法,就缺一個程序員/產品經理了」,今年大家都改口「我的想法就缺 AI 了」。
但人工智慧對社會的顛覆其實還沒有發生,並且這個顛覆沒那麼容易發生的。因為人工智慧的資源是很稀缺的。稀缺資源造成現在組建一個人工智慧團隊,就一個字——「貴」。現在一個北清畢業的博士的入門價格 BAT 能給他開到 60萬*。過去我有看過其他人的團隊預算,十個人的機器學習團隊,初期需要投入上千萬。由於人才的稀缺,決定了這個風險不但來自於業務更來自於團隊本身,少了任何一個人都很填上這個坑。
* 編者註:具體數字有待證實
人工智慧的技術局限 ▼
其實,目前的 AI 技術並不是那麼靠譜,還是不成熟的。人工智慧已經經歷了兩次大型 AI 寒冬了,小的冬天不計其數,我就經歷過其中兩次小寒冬(神經網路和語義網)。這次的熱潮還會不會有冬天?有人說不會,但我已經被咬兩次了,我不敢這麼樂觀。
因為人工智慧現在還是人工智障的成分居多。我們做產品,更多是從人工智障開始做的。
2000 年,我在MIT研究期間的導師 Tim Berners-Lee(註:英國計算機科學家、萬維網的發明者,南安普頓大學與 MIT 教授) 曾告訴大家,未來會是語義網**的。當時實驗室成果讓大家很樂觀地認為可能 10 年之內就能在消費者領域實現語義網。2001 年他在 《科學美國人》相關領域中的描述的產品就很像是 Siri***,但當我們做了 10 年以後,我們發現我們遠遠低估了這個開發難度。現在 16 年過去了,我們還是沒有達到他描述的對話機器人的技術水準。
**編者註:語義網是對未來網路的一個設想,現在與 Web 3.0 這一概念結合在一起,作為 3.0 網路時代的特徵之一。簡單地說,語義網是一種智能網路,它不但能夠理解詞語和概念,而且還能夠理解它們之間的邏輯關係,可以使交流變得更有效率和價值。語義網核心是:通過給萬維網上的文檔 (如:HTML文檔、XML文檔)添加能夠被計算機所理解的語義「元數據」(外語:Meta data),從而使整個互聯網成為一個通用的信息交換媒介。
*** 編者註:2011年 10 月,Siri 才與 iPhone 4S 一起上市。
所以我們今天看到的很多的事情,比如知識圖譜、深度學習,從一開始的一個想法,到工程上、到產品上,最後落地到商業上是一個很漫長的歷程,通常需要 30 到 40 年。所以當我們看到一些實驗性的成果時,我們應該把自己的興奮壓一壓,因為這中間有很多不靠譜的坑。
人工智慧的技術瓶頸不是要代替智人作為動物的那一部分,而在於代替我們最近幾千年發展起來的那些認知能力,也就是我們有了符號思維能力之後的智能。在學術上體現在,深度學習這種演算法在不同領域上起到的改變是不一樣的,它可以讓語音和圖像的識別能力前進了一大步,但是在自然語言處理或是知識圖譜這方面的提高只有 1-2%。比如說,假設傳統的自然語言分詞演算法可以達到 88% 的正確率,那麼深度學習演算法在準確率上可能做到 89-90%。但是深度學習可以把視覺識別的準確率提升了 10-20%。
為什麼會有這種區別呢?
原因是「識別」這件事情是哺乳動物的智能,不僅僅限於人類。你家的小貓小狗會識別出你跟別人不一樣。深度學習可以在這種自然能力的處理上有很不錯的表現。但是語言和文字這種符號思考能力是近幾千年歷史上發展出來的,跟傳統的信號處理能力非常不一樣。
所以,現在的演算法是有局限性的,我們在構建人工智慧系統的時候要理解它的局限性。
關注路徑,而非直奔目標 ▼
移動時代互聯網產品經理培養的直覺是:剛需、極致。但是在人工智慧領域,這樣直奔主題的直覺未必能成功。人工智慧產品的複雜性,決定了產品的設計核心在於它的中間路徑而非最終目標。
我們移動互聯網時代在制定項目的時候,常會先有一個明確的目標。但是怎麼完成一個項目不是由目標所決定的,是路徑決定的。
一群老鼠開會要做風控,貓來抓老鼠之前做一個預警。怎麼做呢?大家定了一個明確的目標,在貓脖子上系鈴鐺。問題是,哪只老鼠來做這件事呢?怎麼做呢?
這就是路徑。
路徑有很多層含義。
別人的目標不是你應該效仿的終點,別人的路徑更不是你要效仿的路徑。BAT 的終點不是你的終點。我剛開始創業的時候,特別喜歡看別的架構師的那些架構,認真地做筆記,但當我開始認真搭建自己項目的架構時,我還是不知道這個邏輯是什麼,為什麼這麼搭。因為整個項目的演進過程中,最重要的事情不是最終公布出來的那些,而是沒有被公布出來的。你最終學習到的都是一些切片,無論是他的終點、還是所謂的路徑,其實都是他 90% 預想的路徑被否定之後的一些切片。
探索新生事物的過程中,「被否定的痛苦」,才是真正的核心競爭力。
痛苦是不可複製的。哪怕是我們在學習別人總結經驗、路徑形成的方法論。方法論的複製,也是建立在海量的痛苦當中。我們都知道找到實現目標的路徑很關鍵,但是沒有人會告訴你路徑在哪裡,只有靠自己去摸索。即使是「元方法論」(Meta 方法論),也只能幫助我們在海量的不確定因素中,去找到幾個確定的點,減少死亡的概率。
AI 產品路徑設計方法論 ▼
成本問題。我們在設計人工智慧產品的時候,會有種種不靠譜的因素在制約產品。我們只有快速的迭代,Lean startup(精益創業) 降低成本,才能提高我們的成活率。儘管互聯網產品和 AI 產品不一樣,但是快速迭代是一個通用的方法論。
不確定性拆分。把大的不確定性切成小的,切成小的不確定性。這個方法可以幫助我們在人工智障中尋找到人工智慧。
必須有業務基礎系統。像我這種技術出身的人,都會有一個做偉大的人工智慧系統的夢想。但實際上資料庫系統跟智能系統有什麼區別?其實者兩者在角色上是非常接近的,他們都是一種支持系統,支持系統是沒辦法離開基礎業務去獨立工作的。
如果說真正好的產品是一塊蛋糕,那裡面的精華一定是基礎業務系統;人工智慧系統可能連一個糖衣都算不上,它可能是蛋糕頂上的那個小櫻桃。2016 年某銀行花了一年的時間來做出一個大數據系統,系統有豐富AI模塊但內部業務部門都不願意用。這裡面只有報表系統,把 Excel 的 Copy、Paste 功能做進去了,真正打中了剛需,然後業務部門才逐漸接受了智能的附加功能。
中間節點是在考驗所有人的耐心。由於人工智慧系統不靠譜、周期長,所以一個人工智慧系統從投入到產出中間要有很長的周期,內部、外部、包括投資人在內的參與方的耐心很容易耗盡。怎麼在耗盡之前達到中間節點?這裡面最大的風險,並不是來自於技術,而是怎麼做好中期管理。
做人工智慧的產品,不要直奔主題而去。做金融,就不要直接去做投資研究系統。做醫療,不要直接做診斷系統。做招聘,不要直接做人才匹配系統。直奔主題的失敗不是特例,很多大公司都是上來就做一個特別大的系統, 90% 都會失敗。
AI 產品特性:可演進性 ▼
人工智慧系統是非常複雜的系統。但是複雜在英文中有兩種表達方式,Complex 和 Complicated,這兩種是不一樣的。移動互聯網產品是一個 Complex 的系統,而人工智慧應用,可以類比生物,是由千億個小元件精細配合完成的,是 Complicated 系統。Complex 的系統強調的是Scalability,規模能力,擴張能力。而人工智慧產品需要的是 Evolvability 可演進性。類比而言,一百億個草履蟲組合在一起不能合成一個人,但人工智慧系統也是需要從細胞開始進化的。
人工智慧系統的設計方法論要根根據這個區別去做改進。
蓋爾定律說,一個複雜系統是沒法自頂之下進行設計的;如果一個複雜系統從一開始的設計不是切實可行的,那麼到後面的修修補補也是無法讓它切實可行的;複雜系統必須從一個切實可行的簡單系統重新開始做。
從頂向下去設計的複雜系統無一例外都會是失敗的。一個切實可行的複雜系統勢必是從很多個切實可行的簡單系統發展而來的。在大公司裡面可能需要你交付一個預算是 2、3 億的複雜產品,失敗了也就是失敗,當成本攤薄之後可能是可以過日子的。但是這個成本對於創業公司來說,是不可能實現的。在過去將近 20 年的時間裡,我做過很多 AI 相關的項目,大部分都悲慘失敗了。我在現在的項目(文因互聯)里,有很多具體的小嘗試,有些還是失敗的。但我們可以把大的失敗、切分成小的失敗,讓每一個失敗都成為離成功更進的墊腳石。這是讓 AI 產品落地的根本。
那麼, AI 公司可以交付什麼?
我們有四種選擇——零件、工具、解決方案、系統。我們在實際解決問題的時候,我們很難交付一個複雜的系統。優秀的 AI 創業者不約而同地選擇一種路徑,為了設計實現一個通用系統,不得不先做包工頭,做了一個一個的解決方案,從解決方案裡面總結一個系統出來。
好的產品是總結出來的,並不是設計出來的。我們從具體的小事情開始做起來,當我們完成了 10 個解決方案的時候,我們或可以從當中總結出一個系統出來。當我們連解決方案都找不到時,我們就需要從零件、工具開始做起來的。
每一個產品的背後都是有科技樹的。一個產品首先需要很多零件去製造工具,沒有工具就沒有解決方案,沒有解決方案就沒有系統。以火車鐵路系統為例,鐵路在火車出現之前就存在了,後來出現蒸汽機之後又經過了瓦特的改良,過了很長一段時間才有了火車發動機。在這個案例里,零件——平行運動連桿、工具——蒸汽機、解決方案——礦山抽水,最後就有了系統——火車鐵路系統。就像蒸汽機一開始也不是應用在火車上,而是礦山抽水系統上。一個解決方案產生價值的時候,你會想像不到,後面會有什麼機會發生。
再比如,我們現在在微信上實現的電視電話,跟我們20年前設計的解決方案也是不一樣的。我們當時的電子工程師,想的是怎麼能夠設計一套編碼系統,讓視頻電話在電視系統里跑起來。我們在設計這個方案的時候連 CCD (圖像感測器)也不夠成熟,我們設計了一系列的光學的模擬信號去實現這件事。在這個案例裡面,零件—— CCD 圖像感測器,工具——攝像頭,解決方案—— PC 視頻聊天,最後就有了系統——「電視電話」。每一個工具、每一個理念,都有它當時的作用,在構造一個系統的時候,我們把這些中間節點找到他們的應用場景,然後去培育這個技術。這是所有複雜系統的統一的規律。
產生偉大的AI公司需要可演化的產品。直奔市場、用戶、需求所要求的主流剛需而去,就是讓 AI 產品失敗的保證書。
其實不僅是AI公司,「演進」也是很多更早的互聯網公司的特點。雅虎是從分類目錄開始做的,兩個創始人 8 個月時間,手工地做出來了分類目錄,巨頭完全看不起。後來他的網站演化成了門戶。而一個從一開始就想做門戶的公司,花了 600 億美金才明白這個道理。這就是 AT&T 的故事,早期的虛擬的互聯網接入服務供應商(ISP) 之一,在沒有 Web (1990 年面市)之前,就做了訂票、天氣等應用。 當 Web 開始出現的時候,它想做一個門戶,把所有的用戶都包含在平台上,當時為了維護這個封閉花園它前前後後花了 600 億美金,最終還是無奈破產。
另外一個演進的例子是 Pinterest。Pinterest 一開始也是做電商導購系統,然後失敗了。在這個過程當中發現大家對他們的圖片分享非常喜歡,於是他們把其他功能扔掉了,就做圖片的分享。他們簡化為非常簡單的工具:菜譜的圖片分享。後來經過幾年演化之後,才又做回了導購系統。
很多人工智慧產品的公司在發展過程中會有場景躍遷。比如出門問問,開始做出行 App ,後來做了手錶、車載導航;雲知聲的發展,最早的業務是搜音樂,後來做了語音雲,為很多行業的產品方案,下一步的場景包括智能家居。文因互聯一開始做的是金融搜索,現在我們在做金融自動化報告的機器人,未來可能會演化到智能資管或者智能投顧。
做智能金融、法律、醫療產品演化的一般的中間節點是什麼?這個問題我也沒有答案。需要大家去探索。
產品是團隊的映射 ▼
康威定律講的是產品演化更底層的問題:產品的結構映射了產生它的團隊的結構,可演化的產品需要可演化的團隊。
每一個公司的成員和架構跟它的產品會有很大的相關性。公司的成員都會決定你的產品是什麼樣子,而我們剛剛提到做 AI 產品最重要的一個特質就是要具有演化性。也就是說產生這個產品的人的集合,一定是要具有演化性的。
關於如何組建團隊,我們會聽到各種不同的方案或者聲音。有些團隊會強調技術,有些團隊會強調領域專家,有些大學出來的公司會強調演算法,也有人說要強調一針見血的領域洞察力,要一眼看出用戶需求在哪裡。
團隊演化遇到的最大的一個難題就是,如何把技術專家和領域專家融合在一起,特別是兩種人都是明星的時候。以我們自己為例,我們做金融領域的知識圖譜,金融和技術這樣兩種人都是我們團隊需要的,但更重要的一點就是團隊有沒有演化的基因和認識。
十幾年前語義網概念大熱的時候,市面上有幾百家公司,現在這些公司很多都沒有聲音了。這背後有一個重要原因就是明星的沉沒成本,我們剛才一開始就提到過,現在做 AI 的創業的人很貴很少,市場上找到的創業者都是明星。
這是很可怕的事情,因為明星很難去做髒的小的事情。明星可以加入任何一家公司去做合伙人,或者在大公司里拿到 200 萬或 500 萬的年薪,這些人不會去做小事情。Twine 是做語義網的明星企業,黃金配置的團隊成員,公司的 Slogan 是 Tie it all together.。所以他們一上來就做一整套的工具鏈。過程中遇到了各種各樣的問題,團隊花了很高的成本,但是產品性能表現很差。後來沒挺住,公司死掉了。儘管他們擁有最好的領域專家和技術專家,一旦開始去追求這麼大的目標,也是很難把這件事做成。
所以說找到一個「明星」是大家的幸運。但是如果這個明星不能夠控制自己的沉沒成本的話,就是大家的不幸。
所以更多的時候我們是要去構造一個可生長的團隊,這個團隊一開始可能沒有那麼厲害,但一定是讓團隊充分了解到什麼叫做演化,什麼是迭代,了解技術能幹什麼,尤其理解技術不能幹什麼。如果團隊真的能夠理解這些,那在這個漫長的周期里,它是不會放棄的。
這裡我列舉的幾個 AI 時代的從業者需要具備的能力。其實這些也並非是完全創新,很多是互聯網時代積累下來的經驗,在精益方法論中也有過討論。不要追求虛幻的確定性。我們在面對新生的需求時,我們會覺得自己需要一個專家來告訴我們怎麼去做;或者一件事我們不知道怎麼做,但是有大公司做了,我們就跟著大公司做;或者我們想不出這個產品是怎麼來的,讓項目客戶告訴我們該怎麼做。這些想法一點都不錯,但要記住,這是一種虛幻的確定性,它會在某個程度上讓你感到很舒適。但是最終如果不能克服這種對不確定性的恐慌,我們是很難演化的。
我們要善於做精益創業,善於做分解。把大的失敗切成小的失敗,做好快速迭代。我寫過一篇文章,叫做任務分解的五個動作,這是需要重複練習的。比如說怎麼寫好一個 OKRs(目標管理文章:創業 6 年,王俊煜首次對外分享 OKRs 目標管理心得),這件事到現在為止對我來說還是很大的挑戰。
要有交付的態度。交付是說每一件事情都要在一定的時間內,按天/周/月來交付一件可用的產品。我們不做複雜的大工程,但是我們做的每一期工作都要做到有一點點價值的,成為下一階段工作的跳板。以我們團隊為例,最近我們在做知識提取,一開始團隊對這次工期完全沒有信心。我說能不能達到 85% 的正確率?大家都不知道。於是我們就坐下來一起來分析知識提取上有什麼困難,做了一次錯誤歸因、持續交付。這次談話並沒有談到任何演算法層面上的問題,但是交付讓團隊更有信心了,也很快就達到了目標。
溝通、復盤。溝通和復盤都是在職場大家都會面對的,我就不多說了。
本錢能力。沒有本錢,不是團隊不打仗的理由;我們打仗是為了賺本錢。只要可以做到交付,本錢就會不斷的積累。
總結今天所說,濃縮為一句話:從小事做起!
更多 AI 話題的交流:深度 | 王守崑:AI 時代,產品經理的機遇和挑戰
福利 ▼
關注職人社公眾號(zhirent)並回復「文因互聯」,可以下載鮑捷的分享 PPT。文因互聯是智能金融核心引擎提供商,在尋找有志於成為中國第一批「人工智慧產品經理」的探索者,也歡迎熟悉 Linux 和 Python 的工程師。文因互聯的博客是 文因互聯 - 官方博客。歡迎通過職人社投遞簡歷,郵箱至 AI@zhirens.com 。
「AI 時代的產品經理」話題下還有 4 篇精華原創文章,歡迎繼續關注
推薦閱讀:
※小密圈,創作者連接鐵杆粉絲的社群工具 | Mind 熱品
※5 年浮沉,網易 LOFTER 演變成國內最優質圖片社交軟體? | MindStore
※闢謠,或許新浪微博的產品經理應該這麼做
※一周精選 | VOL.10 專業人工搜索、照片壓縮、動畫錄製、一鍵觸發、翻牌遊戲
※智能腕帶產品能和中醫把脈結合嗎?