「機器學習之父」Michael I. Jordan:人工智慧——一場尚未發生的革命
編者按:昨夜,「機器學習之父」、加州大學伯克利分校計算機科學與統計學教授教授Michael I. Jordan在Medium上發表文章,闡述了自己對AI這個新興領域的擔憂和看法。對於這個名字,每個涉足人工智慧行業的人都該有所了解,Michael I. Jordan在計算、推理、認知和生物科學領域工作了三十多年,兢兢業業為AI當代研究奠定了基礎,被稱為The Michael Jordan of Machine Learning。那麼,面對同時站在發展和倫理風口浪尖的AI,他的觀點是什麼呢?
以下是論智對大神文章的翻譯(很長,閱讀時間:16min):
人工智慧(AI)是當今時代的「神咒」,它常被技術人員、學者、記者和風投人士掛在嘴邊。和其他從技術、學術領域逐漸普及到大眾的概念一樣,人們談論它們、誤解它們。但這還不是公眾和科學家之間存在理解鴻溝的典型案例——對於AI,科學家們和普通人一樣尚存疑惑。在這個時代,人們從矽片上看到了實現人類智能的可能性,這種可能性令人倍受鼓舞——也同樣令人膽顫心驚。更不幸的是,它讓我們分心。
對於AI,有些人也有不同的聲音。請看下面這個故事,它涉及人類、計算機、數據和生死攸關的決策,但重點又無關我們的矽片幻想。
差點被「唐氏」的女兒
14年前,我的妻子懷孕了,我們一起去醫院做超聲波孕檢。當時檢查室的一位遺傳學專家告訴我們,胎兒心臟周圍有一些白色斑點,「這些是唐氏綜合症的標誌,」她說,「現在孩子患病的概率已經提高到了1/20。」為了確認胎兒究竟有沒有患病,她建議我們做羊膜穿刺術,但這種手術的風險很大,流產率有1/300。作為一名統計學家,我決定找出這些數據的來源。
長話短說,我找到了英國一項已經進行了十年的統計,他們的研究成果表明超聲圖像中的鈣積聚白色斑點的確可被作為唐氏綜合症的篩查指標。但我也注意到,我們做孕檢這家醫院用的成像機器比研究用的機器要高几百個像素。確認了這些因素後,我轉過頭來告訴醫生:「我覺得這些白斑是假陽性的——它們實際上是『白雜訊』。」她有些驚訝:「啊!這就解釋了為什麼這幾年來醫院的唐氏綜合症診斷率不斷上升;這剛好就是新機器啟用的時間。」
最後我們沒有做羊膜穿刺術,幾個月後,一個健康的女孩兒出生了。但這件事一直困擾著我,我粗略算了下,發現每天全世界有成千上萬的人會得到這樣的誤診結果,其中許多人也許遵從醫囑做了手術,一些嬰兒也許就這樣無辜地死去。這種事故一天又一天地發生,直到最後有人發現了真正原因並做了修復。
當然,這些問題和我本人的醫療保健並沒有任何關係,它是整個醫療系用的問題,是在不同時間、地點測量變數和結果,進行統計分析,再把經驗用於其他時間、地點的醫療診斷的問題。它不僅和數據分析本身息息相關,更和資料庫研究人員口中反覆強調的「來源」密切相關——這些數據是從哪兒來的,人們從這些數據中得出了什麼推論,以及這些推論和顯示結果又有多大的相關程度。
一個訓練有素的統計學家可以獨立完成以上的分析工作,但這個故事的問題在於,我們該怎麼為醫院設計一個無需人工監督的完善醫療系統。
我也是一名計算機科學家,如果要構建這樣一個推理、決策系統,我設想的原則需要結合計算機科學、統計學兩門學科的知識,它還要把患者需求納入其中,而這點是教科書上學不到的。除了醫療機構,其他諸如商業、交通、教育等領域也需要這樣一整套原則,在我眼裡,這樣的原則至少和構建花里胡哨的AI系統同樣重要。
「智能」是什麼?也許這個時代很快就能給出「答案」。但無論如何,我們都將面臨一個重要大挑戰,即將計算機和人類結合在一起,從而提高人們的生活水平。目前看來,儘管一些人認為這個任務不如AI研究重要,但我們大可用一顆平常心來看待它——就像一個新創建的工程分支學科,它同樣值得尊崇。幾十年前,人們在物理和化學基礎上衍生出了兩個新學科:土木工程和化學工程,它們結合了兩門基礎學科的核心思想,為社會帶來了巨大的資源和驅動力。現在,這個新任務,或者說這個新學科將建立在前一個世紀所有落地思想的基礎上——如信息、演算法和數據。
雖然有了構件塊,但我們還缺少把這些構件塊整合在一起的原則,所以目前它們只是以特定的方式組合在一起。
在土木工程出現之前,人們也會造各類建築和橋樑,其中的一些有時會以不可預見的方式釀成悲慘的後果——AI系統也一樣,我們正在構建涉及機器、人類和環境的大規模推理、決策制定系統,而這些早期的成果也已經暴露出不少嚴重的概念缺陷。
不幸的是,我們並不善於預測下一個正在出現的嚴重缺陷。我們缺少的是一個具有分析和設計原理的工程學科。
AI的前世今生
關於這類內容,目前人們會很頻繁、很籠統地用AI這個詞來描述,這就使我們很難界定這個新興技術的範圍和後果。也許我們應該更仔細地研究一下在過去和現在,AI到底指的是什麼。
如今大多數AI,尤其是公眾眼中的AI,其實是幾十年來一直被叫做「機器學習」(ML)的東西。ML是一個演算法領域,它將來自統計學、計算機科學和許多其他學科(見下文)的想法融合在一起,設計出種種演算法來處理數據、做出預測並幫助做出決策。就對現實世界的影響而言,ML是切切實實的,而且並非一朝一夕。
早在20世紀90年代,ML的工業化道路就已經很清晰了,到世紀之交,亞馬遜等具有前瞻性的公司已經在業務中廣泛使用ML演算法,來解決後端問題檢測和物流鏈預測等關鍵問題,以及創新面向消費者的服務,如建立商品推薦系統。隨著其後20年間數據集和計算資源的快速增長,很明顯,現在ML的服務對象不再僅限於亞馬遜等公司,任何需要依賴大數據制定決策的企業都已經成了它的擁躉。在這種情況下,新的商業模式即將出現,而隨之而來的是「數據科學」一詞正被用來指代這種現象——社會迫切需要更多的ML演算法專家和資料庫、分散式系統專家攜手合作,構建可擴展的、更強大的ML系統,而這些系統也更全面地反映大社會、大環境的現狀。
在過去幾年中,這種思想和技術相結合的產物被稱為AI,但這個「品牌」的塑造還值得商榷。
從歷史上看,「人工智慧」這個詞是在上世紀50年代後期被創造出來的,它一開始表現的是人們對用軟體和硬體實現一種具有人類智能的實體的強烈願望。我們可以用「人類模仿AI」來表示這一想法,它假設AI應該成為我們人類的一份子,即便不是身體層面上的,那至少也應該是精神層面上的。這還主要是學術界的事。
在當時的學術界,雖然運籌學、統計學、模式識別、信息理論和控制論等相關領域已經存在了一段時間,受人類智能/動物智能啟發,它們也能實現一些「低水平」的神經信號傳遞和決策,如松鼠能夠感知它所居住的森林的三維結構,並在期間跳躍。這些成果的確令人鼓舞,但AI關注的是全然不同的領域——它要模仿的是人類的高級認知能力,如「理性」和「思考」。
可惜的是,在60年後,我們還是沒能摸透高水平推理和思維模式的原理。因此現在被稱為AI的那些事物還是主要存在於低水平的模式識別和運動控制相關的工程領域,或是在統計學領域——這個學科專註於挖掘數據模式、進行有根據的預測,以及測試假設和決策。
20世紀80年代早期,David Rumelhart提出了著名的反向傳播演算法,被視為所謂的「AI革命」的核心。但這其實是五六十年代控制論中的思想,最早被用在優化阿波羅太空飛船登月的推進系統中。
所以雖然自20世紀60年代以來,AI取得了巨大進展,但我們可以說它並不是模仿人類的AI。相反地,就像阿波羅太空飛船的事例一樣,這些想法雖然常常被藏在幕後,但一直是研究人員就特定問題採取的手段。儘管公眾對此一無所知,但文檔檢索、文本分類、欺詐檢測、推薦系統、個性化搜索、社交網路分析、計劃、診斷以及A/B測試等等,都早已在科學研究和系統建設等領域取得了重大成功——這些也都是推動Google、Netflix、Facebook和亞馬遜取得如今地位的重要幫手。
人們可以簡單粗暴地用一個「AI」來總結這些事,事實上他們也是這麼做的。但這樣的標籤可能會讓從事優化和統計工作的研究人員感到意外,一覺醒來,這些人就發現自己莫名其妙成了「AI研究人員」。這還是次要的,更嚴肅的問題是,如果我們繼續使用這種單一的、不明確的首字母縮寫名詞,我們又該怎麼界定與其相關的知識、商業範疇。
AI、IA和II:三個不同的概念
過去的二十年中,智能增強(IA)作為滿足人類實現「人類模擬AI」夢想的一個替代品在工業界和學術界取得了重大進展。它通過計算和數據提供服務,並把它們用來增強人類的智能水平和創造力。IA的一個突出案例是搜索引擎,它提高了人類的記憶和知識積累水平;自然語言處理是另一個典型例子,它提高了人們的交流能力。此外,基於計算的音樂和圖像生成能為藝術家提供更多創意。雖然這些服務可能涉及高水平的推理和思考,但目前它們並沒有過多地深入——它們中的大多數還是選擇執行各種字元串匹配和數字操作,從中捕獲人類可以使用的模式。
說到這裡,文章涉及的縮寫字母已經有很多了,這裡我們再說最後一個——智能基礎設施(II)。即一個由計算、數據和物理實體構成的網路,它能使人類環境更友好、更有趣、更安全。這種基礎設施已經開始在交通、醫藥、商業和金融等領域出現,將對個人和社會產生巨大影響。它有時也會和「物聯網」一起出現,但後者努力實現的僅僅是把「事物」連接到互聯網上,而不是讓網路依據數據流具備分析這些「事物」,或其他更大目標的關於世界的所有事實的能力。
舉個例子,讓我們回到我的經歷中。我們可以想像自己生活在一個具有「社會規模」的醫療系統中,它在人體、醫生和設備之間建立起數據流和數據分析流程,從而能幫助人類進行診斷和提供護理。這個系統收錄了大量關於身體細胞、DNA、血液測試、環境、群體遺傳學以及藥物和治療的大量科學文獻的信息,它不再只關注單個病患或醫生,而是關注所有人之間的聯繫——就像現代醫學會把從一堆人身上得出的實驗結果拓展到所有人身上一樣。
這種做法將有助於確保數據的來源、相關性和可靠性,它們也是現在銀行機構在金融和支付領域力圖解決的主要問題。放到現實中,我們可以預見這樣一個系統會出現多少問題——隱私、安全、責任等——但它們應該被視為挑戰,而不是阻礙。
現在放在我們面前的就是一個關鍵問題:對於這些挑戰,研究古典的「人類模仿AI」是不是唯一的方法?事實上,現在不少大熱的ML成功案例都是圍繞「人類模仿AI」展開的,如計算機視覺、語音識別、強化學習和機器人等。所以也許我們應該耐心等待這些領域的進一步發展。但這裡有兩點需要說明。
首先,雖然人們無法直接從報紙上直接讀到研究成果,但即便「人類模仿AI」獲得了進展,它帶來的影響也是有限的——我們距離實現「人類模仿AI」還很遙遠。不幸的是,這些由微小進展帶來的快感(和恐懼)引發了行業內的虛假繁榮和媒體的過度吹捧,這在其他工程領域聞所未聞、見所未見。
其次,更重要的一點是,這些領域的成功既不足以解決IA和II中的重要問題,也不是解決這些問題所必需的。以自動駕駛汽車為例,為了實現這種技術,我們要解決一系列工程上的問題,但這些問題可能和人力資源(或從業人口稀少)關係不大。比起他們搜集的那些鬆散的、只會朝前看的、注意力不集中的人類司機數據,這樣一個交通系統(一個II系統)可能更像空中交通管制系統,甚至比當前的空中交通管制系統還要複雜得多,特別是在使用大數據和自適應統計建模來指定決策時。在研究「人類模仿AI」前,這些挑戰應該被放在前列。
至於有沒有必要這個論點,有時人們也會覺得「人類模仿AI」其實包含了IA和II的願望,因為它不僅能解決AI的經典問題(如圖靈測試),也能為IA和II問題提供了最佳解決方案。但這樣的論點還沒有歷史先例來支撐。為了發展土木工程,我們是不是該開發一個人造木匠或泥瓦匠?或者為了發展化學工程開發一個人造化學家?更激進一些,如果我們的目標是造一座化學工廠,那麼我們是不是應該先造一個人造化學家,再由他來思考怎麼造一座工廠?
與之類似的一個論點是,人類智慧是我們所知道的唯一一種智慧,我們應該把模仿它做為第一步。但是其實人類並不擅長某些推理——我們有我們的失誤、偏見和局限。而且最關鍵的是,我們也沒有進化出類似現代II這樣需要面對大規模決策的系統,也不用處理II背景下的各種不確定性。有人可能會說AI系統不僅能模仿人類智能,還會糾正其中的錯誤,並把這個優點擴展到任意大小的問題上。但是,我們所處的環境不是科幻小說——這種推測性的論點雖然在小說里頗具娛樂性,但它不應該成為我們解決關鍵的IA和II問題時的主要策略。我們需要根據它們自身的優點來解決問題,而不是為了模仿人類而模仿人類。
未來的展望:一個新興的工程學科
如果要建立一個II系統,我們可以遇見其中由演算法和基礎設施帶來的困難,但這些並不是「人類模仿AI」研究的核心主題。首先,II系統需要管理分散式知識庫,這些知識庫的變化十分迅速,並且可能在全球範圍內不連貫。其次,這樣的系統必須在做出及時的分散式決策時應對雲端的相互作用,還要必須處理長尾現象,即有些人的數據量很大,但大多數人的數據卻很少。它們必須解決不同管理部門和競爭對手間數據分享困難的問題。最後,尤其重要的一點是,II系統必須將諸如激勵、定價等經濟理念帶入統計和計算基礎設施的領域中,這些基礎設施會把人和人、商品和商品聯繫起來。
這時,這樣一個II系統就不單單是一個服務系統,它還是一個市場,一個利用數據分析將生產者和消費者聯繫起來,一個被傳媒、文學和音樂等領域廣泛呼籲的市場。這一切都會在不斷演變的社會、道德和法律規範下井然有序地運作。
當然,經典的「人類模仿AI」問題也仍然值得關注。然而,目前它的重點還是通過收集數據進行人工智慧研究,部署「深度學習」基礎設施,以及模仿某些狹義定義的人類技能的系統演示——幾乎沒有新出現的原則,更傾向於偏離經典AI中的一些重大開放性問題。
這些問題包括:把意義和推理引入自然語言處理系統中;推理和表示因果關係;開發處理不確定表示的簡便計算方式;以及需要開發制定並追求長期目標的系統。這些是「人類模仿AI」的經典目標,但似乎已經被「AI革命」的喧囂所湮沒。
IA仍將保持相當重要的地位,因為在可預見的未來,計算機還無法像人一樣抽象地描述現實世界的情況。對於靠人類和計算機互動來解決我們最緊迫的問題這件事,我們要深思熟慮。我們希望計算機能提高人類的創造力水平,而不是取代人類的創造力。
當年John McCarthy(當時還是達特茅斯大學的教授,但很快就赴任MIT)之所以創造「AI」這個術語,是因為他想把自己的成果萌芽和Norbert Wiener(當時MIT的一位老教授)的研究區分開來。Wiener的「cybernetics」也是一個與運籌學、統計學、模式識別、資訊理論和控制論密切相關的新概念,而McCarthy更強調AI和邏輯的關係。一個有趣的反轉是,現在我們打著的研究旗號是McCarthy的,在這個時代佔據主導地位的研究內容卻都是圍繞Wiener的(當然,這只是暫時的)。
但我們需要超越McCarthy和Wiener的特定歷史觀點。
我們需要認識到,目前關於AI的公眾宣傳——主要集中在工業、學術上的狹窄領域應用——有使我們每一個人面臨AI、IA和II三重挑戰和機遇的風險。
它無關科幻小說的美夢和超人類機器人的噩夢,更多是關於人類理解和塑造技術的需求,因為它在日常生活中正變得更加現實,影響力也更大。此外,因為它的職責在於理解和塑造,我們也需要來自各行各業的不同聲音,而不僅僅是技術上的需求。如果過分專註於「人類模仿AI」研究,我們會閉目塞聽以至於聽不到更廣泛的建議。
在工業界蓬勃發展的同時,學術界也將也將繼續發揮重要作用,它不僅會持續提出最具創新性的技術理念,也會將計算機科學、統計學的研究人員和其他學科的人聚集在一起,傾聽他們的重要觀點,尤其是社會科學、認知科學和人文科學的專家學者。
另一方面,雖然人文和科學是我們發展的大方向,但我們也不能跳出工程範圍空做探討——社會需要一個新建的大工程,而且它應該能按照人們的預期運行。我們不希望辛辛苦苦構建出一個個醫療系統、交通系統和商業系統,結果它們都沒什麼實際作用,甚至會毀了人們的生活。正如我所強調的,在這個以數據和學習為重點的領域,有一個新的工程學科亟待出現。而就現在已有的這些激動人心的工程應用來看,它們中的任何一個都還達不到成為一個學科的門檻。
而且,我們應該接受這樣一個現實:我們正在目睹一個新的工程學科的出現。雖然從狹義上來看,工程這個詞——無論是在學術上還是在其他領域內——始終帶有冷漠、機械式的意味,甚至還透露出無法受人掌控的消極內涵。但我們真正想要的就是這樣一個「工程」學科。
在這個時代,我們終於有一個真正的機會來做一件歷史性的大事——創造一個以人為中心的工程學科。
我拒絕為這個學科命名,但如果我們繼續沿用AI這個詞,這會讓我覺得大大受限。讓我們擴大範圍、淡化炒作並認識到未來的嚴峻挑戰!
——Michael I. Jordan
推薦閱讀:
※無人駕駛時代你不打算買車了?五個理由告訴你還得買
※浪潮:隱形的人工智慧巨頭
※Deep Learning in CV and AI (1) -- Intro of CNN
※科大訊飛醫學影像再下一城 奪得眼底圖分析國際賽事冠軍
※[中國電子學會]新一代人工智慧發展白皮書(2017)第一、二章
TAG:機器學習 | 人工智慧 | 邁克爾·喬丹MichaelJordan |