「人工智慧」這個詞是不是被計算機科學與技術方向的人濫用了?
用「圖靈測試」判斷機器是否具有智能,有沒有意義?
也有些人生搬硬套圖靈測試,比如下棋,聊天機器人等,並說自己實現了人工智慧,然而,大家都知道,棋的規則簡單,它只不過是把人已經創造出來的推理演算法複製到機器上,本質上和我們用軟體編寫個冒泡演算法沒有區別。而聊天機器人,也只不過是基於統計學上的匹配,機器根本不懂我們在說什麼。現在比較火的機器學習,感覺就是統計學,所謂的學習過程,只不過是根據樣本信息獲得一些統計規律。這和我理解的「學習」相差很遠。將統計理論叫做人工智慧,是否有誤導性?
現在大都轉成統計學派,這是否是人工智慧發展方向?你們確定沒有感知這個世界,沒有推理的「學習」是人工智慧的方向?
不是,是被計算機科學與技術之外的人濫用了。
媒體啊,公眾號啊,以及某些公眾人物啊,成天鼓吹什麼人工智慧威脅論,一心只想搞個大新聞。
真是行行好吧,不要再瞎吹了。凈是坑我們正經在科研第一線搬磚的人。幾年以前申請簽證還能躲過去,現在好了,簽證官一看專業欄寫的是人工智慧,得,check。而且一check就check一兩個月...
種種方式我們都試過了,都沒用...
上次我去北京簽證的時候,簽證官是一個漂亮的白人妹子,我和她談笑風生。
不但生動的介紹了我的專業情況,著重強調了我乾的事情就是給互聯網上貼牛皮蘚廣告啦一點威脅都沒有的啦,而且還聊到了匹茲堡(我所在的城市)的風土人情,得知她的弟弟就在匹茲堡,跟我住的地方就隔一條馬路,等等等等。
整個聊天過程充滿了歡樂的氣氛,簽證官被逗得咯咯直笑。
然並卵,check!美女簽證官還非常耐心的安慰我說沒關係啦,最後一定會過啦,就是時間可能會久一點。然後直接check了我50天,機票都改簽了兩次...
另一個做計算機視覺的同學也是。跟簽證官說他其實是做人的認知科學的,具體就是人眼看一個東西然後怎麼想的blablablabla。簽證官聽了好久之後跟他邪魅一笑:「你是做人工智慧的吧?」 check!
更不要提國內研究人工智慧的老師了,微博截圖一張,來自國內著名的AI學者周志華老師:
確實很有經驗嘛你看從2013年就開始了,基本就沒有在出國開會前拿到過......
有些事情啊,只能說一開始就還是不解,然後是憤怒,最後就還是只能一個人默默沉默.....
對了,這股不正之風現在已經蔓延到美國海關了。系裡已經開始有同學入關的時候被海關工作人員恐tiao嚇xi說:「你是研究人工智慧的么?你為什麼想要毀滅人類?」
所以啊,真是擺脫媒體同志們高抬貴手,再這麼搞下去,別說本來強人工智慧研究不出來,就是能研究出來,這麼下去也被搞黃了.......
再來一個例子:
道德不好會影響學習嗎? - 深度學習(Deep Learning)
這玩意兒和深度學習啥關係?
========== 1.23 更新分割線 ==========
補充一個專業術語被外行濫用的例子:
剛剛在知乎機器學習的話題下看到一個問題 我22歲大四,中文系,想自學珠寶設計,可行嗎?應該怎麼開始呢? - 學習方法。大惑,這玩意兒和機器學習啥關係,點進去一看,作者加了個「無監督學習」的標籤......
親,不懂的東西不要隨便玩。人工智慧是被那些大忽悠們濫用了好么,被濫用的還有大數據、雲計算、物聯網、可穿戴,估計是同一撥人吧。估計下一個輪到 虛擬現實 啦?
我是沖著高票答主 @熊辰炎 的評論來的:)
哥們寫的不錯,很有幽默感。我也來湊個熱鬧來兩句哈。
看過我問答的人知道,我一直對計算機視覺領域的過分炒作持反對態度。因為過分炒作其實是對行業有害的。媒體吹的那麼高,但測試結果不好的話,客戶不光不相信他,客戶有可能誰都不信了。
如何看待 2014 年以來計算機視覺(Computer Vision)界創業潮? - jacky yang 的回答
另外,說個比較傷感的事情,在2010年計算機視覺最低谷的時候,有業內人士跟著銷售去拜訪客戶,據說客戶那邊有人背地裡說:那些做人臉識別的騙子又來了!
媒體的吹捧最後要無辜的從業人員買單,真的傷不起!人工智慧是目標(Goal),機器學習、統計學習是方法(Approach)。
對人工智慧的定義非常多,但都脫離不了「讓機器去做需要智能的事情」這一點,這是這個學科的目標,而針對這個目標,有非常多的方法(approach),包括Logic-based,Statistical,這些都是實現人工智慧這個目標的方法。
而針對題主這個問題
1. 計算機學界有一些濫用,但並不嚴重,大家都清楚自己是用統計方法在實現人工智慧。相對這個,我覺得媒體濫用的更為厲害,或者創業圈子濫用也比較嚴重。
2. 統計方法是否能達到人工智慧?我們不知道。關於人工智慧該如何達到,有各種沒有答案的問題。題主說機器學習,感覺就是統計學,所謂的學習過程,只不過是根據樣本信息獲得一些統計規律。這和我理解的「學習」相差很遠
而事實上,人工智慧是否需要學習這件事情我們都不清楚,或許只要注入人類學到的知識就能實現了呢?所以糾結這種問題是沒有意義的。統計方法收到關注的原因只有一個,效果好。而我覺得這就夠了,至於最終哪種方法能實現人工智慧,也是看療效,自己去「覺得」 是沒什麼意義的。
其實題主的問題可以通過考慮一個思想實驗(thought experiment)來回答。
以下的思想實驗基於的假設是:我們無法精確定義、刻畫智能的本質,或者這種定義和刻畫無法直接幫助我們製造或者甄別一個生命體或者非生命體是否「智能」。
那麼如果我今天聲稱我造出了一個人工智慧,擁有和人類相同或者更高的認知能力(這裡「認知能力」作為智能的同義詞,不加區分),那麼我需要如何驗證我的觀點呢?
因為根據假設,了解這個智能體的內部原理對我們的判定毫無幫助,所以我們只能通過它的外部表現來判斷其是否智能。所以我們只能設定一系列「智能體應該能完成的任務」,並驗證這個智能體是否和我們的參考體(人,因為我們都同意人是「智能」的)得到同樣(或者同樣合理)的答案。這就是圖靈測試。所以圖靈測試其實很廣泛,它真正被「用濫」是在新聞報道中。
學界做出的成果通常是這樣的:『我們開發了一個系統,它在X任務的Y數據集下,在Z個被試的測試下,通過了以W歲人類為參考的圖靈測試』。新聞報道為了抓人眼球(其實也無可厚非),通常就會寫出以下標題『A大學研究小組取得人工智慧研究重大突破,其開發系統已通過圖靈測試』。
通過圖靈測試的這個結果是不是有誤導性呢?因為我們假設了我們無法刻畫「智能」本身,所以任何原理的系統,如果在相同的輸入下得到和參考體類似的輸出,那我們就沒有理由認為它和參考體(在這一任務上)有任何智能的差異。因為我們在這個任務上觀測不到可以判別的差異,所以因為其實現方式和人類大腦不同而認為這個系統不夠智能,是過分主觀的。
題主之所以覺得圖靈測試有誤導,那是因為新聞報道
a. 沒有限定參考體,和/或
b. 沒有限定任務
導致的誤解。
如果一個系統被證實在「閑聊」這件事上和一個「12歲的人類兒童」有同等智能,那麼如果我誇大稱它和「人類」在「聊天」上擁有同等智能,顯然做了兩方面的誇大:一是通常我們認為成年人類的認知水平遠高於大多數12歲兒童;另外「閑聊」所需要的知識體系可能遠不如某個專業領域的「聊天」。
其實我們更希望的是智能系統能像人腦一樣,用一套系統(「The master algorithm」)解決各種問題,並對大量非常不同的問題都有還算不錯的解決方案。但這只是一種獲得智能的途徑。如果一個由多種針對不同問題的解決方案複合而成的系統,可以在我們考慮得到的問題上都得到與人類無法區分的響應(注意這是一個很強的假設,即所謂「強AI」的下界),那我們有什麼理由認為這個系統不如人類智能呢?我倒覺得題主沒有很好滴理解圖靈測試,人工智慧不應該被定義為高高在上的東西
「人工智慧」有強AI和弱AI之分。強AI指的是機器中實現的類人智能,這是人類長期的夢想和奮鬥目標。更現實的弱AI是對人類智能某些方面的模擬。比如Google、微軟等公司用deep learning做的語音識別和圖像分類系統,模擬了人類的一些不那麼高級的感知能力。
至於統計派是不是一定實現不了人工智慧,我個人的意見是:1. 首先任何知識都是概率性的,人腦也一直在做概率推理。比如最簡單的邏輯三段論:
人都是要死的。蘇格拉底是人,所以蘇格拉底是要死的。
這個先驗知識「人都是要死的」就只是個幾乎為真(成立概率0.9999...,而不是1)的命題。比如也許未來某一天人可以以某種形式永生呢?或者我們在看科幻、奇幻作品裡有不死的人,也可以根據這個設定來調節我們頭腦中這個先驗概率,從而順利理解情節,而不會因為邏輯衝突而大腦「死機」。
所以要準確建模人的認知過程,避免無數的例外情況,必然要在統計的基礎上做。
2. 然而僅僅靠統計理論是不夠的,因為現實提供了某種剛性結構,比如我們這個世界裡,天是藍的水是無毒的,這些在統計公式里並沒有體現,而是需要建模者顯式的構建為模型中的先驗知識或者約束。
3. 我目前的個人信念是,現在實現強人工智慧的瓶頸之一在於難以提供一種框架,可以自動的把hypothesis space里不太可能的hypotheses刪掉,這樣做推理的時候就會像人那樣,在小數據下也能精確的學習知識,而不會像deep learning那樣,很容易構建adversarial test case來攻擊,比如修改一張熊貓的圖識別成禿鷲:https://codewords.recurse.com/issues/five/why-do-neural-networks-think-a-panda-is-a-vulture
這種錯誤人類絕對不可能犯,充分顯示了deep learning同樣overfit了訓練數據,效果好只是因為比之前方法overfitting的程度輕些。
但是這種框架又不能太剛性,而是本身是通過學習不斷演化的。這實在是個非常困難的問題。
終極目標或許都是「人工智慧」。
正如我們的終極目標或許都是「共產主義」一樣。
但是,做計算語言學的就只談計算語言學,做自然語言處理的也只談自然語言處理,做視覺的也就談視覺,做機器學習的也就只談機器學習...沒聽說這圈兒內有多少人成天談論「人工智慧」,撐死了聊聊「認知科學」。但凡一個人做的工作與「神經科學/腦科學/計算機最底層架構」毫無關係,而與「演算法」有關,那麼他做的事兒,跟「智能」幾乎也就沒啥關係了。而如果一個「認知科學」學術圈兒的人,成天關心的事兒並非怎麼刷paper,從哪兒拿funding,畢業後去哪兒工作,創業怎麼包裝...而是關心什麼「人工智慧何時實現」...估計撐死了博士一年級吧。
「人工智慧」這種玄乎的事兒,老老實實等著神經科學/腦科學/計算機最底層架構的革命性突破就好了。而上一段兒提到的那些類似「機器學習」的概念,雖然跟「人工智慧」沒什麼實際關係,但真心能改變我們的生活哎,且正在改變我們的生活,不也很酷么?傳統意義上的軟體本質上是在解決信息化的問題,從基礎層的數據存儲、網路傳輸、數據計算,到應用層多樣的應用程序技術,以及由信息化帶來的各種中間件技術和網路安全技術,簡單問題用輕量級的技術架構信息化,複雜問題用平台級的技術架構信息化,這是一個將世界從analog到digital轉化的digitalizing過程;互聯網基於軟體但核心不是軟體技術,互聯網的巨大商業價值產生於實現了人與信息的「連接」,互聯網商業模式就是一種「發現信息的機制」,某種角度,我們也可以把使機器理解人的AI技術看作一種「連接」,過去是人approach信息,所謂感知(人感知信息),有了這層AI Enabler之後,未來是信息approach人,所謂認知(信息認知人,機器認識世界),也就是說,AI enable了另一個方向的「連接」,開啟了另一個境界的信息化!Sounds like a big thing, right?
In the long run, 機器將理解人類的情感,甚至擁有自己的思想,in the short run, 比較務實的理解是,AI = Smart Computation (Data x Algorithms),也就是一種更智能更自動化的「計算」。Why now? AI從量變到質變的突破來自於:
- Data:信息化所積累的足夠大規模、多元化的數據,以及雲計算所帶來的數據集中化;
- Algorithms:作為machine learning的分支,deep learning在上世紀60年代就被提出,直到2012年左右Lecun的卷積神經網演算法所取得的進步終於帶來了質的突破,在人臉識別領域,機器第一次超越了人眼識別的能力;
- 硬體層面:基於deep learning的學習迭代需要恐怖的硬體計算資源支持,GPU並行計算的運用提供了CPU無法達到的計算能力(NVIDIA的市值也應聲水漲船高),我們可以期待定製集成電路ASIC,神經元晶元NPU的發展對AI的重要促進。
今天,機器學習還是基於監督式學習,也就是說,需要人工介入事先把數據集打上標籤來訓練模型,告訴機器這張圖片是貓那張圖片是狗,反反覆復訓練之後,演算法就具備了識別貓貓狗狗的能力,聽起來不太sexy... right? 稍複雜一些的場景,機器可以將一張圖片翻譯為它所理解的文字,比如 A young lady holding a Starbucks coffee。在運用deep learning之後,語義理解NLP領域已經取得了一些進步,但deep learning在NLP方面的應用還沒有取得突破性的進展,原因在於deep learning是一種更適合於做特徵提取的演算法,也就是,在人不好描述的情況下通過機器做特徵描述,因此deep learning在圖像這個便於模式抽象的領域最容易發揮,在自然語言理解方面還有待探索。科學家們也在努力使深度學習模型獲得邏輯推理能力。未來的想像空間在於從監督學習到非監督學習的跨越,畢竟這個世界的絕大部分信息是沒有被打上準確標籤的,非監督學習將減少人工干預,讓機器更自動更自由的學習探索世界,這將帶來根本的進步,一切才剛剛開始。
AI能成為Infrastructure而不僅僅局限於vertical技術的原因在於deep learning技術的強「獲得特徵遷移性」,也就是強通用性。DeepMind在成功挑戰人類複雜遊戲圍棋之後(AlphaGo),向視網膜醫學影像診斷領域進軍,並且再次證明了機器可以比人類做得更好,同時,DeepMind還在探索基於機器感測數據做針對機器硬體的能耗管理、故障預測。在越來越多的領域,作為一種基礎設施級的enabler,AI技術的出現極大的提升了行業效率,甚至是這個領域的Game Changer。無論是自動駕駛對交通出行的改變,還是智能製造IIoT(Industrial IoT)或者智能投顧RA(Robot Advisor)的興起,機器替代人工並不新鮮,技術創新重塑行業產生的機會以及對產業上下游產生的改變才應該是我們關注的重點。
說的好像人類學習就不是根據樣本特徵獲取統計規律一樣……
我本人希望「人工智慧」、「機器學習」、「數據挖掘」、「大數據」這樣的詞被濫用。
不濫用科研經費哪裡來?
不濫用學生就業哪裡去?
不濫用我們薪水哪裡拿?
首先,「智能」這個詞大家被誤導了。人工智慧的「智能」和智能手機、智能電視的「智能」是兩個幾乎不相干的東西。
智能手機(smartphone)的wiki解釋A smartphone is a mobile phone with an advanced mobile operating system which combines features of a personal computer operating system with other features useful for mobile or handheld use.
智能手機是一個擁有高級的移動操作系統的手機,這個操作系統集成了PC和一些易於移動使用的功能。
再看看人工智慧(AI)的解釋Artificial intelligence (AI) is the intelligence exhibited by machines or software. It is also the name of the academic field of study which studies how to create computers and computer software that are capable of intelligent behavior.
人工智慧是由機器或者軟體展示的一種智能。人工智慧領域是研究怎麼使計算機和計算機軟體擁有智能行為(這裡的智能可以認為和人一樣,有知識體系、能推理、能學習、能創造等等)。所以,「智能」手機、「智能」XX和「人工智慧」其實沒什麼關係。只是人們被「智能」這個詞誤導了。
其次,機器學習是人工智慧的一個分支,我更喜歡它的另一個名字「模式識別」。機器學習是從眾多數據中進行監督或者非監督的學習(其實還有我喜歡的增強學習)。原來這些規律只是基於本地數據去尋找規律,現在互聯網了,大數據了,可以基於更多維度的數據去尋找規律,但是尋找什麼樣的規律(監督學習),找的規律怎麼用(非監督學習)還是由人決定。所以電影中看到的自主學習、自主創造的人工智慧還很遠,我們覺得各種軟體神奇,不如說是機器背後的工程師們神奇。
人工智慧目前最大難度是我們自己都不知道什麼是智能。因為人的大腦目前的研究非常非常少。計算機擁有和人一樣的知識體系、推理能力、學習能力、創造能力要走的路還很長很遠。
我覺得正相反,「智能」這個詞被神棍濫用了。
另外,「耕地」一詞能被農民濫用么?不能,因為什麼是耕地就是農民來定義的。同理,什麼是人工智慧,本來就是計算機科學家說了算的事情,哪有濫用的可能性?你要是說媒體或者投資人濫用這個詞還可以討論一下。
EDIT 說神棍是因為,除非你相信人必須有靈魂才能有意識一類的神學概念,否則你實在沒理由說靠統計搞出來的模型不是「推理」,感測器返回的東西不叫「感知」。沒有,是被電影方向的人濫用了。
目前人工智慧最著重的方向的一塊是在機器學習和神經網路這一塊,對模型的訓練會用到大量的統計學方面的知識。訓練出來的模型輸出的值往往是概率最大的值,而實際上我們人每天也在有意無意的做出決策,依據已經知曉的條件做出在當時自己看來最有利的決策。在我看來,從統計學方向對人工智慧進行努力在我看來是和人本身相通的。
人從一出生開始是不知道什麼事情的,但是通過感知,教育(輸入,訓練),一步步了解世界,學會吃飯,讀書,適應世界的能力越來越強(模型的準確率越來越高)。目前的人工智慧沒人類那麼全能,但是某個訓練的模型能夠精通某一方面,甚至超出人類,比如2015年年初微軟研究院的人臉識別系統的人臉識別率已經超過人類。這些模型早就刨除早年的窮舉之類的笨方法,而是跟人類一樣,發現規律,提取特徵。
應該不是被專業領域的人濫用,而是被外行和商人炒作濫用。
本質上,所有需要人工干涉學習結果的訓練,都不能算智能。
真正的人工智慧絕對是恐怖的。別以為,3歲的小孩子的智力可以被小覷。想一下,一群可以不眠不休的三歲小孩,一個個分開學習各種語言,算數,音樂,甚至開槍射擊,開車,然後再把這一群小孩合成一個,再複製成一群,再把他們裝到一堆比阿諾強百倍的機器身體裡面,是什麼結果?
話說自從兩次AI之冬以後,很多計算機科學家都不敢說自己搞的是「人工智慧」了,都是機器學習什麼的……………
條件反射是人類行為的基礎,和巴甫洛夫訓狗一樣,你罵一個人,他會生氣,讚美一個人,他會開心。"開心""難過""嫉妒""痛苦""悲傷" "愛""恨"這些定義性詞語的出現無非是因為人的情感是有共性的,可以被歸納的。攻略遊戲,心理學等等,其實都是數據分析和被總結的最優演算法,所以,看似捉摸不定的感情,其實有規律可循的,並且參考腦電圖和神經遞質水平會更精確(默認正常值)。
而社交的本質很大程度上就是一個反饋過程。 一個人無法完全了解另一個人,他只能獲取信息,轉換成他所理解的信息,再從他已錄入的信息(資料庫)里查找, 再發送條目所對應的答案。所以我們評價某人孩子氣/閱歷豐富/八面玲瓏/不知變通,其實就是資料庫是否完備,演算法準不準確的問題。
而這兩方面,也就是"反饋"上,隨著技術發展並不是問題,題主覺得最大的壁壘,"主動"和"學習",其實就是保存所有外源性數據(更新資料庫),量化反饋模式再自動優化演算法的過程,我覺得還是有希望的。
可以類比一下「大數據」這個詞!!
我媽在我出國之前有次悄悄跟我說,對不起人類的事情我們不好做的啊!
推薦閱讀:
※支持向量機(SVM)是什麼意思?
※如果Cortana,siri,小冰一起聊天會是怎樣的場景?
※深度學習有哪些好玩的且易於實現的論文?
※普通程序員如何向人工智慧靠攏?
※為什麼AlphaGo和李世石下棋這麼慢,卻能和自己一天下一百萬盤棋?