《人工智慧是如何設計的讀書筆記》 丟爸
有一個有趣的人,製作出了這樣一張有趣的人類進化史圖片,我覺得還真說不準,可能過個50年,一個世紀,那時候,流行的不再是血統純真的人,可能是生化機器人,機器與人的完美結合!這裡,不妨做個大膽預測,也許,我們看不到那一天的到來,但我們的後代一定能看的到! —— 丟爸
以下內容來自於傅渥成先生的書籍《人工智慧是如何設計的》
如果人工智慧是一塊蛋糕,那麼無監督學習(預測學習)就是蛋糕本身,監督學習是外面的糖霜,強化學習則是蛋糕上的一粒櫻桃。目前,我們只知道如何製作糖霜和櫻桃,卻不知如何製作蛋糕本身。
什麼是人工智慧?
下面主要說說人工智慧領域的應用學習,畢竟這本書參考了大量的機器學習,神經網路等方面論文,專業術語太強。
1.預測貧困:遷移
學習
我們都曾經見過城市夜光的衛星照片,在這些照片中,我們可以明顯看到中國沿海地區和內陸地區(或者韓國與朝鮮)夜光亮度的差距,這些差距反映出經濟發展狀況的差距。有許多研究建立起了夜光與地區經濟水平(貧窮指數,經濟生產率,GDP等)發展之間的定量關係。這是一種全新的數據收集方法,這些信息可以真實而準確地反映出許多社會問題,為政府和非政府組織的決策可以提供非常重要的參考。
然而,夜光數據有其天然的缺陷,夜光的照片通常解析度較低,而且一塊黑暗的區域既有可能是因為貧困,也可能是因為無人居住,亮度較高的區域也可能是政府的公共設施(例如高速公路),並不反映出相應區域真實的貧困情況。怎樣才可以準確地對一個局部區域(例如一個村莊)的經濟發展情況進行有效的評估?斯坦福的一個研究團隊巧妙地利用了遷移學習的方法的方法,先用低精度的夜光圖片數據作為標記,再訓練一個深度卷積神經網路,使得這個網路可以通過白天的高清衛星遙感圖像來預測(夜光)的強度。這一預測的目的並不真的是為了預測夜光,而是希望提取白天的衛星遙感圖像中的特徵,例如可以從圖片中識別出有人居住的房屋屋頂,公路,無人居住的河流等特徵。然後,再用這些特徵作為輸入,結合部分採樣點的貧困調查數據作為標籤,再訓練一個神經網路。
通過遷移學習,最終,科學家們得到了一個這樣的神經網路:只要給這個網路某個區域內的衛星遙感圖,它就可以準確地對局部貧困程度進行較高精度的預估。這個例子展示了遷移學習巨大的應用前景:如果可以讓機器學習的系統首先在那些易於獲得的(可能質量相對較低的)小規模數據上進行訓練,這些訓練的結果有可能可以幫助我們在新環境(或者另一種類型的數據)的學習任務中達到優異的表現;更重要的是,隨著衛星遙感,移動互聯網,感測器技術等諸多的發展,面對許多複雜的問題,我們開始可以收集到更加豐富而全面的數據,隨著這些數據量的不斷累積,我們必然需要發展出一些方法處理爆發性增長的大數據。遷移模型正是一種極具可行性的方案,利用舊有的已標記的數據(這些數據可能是另一領域的數據),訓練新的模型,這為未來更大規模,更精細化的研究提供必要的準備。
2.對偶學習
對偶學習是近來被提出的又一種新的學習範式,這種學習的方式看起來就更加神奇了。簡要介紹一下這種學習方法的基本思路:假如現在小明只能講中文,Alice只會講英文,他們兩個人雖然都不懂對方的語言,但是他們希望可以改進中英文之間的翻譯模型(中譯英,英譯中)。怎樣可以實現他們的目標呢?首先,對於一個英文的句子,Alice先用翻譯工具將其翻譯為中文,由於她並不懂中文,於是她直接把句子發給了小明,但小明又不懂英文,於是小明只能按照中文的語言習慣判斷這個句子是否通暢,這可以幫助小明判斷這個英譯中的系統是否做到很好,隨後,小明把他修改過的句子再用中譯英的系統翻譯成英文,並把英文句子發給Alice。Alice雖然不懂中文,但她能比較經過這一大圈的翻譯之後,得到的新句子與最初的版本是否相似。這一信息可以幫助判斷是否兩個翻譯模型都表現良好。隨著對偶學習過程的持續進行,未標註的數據也得到了充分的兩個翻譯模型。這種對偶學習的想法為進一步改進現有的翻譯模型提出了嶄新的思路。
3.生成對抗網路(GAN)
假設一個城市治安很亂,很快,這個城市裡就會出現無數的小偷。在這些小偷里,有的可能是盜竊高手,有的可能毫無技術可言,假如這個城市開始整飭其治安,突然展開一場打擊犯罪的運動,警察們開始恢復城市中的巡邏,很快,一批沒有技術小偷就被捉住了。之所以捉住的是那些沒有技術含量的小偷,是因為警察們的技術也不行了,在捉住一批低端小偷後,城市的治安水平變得怎樣倒不好說,但很明顯,城市裡小偷們的技術平均水平已經大大提高了。
警察們開始繼續訓練自己的破案技術,開始抓住那些越來越狡猾的小偷。隨著這些職業慣犯們的落網,警察們也練就了特別的本領,他們能很快從一群人中發現可疑人員,於是上前盤查,並最終逮捕罪犯,小偷們的日子不好過了,因為警察們的水平大大提高,如果還像以前那樣鬼鬼祟祟,那麼很快就會被警察抓住。為了避免被捕,小偷們努力變現的不那麼可疑,而魔高一尺道高一丈,警察也在不斷提高自己的水平,爭取將小偷和無辜群眾區分開。隨著警察和小偷之間的這種交流和切磋,小偷們都變得非常謹慎,他們有著極高的盜竊技巧,表現得跟普通群眾一模一樣,而警察們都練就了火眼金睛,一旦發現可疑人員,就能馬上發現並及時控制,最終,我們同時得到了最強小偷和最強警察。
上面所介紹的內容即為生成對抗網路GAN演算法的基本思路,GAN的想法最早由lan goodfellow在2014年提出,機器學習領域的大師,facebook人工智慧部門的領導人yann lecun曾評價GAN是自切片麵包以來最酷的想法,近來,蘋果公司首次公開的其人工智慧領域的論文也正是關於GAN的。GAN用對抗的方法,同時訓練了一個生成模型與一個判別模型,在學習的過程中,這兩個模型之間的競爭和博弈,逐漸提高模型整體的生成能力和判別能力。生成模型和判別模型可以都是神經網路。生成模型的優化目標是儘可能地去生成偽造的數據,從而獲得真實數據的統計分布規律,而判別模型則用於判別給出的一個輸入數據到底來源於真實數據還是生成模型。最終,當一個判別模型無法準確分辨生成模型所生成的數據是否為偽造時,則訓練結束,此時我們認為判別模型與生成模型都已經提高到了較高的水平,生成模型所生成的數據足以模模擬實世界中的數據。
最早提出這種模仿的想法的人是人工智慧之父阿蘭圖靈,不過他更強調的是機器對人的模仿遊戲,這種模仿我們今天稱為圖靈測試。事實上,模仿遊戲中的遊戲我們也可以理解為博弈,在這種視角下來看,GAN對應於博弈論中的二人零和博弈,博弈雙方分別是生成模型和判別模型,在這種博弈中,如果一方有所得,則另一方必有所失,因此,雙方都必須想盡一切辦法損人利己。隨著這種博弈的不斷進行,我們最終得到了兩個互相競爭,而且都表現良好的神經網路。
GAN演算法提供了一種非常靈活的演算法框架,事實上,對於生成模型和判別模型,我們可以選用不同的各種類型神經網路來進行計算,針對各種不同的任務,我們還可以設計不同的損失函數,在GAN的框架下不斷進行生成和判別,最終達到學習的效果。GAN演算法可以給出許多神奇的應用,很容易想到,這一模型可以用來生成各種圖片。隨著演算法的不斷改進,GAN演算法這方面的潛力正在逐漸被釋放出來,目前的一些生成演算法甚至已經能生成一些解析度較高的圖片,這些生成模型還可以用來還原一些解析度較低的圖片,還可以用來根據文字生成其所描述的圖片內容,或許在不久之後,與之類似的一些生成演算法也可能會像AlphaGo一樣做出一些讓我們每個人都感到驚奇的事情。
【每周讀一本好書,來次,丟吧】
丟爸 2017 3 6 周一 8:55
推薦閱讀:
※亞丁灣護航圖書主要講述什麼?
※關於買書
※【原著解讀】《哲學方法導論》:第2章,分析(下)
※繼《他來了請閉眼》後,推薦大家幾本犯罪推理心理學方面的言情小說
※陳天權《數學分析講義》與A. Browder的Mathematical Analysis 一個章節的比對
TAG:書籍 |