身為AI界網紅,神經網路有何過人之處?
說起人工智慧,人們總會多多少少將它和人類的智能聯想起來。儘管新司機一貫堅持人工智慧是讓機器獲得解決開放性問題的能力,與人類智能並無必然聯繫的觀點,但也時不時會冒出這樣的聯想。
這可能是因為在人工智慧發展的過程中,我們的確借鑒了一些人類自身的特點。
人類最引以為傲的技能是思考,思考所依賴的則是人類秒殺生物圈的大腦。所以在研究如何讓機器獲得智能時,我們自然會想到去借鑒大腦的奧秘。
於是,就有了今天紅遍宇宙的AI模型——神經網路。
神經元與神經網路
中學生物課講過,大腦的基本組成單位是神經元。每個神經元有一些短短的「樹突」用作接收信號輸入,還有一個長長的「軸突」用於輸出信號。當樹突收到的輸入信號足夠強,超過某個特定的值(稱為閾值)後,則會激活軸突發出信號。
在我們的大腦中有無數個這樣的神經元,它們以某種形式相互連接,相互傳遞信號。這就是人類思維形成的最基本原理。
神經網路則是受此啟發,它的基本組成單位也被稱為「神經元」。與生物學中的神經元類似,它有輸入、輸出、權重、閾值與激活函數五個要素。神經元的輸入來自外界或其他神經元,每個輸入都有對應的權重;輸入的加權求和會與閾值進行比較,並通過激活函數來產生輸出。
很多神經元相互連接就形成了神經網路,其中各個神經元的輸出往往作為另一個神經元的輸入。神經元的連接結構可以非常複雜,在實際應用中,神經網路多採用下圖中的層級結構,層級之間互相連接。
上面的圖中,神經網路的底層被稱為「輸入層」,頂層被稱為「輸出層」,中間的各層均被稱為「隱層」。輸入層負責接收外界輸入(比如樣本),隱層負責對信號進行一系列的加工提取,最後由輸出層輸出結果(比如樣本的類型)。
神經網路的訓練,就是通過訓練樣本,通過一輪輪迭代來調整這些神經元的閾值和輸入權重(稱為連接權)的過程。有時,我們會把閾值看作是輸入為「-1」所對應的連接權,這時訓練過程就可以統一看作連接權的調整過程。
訓練時會指定一組初始的連接權,然後將訓練樣本從輸入層輸入,並比較模型輸出與樣本標記的誤差,以此調整連接權。經過很多輪的迭代後,連接權會逐漸達到穩定,神經網路的訓練也就完成了。
訓練神經網路最出名的演算法被稱為「誤差逆傳播(BP)演算法」。顧名思義,就是把模型輸出與樣本標記的誤差從輸出層逐層「傳遞」到輸入層,並對每一層的連接權進行調整。
深度神經網路
一般來講,神經網路的層數越多,它的「潛力」——即理論上能夠進行預測的任務的複雜程度與理論上能夠達到的性能指標就越強。相應地,它對計算資源以及訓練數據的要求也會越高。所以在實際任務中,需要根據任務需求以及數據與計算資源的限制,合理地控制模型的複雜程度。
我們經常聽到的「深度神經網路」,指的就是擁有較多層數的神經網路(一個用於人臉識別的神經網路往往有數十層至數百層)。由於目前的計算資源往往不成問題,可供利用的數據也越來越多,深度神經網路自然因為其較高的「潛力」而受到青睞。所謂「深度學習」,通常就是指對於深度神經網路的訓練過程。
模式識別的神器
神經網路能夠作為各種AI模型中的網紅,是因為它在模式識別領域所發揮的出色性能。比如在圖像識別領域,卷積神經網路(CNN)的應用非常廣泛;在自然語言處理領域,遞歸神經網路(RNN)與長短期記憶網路(LSTM)發揮著重要作用。這在很大程度上掀起了這波AI浪潮。
長期以來,對圖像、自然語言等環境信息(稱為模式)的識別與理解困擾著AI界。一些早期的人工智慧儘管能夠進行邏輯推理,甚至能用比人類更巧妙的方法證明數學難題,但對於模式識別這類人們習以為常的「簡單任務」卻無能為力。
人們對模式識別的研究已經持續了很多年,各種各樣的技術路線層出不窮,為何深度神經網路可以獨佔鰲頭?這就要分析人類在進行模式識別時的思維過程。
下面圖中的飛機有著差異明顯的形狀、尺寸等幾何特徵,但我們卻能夠很輕易地將它們統一識別為「飛機」。甚至對於很多隻見過真實飛機的人,可以輕易地在第一次看見飛機的簡筆畫時認出它來。
人們在識別一個物體時,往往並不會去關注物體各個局部的細節幾何特徵是否符合先前的經驗,而是把這個物體的所有特徵當作一個整體來進行識別。也就是說,我們觀察物體時跳出了局部的細節,而著眼於更加全局、更加抽象的特徵。
「局部多變,整體統一」正是所有模式識別問題的特點和難點。每個人的長相千差萬別,但整體來看仍然屬於「人臉」這一大類;由於句式、用詞的區別,同樣的語義更是有無數種表達方法。而此前模式識別的技術路線,更多是關注局部特徵(比如五官之間的幾何關係、語句的分詞、語法等),自然會被它們的豐富變化所困擾。
神經網路中的每一層神經元,都可以看作對前一層神經元所輸入信息的進一步「提煉與抽象」。比如在理解一句話時,「低層」神經元關注的是「字」,「中層」神經元關注的是「詞」,而「高層」神經元關注的則是「句」。
經過神經元的層層提取,到達輸出層時所接收的信息已經相對抽象和整體,因此可以獲得更好的模式識別效果。
總結
神經網路作為連接主義的代表,借鑒了人腦神經元相互連接傳遞信號的結構,是眾多AI模型中的一員。神經網路的每個神經元都可以看作是一個函數,神經網路也可以看作很多個函數的層層嵌套。
在計算資源與數據迅速增長的今天,擁有複雜結構的深度神經網路在模式識別領域表現出了出色的效果,並加速了人臉識別、語音識別、自然語言理解等技術的落地應用,也因此造就了一大批迅速發展的創業公司與投資熱潮。
在今天的AI界,神經網路的光芒十分耀眼,某些時候甚至成為了人工智慧的代名詞。但在神經網路之外,還有很多其他類型的模型在各個領域發揮著作用。一個時代的主角也許只有一個,但真正在戰鬥的永遠不止TA一個人。
最後來看看主角所在的舞台——奉上一張AI產業鏈結構圖。
********************
歡迎關注微信公眾號「AI從入門到xx」,用一看就懂的語言分享AI知識與見解。
推薦閱讀: