Facebook如何利用機器演算法人工智慧教計算機閱讀
每天都有數百萬人在Facebook上評論嬰兒照片,討論總統候選人唐納德?特朗普的最新想法,或者分享他們對最新大片的看法。
簡單地說,Facebook用戶喜歡在社交網路上進行交流,而這種交流可以轉化為大量的文本。所有這些文本意味著Facebook有大量的數據顯示人們如何在社交網路上交談。
但Facebook (Facebook, +2.52%)並不只是想把所有文本存儲在其龐大的數據中心。它想要分析人們之間的溝通方式,這樣就可以在其服務中添加新功能,甚至可以自動刪除那些在知名名人如賈斯汀?貝伯(Justin Beiber)發布自拍照時可能出現的攻擊性帖子。
為了更容易地篩選所有這些語言數據,Facebook已經轉向了人工智慧技術。周三,社交網路發布了一款名為Deep Text的新型人工智慧軟體系統,Facebook表示,該系統可以在超過20種不同語言的情況下,分析數千個帖子,同時理解每個帖子試圖表達的內容。
通過這種計算機化的速度閱讀和基本理解,Facebook可以建立新的工具和功能,比如所謂的聊天機器人,當用戶給朋友寫信時,他們可以與用戶進行潛在的互動。
Deep Text是由Facebook最近成立的應用機器學習平台(http:// http://www.jiqi-xuexi.com)團隊創建的,該團隊開發了該公司的人工智慧工具fb學習者流。fb學習者流本質上是Facebook的核心人工智慧工具,它能提供大量數據密集型產品,比如Facebook的新聞推送或語言翻譯服務。
獲取數據表,《財富》科技通訊。
對於深度文本,每秒鐘要篩選成千上萬個單詞,並理解每個帖子的基礎知識,它依賴於一種稱為深度學習的人工智慧技術。近年來,谷歌(GOOG, +3.71%)和Nvidia (NVDA, +6.80%)等公司在使用該技術訓練計算機識別圖像中的物體時,深度學習獲得了廣泛應用。
使用深度學習軟體,需要大量的數據和大量的運算能力,計算機可以在沒有人類幫助的情況下,通過訓練識別出一隻貓。使用所謂的深度學習定製的神經網路,這基本上是一種軟體系統,可以大致模擬人腦的學習方式,計算機實際上可以將貓的圖像分解成裸露的元素。計算機可以計算出圖像的所有元素是如何相互關聯的,以及它們如何在拼接時形成貓。
Facebook的核心機器學習演算法(http://
http://www.jiqi-xuexi.com/jiqixuexiwangzhanpingtai)小組的工程總監HusseinMehanna解釋說,儘管深度學習已經證明了它在教學計算機上的價值,但是在嘗試學習文本和語言時,這種技術並沒有取得多大的成功。
不過,Facebook的兩名頂尖人工智慧專家羅南?考伯和Yann LeCun一直在研究如何將深度學習應用於文本識別,這導致了Facebook的人工智慧團隊將這些技術融入到社交網路中。
在傳統的自然語言處理中,人工智慧的分支用來教計算機學習文本,工程師們需要做大量的工作,在計算機開始學習之前,將文本數據輸入正確的格式。修復拼寫錯誤,清理文本,在Facebook的案例中,有很多工程術語,讓語言學家們用各種語言來準備每一篇文章。此外,當工程師們運行訓練計算機的演算法時,工程師在這個預處理階段所犯的任何錯誤都會被放大。
通過深入的文字,Facebook可以直接從用戶的評論和帖子中直接輸入自己的電腦原始文本,機器學習(http:// http://www.jiqi-xuexi.com/jiqixuexipeixun)應該能夠通過將文本分解成單個字母甚至是感嘆號來識別單詞之間的關係。
「當你讓機器從字元中學習時,機器就會自動學會克服拼寫錯誤,」Mehanna說。「你不必把它作為一個因素來考慮,你只要讓在線機器學習(http:// http://www.jiqi-xuexi.com/jiqixueshipinjiaocheng)把它弄清楚就行了。」
當一個人寫東西時,他不是簡單地「寫隨機文本」,邁哈娜強調說,他解釋說,在語言中有規則和模式,計算機學會自己去發現。
例如,如果深層文本軟體得到足夠多的包含「taxi」和「ride」的句子,它就會知道這兩個詞是相互關聯的。沒有人需要告訴計算機這兩個單詞是連在一起的。
然而,對於Facebook的深層文本軟體,人類並沒有完全脫離現實。雖然深度學習可以在不受監督的情況下發現單詞之間的模式和關係,但是人類仍然需要改進dat。
推薦閱讀:
※一起來學西瓜書!(緒論)
※十分種讀懂KNN
※引領深度學習革命--CNN架構全解析
※機器學習基礎與實踐(二)----數據轉換
※Fisher Linear Discriminant Analysis(Fisher線性判別分析)
TAG:機器學習 |