標籤:

10家將機器學習玩出新花樣的公司

作者 | Dan Shewan

譯者 | 大愚若智

編輯 | Vincent

AI前線出品| ID:ai-front

AI 前線導語:「本文介紹了十家不同領域公司對機器學習技術的實踐運用,並簡要探討了機器學習領域未來的發展趨勢」。

如果我們能從科幻電影中學到點什麼,未來一定是一個陰冷可怕的世界,由產生了意識的兇殘機器人統治著。

好在上述各種可能性頂多只會有一種成真,但情況很快就不同了,就像末日預言者迫不及待想要告訴我們的那樣。

圖片來源:Abdul Rahid

人工智慧和機器學習是近年來進展最受矚目的技術。其他領域很少能像機器學習這樣對我們的生活造成「顛覆性」(借用一個大家都在用的詞)影響,但機器學習技術的很多應用都發生在我們看不見的地方。

想看看機器學習技術在現實中的應用嗎?下文介紹的十家公司正在將強大的機器學習技術運用在各種新穎奇特的領域(從中也可以管窺到機器學習技術的未來)。

1. Yelp – 大規模圖片管理

體驗過一家新餐廳,然後上網吐槽,很少有別的事情能比這更讓人不爽的。而這也是 Yelp 大受歡迎(並且那麼實用)的原因之一。

雖然乍看起來 Yelp 並不是一家技術型公司,但實際上 Yelp 正在利用機器學習技術改善用戶體驗。

對人類來說,將圖片按室內 / 室外這樣簡單的條件分類很容易,但對計算機來說極為困難

圖片是 Yelp 用戶評論的重要組成因素,因此不難理解 Yelp 為何要不斷改進圖片處理方法。

為此 Yelp 早在多年前就開始使用機器學習技術,並以此為基礎開發了他們的首個圖片分類技術。Yelp 的機器學習演算法幫助這家公司中的人類員工更高效地彙編、分類、標記海量圖片 —— 面對上千萬張圖片,這個任務一點都不簡單。

2. Pinterest – 提高內容的可發現能力

無論對於 Pinterest 的骨灰級用戶或以前從未用過這個網站的人,Pinterest 都在社交媒體生態系統中佔據了重要地位。Pinterest 的主要功能是組織整理現有內容,因此有必要通過技術讓這一過程變得更高效,而 Pinterest 恰恰也就是這樣做的。

2015 年,Pinterest 收購了 Kosei,這是一家專註於及其學習技術(尤其是內容發現和推薦演算法)商用化的機器學習公司。

目前,機器學習幾乎已經遍布 Pinterest 的所有業務運作流程,從垃圾信息審核和內容發現到廣告內容貨幣化以及減少新聞郵件訂戶流失率,都用到了機器學習技術。很酷!

3. Facebook – 聊天機器人軍團

雖然 Facebook 的 Messenger 服務依然不溫不火……這一點倒是有爭議(貌似大家對不同聊天應用都有非常強的粘性),但該服務依然是這個全球最大社交媒體平台最令人激動的服務之一。因為 Messenger 已經成為一些實驗性聊天機器人程序的測試場地。

在通過文字交流的情況下,一些聊天機器人的表現已經很難與人類區分開來了

任何開發者都能基於 Facebook Messenger 創建並提交聊天機器人。這意味著重視客戶服務和客戶維繫的公司,哪怕還是開發能力有限的小型初創公司,也可以充分使用這項技術。

當然,Facebook 感興趣的機器學習技術還有很多。Facebook 已經在使用人工智慧技術篩選垃圾信息和質量低劣的內容,該公司還在研究能夠為視覺受損用戶「讀取」圖片內容的計算機視覺演算法。

4. Twitter – 時間線管理

Twitter 最近引發了很多爭論(例如他們最近決定將用戶頭像處理成圓角,並改變通過 @ 提及某人後通知對方的方式,這些決定就受到了很多爭議),但對 Twitter 來說,最大的爭議之一可能就來自於對信息源(Feed)演算法的改變。

通過演算法調整 Twitter 時間線內容的做法讓 Rob Lowe 極為不爽

無論你是願意讓 Twitter 將「最佳推文展示在首位」(也不知道這是啥意思),或者按照一定的規則以推文的發布時間排序顯示,這些變化都是由 Twitter 的機器學習技術驅動的。Twitter 的 AI 會實時評估每條推文,並根據不同指標為推文「打分」。

藉此,Twitter 的演算法會展示最有可能吸引用戶興趣的推文,具體因素則可根據每個用戶的特徵來決定。Twitter 的機器學習技術會根據每個人的偏好做出決定,通過演算法安排時間線上的內容,對於真真正正的老實人來說這真是糟透了。(真的會有人喜歡演算法決定的時間線嗎?請在評論中答覆,你還真是怪異得可愛。)

5. Google – 神經網路和「有夢想的機器」

近一段時間來,與其勞心費力列舉 Google,或他的母公司 Alphabet 研發部門正在努力的技術方向,可能直接列舉他們沒涉足的領域會更簡單些。

毋庸置疑,Google 近些年很忙,正在不同領域百花齊放:抗衰老技術、醫療設備,當然還有最讓技術宅們激動的領域:神經網路。

精選的 Google 神經網路畫作

精選的 Google 神經網路畫作

Google 有關神經網路的研究成果中,最矚目的可能就是 DeepMind 網路,「有夢想的機器」。這個網路還繪製了一些前段時間被人們津津樂道的夢幻風格畫作。

根據 Google 的介紹,他們正在研究「圍繞機器學習的幾乎方方面面」,並獲得了一些激動人心的成果,例如 Google 所謂的「經典演算法」,以及包括自然語言處理、語音翻譯、搜索評級和預測系統等其他應用。

6. Edgecase – 提高電商轉化率

多年來,零售商一直在努力彌補線下實體店購物和線上購物之間的鴻溝。雖然很多人都在說在線零售商敲響了傳統零售業的喪鐘,但很多電商網站依然很糟糕。

Edgecase,原名 Compare Metrics,這家公司想要改變這一情況。

Edgecase 希望通過機器學習技術幫助電商企業改善用戶體驗。除了通過優化電商購物體驗提高轉化率,Edgecase 還計劃藉助自己的技術為還不太清楚自己到底想要買什麼的買家提供更好的體驗,他們會分析代表商業意圖的用戶行為和操作,讓無目的的隨意瀏覽變得更有價值,更接近傳統的零售店購物體驗。

7. 百度 – 語音搜索的未來

Google 並不是唯一涉足機器學習領域的搜索巨頭。中國搜索引擎百度也在人工智慧應用方面進行了巨大的投入。

簡化的五步示意圖展示了自然語言處理系統的關鍵環節

Deep Voice 是百度研發實驗室最受人關注(也最讓人不安)的成果之一,這是一種深度神經網路,可以合成人類聲音,效果與真正的人類講話幾乎難以分辨。這個網路可以「學習」語調、口音、發音、音高等方面獨特且微妙的差異,以精確到可怕的效果重現講話者的聲音。

這並不是什麼無聊的實驗,該技術的最新版本 Deep Voice 2 承諾對自然語言處理技術進行持續不斷的完善,並將其作為語音搜索和語音模式識別系統的底層技術基礎。這會對語音搜索應用產生翻天覆地的影響,並且可以衍生出大量其他領域的潛在應用,例如實時翻譯和生物識別安全機制。

8. HubSpot – 更智能的銷售

任何熟悉 HubSpot 的人可能已經知道,這家公司歷來喜歡在第一時間採用各種新興技術,而該公司月初對機器學習公司 Kemvi 的收購再次證明了這一點。

預測線索評分僅僅是人工智慧和機器學習廣泛應用領域之一

HubSpot 計劃在自己的各類應用程序中使用 Kemvi 的技術,最受關注的是即將應用在其內部內容管理系統中的 Kemvi DeepGraph 機器學習和自然語言處理技術。

根據 HubSpot 的首席戰略官 Bradford Coffey 介紹,這種技術可以幫助 HubSpot 更好地識別「觸發器事件」,例如公司結構、管理層以及可能對日常運維產生影響的任何變化,藉此 HubSpot 可以更高效地吸引潛在客戶,服務現有客戶。

9. IBM – 更好的醫療健康

這裡提到 IBM 看起來可能有點奇怪,畢竟 IBM 可謂是最大規模,同時也最古老的遺留型技術公司之一,但 IBM 正在從古老的業務模式向著新的業務模式轉型,並取得了不錯的成果。在 IBM 的諸多產品中,與人工智慧有關的 Watson 就很好地證明了這一點。

IBM Watson 用於測試並驗證自主學習行為模式的範例之一

Watson 曾是電視節目 Jeopardy! 的冠軍,但除了在電視遊戲節目中打敗人類選手外,它還在很多方面取得了傲人的成績。近些年來,很多醫院和醫療中心已經部署了 Watson,並在某些類型癌症的診斷方面展現出比人類腫瘤學專家更有效的能力。

除了醫療行業,Watson 在零售領域也有這極大的潛力,可以充當顧客的購物助理。因此 IBM 已經開始通過授權的方式提供 Watson 機器學習技術,這也是人工智慧應用領域首個這樣做的典範。

10. Salesforce – 智能 CRM

作為技術世界的巨頭,Salesforce 在客戶關係管理(CRM)領域佔據了主要市場份額和相關資源。就算最老練的數字化營銷從業者,預測和計分工作中也會面臨巨大的挑戰,因此 Salesforce 在自家專有的 Einstein 機器學習技術上下了很大的賭注。

Salesforce Einstein 可以幫助使用 Salesforce CRM 軟體的企業分析客戶關係的方方面面 —— 從最初的聯繫到隨後持續不斷的接觸點均可包含在內,藉此構建更詳細的客戶畫像,識別銷售過程中的所有重要時刻。這意味著用戶可以獲得更全面的線索計分,提供更有效的客戶服務(並改善客戶滿意度),抓住更多商機。

機器學習的未來

對於進展速度如此快的技術,目前最大的問題之一在於,無論任何原因,我們最終會將這些進步視作理所當然。上文列出的一些機器學習技術的運用哪怕在十年前都是不敢想像的,而科研人員前進的步伐依然讓我們驚嘆不已。

那麼機器學習領域的未來會是什麼樣?

機器的學習成效更顯著

很快,我們將開發出學習成效更高的人工智慧。這將大幅改變演算法的發展歷程,例如人工智慧可以在只需最少量人類監管的情況下自行識別、調整、改進自己的內部結構。

網路攻擊對抗自動化

網路犯罪和勒索的盛行迫使不同規模的公司重新思考自己該如何對系統化的在線攻擊做出回應。很快我們將看到 AI 在網路攻擊的監視、預防和回應方面擔任越來越重要的角色,例如資料庫入侵、DDoS 攻擊以及其他威脅的處理等方面。

更有信服力的生成模型

很多生成模型,例如上文提到百度使用的模型,已經足夠有信服力了。但是很快我們將完全無法將其與人類區分開來。生成模型的進一步完善使得演算法能夠創造出更逼真的圖像、聲音,甚至完全由演算法生成的「人」。

更完善的機器學習訓練

就算最精妙的 AI,學習效率也受制於所獲得的訓練。以前,機器學習系統需要通過極為海量的數據進行訓練,但以後的機器學習系統「學習」過程中需要的數據量將越來越小,需要的數據集越小,也意味著系統的學習速度會越快。

閱讀英文原文

business2community.com/


全文完-

人工智慧已不再停留在大家的想像之中,各路大牛也都紛紛抓住這波風口,投入AI創業大潮。那麼,2017年,到底都有哪些AI落地案例呢?機器學習、深度學習、NLP、圖像識別等技術又該如何用來解決業務問題?

2018年1月11-14日,AICon全球人工智慧技術大會上,一些大牛將首次分享AI在金融、電商、教育、外賣、搜索推薦、人臉識別、自動駕駛、語音交互等領域的最新落地案例,應該能學到不少東西。目前大會8折報名倒計時,更多精彩可點擊閱讀原文詳細了解。

t.cn/Rl2MftP

推薦閱讀:

Coursera吳恩達《優化深度神經網路》課程筆記(1)-- 深度學習的實用層面
乾貨 | 28 張相見恨晚的速查表(完整版)——( Python 速查表 | 機器學習、R 、概率論、大數據速查表)
PyTorch 的 backward 為什麼有一個 grad_variables 參數?
CS 294: Deep Reinforcement Learning Note(1)

TAG:机器学习 |