工程才是做AI的瓶頸!免費下載《AI 前線》11月刊
本文由 【AI前線】原創,原文鏈接:http://t.cn/RTxjzow
作者|Natalie,編輯|Emily
AI 前線導讀: 」如今的 AI 落地,核心是工程問題,不是演算法問題,更不是「哲學」問題。一定要特別特別「土」,踏踏實實從樸素的運維、資料庫、數據清洗做起,從實際的工程中逐步演化。如何按天迭代?如何構造聯調系統?如何無標註數據啟動?如何分離準確度和召回率要求?如何統一運用規則和統計?如何適應無明確衡量標準的開發?如何設計可演進的數據模式?如何提升數據可理解性?如何逐步提升規則系統的表達力?如何平衡黑箱和白箱模型的優缺點?如何在優雅架構和工期間取捨?等等,這些都是教科書上沒有的答案。只有扎紮實實從工程出發,才能實事求是地發展出低成本的、有生命力的 AI 系統。
從能在頂會上發文章到能真正工程落地,中間的細節足夠再讀兩個 PhD。
—— 鮑捷
《AI 前線》月刊是 InfoQ 策劃的新月刊,旨在為技術人提供當今人工智慧領軍人物對技術和行業的評價、與大師共同探討 AI 技術與應用、學習企業技術升級落地案例。11 月刊新鮮出爐,關注公眾號,後台回復「AI」可免費下載!
生態評論
顏水成:學界與工業界的 AI 研究,有哪些重要不同?
學術界很多時候研究的目的,是要有成果論文發在最頂級的學術雜誌上,也希望這些演算法能夠具有普適性,除了能解決自己的問題,其他人也能借鑒,最好能開源,所有的人都可以去使用,這樣就能很好的提升自己在這個領域的影響力。
但是工業界不是這樣。工業界要去探索商業,註定要有經濟上的考慮,思考盈利模式,那對人工智慧的考慮就會不一樣。
在工業界里待過就會明白,人工智慧本身並不是一個產品,不是單純靠人工智慧就能獲得利益,必須要通過與自己的業務和場景相結合,才能發揮它的價值,核心演算法只是其中的一個模塊而已。無論是往前端走,還是往後端走,還是需要很多不同類型的人,才可以做出一個產品。
最重要的是,人工智慧並不是一個靜態的東西。比如說訓練出來的模型,要用到某個業務場景裡面,業務場景里產生新的數據,這些數據進一步提升人工智慧模型的能力,再用到場景裡面,這是一個閉環和不斷迭代的過程。
另一方面,也是很多從學術界到工業界的教授和學者經常很容易犯的一個很嚴重的錯誤。就是認為技術在真正推動產品,但其實,用在具體的場景裡面,技術只是起到一個非常小的作用,如果說它的貢獻大概到 30% 到 40% 就不錯了。
重磅訪談
商湯科技楊帆:AI 落地的關鍵是演算法閉環
AI 技術落地需要與行業相結合,而如何去選擇需要結合的行業就是第一個難題。楊帆說,「如果技術還沒有到真正能成功的門檻,比如搜索引擎中的視頻搜索,大公司不斷積累可能沒問題,但如果是一個小的創業公司,把它作為安身立命之本,難以得到回報,可能兩年之後就死了。」楊帆表示,首先需要確認所選擇的行業市場是一個真實有效、有規模的剛需市場;其次,需要在市場中真正拿到完整的閉環數據,才能獲得持續性的進步;接下來,需要考慮行業當前的技術紅線是不是在一個合理的區間內,介入太晚或介入太早,都是會有問題的;最後,在產品落地的過程中,需要考慮如何利用技術門檻期(通常 1 年到 1 年半)帶來的優勢,進一步建立行業壁壘,只有技術壁壘而沒有行業壁壘的話,最後從長期來講還是為他人做嫁衣。
從另一方面來講,行業落地需要各種綜合性的關鍵技術的整合。行業的需求往往是一些相對模糊的,而且從技術上來看是非常不明確的東西,這時候就需要有人有足夠的能力去一一拆解。在楊帆看來,找到或培養一些既有技術背景、又對行業有足夠深的理解的人才,是企業實現 AI 技術落地最關鍵的一點。他說到,「人才問題、團隊組織問題、發展問題,特別是做 2B 行業,標準化與非標準之間的平衡性掌握,任何一個技術性產品落地會面臨的共有問題,做 AI 技術落地,這些問題一個都不會少,而只會更嚴重。AI 人才是個更大的坑,AI 的技術性更深重,從過往來看,它跟行業的結合更弱,所以你想要真正去打磨出一個符合真正行業需求的產品的時候,需要把對行業的理解和對技術的理解融合在一起,這在我看來是最有挑戰的,因為過去可能這個世界上基本不存在這樣的人,對行業有理解的人很少。」
落地實踐
圖像演算法在電商大促中的應用淺析
電商平台為用戶帶來價值的關鍵是保障商品豐富、價格合理、服務可靠,由此帶來的挑戰包括:如何提高商品管理的效率,以及如何改善用戶體驗。在眾多的技術和產品方案中,圖像演算法作為一項重要能力,運用於電商場景中,支持上述業務問題的改善。本文將詳細介紹蘑菇街如何結合實際業務場景,玩轉圖像搜索技術和圖像標籤技術。
人工智慧在餓了么的應用實踐
大部分人都點過外賣,外賣也逐漸成為了另一種中國特色。每天面對著巨大量級的訂單數據,系統如何能夠做到不出差錯的精準下單並且實時追蹤外賣小哥的送餐情況?人工智慧又是如何在外賣應用場景中應用的?「餓了么」技術副總裁張浩將為各位讀者帶來他的經驗分享。本文主題是關於人工智慧在 「餓了么」 的應用實踐,主要分為三部分,分別為 「餓了么」 簡介、 「餓了么」 的應用場景,以及運籌優化與機器學習的應用實例。
準確率 99% !基於深度學習的二進位惡意樣本檢測
全球正在經歷一場由科技驅動的數字化轉型,傳統技術已經不能適應病毒數量飛速增長的發展態勢。而基於沙箱的檢測方案無法滿足 APT 攻擊的檢測需求,也受到多種反沙箱技術的干擾。在充分考察過各種技術方案的優劣後,瀚思科技開發出了基於深度學習的二進位病毒樣本檢測技術,可以做到沙箱同等水平的 99% 的檢測準確率,而誤報率低於 1/1000。
本文首先介紹了病毒檢測的技術沿革,各種技術的優劣和取捨;然後說明了為什麼深度學習可以很好地應用於病毒檢測,具體解讀了翰思科技是如何應用深度學習的、用的什麼網路、中間有什麼技巧;最後是瀚思科技從實際操作中得到的一些經驗教訓以及下一步的發展規劃。
阿里小蜜:電商領域的智能助理技術實踐
在全球人工智慧領域不斷發展的今天,包括 Google、Facebook、Microsoft、Amazon、Apple 等互聯公司相繼推出了自己的智能私人助理和機器人平台。
智能人機交互通過擬人化的交互體驗逐步在智能客服、任務助理、智能家居、智能硬體、互動聊天等領域發揮巨大的作用和價值。因此,各大公司都將智能聊天機器人作為未來的入口級別的應用在對待。
2015 年 7 月,阿里推出了自己的智能私人助理 - 阿里小蜜,一個圍繞著電子商務領域中的服務、導購以及任務助理為核心的智能人機交互產品。通過電子商務領域與智能人機交互領域的結合,帶來傳統服務行業模式的變化與體驗的提升。
在去年的雙十一期間,阿里小蜜整體智能服務量達到 643 萬,其中智能解決率達到 95%,智能服務在整個服務量 (總服務量 = 智能服務量 + 在線人工服務量 + 電話服務量) 佔比也達到 95%,成為了雙十一期間服務的絕對主力。
本文對阿里小蜜在電商領域下不同場景的技術實踐進行了全面的解讀,包括基於增強學習的智能導購、基於知識圖譜和語義索引的品類管理、基於知識圖譜和相似度計算的屬性管理、智能服務:基於知識圖譜構建與檢索模型的技術實踐、智能聊天:基於檢索模型和深度學習模型相結合的聊天應用等。
推薦閱讀
TensorFlow 與深度學習
本文作者是來自 Google Brain 的工程師,目前正在做 TensorFlow 和 TensorFlow 分散式的開發以及使用機器學習來優化 TensorFlow 的研究項目。本文將深入分享深度學習的案例和 TensorFlow 的一些最新特性,以及他本人在 Google Brain 的研究項目。
ImgeNet 冠軍帶你入門計算機視覺:監督學習與神經網路的簡單實現
近幾年,人工智慧的浪潮席捲了整個科技圈。Google,Facebook,微軟,百度等全球最頂尖的科技公司都將目光轉向了人工智慧,並將之視為今後的戰略重心。 隨著人臉識別,輔助駕駛,AlphaGo 等應用的不斷湧現,基於學習的計算機視覺(learning based vision)正在越來越多的改變我們的生活。
「ImgeNet 冠軍帶你入門計算機視覺」是由多次參加 ImageNet 等世界著名人工智慧競賽並獲得冠軍的奇虎 360 高級數據科學家董健帶來的系列文章,將逐步介紹這些看似神奇的系統背後的視覺演算法原理。本文是整個系列的第一篇文章,將會簡單介紹一下計算機視覺的發展,以及監督學習、神經網路的基本原理;最後的實踐部分會用 TensorFlow 給出之前介紹演算法的一個簡單實現。
關注我們的微信號"AI前線",後台回復「AI」可獲得《AI前線》系列PDF電子書
推薦閱讀:
※人工智慧神啦,透過街景就能預測選票……
※ReSpeaker 智能助理
※【高級AI】用Unity實現一群鳥
※人工智慧進擊之路 | 品途創投深度
※華為mate10的AI具體有哪些實際應用?
TAG:AI技术 |