如何看待 Nervana 被 Intel 收購?


謝邀。

10多年前念博士是Intel贊助的,和Intel的幾個老前輩合作了好些年,評論多少有些主觀。

Intel這個企業,從創立到Andy Grove退休這32年間(1968-2000),這個企業的核心價值觀就是:半導體行業,好的工藝碾壓一切。1969年公司出的SRAM就把創始人老東家仙童的同類產品打爆頭(2X速度),1980年代開始的Wintel聯盟橫掃其他microprocessor廠家,也是靠著無敵的工藝工程能力。答主在Intel混吃喝的時候,CEO還是Paul Otellinii (是的,就是那個被Tony Fadell罵成狗的傢伙),CTO還是Justin Rattner。他們每次內部出來講話,到了2000年後高端PC增長極度減緩的年代,還是一個勁兒的試圖描繪PC增長新動力,移動市場一定還是CISC的天下這種調調。結果大家都看到了,後Andy Grove的年代這個公司因為Andy晚年的用人不當,新人無法糾正Andy教主的錯誤,移動晶元市場完全錯過。(原因可以參考Atom平台任何手機的體驗)

過去這10年的自廢內功(換成AMD早掛200回了)以後我們看到了Intel一個不起眼但可能很有趣的轉變:就是核心價值觀更加開明。從一心一意專註工藝到更多關注應用端,關注不同應用下計算架構的多樣性。雖然沒看到什麼成績,但是交了不少學費。比如投資不靠譜的無人機公司,比如花大價錢做下游產品的開發,如帶手勢交互的平板,VR設備,比如在IoT和bio sensor上花大價錢研發。

個人認為Intel在基於深度學習的應用領域是可以有所作為的,這個領域近5-10年在enterprise領域有很大的發展。這可是Intel的強項,好的材料技術和不錯的晶元設計能力推出高端的晶元產品。要的就是性能,不在乎功耗。

再來講講Nervana。他們的主打產品是基於Python open source的Neon DL framework。他們使用的Coppersmith–Winograd algorithm號稱是理論上最快的矩陣操作演算法。是一個典型的Leap Frog technology。他們現有的解決方案在多個行業的都有應用的例子。接下來就是想到自己開晶元做ASIC把核心演算法計算效率進一步提升。傳統使用如Nvidia Tesla系列這種基於GPU來做矩陣計算,效率還是比較低的。GPU的矩陣計算主要是為了計算機圖形學來設計的,只是近幾年深度學習發展起來,GPU比其他的晶元更適合來做這件事情。然而如果專門為深度學習的矩陣操作做定製化的設計,硬體效率還能提高更多。

在紙面上來講,通過Intel優秀的晶元設計和製造能力,將Nervana的演算法潛力充分發揮出來,leapfrog的進步來和nvidia現有的架構競爭,聽起來是一件比較靠譜的事情。這個收購個人感覺挺值的。

然而根據Intel過去收購的例子,如果公司獨立運營,總公司給夠支持,足夠open,才可能達到收購的戰略意圖(Intel Security)。如果是「整合產品線」,比如LSI或者是Infineon Wireless那樣的,那就不包郵了。


幾乎還沉浸在Wintel的輝煌里走不出來的英特爾,終於發現自己一把老骨頭想躺在x86功勞簿上吃一輩子的時候,後起之秀們早就把自己甩在身後n丈遠,mobileig datamachine learningself driving car玩兒的飛起。

10多年前喬布斯找到保羅歐德寧,說我們要做個手機,能幫我們做個晶元兒么?歐德寧一臉鄙夷的給拒絕了。理由是手機算什麼玩兒,能跟pc市場比么?能賺錢么?13年歐德寧辭職的時候搞了個forum,有員工問你掌管英特爾這麼些年,最大的失誤是什麼?歐哥靦腆了一會兒說不好意思,哥當年把移動市場給錯過了。然後台下啪啪啪的鼓掌 - 當時特別無語,不知道這還鼓個什麼掌。

其實也不能完全怪這哥們兒。公司發展48年了,據老員工講,90年代Intel高速發展的時候,公司內部的創新氛圍,員工的素質和士氣,完全不輸現在的hot startup,後來越做越大,人也越來越多,人一多就官僚,行動越來越遲緩。管理層也不是沒有明白人,前幾年投了7.4億美金給Cloudera,現在又買Nervana,雖說每一步都慢競爭對手好幾步,這也算盡全力在追趕了。相比之下,NVIDIA早就在把自家的GPU跟DNN玩合體了,最近幾年大舉招募深度學習專家,同時也在搞自駕車,然後Google前不久又搞了個TPU,分分鐘往英特爾肺管子上戳,就是再遲鈍也該有點動作了。

公司差不多每十年搞一次大裁員,2016年這次裁員格外的大,據說是史上最大的一次,PC市場連續4年下滑,飯都要吃不飽了。組裡表現不好,工作態度不好的都被送走了,但是也有很多表現良好,但是長期在一個level上升不上去的也被送走了 - 真的不知道hr選人的標準是不是出了問題,總不能每隔幾年就升一級吧?但是遣散費絕對良心。同時公司也在從學校里招畢業生,可能是想趁機換換血。

公司現在在向IoT,Cloud Server方面轉型,我個人表示看好。只要這次能成功轉過來,再吃個十幾二十年應該不是問題。廉頗老矣,尚能飯否?

利益相關:現英特爾俄勒岡全職員工。說了太多實話了。必須匿。


這次收購可以說是英特爾一次防禦性的收購。
英特爾在數據中心的統治地位是顯而易見的,雖然PC業務節節萎縮,但數據中心業務是一直在擴張的。如果說英特爾這幾年的業務還有什麼亮點的話,數據中心業務絕對還算是可圈可點的。
在以海量流程性業務處理為主要應用的互聯網時代,英特爾的硬體構架和軟體生態很好的支持了相關的業務需求,這也是英特爾成功的原因。
對Linux和開源的大規模投入,讓英特爾在數據中心市場呼風喚雨,包括MySQL,Hadoop在內的一系列基於開源組件的成功,都鞏固了其地位。
英特爾的構架雖然可以很好解決流程性的業務應用,但顯然在大規模並行計算上是不足的,特別是在人工智慧領域,顯卡廠商英偉達的CUDA設備已經成為最重要的人工智慧計算設備。
而就從趨勢上來看,在傳統業務積累大量數據之後,之後驅動數據中心業務的很大的一個方向就是基於人工智慧的數據分析業務,而這正是英特爾的弱項。
英特爾之前推出了協處理器Phi來應對英偉達在該領域進攻。但就目前來看,顯卡廠商在人工智慧領域仍然佔據領導地位。
收購Nervana可以增強英特爾在人工智慧領域的晶元以及軟體生態建設的能力。畢竟不管是Phi還是英偉達都不是專門為人工智慧優化的,人工智慧只是其上跑的一種比較適合的應用。
Nervana計劃開發的是一個專門為人工智慧應用優化的晶元,如果人工智慧真正的進入爆發期的化,憑藉英特爾強大的硬體製造能力以及業界影響力,還是很後可能將這個坑重新從顯卡廠商那邊搶回來的。
英特爾重回個人消費市場的巔峰狀態已經越來越困難了,所以英特爾一方面是要鞏固傳統強項業務,一方面是拓展新的方向。
雖然說人工智慧是個新的方向,但應該也只能算是數據中心業務的一個部分,還是屬於鞏固傳統業務強項的範疇。
至於對IoT的探索,英特爾方面也只能說是雷聲大雨點小,落地的應用非常少。
另外,從收購價格來看,4億美元,對英特爾來說也是毛毛雨,花那麼少錢買個安心,也是非常合算的。看看國內的各種收購,還哪裡來的這麼價廉物美的小公司,如果真的做出些成果那就賺大了。要知道英特爾的移動業務已經虧損近百億了,到後來都不好意思公布財報,直接算是消費業務,將部門和財報合併了。


nervana的neon框架據說在GPU上速度驚人,從github上的benchmark也看得出來和cudnn有得一拼。但是從CPU上的性能來看,速度還不足caffe的1/10,用alexnet親測,其底層操作如卷積和池化還是用python實現的,希望這次被收購能夠有C和winograd演算法的實現,速度上去了什麼都好說。


恭喜做DL的其它IC公司,你的競爭對手被殺死了。

Intel是矽谷最有名的公司殺手,它收購的公司沒有任何一個能活下來/做出東西。


沒有回答問題,只是補充一點背景材料...
正想提這個問題,發現來晚了。

相關問題:目前有多家廠家投入Deep Learning深度學習處理器研發,以當前信息預計哪家會最先投入市場? - 機器學習

相關的信息可以看:
Nervana官網的文章Intel + Nervana
機器之心公眾號文章 重磅 | 深度學習晶元大戰愈演愈烈,英特爾為何斥巨資收購創業公司Nervana?


GPU方面:
用過他們家的maxas寫Maxwell架構的原生彙編。可以直接操作寄存器,做雙緩衝預取。寫出來的kernel可以達到計算能力或訪存的極限值,比nvcc編譯出來的效果要好。
Nervana的neon框架在convnet-benchmarks (https://github.com/soumith/convnet-benchmarks)里的排名也一直處於前列,經常超過NV。

前幾個月在官網上看到他們準備自己做晶元,和GP100類似,也用了HBM。準備集成到自己的Nervana Engine中。
Technology: Nervana Engine
Nervana Engine delivers deep learning at ludicrous speed!

不知道寒武紀和地平線的晶元有哪些新的進展?
雲端和終端會出現什麼樣的晶元和應用?


目前的狀況是,我負責任地說,如果要進行二次開發的話,cudnn那套api比neon好用的多。

1. neon目前只支持特定的輸入格式,cudnn可以自定義輸入格式。比如卷積的channel,width的位置,雖然目前只有兩種,以後可能會更多。

2. neon的現在還沒有官方的卷積c api。為什麼呢?因為輸入參數太多,自己寫很難忍受…別問我為什麼知道…

3. neon只支持maxwell,硬傷。很多地方還在用kepler,阿里就有kepler的指令說明,雖然也不是特別完善。


neon 當然也有很多優勢,比如說行業整合,雲服務。intel加入以後,我相信cpu端會有很大的提升,結合mkl中的deep learning函數(據說2017年推出),把neon打造成一個真正的高性能框架。想想還是很激動的。

-----

更新下,mkl2017已經可用,文檔還不完善


深度學習是否真的有未來還不可知,計算力只是個藉口。個人以為這番除了取悅股東、彰顯新班子的業績,也只是一次賭博而已,總比找不到回春點而原地衰老好。


Deep learning不能再錯過了,各大公司都在布局


老黃不會坐視不管的


似乎我印象中intel都沒有成功的收購案例?


應該是Intel急了,輸了手機晶元市場(嚴格講是應用處理器),不能再輸GPU計算的市場了。


推薦閱讀:

計算機方向學生 MacBook Pro 128GiB 是否夠用?
如何評價中科院山世光老師開源的Seetaface人臉識別引擎?
arxiv只能查看最近一周的論文嗎?
使用深度學習演算法實現圖像目標跟蹤,該怎麼做?機器學習剛入門,完全沒頭緒。?
如何看待用機器學習已經可以根據化學分子的特點預測它的氣味?

TAG:人工智慧 | 機器學習 | 計算機視覺 | 無人駕駛車 | 深度學習DeepLearning |