國內哪些公司在用caffe、torch、TensorFlow、paddle等框架,哪些在用自研框架?


圖森在用mxnet,並且圖森的一些人員也參與了mxnet的核心開發工作

Sensetime和Face++都在用自己研發的系統

我司Momenta也在用自己研發的系統

總體上感覺,完全採用開源社區里拿來的一個深度學習框架是撐不起一個以深度學習為核心技術的公司的研發任務的。因此普遍各家或多或少都選擇了自己開發。有的從頭開始搭建,有的魔改一個開源框架。


圖森用mxnet,同時還參與開發了mxnet

美團據說好多在用mxnet

騰訊AI lab據說在轉tf。

當然,曠視Face++自然用的是內部自研平台了,完全自研的,而不是基於某個框架改的。但是呢,研究院內部,用pytorch,tf的也不在少數。

其實對於一家公司而言,選擇什麼框架關注點可以分成兩部分:研究和產品。研究關注的是:框架成熟度,社區是否強大,是否易用,是否易可擴展。產品的關注點自然是性能和速度了。

如果一個框架你想要的功能都有, 那自然最棒的了。研究員拿來就是一頓干。但是,框架始終跟不上研究的奇思妙想。所以如果強大的社區能提供高效可用的解決方案,那自然也很棒。但是,社區有時候也不一定靠譜。所以,難免要自己開發。這時候就對框架的可擴展性或者易擴展性提出要求了。自己分分鐘實現一個新功能,研究員就會覺得自己確實是在搞研究了。如果幾周幾周還實現不了,研究員就要懷疑人生了,人家人生都懷疑了,框架還不就說否定就給你否定了。另外如果一個框架非常好用,能寫更少的代碼實現更多的功能,寫起來還能流暢到卧槽,那說不定對於多年的頸椎病和視力還有幫助呢。

而對於產品而言,在都用nvidia底層的前提下,各個框架的差距可能並不太明顯。但是,有時候可能就是這點差距就會影響到能不能融到資,能不能賣給客戶(畢竟要PR)。所以,就得開始自己優化底層了,這時候難免改一發 現有框架的底層, 或者直接從頭研發一套自己的框架以供內部使用。這樣一來,研究的易擴展性也解決了,自己想怎麼搞怎麼搞,而且各個部門還能交流,想加什麼功能加什麼功能,爽的一匹。當然前提是公司有這樣的一群大神能去從頭研發一套自己的框架(逃


推薦閱讀:

為什麼強大的 MXNet 一直火不起來?

TAG:深度學習DeepLearning | Caffe深度學習框架 | TensorFlow | mxnet | Caffe2 |