9. 端部署V.S雲部署
說過了模型訓練與模型檢測,以及支持的伺服器硬體甚至晶元,一個很自然的問題就是深度學習模型的部署。和所有的數據密集的應用或服務一樣,都有部署的「雲端化」和「本地化」平衡。
在模型訓練方面,由於耗時較長且需要大量計算資源,所以這塊主流方案都是部署在雲端或者服務商自己的伺服器。一方面這樣對於AI能力提供方更加方便管理計算資源,另一方面也更便於他們獲取和利用客戶的數據。自然,也有很多大型的客戶因為數據安全和沒有掌握模型改進的核心能力(畢竟模型交付之後還是有修改的需求)而不滿足於此,但在客戶本地部署訓練用的伺服器硬體成本,對於中小型客戶還是比較大的。雖然業界也有很多輕量級的訓練方案,甚至有隻利用手機自身的計算資源就完成模型訓練的框架,不過這個目前都還不太主流。
而在模型的檢測,即單純的前向運算方面,本地化部署和雲端部署的方案在業內都存在。部署在本地,比如集成在手機或手機APP包中的一些相機AI美顏功能,難點在於端的優化,包括佔用更小的存儲獲得更快的處理速度,而好處在於這樣一些需要實時處理的功能模型響應更快,避免了API傳輸中的時間損耗。尤其是自動駕駛和安防攝像頭這種對於實時性有極高要求的服務,對於本地端的計算能力和響應時間要求極高,傳輸的時間損耗很難忽略,這也促進了很多向端提供晶元的企業的市場。而另一方面,很多大型企業在其雲平台都會對已經比較標準化的AI技術,比如語音識別、人臉識別等提供可供小型企業、甚至個人直接調用的API,這個和很多雲端服務是類似的。這種服務對於客戶的好處在於他調用和付費的便捷性。但如果是對於大型企業,或這個AI模塊承擔了比較大的作用,這種服務就不太充分了。