自研AutoML技術,智易科技要走不同的AI平台之路
調研 | 李喆 費凱琳
撰寫 | 崔可家
AI技術的不斷發展,似乎讓我們看到了未來無限可能,然而如何將AI技術落地,服務行業,依舊是正在探索的問題。
智易科技創始人李傑認為,AI技術應該是一種賦能型的技術,可以服務各個行業,幫助提升生產力,目前,AI商業化落地處於初級階段,有很多平台級的機會存在。
李傑具有雲計算和AI技術背景,曾在微軟、谷歌從事開發工作多年。2017年5月,李傑創立智易科技,並於年底正式完成深思平台研發,一款零門檻AI模型研發和應用平台。
深思平台可以幫助任何企業用戶快速開發出可應用於實際生產環境的AI模型,用戶只需要將數據導入並選擇預測目標,平台即可給出最優模型。深思平台定位零門檻和全程可視化的人工智慧應用開發平台,用戶不需要掌握任何AI相關的理論和知識,就可以輕鬆上手。
深思平台是一個龐大的系統集合,包括底層的分散式集群、雲基礎設施;上層的AI模型研發、分散式訓練架構以及大數據引擎,包括Hadoop、Spark等;同時擁有ETL層,對數據進行處理,有可視化和BI等功能;並在面向前端用戶時,搭建了基於瀏覽器的可視化操作頁面,大幅降低了使用門檻。
AutoML是深思平台中關鍵技術之一,也是如今AI研究的前沿領域。2016年,Google第一次提出AutoML概念,旨在幫助降低AI使用門檻,但是Google選擇了更為依賴算力、偏重利用高性能硬體暴力搜索的方式實現智能建模調參。
李傑認為,這種方式在商業化中並不具備實際條件,所以智易科技在自主研發AutoML技術中,選擇加入啟發式搜索技術,即在面對特定問題時,平台會根據過往規則給出預判模型,將更多算力投入其中,這樣可以利用更少的迭代次數達到和暴力搜索方式類似的效果。
深思平台支持公有雲和私有部署兩種方式。初次使用AI的客戶會更傾向於公有雲模式,已有AI使用經驗並對於信息安全有較強要求的客戶,比如金融行業客戶,會更傾向私有部署。
目前,深思平台主要應用在金融業、零售業以及工業中,支持結構化數據和圖像數據,可以幫助客戶完成反欺詐、銷量預測以及產品缺陷檢測等一系列AI應用。
對於AI領域中的競爭,李傑認為,目前AI領域處於非常初期的階段,正是建立行業壁壘的關鍵時期,由於開源的存在,演算法普及程度很高,技術已經不能形成較高的競爭力,對行業場景的深入理解,準確捕捉行業痛點需求才是維持在該行業中競爭力的重要保障。
近期,愛分析對智易科技創始人李傑進行了專訪,就智易科技的產品、經營策略、戰略發展目標以及AI行業的發展趨勢做了深入探討,現將部分精彩內容分享如下。
降低AI使用門檻,以通用型AI平台切入市場
愛分析:為什麼選擇AI這個行業作為創業方向?
李傑:我博士期間就有雲計算和數據挖掘的背景,工作後先在微軟總部做了兩年多雲計算平台研發,之後去了谷歌開始接觸AI尤其是深度學習。
當時我所在的項目組為底層雲平台系統,管理著Google所有機器集群,可以接觸到整個數據中心的核心數據和資源。也正是那時我發起和主導了一個數據中心智能化管理項目的研發,利用AI技術來挖掘數據價值,結果非常成功,當時就被AI的能力所震撼。
這樣的一個契機使我認識到,AI作為一個賦能型技術,幾乎可以用來服務全行業,挖掘不同場景下大數據的價值,所以很希望在這個方向上做一些深入的探索。
愛分析:為什麼選擇以通用型AI平台切入市場?
李傑:AI創業的主流方式是選擇一個垂直領域(醫療、零售等等)進入,然後做AI相關的應用等等。
我想做的是通用型AI研發平台,主要有兩點因素:
第一, AI本身作為一個賦能型技術,應該是通用的,全行業都存在跟AI結合的機會;目前,AI的商業化落地處於初級階段,有很多平台級的機會等待我們去開拓。
第二, 在微軟和谷歌的工作經歷,使我能夠站在國際視角看到最為前沿的一些技術趨勢,所以希望能結合自身的背景經歷做一些更有價值的事情。在雲計算、大數據、以及人工智慧多年的經驗積累,使我能夠快速利用自身技術能力搭建這樣一個通用型AI研發平台,之後再利用這個工具慢慢進入其他行業,去獲得對行業更多的認知。
愛分析:深思平台的研發周期是多久?
李傑:2017年4月底,我從Google離職,利用1個月左右做行業調研,發現市場上沒有很好產品先例,之後2-3個月用來設計系統和原型的迭代開發,8月份開始正式進入開發階段,12月底1.0版本開發完成。
愛分析:深思平台的定位是什麼?
李傑:我們的產品定位是在一定程度上取代初中級的AI專家,並且將AI使用的低門檻做到極致。
在降低門檻方面我們有兩個目標,第一,用戶全流程不需要寫任何代碼;第二,完全不懂AI的用戶也能完成相關的AI應用模型開發。
愛分析:市場上也有一些為了降低AI使用門檻的產品,這些產品有什麼不足?
李傑:國內外有很多為了降低AI使用門檻的工具,但是最後的產品並沒有達到這個目標,主要原因是,雖然這些工具提供了一定的可視化交互界面,但同時也暴露了大量的技術參數、配置給用戶,所以這些產品依然是面對AI專家的。
自研AutoML技術,滿足商業化要求
愛分析:深思平台包括ETL層、數倉嗎?
李傑:我們的產品是一個龐大的系統整合。
最底層是分散式集群管理,雲基礎設施;再往上一層是基於主流的開源框架的核心AI研發層,用於AI模型訓練;再往上一層,是基於Hadoop、Spark的大數據引擎,包括數據的存儲和處理,以及ETL部分,支持BI、可視化功能;最後是面向用戶的,搭建了基於瀏覽器的可視化操作頁面,大幅降低了使用門檻。
愛分析:用戶如何使用深思平台開發AI應用?
李傑:首先,用戶可以從不同數據源(本地、雲端)導入數據,然後只需要確定訓練目標,平台就會自動化完成模型的搜索和迭代,找出最優解。如果模型達到了用戶的生產環境要求,我們提供模型託管以及模型API介面,之後用戶可以直接調用API使用模型。
愛分析:模型的選擇是平台自動完成的嗎?
李傑:是的,這是利用我們自主研發的AutoML技術。用戶只需要選擇預測目標,我們的產品就可以完成模型演算法的選擇、超參數的組合迭代,然後找到最優化模型。
我們跟Google AutoML的技術路線有一些差異。
Google自身有資源優勢(TPU硬體),所以採取的是更為依賴算力、近似暴力破解的方式來尋找最優解,我們認為這種模式硬體成本過高,在商業化中並不適用。
我們則是更多的依賴於一些數學優化理論去做更加經濟的搜索、迭代,並且結合我們的啟發式搜索,對於不同類型的問題,我們會給出某種預判模型,我們把這些人為規則加入到自動化迭代中,達到用更少的迭代次數達到和暴力搜索類似的效果。
愛分析:模型由平台直接給出,大型客戶對於模型的可解釋性是否有顧慮?
李傑:有的用戶會有可解釋性需求。現在這也是AI領域需要突破的難點,從效果來講,神經網路往往能達到最佳的效果,但是缺少可解釋性,如果用戶有很強的可解釋性需求,我們會選擇一些有較強可解釋性的演算法來服務客戶。
愛分析:模型會根據實時數據不斷更新嗎?
李傑:模型持續訓練已經支持了,按照周期來不斷訓練模型。但是在實際中,實時訓練的需求比較少見。
愛分析:在建模功能上,Tensorflow和深思平台的區別有哪些?
李傑:我們平台是基於可拓展的架構設計,支持當前主流的AI演算法框架,包括Tensorflow、Scikit-learn、Caffe等等。一些Tensorflow支持得並不太完善的模型演算法,比如像決策樹等等,我們會通過支持其它的一些第三方框架(例如XGBoost和LightGBM)來進行補充。
部署模式靈活,未來加入數據準備模塊
愛分析:用戶在使用深思平台時,可以做計算資源調度嗎?
李傑:這些都是可以配置的,首先我們的平台是提供兩種形式的服務,一種是公有雲形式,SaaS模式,另一種是私有部署,私有部署中就可以根據客戶需求來配置計算資源。
其實建模過程中每一個環節都涉及到大量數據處理,需要大量計算資源調度,我們提供兩種方式,一種是平台自動化選擇,另一種是用戶自己制定。
愛分析:目前,哪種部署方式更加廣泛?
李傑:這跟不同行業的屬性有關,金融業客戶傾向於私有部署,而對於一些追求快速發展、意識更為前沿的客戶(如零售、互聯網等),公有雲模式會較多。
愛分析:深思平台對於數據準備環節的支持如何?
李傑:在AI應用研發中,佔用時間最多的是模型選取迭代以及數據準備工作。現階段,我們更多資源是投入到優化模型這塊,對於數據準備工作,我們已經開始進行研發,未來我們的平台會兼顧到數據前期準備環節。
客戶需有良好數據基礎,AI平台市場仍處早期
愛分析:深思平台的客群定位是什麼?
李傑:對於客戶,我們有兩個要求:有良好的數據基礎,有明確的需求。
現在我們把客戶分為三個階段:
第一階段,沒有AI使用經驗,想做AI嘗試,比較初級;
第二階段,有AI成功使用案列,會嘗試更多場景,更加積極去使用AI,會尋求外包解決方案;
第三階段,相當多的成功AI應用場景,不再滿足於第三方提供解決方案,更傾向於自己擁有AI的能力。
我們服務的最佳客戶是對AI有比較成熟的理解,並且之前有相關AI使用經驗的第二和第三階段客戶。
愛分析:目前,智易科技的客戶主要分布在哪些行業?
李傑:金融行業,因為跟AI結合很早,不再滿足於業務解決方案,想要AI通用型能力;零售行業,有銷量預測、庫存管理等方面的需求,深思平台可以幫助零售行業的所有環節提升生產力;工業,利用工業視覺開發對於產品缺陷檢測的AI應用。
愛分析:深思平台與客戶原有系統的集成性如何?
李傑:深思本身是可以作為一個單獨的平台存在的,最後輸出的是一個模型,會有一個API介面,用戶只需要調用API介面就可以完成應用部署。
愛分析:客戶對平台級產品的接受程度如何?
李傑:現階段,可能只有少數客戶對於平台級產品的接受程度較高,但是隨著客戶對於AI的認知不斷進步, 在未來的幾年,會有更大需求爆發。
愛分析:智易在進入行業之後會向上層應用發展嗎?
李傑:目前是以單點切入行業,會不斷滲透到其他業務中,我們之後會不斷打磨平台產品,並且會向行業應用發展。
愛分析:您怎麼看待目前AI平台領域的競爭?
李傑:我認為目前AI市場處於非常初級的階段,可以叫做人工智慧商業探索的大航海時代,還有很多未探索的領域,AI+行業的機會還非常多,各個廠商都有機會成為AI時代領導者,並且我個人非常看好平台級的AI產品。
愛分析:開源盛行,技術不再是難點,AI行業的競爭壁壘是什麼?
李傑:應該是對不同行業的認知程度吧,現在許多行業對AI的認知仍停留在一個較為初級的階段,不知道AI能幫助改善生產中的哪些環節,這是我們需要跟不同行業一線業務人員共同去探索的。誰先完成對行業的深入探索,幫助客戶解決實際需求,就能建立起該行業的競爭壁壘。
愛分析:智易科技有哪些對標公司?
李傑:從國際範圍來看,在產品理念方面美國的DataRobot跟我們比較相似,但我們的核心競爭力在於把AI低門檻做到極致,比如讓一個完全不懂AI的外賣小哥15分鐘學會使用我們的產品。
國內目前也有一些公司在往這個方向探索,但在產品的形態理念和AI研發過程的複雜性封裝方面都跟我們有較大差距。
愛分析:智易與微軟加速器在哪些方面進行了合作?
李傑:智易是一家非常年輕的初創公司,很榮幸能跟微軟加速器合作,同時,我們也確實感受到了微軟加速器給予初創企業莫大的扶持和助力,包括技術、資源全方位的幫助。
第一, 微軟的Azure雲平台計算資源,我們拿到了非常大的一個免費額度,現在,我們平台也在部分往Azure平台遷移。
第二, 媒體資源的獲取,也是微軟無條件支持的。
第三, 投融資對接方面,微軟設置了很多私下以及公開的渠道幫助我們去獲取。
第四, 客戶方面,微軟很願意將自身的一些大客戶資源提供給我們,幫助我們進行針對性的對接。
推薦閱讀:
※Google I/O 2018 最值得期待的 5 大看點,了解一下?
※頂級黑科技 | 當你們在談論VR、AR、MR的時候,你們到底談論的是什麼?
※小米8SE:求小米6X和眾友商的心理陰影面積!
※Facebook老闆捐出99%股份,還有哪些「科技大神」慷慨解囊?
※每日公告:中海達投放導航晶元,迎來新機遇;承接資管股份,中鼎未來預期在哪兒?