什麼才是整個GE Predix的核心?關於Predix的五大誤解
【造奇新媒體導讀】:本文是2017 GE Minds+Machines見聞系列之二,作為工業互聯網平台公司的業界專家,是國內少數現場觀摩、聆聽報告,並寫文詳細描述這次工業互聯網領域全球盛會的。
昨天,分享的《深度剖析Predix最新玩法 | GE全球2017年度大會Minds+Machines現場見聞》主要講了Predix Edge,今天第二篇的下半部分會為大家分享Predix Cloud。另外,下一篇將重點介紹利用GE基於Predix架構開發的應用,以及其在各個行業(航空、電力能源、油氣、交通以及製造)中的實際案例,請大家持續關注。
「數」說2017 | 這一年,我們走過的路,表達過的觀點和思想文 | 時培昕博士,寄雲科技CEO
3 平台篇:Predix Cloud
Predix Cloud是整個Predix方案的核心,圍繞著以工業數據為核心的思想,提供了豐富的工業數據採集、分析、建模以及工業應用開發的能力。
由於GE本身是生產大型複雜型工業產品(飛機發動機、燃氣輪機、風力發電機、機車等,也就是我們通常所說的高端裝備)的企業,所以Predix Cloud的構建也是從GE本身的業務特點出發來,即緊密圍繞著離散製造行業里的大型高端裝備的設計、生產和運維,提供以工業設備數據分析為主線的一系列能力,方便構建高端裝備行業的應用。但是在Predix Cloud發展過程中,由於平台優異的開放性,很多其他行業,包括很多流程製造和服務的客戶,也在利用Predix Cloud開發相關應用。
1 平台需要解決的問題
按照我的理解,一個強大的工業互聯網平台,需要為工業應用提供強大的支撐能力。它的核心是「能力平台」,需要具備如下的能力:
1)支持多種數據源的接入
不僅包括對各種實時傳輸協議(MQTT、HTTP/HTTPS、WebSocket、Kafka等)的支持,還需要支持控制系統的直接對接,包括以文件的方式批量導入工業數據;
2)提供針對不同數據源的靈活數據處理功能
工業系統的數據質量很多時候並不理想,不僅需要支持標準的ETL實現數據清洗(特別是針對工業時序數據),還要提供靈活的時序數據處理機制,包括去重、對齊、填充、過濾和匯聚等功能;
3)支持對工業設備數據的元數據管理
需要提供一致化的工業數據管理功能,包括設備層次關係、依賴關係、屬性、採集點以及關鍵指標的定義機制,以保證後續的應用開發和數據分析,都能夠以相同的標準開展;
4)提供異構的存儲介質
需要提供豐富的存儲能力,不僅包括結構化資料庫、非結構化資料庫,還要支持文件存儲、對象存儲,以及時間序列資料庫;
5)提供強大的工業大數據分析能力
不僅能夠支持對工業大數據的統計分析,還需要支持通過建模實現對歷史數據的診斷分析、當前狀態的評估分析,以及對未來趨勢的預測分析;
6)提供快速的演算法和模型開發工具
提供低級別的、多種語言的演算法開發環境,支持數據科學家開發模型;
提供高效的快速模型開發工具,可利用採集的數據快速構建數據和機理驅動的模型,能夠直接生成實時的應用,並提供外部訪問的API介面;
7)提供實時分析運行環境
需要提供基於實時數據流的運行環境,支持為構建的實時模型提供可擴展的運行環境,支持根據實時數據實現診斷、評估和預測;
8)支持高效便捷的工業應用開發
需要以DevOps的理念進行工業應用的開發和部署,支持多種開發語言和開發框架,提供包括身份管理、許可權管理、設備元數據模型等在內的豐富微服務模塊,將複雜的工業應用拆解成細粒度的功能模塊,通過集成標準化的微服務、微分析和微應用的方式實現快速的工業應用開發。同時,需要為應用提供彈性擴展的、高可靠的、容器化的程序運行環境。
同時,對於常見的應用場景,提供可視化開發套件,支持工業運營人員構建自定義的監控和分析應用。
9)提供全方位的安全防護
提供從邊緣、平台到應用的端到端的安全防護,包括傳輸加密、設備接入認證和授權、用戶角色管理和許可權設置、登錄連接管理、訪問日誌審計以及應用層防護在內的多重安全機制;
10)提供開放的架構
能夠將平台的各種能力以API的方式開放出來,包括微服務、微應用及模型,支持客戶或者合作夥伴利用這些成熟的能力快速開發自己的工業應用。
2 關於Predix的誤解
在國內,關於Predix的討論很多,我們也看到了很多對Predix錯誤的解讀。在介紹Predix Cloud之前,我有必要糾正一下這些錯誤理解。
1)Predix只是一個平台
正如前面所說,Predix遠遠不止是平台,包括了邊緣+平台+應用三部分,其中邊緣和平台都只是配合應用的,應用才是Predix的最終目的。但由於歷史的原因,目前基於Predix只開發了一部分的APM應用,相信未來會越來越多。
2)Predix是一個PaaS平台
如果按照PaaS標準的定義,Predix提供了基於Cloud Foundry的開發框架,它具備了PaaS(APaaS,Application PaaS,類似Heroku)的能力。但是Predix最有特點的是將其在工業大數據的分析能力和PaaS開發能力緊密結合在一起,通過微服務的理念,將數據分析和建模的結果,以微服務(微應用)的方式被基於PaaS(Cloud Foundry)開發的應用框架所集成。
3)Predix的核心是Cloud Foundry
Cloud Foundry在Predix Cloud中起到的作用並不高,它只是Predix在早期規劃應用開發的框架,但由於Cloud Foundry本身的局限性,它只能提供應用構建和Runtime的能力。不過它很好的奠定了Predix「基於微服務開發微應用」的核心思想。
隨著Predix Studio的推出,Cloud Foundry在Predix平台中的比重還會有所下降。
4)Predix只是將原有工業應用雲化
Predix針對的不是原有的類似PLM、ERP之類Legacy的工業應用,而是全新的應用場景,即基於工業設備數據分析的新型應用,旨在解決很多傳統應用無法解決的效率、質量和成本的問題,如APM針對設備運行效率和預測性維修、OPM針對運營效率等。 所有的應用都緊緊圍繞著設備數據來構建,通過Digital Twin的統一的標識以及同設備激勵結合的快速分析和建模,實現原有工業應用無法滿足的功能。
5)Predix只是針對GE自己的設備
Predix提供了很多基礎的演算法和模型,僅異常檢測就有十幾種機制,還有很多文本和圖像的處理模型,因此針對的是較為通用的場景,並且提供非常豐富的建模和分析工具。合作夥伴或者客戶可以利用這些演算法、基礎模型和工具,開發針對自己行業特點的分析模型和應用。
6)Predix是針對智能製造的
這次大會涉及的主要是GE在一些重點行業裡面的重資產的運維和運營效率的提升,跟智能製造相關的內容比較少。在Predix平台上提供的開發和分析服務裡面,與製造相關的服務也相對較少,而PHM(預測和健康管理)的服務則有很多。
3 Predix Cloud概述
毫不誇張的說,Predix Cloud是一個功能異常強大的平台,集成了工業大數據處理和分析、Digital Twin快速建模、工業應用快速開發等各方面的能力,以及一系列可以快速實現集成的貨架式微服務。
這是Predix Cloud的完整架構圖:
這張架構圖很好的呈現了Predix Cloud的功能構成,主要有如下幾個部分:
- 基礎架構
Predix提供了三種部署架構:公有雲(AWS、Azure),私有雲(未知),和Country Cloud(沒看明白)。所以,Predix Cloud是支持私有化部署的,但是很貴!
- 安全
Predix Cloud提供了非常多的安全機制,包括身份管理、數據加密、應用防護、日誌和審計等。
- 數據匯流排
這部分包括了數據的注入、處理以及異構數據的存儲等功能,支持流數據和批量數據的導入和處理。
- 高生產力開發環境
提供包括Predix Studio在內的可視化應用開發環境,支持平民開發者(Citizen Developer)使用拖拉拽的方式快速構建工業應用。
- 高控制力開發環境
提供代碼級別的開發環境(基於Cloud Foundry),提供可控程度最高的工業應用開發環境,以及一系列可快速集成的微服務;
- 數字孿生開發環境
提供快速的建模工具,實現包括設備模型、分析模型以及知識庫結合的模型開發。
4 工業大數據分析
Immelt在位期間曾經說過,近五年來全球工業一直維持在1%的增長率,無法通過現有手段實現更進一步的提升,而造成無法提升的主要原因,是因為到現在為止,只是按照我們對工業的理解實現了可控制,但並不能解釋很多工業未知的問題,唯有通過數字化才能改變這一切。
Predix的根本,就在於通過精細化的工業大數據分析,來解決很多工業領域未知的問題,實現新的增長。
1 基於Digital Twin的工業大數據分析
Predix最強大的地方是基於Digital Twin的工業大數據分析,即將物理設備的各種原始狀態通過數據採集和存儲,反映在虛擬的信息空間中,通過構建設備的全息模型,實現對設備的掌控和預測。
Digital Twin概念的提出已經有15年的歷史,但是在Predix之前,一直只停留在概念階段,而GE Predix真正將這個「概念」數字化了,賦予其非常具體的意義,即軟體形式(虛擬空間)表現的物理設備或系統(物理空間),也就是我們常常提到的Cyber Physical System。
國內很多人把Digital Twin理解成用3D模型的方式展示物理設備,是非常片面的。GE定義的Digital Twin由三個部分組成:Asset Model、Analytics和Knowledge Base。Asset Model定義設備的屬性和指標,Analytics給出對設備過去、當前和未來三種狀態的數據分析,而Knowledge Base則結合設備機理給出對設備的判決和洞察。
通過這三部分的組合,我們可以在信息世界中完整的描述出一個物理設備,實現對設備的全面掌控,這才是真正的Digital Twin。
1)Asset Model
Predix Cloud提供了一種設備元數據管理的微服務,叫Asset Service,用以描述設備的組織、地點、歸屬關係、屬性以及管理者等,支持特定場景下強制和定製化的屬性定義。
通過Asset Service,可以將一個複雜的工業設備拆解成層次化的模塊,並且為每個模塊定義出相應的關鍵屬性和關鍵指標,方便通過可視化的手段進行映射和展示。
2)Analytics
Digital Twin裡面關於數據驅動的模型開發,不僅要實現對當前設備關鍵採集點的實時展示,更要實現對設備過去歷史的理解、當前狀態的評估以及未來趨勢的預測。
- 對歷史的理解:通過分析歷史數據,找到故障的相關性、故障的發生路徑等;
- 對當前的評估:通過基於歷史數據的學習和訓練,構建評估模型,對當前設備的健康狀態進行評估;
- 對未來的預測:通過歷史數據的建模,預測未來的發展趨勢及可用生命周期;
Predix提供了大量的工業演算法和模塊,並提供在線的訓練和測試的工具,方便用戶開展模型開發。
3)Knowledge Base
Knowledge Base在這次大會上並沒有進行正式闡述,大家都不太理解這個詞。個人理解認為Digital Twin Knowledge Base是關於設備關鍵指標的定義方式,即針對設備在不同層次、不同視圖上,都會有相應的關鍵指標,而很多關鍵指標都是基於機理和數據的模型給出的,而Digital Twin Knowledge Base則完整的描述了關鍵指標的計算方式、模型來源、輸出結果存儲方式,以及對應的處理方式等信息。(此處理解如有不當,歡迎討論、指正)。
2 Predix分析模型目錄
GE認為,Digital Twin的構建必須將設備機理模型和數據驅動分析結合起來,缺少任何一個都將有很多問題。
- 單純依賴數據驅動的方式進行學習、判決,一定會出現嚴重的判決錯誤。
- 單純依賴機理模型,只能實現「已知「問題的驗證,而不能發現」未知「的問題。
在實際的模型開發和使用過程中,必須將兩者結合起來,才能實現更好的效果。
但是模型本身的開發,是一個非常專業和複雜的過程,一般用戶並不具備這類的專業能力,因此對模型的使用存在很大的瓶頸。
Predix提供一個模型目錄,將GE和合作夥伴開發的各類模型以API的方式發布出來,並提供測試數據,讓使用者可以站在巨人的肩膀上,利用現有的模型進行模型訓練,快速實現實例化。同時,用戶開發的模型也可以發布到這個模型目錄中,被更多的客戶共享使用。
這裡的模型不僅包括常規的異常檢測,還包括文本分析、信號處理、質量管控、運行優化等,根據大家公認的工業大數據分析類型,可以將其分為四類,即描述性(Descriptive)、診斷性(Diagnostic)、預測性(Predictive),以及策略性(Prescriptive)。
除了這些分析模型,還有GE提供的超過300個資產和流程模型,這些模型都是跟GE旗下的不同產品相關的,包括各種屬性和3D模型,方便客戶或者合作夥伴快速構建Digital Twin。按照GE的宣傳資料,包括GE自身以及合作夥伴在內,已經構建了數萬個Digital Twin。
同時,GE還在Predix「當家花旦級」應用產品—SmartSignal(APM系列中的一個產品)中提供了超過150個針對不同設備的預測性模型。
5 工業應用開發
工業客戶通過工業應用來實現對生產過程和設備運維的掌控,因此工業應用實際上完成了最後一步,即人機交互的關鍵作用。
1 工業應用開發vs互聯網應用開發
本人是從IT領域進入工業領域的,從事過一些互聯網應用開發,在進入工業領域之前,一直對工業應用的開發懷著崇敬的心理,但是在做了一定的調研和經歷了很多項目之後,發現工業應用相對來說存在相當程度的落後性,並存在著一些多年未解的問題,需要利用新的IT技術進行大幅升級,來解決之前懸而未解的問題。
首先,工業應用基本上採用的都是十年前的開發架構,絕大部分工業應用都是直接跑在Windows的單機上(對於很多互聯網應用開發者來說,這簡直是不可接受的),有一些還在採用連微軟都停止支持的模塊(居然還遇到過有人認為工業應用比互聯網應用更安全)。新架構、新技術在工業領域的應用,實在少得可憐,甚至還有很多人還在爭論開源軟體是否不安全的問題。
其次,工業應用開發的效率實在太低,動輒數年一個版本,而互聯網都已經到了一年數萬次迭代的時代。這裡面,一方面是因為工業追求穩定性和安全性,另外一方面也不得不說是因為歷史的原因,工業領域無法吸引專業的應用開發人員,無法將先進的開發工具、理念應用到工業開發中。
同時,由於工業領域過於瑣碎,但是每一個處理環節又需要經驗豐富的專業技術人員,不可避免的造成跨專業的人才非常奇缺,無法將不同專業的基礎知識通過重用來提高應用開發效率,這與互聯網敏捷應用開發的思路截然相反。因此,工業應用基本都是單塊化、緊耦合的複雜系統,缺少彈性擴展能力,並且無法保證其單點可靠性;相反,互聯網應用卻越來越追求松耦合和微服務,希望將一些基礎功能服務化實現重用,滿足不同場景下的快速定製,並通過微服務的開發架構,來提高系統的擴展性和可靠性。
最後,也是最關鍵的一點,工業應用並沒有跟工業數據分析結合起來。現有的工業應用,只能提供少量的實時工業數據展示,和短期歷史數據查詢的功能,而無法將海量歷史數據的分析和建模的結果結合起來,生成實時的應用,對工業的設備和流程進行實時的判決和預測,因此也就無法實現有效的持續改進。
當然,還有更多的問題,因為篇幅限制,不再一一列舉。
可能很多人會爭論,工業裡面有各種安全性和可靠性的問題,無法採用互聯網的方式來重構,而我只能回憶起10年前,當新技術開始進入金融行業的時候,很多人也有相同的顧慮,而現在的金融行業,已經快被互聯網化了。
我認為不用過慮,畢竟新的工業應用才剛剛登場,99%的工業應用還沒開發出來。想想十年前的互聯網應用與現在的互聯網應用的差異,就應該能理解了。
2 工業應用開發平台需要具備的能力
一個強大的工業應用開發平台,至少需要具備如下的能力:
1)提供基於數據的應用開發能力
支持統一的數據標準介面,而不是需要應用在不同的業務系統之間獨立抽取不同數據再單獨整合;
能夠針對不同工業應用場景,快速定製工業數據分析結果的可視化;
提供數據處理工作流,支持對不同應用場景下數據處理的靈活支持;
提供開放的數據訪問介面,便於對接第三方應用;
2)提供微服務的開發能力
支持構建基於微服務架構的微應用,並支持提供統一的API接入、認證、授權、服務發現等功能,為每個單獨的微應用提供彈性擴展的集群部署環境;
3)提供DevOps的開發能力
提供編譯、構建、打包、部署等環節的全自動能力,支持根據代碼的變化快速實現自動化重構,為開發人員提供便捷的部署環境,實現代碼開發所見即所得;
4)提供豐富的貨架類微服務
提供包括資料庫、消息、身份管理、安全、設備連接管理等通用的工業應用開發服務,使用者只需要訂閱,而無需關心服務的提供和運維;平台需要提供包括服務註冊、服務發現和服務訂閱等服務生命周期管理的功能;
5)提供數據可視化的開發能力
提供基於數據分析的可視化開發能力,支持普通用戶通過定義數據源、定製工作流、使用拖拉拽的方式快速構建數據可視化的應用;
6)提供實時的模型運行環境
針對開發出來的模型,提供實時的模型運行環境,可以對實時數據流進行分析,並提供可視化;
3 Predix的應用開發能力概述
Predix的應用開發可以分為三部分:
- 高控制力開發套件:為高級軟體開發工程師提供微服務級別的應用開發能力;
- 高生產力開發套件:為普通運營和分析人員提供快速應用開發能力;
- Digital Twin開發套件:提供Digital Twin的開發支持;
第三點在前面數據分析階段已經介紹了,這裡重點解釋前兩點。
4 高控制力開發套件: Predix App Engine
這是Predix早期剛推出應用開發能力時候的基礎框架,即基於開源框架Cloud Foundry的開發架構,主要包括兩個部分:
- 基於Cloud Foundry的開發環境和運行時;
- 服務目錄
1)基於Cloud Foundry的開發環境和運行時
下面是Cloud Foundry的技術架構,其核心實現的是從代碼編譯到部署完成應用的完整過程,並提供了一部分包括負載均衡、賬戶管理、存儲的基礎服務。
Cloud Foundry提供了豐富的命令行,支持代碼的上傳、下拉、構建以及綁定服務等操作。同時,針對應用完成部署之後的運行,提供基於容器的彈性擴縮能力。
關於這部分,我個人覺得Predix做的並不好,只是將Cloud Foundry的能力原封不動的搬過來,如果參考Heroku和一些CI/CD的平台,可以將這部分的開發過程變得更簡單和自動化,方便開發者使用。
2)服務目錄
如果PaaS平台只是提供Cloud Foundry的基礎能力,對代碼開發者來說是沒有吸引力的,因為編譯、打包和部署的工作,對於代碼開發者來說只是Nice to Have的工具,並不能降低開發的難度和工作量,而真正提升開發進度和降低開發工作量的,是圍繞核心代碼的外部服務重用,甚至核心功能的重用。
因此,基本上所有基於Cloud Foundry的商業化PaaS平台,包括Predix和Bluemix在內,都進行了大幅度的擴展,豐富了其服務目錄。
Predix提供了包括資料庫、數據管理、資產管理以及存儲和消息在內的多種服務,如下圖所示。
對於開發者來說,只需要訂閱相關的服務,獲得服務的訪問密鑰和訪問接入點,就可以使用該服務,通過將數據或指令發送到該服務,獲取處理結果,無需關注服務本身的運行和維護,極大的降低了對開發者的能力要求。
5 高生產力開發套件:Predix Studio
雖然Predix App Engine原則上可以構建任何類型的、複雜的工業應用,但是仍然需要依賴專業軟體開發人員通過寫底層代碼才能實現,而且往往是需要對工業有一定理解能力的開發人員。
在工業裡面,正如我前面所提到的,很難有「兩全其美」的開發人員,即使有,也不是一般的工業企業所能奢望的。這種局限性,造成了Predix曲高和寡的局面。雖然Predix能力很強,但是針對很多應用場景,仍然需要Predix自己的開發人員或者專業合作夥伴替客戶開發應用,很難實現高效的目的。
在這次大會上,Predix預覽了一個工業應用的可視化開發套件——Predix Studio,該服務將於2018年第一季度上線。基於Predix Studio,平民開發者(Citizen Developer)可以通過自動化的數據集成、拖拉拽式的開發以及快速發布的機制,快速構建工業級的互動式應用。
Predix Studio提供基於「少量代碼」(Low Code)理念的應用開發平台,並提供了自動化的數據集成及很好的應用擴展架構和非常便捷的部署架構,能夠極大的加快工業應用開發的速度和效率。
【專題鏈接】:
深度 | 中美德20多家工業互聯網平台大比拼,得出了這5點結論
亂花漸欲迷人眼,滿天飛的工業互聯網平台,真的?假的?
可喜可賀!工業互聯網躍升為「中國製造2025」的主攻方向之一
獨家 | 安筱鵬之問:中國消費互聯網優勢能否自然遷移到工業互聯網?
一文讀懂《工業物聯網白皮書(2017版)》
————————————
[工業互聯網]專題系列文章
工業互聯網在製造業數字化進程中的作用
深度 | 向左走?向右走?打造工業互聯網平台的七種路徑
亂花漸欲迷人眼,滿天飛的工業互聯網平台,真的?假的?
曾鳴 | 平台型企業從0到0.1的三大原則與四大核心決策
重讀曾鳴教授平台企業從0到0.1孕育歷程,為工業互聯網平台把脈
獨家 | 安筱鵬之問:中國消費互聯網優勢能否自然遷移到工業互聯網?
航天科工董事長高紅衛:「中國有可能走出一條符合國情的『雲製造』之路」
「社交大王」騰訊,在產業互聯網生態里扮演什麼角色?| 獨家深度
獨家 |「大智移雲」之上,笑看哪些工業物聯網創業公司崛起?
「互聯網+」下半場 | 雲計算、大數據賦能製造業,任重道遠
林詩萬演講PPT:工業互聯網與工業大數據分析的應用
智庫,在新工業革命和智能製造進程中扮演什麼角色?
以航天雲網為例,探討中國工業互聯網發展之路
獨家 | 大「雲」壓境:阿里雲「虎視眈眈」製造業
解碼工業物聯網:一文看懂lloT 現狀和未來
李毅中、王民等縱論中國製造2025與智能化進程
演講 | 周宏仁:工業互聯網系統的基本思想,應用超越製造業
跨入智能互聯網時代——從連接到數據,從流量經濟到效率經濟 |深度長文
演講 | 林詩萬:工業互聯網戰線廣闊,要以業務價值驅動,避免打造面面俱到系統
工業互聯網產業聯盟(AII):推動中國工業互聯網發展的「旗手」
深度 | 工業互聯網與智能製造,須以解決業務問題為突破口
國研丨儘早啟動工業互聯網平台項目 搶佔國際有利地位
軍觀察 | 工業互聯網的崛起,是如何開啟「第三次浪潮」的?
深度觀察|當下工業互聯網發展狀況的六點思考
關於工業互聯網聯盟的那些事
後記 | 2017工業互聯網峰會透漏出的六點動向
【造奇智能產業新媒體】:國內第一家正式成立並開展運營的智能製造產業新媒體機構,聚焦新工業革命與智能時代的價值創造,以「深度影響智能製造進程,守望智能製造產業成長」為使命,聚焦智能製造、工業互聯網、工業4.0、數字化轉型及人工智慧、大數據技術在產業領域的應用。
聯接產業企業、大學、研究機構、政府、資本等產業核心力量,通過創新和融合力量,打造深度觀察、行業洞見、豐富資訊於一體的原創型、產業新媒體平台。
推薦閱讀:
TAG:通用電氣 | 工業互聯網物聯網平台 | 製造業轉型 |