大數據在能源管理中的應用:預測模型
來自專欄 機械數據工程師的未來
背景:全世界的汽車生產商現在越來越重視工廠節能,主要的目的有三點
- 降低成本。歐洲,平均下來製造一輛高爾夫大約需要3MW的能源,可以大約看成3000人民幣。就算只考慮製造過程(不考慮研發大樓等其他消耗),一輛車大約需要0.5MW-3MW能源。
- 環保法規要求。法律法規慢慢變得越來越嚴格,不光對於車輛的消耗有要求,而且對於生產過程消耗的能源也提出了更多的要求。
- 公眾的環保意識。節省了更多能源的企業,往往會被公眾認為是更先進的,更環保的,如果降低了生產過程中的能源消耗,也可以提升在市場中的形象。
機會:隨著工廠變得更智能化,我們可以採集的數據也越來越多。也隨著大數據技術進一步的發展,我們現在可以利用一些大技術的數據,來進一步提升我們的能源利用效率。
評價能源效率主要使用的KPI為MWH/car,也就是每輛車的綜合能耗。
文章的數據收集主要在歐寶集團以及PSA集團內部完成,相關因素比如天氣數據使用了開源的天氣數據。
數據處理以及分析主要使用了KNIME分析平台,R語言,Excel以及VBA。
應用場景:
- 預測:用歷史數據建模,使用規劃數據天氣數據等,預測未來的能源消耗。
- 更便於規劃
- 可以從能源供應商獲得更優惠的價格
- 可以有一個用來監測能源消耗的參考值
- 能源效率對標:不同的工廠有不同的大小,在不同的區域,有不同的一天氣,運行時間,不同的工廠設計、新舊,生產不同的汽車。這就造成了,雖然知道不同工廠的能源效率不同,但是很難知道具體的效率不同的原因,甚至無法知道哪個工廠是更有效率。
預測:
預測的關鍵:
- 影響因素:對於預測,不光是要求歷史數據可以獲取,還要求未來數據可以預測。預測結果的要求一是準確,二是穩定,三是應用簡便。經過分析,選取了生產車輛和工作時間來衡量內部工作,選取了天氣作為唯一外部影響。天氣使用degree days。
建模:
建模前期經過了數據清洗(去掉不合理數據,補充缺失數據等)以及特徵工程(使用Heating degree days 和cooling degree days 來代替溫度)。
經過文獻檢索,選取了四種最常用的預測方法。分別是:多元線性回歸,決策樹,隨機森林,神經網路。
預測的目標為每月的能量消耗。
測試:
選取了歐洲的六個工廠,分別是德國總部Ruesselsheim,Eisenach,波蘭Gliwice,英國Luton,Ellesport Meer,以及西班牙的 Zaraagossa。使用2013到2017的數據進行測試。一共進行了三次測試。測試預測結果好壞的標準為R square。
其中一個工廠的測試結果如下。
我們可以看到,當數據量達到三年的時候。幾乎所有的方法都可以相對穩定的預測每個月份的能源消耗。其中隨機森林以非常高的R2和穩定的測試結果成為了最合適的預測方法。
不過從其他工廠結果來看,工廠發生一些數據無法表達的變化的時候,是利用生產車輛和天氣,不包含工作時間的模型,可以更穩定的預測結果。當這種方法在一個新的工廠開始使用的時候,最好再進行測試,以便確定最好的方法。
應用:
這個預測模型的應用主要分為兩方面。一是預測未來的能源消耗。二是為能源效率提供一個標準。
預測消耗非常容易理解,為能源效率設定的標準,主要是以如下的方法實現。
將過去三年的數據帶入此模型中,分析模型結果和實際消耗的偏差。統計偏差的分布。
如果想要知道今年上半年的能源使用效率,將今年的數據代入模型,就可以得到使用的參考值,以及和實際值的偏差。這個偏差在分布中的位置,就說明了當前能源消耗的效率。
可視化、應用:
應用包括如下步驟:
將預測數據(生產計劃,排班計劃,近年平均天氣)帶入模型,得到預測值。
每經過一個月,講實際值填入,並且更具過去分布,得到狀態範圍(紅色,黃色和綠色)
對比狀態範圍和實際值,每個月定期檢測能源利用效率。
文章主要是應用方向,有興趣了解更多數據源,數據清理,具體實現,應用的可以持續關注
視頻參考:
自己製作的一個面向普通觀眾、偏應用的展示視頻:
優酷鏈接:
01_Prediction Demo_With Sound關注專欄持續學習
搜索「黑盒理論公眾號」,回復」能源「獲取論文細節以及參考資料
推薦閱讀: