標籤：

大數據能源大數據預測

大數據在能源管理中的應用：預測模型

05-24

大數據在能源管理中的應用：預測模型

來自專欄機械數據工程師的未來

背景：全世界的汽車生產商現在越來越重視工廠節能，主要的目的有三點

降低成本。歐洲，平均下來製造一輛高爾夫大約需要3MW的能源，可以大約看成3000人民幣。就算只考慮製造過程（不考慮研發大樓等其他消耗），一輛車大約需要0.5MW-3MW能源。
環保法規要求。法律法規慢慢變得越來越嚴格，不光對於車輛的消耗有要求，而且對於生產過程消耗的能源也提出了更多的要求。
公眾的環保意識。節省了更多能源的企業，往往會被公眾認為是更先進的，更環保的，如果降低了生產過程中的能源消耗，也可以提升在市場中的形象。

機會：隨著工廠變得更智能化，我們可以採集的數據也越來越多。也隨著大數據技術進一步的發展，我們現在可以利用一些大技術的數據，來進一步提升我們的能源利用效率。

評價能源效率主要使用的KPI為MWH/car，也就是每輛車的綜合能耗。

文章的數據收集主要在歐寶集團以及PSA集團內部完成，相關因素比如天氣數據使用了開源的天氣數據。

數據處理以及分析主要使用了KNIME分析平台，R語言，Excel以及VBA。

應用場景：

預測：用歷史數據建模，使用規劃數據天氣數據等，預測未來的能源消耗。

更便於規劃
可以從能源供應商獲得更優惠的價格
可以有一個用來監測能源消耗的參考值

能源效率對標：不同的工廠有不同的大小，在不同的區域，有不同的一天氣，運行時間，不同的工廠設計、新舊，生產不同的汽車。這就造成了，雖然知道不同工廠的能源效率不同，但是很難知道具體的效率不同的原因，甚至無法知道哪個工廠是更有效率。

預測：

預測的關鍵：

影響因素：對於預測，不光是要求歷史數據可以獲取，還要求未來數據可以預測。預測結果的要求一是準確，二是穩定，三是應用簡便。經過分析，選取了生產車輛和工作時間來衡量內部工作，選取了天氣作為唯一外部影響。天氣使用degree days。

建模：

建模前期經過了數據清洗(去掉不合理數據，補充缺失數據等)以及特徵工程(使用Heating degree days 和cooling degree days 來代替溫度)。

經過文獻檢索，選取了四種最常用的預測方法。分別是：多元線性回歸，決策樹，隨機森林，神經網路。

預測的目標為每月的能量消耗。

測試：

選取了歐洲的六個工廠，分別是德國總部Ruesselsheim，Eisenach，波蘭Gliwice，英國Luton，Ellesport Meer，以及西班牙的 Zaraagossa。使用2013到2017的數據進行測試。一共進行了三次測試。測試預測結果好壞的標準為R square。

其中一個工廠的測試結果如下。

我們可以看到，當數據量達到三年的時候。幾乎所有的方法都可以相對穩定的預測每個月份的能源消耗。其中隨機森林以非常高的R2和穩定的測試結果成為了最合適的預測方法。

不過從其他工廠結果來看，工廠發生一些數據無法表達的變化的時候，是利用生產車輛和天氣，不包含工作時間的模型，可以更穩定的預測結果。當這種方法在一個新的工廠開始使用的時候，最好再進行測試，以便確定最好的方法。

應用：

這個預測模型的應用主要分為兩方面。一是預測未來的能源消耗。二是為能源效率提供一個標準。

預測消耗非常容易理解，為能源效率設定的標準，主要是以如下的方法實現。

將過去三年的數據帶入此模型中，分析模型結果和實際消耗的偏差。統計偏差的分布。

如果想要知道今年上半年的能源使用效率，將今年的數據代入模型，就可以得到使用的參考值，以及和實際值的偏差。這個偏差在分布中的位置，就說明了當前能源消耗的效率。

可視化、應用：

應用包括如下步驟：

將預測數據（生產計劃，排班計劃，近年平均天氣）帶入模型，得到預測值。

每經過一個月，講實際值填入，並且更具過去分布，得到狀態範圍（紅色，黃色和綠色）

對比狀態範圍和實際值，每個月定期檢測能源利用效率。

文章主要是應用方向，有興趣了解更多數據源，數據清理，具體實現，應用的可以持續關注

視頻參考：

自己製作的一個面向普通觀眾、偏應用的展示視頻：

優酷鏈接：

01_Prediction Demo_With Sound?

v.youku.com

關注專欄持續學習

搜索「黑盒理論公眾號」，回復」能源「獲取論文細節以及參考資料

推薦閱讀：

※傳統能源助力人類文明

TAG:能源大數據 | 預測 | 大數據 |