第一章:面向能源系統的數據科學(展望)

能源系統大數據挖掘研究展望

作為通用的知識發現技術,大數據挖掘在未來的能源系統中有非常廣泛的應用前景。從總體上講,大數據挖掘技術潛在的應用場景主要有兩類: 一種是目前已有較為成熟的建模技術,但模型求解的計算量太大,需要進一步提高計算效率的情況,例如電力系統安全評估; 第 2 種是目前尚無有效建模手段,或現有建模手段精度很低的情況。本節所討論的幾類應用屬於第 2 種情況。需要指出,大數據挖掘技術在能源系統中的可能應用無法窮盡; 受篇幅所限,僅列舉作者認為較有研究潛力的幾個應用。

負荷預測與負荷建模

電力負荷預測是電力系統規劃和運行的基礎。電力負荷受眾多因素影響,且相當多的相關因素由於難以觀測而無法收集到數據,因此難以建立直觀且精確的數學模型。所以,負荷預測屬於最早應用數據挖掘方法的電力系統問題。多種常用的數據挖掘方法,如前饋人工神經元網路、支持向量機、複發人工神經元網路、回歸樹等,已被應用於電力負荷預測之中。從總體上講,人工神經元網路等方法作為短期負荷預測工具已被電力工業界廣泛認可。然而,在很多文獻和實際應用中,採用了過度複雜的數據挖掘模型結構,而訓練數據量不足,從而影響了模型預測效果。這是由於未掌握數據科學的基本理論所導致的。

現有的基於數據挖掘的負荷預測方面的研究文獻主要集中於中短期負荷預測,但也有長期負荷預測的研究報道。就長期負荷預測而言,由於數據量不足和容易發生數據挖掘領域中的概念轉移 ( 即當時間跨度很長時,負荷變化所服從的概率分布不同) 等原因,尚不存在獲得工業界普遍認可的基於數據挖掘的有效方法。未來的大能源系統是電力系統和天然氣、供冷、供暖等系統融合的產物,已有將數據挖掘方法應用於天然氣、熱負荷和冷負荷預測的研究報道。

現有的多數負荷預測方法僅限於利用歷史負荷數據和溫度等天氣數據,外推得到未來的負荷,而對負荷組成和用戶行為無法進行精細化分析。隨著智能電錶的逐步普及,高頻負荷數據( 智能電錶採樣頻率一般在 1 /60 Hz 或更高) 的大範圍採集將變為現實,這為精細化的負荷建模與預測,以及對用戶用電行為的精細化分析奠定基礎。

利用智能電錶數據對負荷的組成進行分析,在文獻中一般稱為非侵入式負荷識別問題。這種方法一般通過分析智能電錶採集的負荷設備的電氣特徵信息,對具體負荷設備進行識別; 特徵信息通常包括電器設備的暫態和穩態信息,例如: 電流波形、設備的有功/無功功率、諧波、瞬時導納波形、瞬時功率波形、設備開關操作的暫態波形等。目前,有些文獻已經將支持向量機、人工神經元網路、倒頻譜分析、粒子濾波等方法應用於負荷設備識別。在識別負荷設備時,如何從各種電氣量的時間序列中提取有效特徵是提高識別精度的關鍵。考慮到深度學習中的自編碼、長短記憶網路等技術已經在語音時間序列等方面取得了極佳效果,未來可以重點研究深度學習技術在負荷設備識別方面的應用。

負荷設備識別是實現對負荷精細化建模的第一步。傳統的負荷動態模型和需求響應模型無法精確掌握負荷成分及其變化規律,只能假定一個模型可以在相當長的時期內是適用的。事實上,由於負荷組成是不斷變化的,因此負荷的價格彈性和動態響應等特性也自然是時變的。只有通過對用電數據進行數據挖掘獲取負荷成分的變化規律,才能建立準確的時變負荷模型,而這對實現精細化的需求側管理和分析主動配電系統的動態特性具有重要意義。因此,用電數據挖掘將是未來能源系統數據挖掘研究的一個重要課題。

電力系統與交通系統的融合電動汽車的電動機和車載電池等技術日趨成熟,電動汽車的滲透率可望不斷提高。利用電動汽車向電力系統反向送電等技術,能量可以在電力系統與交通系統間互相轉換。因此,電力系統與交通系統的融合會不斷加深,成為大能源系統的重要組成部分。

已有一些文獻將數據挖掘方法應用於電動汽車的相關研究之中。在設備層面,將模糊聚類、前饋人工神經元網路等技術應用於估計電動汽車車載電池的荷電狀態 ( state of charge,SOC) 。在車輛層面,利用馬爾可夫鏈等方法,對司機的微觀行為( 如加速、減速、換道等) 進行建模。利用前饋人工神經元網路對車輛的駕駛環境進行預測,並在此基礎上設計了最優車輛輸出功率控制策略。

在宏觀層面上,對電動汽車充電負荷精確預測是開展充電設施規劃與制定電力系統運行方案的前提。已有一些文獻報道了在電動汽車充電負荷預測方面的研究工作。這些研究工作的一般思路是: 首先估計各區域中電動汽車的總保有量及其中不同類型車輛的組成比例,隨後根據不同類型電動汽車的駕駛特性,利用模擬方法獲得各區域中的電動汽車充電負荷。考慮到電動汽車保有量和組成比例是不斷變化的,而同類型電動汽車的駕駛行為也可能有很大區別,因此模擬方法難以準確預測時變的充電負荷。

由於可以採集到包括充電站充電負荷、交通網路交通流量、電動汽車車載 GPS 軌跡等多種與電動汽車駕駛和充電行為相關的數據,這樣就可以利用數據挖掘方法從上述數據中挖掘電動汽車充電行為特 征。基 於 k 近 鄰 ( k-nearest neighbouring) 演算法提出了一種新的被稱為時間加權點積( time weighted dot product) 的時間序列距離指標,並應用於預測充電站的充電負荷。提出基於條件隨機場來挖掘車主充電行為與充電價格間函數關係的方法。由於充電站充電負荷、交通流量和車載 GPS 等數據分別提供了電動汽車駕駛行為的某個方面的信息,因此自然可以考慮應用上文介紹的多源數據融合方法。在融合多元數據預測電動汽車駕駛行為方面做了初步嘗試,採用多視角挖掘技術並融合 POI、交通流量與充電站負荷數據對充電負荷進行預測,之後在此基礎上構建了充電設施規劃模型。考慮到電力系統與交通系統存在諸多相互關聯的數據源,可以預見多源數據融合技術在電力系統與交通系統融合研究中具有廣闊的應用前景。

電力市場預測與模擬

西方多數發達國家在過去二十多年中已先後完成了電力工業的市場化改革。隨著 2015 年新電改 9 號文的發布,中國的電力市場建設再次拉開了帷幕。在市場化改革之後,現貨市場競價與出清會成為電力市場運營與電力系統運行的關鍵環節,這樣電價預測、競價策略和市場模擬等問題也自然成為重要的研究課題。

對現貨市場電價進行準確預測對發電公司制定競價策略具有重要意義。從總體上講,有兩種主要的電價預測方法。第 1 種是和負荷預測類似,將電價視作一個時間序列,忽略市場參與者的微觀行為,通過挖掘電價數據構建時間序列模型,並以此預測未來的電價。已有文獻報道了將前饋人工神經元網路、支持向量機、回歸樹、k 近鄰等多種方法應用於電價預測。這類方法主要適用於短期和超短期電價預測,且無法有效處理由於電力系統中的突發事件( 如發電機和線路故障) 所導致的電價尖峰現象。

預測未來電價的第 2 種方法是通過模擬市場參與者的競價行為和市場出清過程來實現的。電力市場模擬不僅能用於預測電價,還可用於評估發電公司市場份額、計算髮電投資收益、輔助市場機制設計等很多方面。基於多代理的電力市場模擬方法已有很多研究報道,其效果也在一定程度上得到了實際應用驗證。然而,市場模擬方法面臨的一個重要難題是難以準確模擬市場參與者的競價行為。現有文獻中的市場模擬方法通常假定市場參與者的競價行為是完全理性的,且一般假定市場參與者會按照均衡策略競價,或會採用特定的優化模型競價。然而,在現實中競價行為常常不可避免地存在非理性因素,同類型的發電公司和用戶由於實際制定競價策略的人員不同,競價策略可能會有很大差異。在很多國家的電力市場中,市場參與者的競價數據在事後是公開的,這樣若能聯合利用數據挖掘和基於多代理的市場模擬,採用數據挖掘方法挖掘不同市場參與者的競價行為特徵,則可能獲得更為準確的電力市場模擬結果。到目前為止,尚未見到在電力市場研究中結合數據挖掘和多代理模擬的研究報道,但這是很有價值的研究課題。

「信息—物理—社會」複雜系統的建模與分析

未來的大能源系統將是一個深度融合了物理、信息與社會系統的複雜網路系統。智能電網強調電力一次系統與工業信息系統的深度融合。隨著能源互聯網等新概念的提出,與智能電網相比,未來大能源系統的內涵將有大幅度拓展。在物理層面,大能源系統中將不僅包括電力一次系統,同時還將融合天然氣、交通等其他能源系統。在信息層面,大能源系統將不僅包含工業信息系統,還將與互聯網等通用信息系統實現深度融合,從而支持高可擴展性、即插即用等特性。在社會層面,隨著能源的市場化和能源系統與通用信息系統的融合,能源系統與人和社會的交互程度將大大加深。總之,大能源系統將成為一個典型的融合了「信息—物理—社會」的複雜系統( 或稱為「人機物」複雜系統)。隨著社會信息化程度的進一步加深,各種物理系統幾乎都在逐步加強與信息和社會系統的融合程度。對大能源系統的深入研究有助於建立更具一般性的「信息—物理—社會」複雜系統的理論與方法。

「信息—物理—社會」複雜系統的建模和分析是一個新的研究課題,目前尚不存在成熟的理論指導。對複雜系統的研究通常採用簡化論( reductionism,又稱還原論) 方法,核心思想是將複雜系統劃分為若干組成部分,通過分別研究各組成部分的特徵及其交互影響,最終獲得複雜系統的整體特徵。傳統的電力系統分析實際上大體遵循了這一研究思路,即首先研究各組件自身的數學模型,隨後研究各組件如何通過電力網路進行交互的數學模型,並以此為基礎研究整個系統的特性。在研究 CPS 的一些文獻中也遵循了類似思路,即先研究電力一次系統與電力信息系統的模型,隨後針對信息系統的網路時滯、數據丟失率等因素研究信息系統對於電力一次系統的影響。然而,上述簡化論思路未必能夠簡單推廣到「信息—物理—社會」系統之中,這是因為社會系統中人的行為具有很大的非理性和隨機性特徵,並且難以進行精確測量和量化,因而也就難以構建精確的數學模型。在現有的社交網路、電商推薦等涉及人的行為的研究工作中,數據挖掘方法已經取得了很好的效果。因此,在「信息—物理—社會」複雜系統的研究中,可以採用數據挖掘方法對社會系統建模,從而補足整個建模體系中所缺失的一環( 如圖 3 所示) 。

需要指出,簡化論方法也並非在所有複雜系統中都適用。有些系統可能具有不可簡化的特徵,即其整體特徵無法通過對個體特徵的分析導出。例如,在傳統的電力系統穩定性研究中,雖然對於系統內各類設備的動態特性可以建立較為精確的數學模型,但對於系統層面上的某些特性的機理( 例如電壓穩定) 則仍然無法準確地理解。在社會系統研究中,這一現象則更為突出。因此,基於「信息—物理— 社會」大數據,聯合採用數據挖掘方法與傳統數學建模方法,從整體研究「信息—物理—社會」複雜系統的特性,就有可能突破傳統簡化論方法的局限,在複雜系統建模與分析方面取得理論突破。

圖 3 對「信息-物理-社會」複雜系統的建模與分析

能源大數據對於其他研究領域的意義

能源大數據的用途事實上並不僅局限於能源系統研究本身,還可能在其他與能源系統緊密關聯的研究領域中發揮重要作用。一個典型例子是智慧城市與城市計算研究。城市計算研究的目的是利用信息化與城市大數據,研究智慧城市中急需解決的交通阻塞、能耗、污染、犯罪等問題。大能源系統與智慧城市關係密切。城市電力系統、城市氣網、電動車充電網路以及未來的分散式綜合能源網路都是智慧城市的重要組成部分。提高能效、降低污染是智慧城市研究所關注的重要問題。

城市計算研究已經嘗試分析了包括地理與 POI、個人出行軌跡、交通流量、空氣質量、氣象、社交網路等多類數據,用於解決城市規劃、交通路徑規劃、交通流量預測、空氣質量監測、雜訊污染監測、車輛油耗與污染計算等問題。然而,工業用電數據、家庭用電數據、電動汽車充放電數據等能源數據在城市計算中尚未被充分利用。事實上,能源數據與城市計算中已應用的其他類型數據互為補充,通過多源數據融合可能獲得重要的知識。例如,目前通過用戶出行數據和手機定位數據只能挖掘用戶在戶外的行為規律,而用戶的用電數據蘊含了用戶室內行為的有價值信息。因此,通過融合用電數據、出行數據和手機定位數據,就可能得到用戶行為的全景式模型。類似地,能源數據在城市規劃、污染治理、交通規劃等領域都有潛在的巨大價值。

結語

能源系統正在向著以電力系統為核心,以可再生能源為主要一次能源,電、氣、冷、熱多能源互補協調,一次系統與信息系統高度融合的方向發展。隨著一次能源系統與信息系統,特別是互聯網等通用信息系統融合的加深,其產生的海量數據會明顯超越現有電力系統分析理論與方法能夠處理的範圍。

數據科學是研究數據的採集、傳播、存儲、分析、應用的全過程的交叉學科,其核心目標是從大量數據中獲取知識。通過數據挖掘方法所獲取的知識,其本質仍然是數學模型。因此,數據挖掘方法與傳統的基於人工模型推導的研究方法並不矛盾,可以互為補充。

決定數據挖掘方法能否成功應用的因素很多,應當在適當的理論指導下合理應用。統計學習理論是當前學術界廣泛接受的,用於指導監督式學習的一種理論。此外,數據挖掘的結果與數據質量密切相關,本文對數據質量的基本理論與改進數據質量的方法做了簡要介紹。

數據挖掘技術尚在快速發展之中,本文概述了幾類當前受到廣泛關注的新技術。其中,深度學習融合了監督式與非監督式學習,基於多隱層的人工神經元網路結構,可以從數據中自動提取較為抽象的概念。轉移學習突破了統計學習理論的基本假定,可以利用服從不同概率分布但相互關聯的數據集來提高學習精度。多源數據融合通過利用來自多領域的異構數據集,完成僅利用單一數據集無法完成的任務。上述三類新技術在能源系統研究中均有廣闊的應用前景。

需要指出,大能源系統將是深度融合「信息—物理—社會」的複雜系統,傳統的建模方法在處理類似的複雜系統時面臨極大困難,而數據挖掘方法在 「信息—物理—社會」複雜系統的建模與分析研究中可能發揮關鍵作用。此外,能源大數據除了應用於能源系統自身之外,還可能在城市計算等其他研究領域發揮重要作用,值得深入研究。

參考文獻

趙俊華, 董朝陽, 文福拴,等. 面向能源系統的數據科學:理論、技術與展望[J]. 電力系統自動化, 2017, 41(4):1-11.


推薦閱讀:

Wi-Fi模塊在智能電網的運用 非接觸巡檢代替人工直接操作
微網是什麼,用漫畫告訴你

TAG:電氣工程 | 智能電網 | 數據科學 |