簡單的時間序列數據採樣和模擬股票折線圖

廢話不多說,直接上代碼。

既然標題是簡單的時間序列數據,那麼首先就是創建一個時間序列,其實也就是一段代碼的事。

pandas的date_range方法可以直接創建時間序列,其中可傳如參數還有不少,請自行實驗

然後我們按照月份對數據進行採樣,怎麼採樣呢,這裡有函數供我們使用。

首先創建Series

然後使用resample函數按照月份進行採樣,按照月份採樣,頻率是比較低的,也可以按照小時採樣。

按照小時採樣,這裡需要使用到ffill來填充數據,也可以使用bfill,和ffill不同的是,bfill是2月1號的數據往前填充,ffill是2月1號數據往後填充。

下面再看看畫圖。

畫圖這裡就創建一個股票數據,然後基於時間進行展示。

首先創建一個時間序列。

然後創建一個DataFrame,這裡就模擬阿里巴巴和騰訊的股票數據。

然後就畫一張圖出來。

有沒有發現這圖根本沒法看??這是因為我們的時間序列是每小時一個點,一共有八千多個點在這張圖裡面,所以說這個曲線十分不明顯,是一個很擁擠的狀態,那麼我們可以對這個時間序列進行採樣,把它改成每個星期一個點,我們看看怎麼改。

resample是不是很方便,用mean求得每周平均值。

然後就是畫圖了。

現在再看是不是好多了!當然還可以有更多實驗,按照自己的想法去改改看,都是可以的。

-----------------------------------------------------------------------

簡單的時間序列數據採樣和模擬股票折線圖就這些了,下篇文章就寫數據binning、GroupBy、Aggregation吧。


推薦閱讀:

《機器學習實戰》學習總結(六)——支持向量機SVM(一)
做數據分析里有哪些Python能做,而MATLAB不能做的?
利用python完成大數據建模前期數據準備
小說人物關係的可視化
seaborn可視化學習之distribution visualization

TAG:数据分析 | Python | 数据科学 |