python3機器學習經典實例-第八章解剖時間序列和時序數據30
04-19
切分時間序列數據
這一節將介紹如何用pandas切分時間序列數據,幫助你從時間序列數據的各個階段獲得相應的信息。接下來將學習如何用日期處理數據集的子集。
- 建立slicing_data.py文件,並導入必要的資料庫。
import matplotlib.pyplot as pltfrom convert_to_timeseries import convert_data_to_timeseries
- 使用前一節中用到的文本文件,對該文本文件中的數據進行切分:
# Input file containing datainput_file = data_timeseries.txt
- 又一次用到第三列數據:
# Load datacolumn_num = 2data_timeseries = convert_data_to_timeseries(input_file, column_num)
- 假定我們希望提取給定的起始年份和終止年份之間的數據,下面做如下定義:
# Plot within a certain year rangestart = 2008end = 2015
- 畫出給定年份範圍內的數據:
plt.figure()data_timeseries[start:end].plot()plt.title(Data from + start + to + end)
- 還可以在給定月份範圍內切分數據:畫出數據:
# Plot within a certain range of datesstart = 2007-2end = 2007-11plt.figure()data_timeseries[start:end].plot()plt.title(Data from + start + to + end)plt.show()
結果顯示out
推薦閱讀:
※1024的爬蟲(1)
※100行深度學習文本分類
※社群學習第二關之Python基礎學習(一)
※Stack Overflow 報告:Python 正在令人難以置信地增長!