標籤:

數據分析 練手項目

這篇文章主要是獲取股票數據和簡易分析六隻股票,根據其走勢圖對股票進行預測。

定義問題

首先我們要確定選取那些股票,這裡我比較感興趣的股票是這六隻谷歌,亞馬遜,Facebook,蘋果,阿里巴巴,騰訊。選他們的原因很簡單,這六家公司都是已經成型的大公司,發展相對穩定,從長期看股價波動不會太大,而且盈利的可能性很高。我們需要獲取的是那些值得入手以及收益較高。

準備工作

我們需要導入以下幾個包,pandas包用於數據分析,pandas_datareader用於爬取股票數據,matplotlib.pyplot用於繪製表格,並且創建一個公司和股票代碼相對應的字典。

導入包和創建字典

獲取數據

首要獲取這六家公司的股票數據並核對數據信息。這裡用的是pandas_datareader包爬取的yahoo finance股票數據中2017年1月1日至2018年1月1日這六家股票的數據(爬取數據的過程並不穩定,所以有的時候會出現連接關閉的現象,需要隔一段時間再試一下)。

爬取股票數據

核對基礎信息,主要核對的是收盤價格(Close),成交量(Volume),數據量(count)。前兩個主要是用來數據分析,數據量主要用來核對因為有些股票會停牌一段時間。這裡僅以谷歌和騰訊的股票為例(騰訊比谷歌的數據量少3個)

數據處理

以谷歌為例,我們通過繪製線性圖可以看出,雖然在2017年5月至2017年9月股票波動比較大,但股票的整體形式是增長的,也是值得考慮的一直股票。

為了方便觀察,我將谷歌,亞馬遜和騰訊分為一組(A組);Facebook,蘋果和阿里巴巴分為一組(B組)

A組中可以很明顯看出亞馬遜今年雖然波動性較大但整體增長情況略高於谷歌,而騰訊和谷歌的增長趨勢相同但因為買入的價格不同,收益比率差異很大(具體數值後邊闡述)。除此之外,如圖1所示,谷歌和騰訊的成交量差異巨大,可能也是股價變化一個原因。

圖1. 谷歌和騰訊股票的交易量比較

B組中最值得關注的就是阿里巴巴,雖然在年末有些下滑,但整體來看是漲勢最凶的之一股票,值得持續關注。

當然除了趨勢以外,我們最關心的就是今年這六隻股票中,哪只收益比率最高。首先我們先設定函數,用其進行數據處理,並得出我們所需的收益比率(因為騰訊的數據量有變所以另設函數,方法相同)。

圖2.股票的收益率

如圖2所示,不難看出,阿里巴巴和騰訊是今年收益率較高的兩隻股票,分別為0.95和1.14。而通過數據也可以看出,雖然谷歌和騰訊漲勢幅度相近,但收益率相差極大。

分析結果

從分析結果來看,這六隻股票雖然短期內有所波動,但整體還是增長的,其中阿里巴巴和騰訊是過去一年裡收益比率較高的兩隻股票,且從趨勢來看,整體還是呈現漲幅狀態的。


推薦閱讀:

用Python做數據分析
0基礎包教會 | 數據分析環境搭建:jupyter配置python & r kernel
數據分析師面試怎麼做
數據分析第三關,簡單數據處理
皇帝與太子,不,前太子

TAG:數據分析 |