比特幣價格能預測嗎?(附python代碼) #1

背景:

作者最近參加了某投行群面,莫名被cue到比特幣和區塊鏈。too young, too simple的作者因為被時代選中了,把知道的區塊鏈技術原理,將來的應用,可能的風險一股腦倒了出來。

最後大佬微笑的說,比特幣太扯了,不適合我們……

卒……

另外比特幣在2017年不時的出現在各大報紙頭條,最近又要進行硬分叉,於是好奇心發作,準備寫個系列,來研究下。

正題:

  • 好奇心1: 比特幣大漲,大跌當天,主流金融媒體都說了啥?

Step 1: 用python寫爬蟲,抓了《華爾街日報》五年內的所有關於比特幣的報道。在跟網站進行爬蟲與反爬蟲的鬥爭後,進行一系列的data cleaning。

Step 2: 用pandas_datareader.data包獲得比特幣歷史數據

Step 3: 再次數據清洗,因為謎一樣的19665倍漲幅......

Step 4: 將比特漲幅表與《華爾街日報》新聞表格合併(merge)

Step 5: 大功告成,讓我們看下當日漲幅最大的幾天到底新聞報道了什麼

Step 6: 其實只能說nothing special (內心小絕望),那我們再來看看單日跌幅前10

Step 7: 從step 6可以看出,比特幣幾次大跌都跟政策變化有關係,政策不確定性的確是電子貨幣的最大風險。

接下來,作者想到會不會波動最大的幾天,《華爾街日報》會「蹭」個熱度,狂發文章。

No. of news in WSJ is aggregated by Month

結果呢,發現《華爾街日報》這個量級的報社,的確是不太需要「蹭」熱度 (摔)

  • 好奇心2: 什麼可以用來預測比特幣?

Step 1: 江湖盛傳google trends對做項目有幫助,於是筆者試了一下,結果如下

Step 2: 終於有個相關的變數出現了,讓我們再做個rebase的圖

發現了嗎!Google Trends里的指數可以理解為比特幣價格的leading factor,漲跌都早於比特幣本身。

神馬?你以為自己要賺錢了?不不不,筆者認為在17年初之前,這項規律是符合的,因為畢竟知道比特幣的人並不多,但是在暴漲的17年,熱衷投資(投機)的買家都對比特幣已經有了了解,Google Trends預測的準確性應該會大幅下降。筆者試著看了下Google Trends里的相關搜索發現,大部分人搜索比特幣都是在詢價而不再是問「What is bitcoin?」, "Where can we buy bitcoin?"。

由於沒有數據源,沒有辦法知道各個相關搜索的歷史變化。

Step 3: 最後,我發現了一些奇怪的東西。下面我們來猜下,哪個國家搜比特幣搜的最頻繁?

中國?(我們根本上不去google好嗎)那是美國?日本?歐洲?答案是...

奈及利亞!!玻利維亞!!南非!!迦納!!斯洛維尼亞??? 筆者一臉黑人問號。(自行腦補表情包)

非洲拉美小夥伴因為通貨膨脹摧毀了你們的本身貨幣嗎?看來是時候找個時間,再寫個文章研究下了。(對,就得給自己挖坑,否則永遠不動筆)

Is Ghana Showing the Most Interest in Bitcoin? (有興趣的小夥伴可以看下這個報道)

BC: So the combination of smartphones and Bitcoin technology enables the people in Ghana to have access to the global economy, which is something they can』t do with their local currency?

TD: Exactly. One more thing that gets people involved is that it makes transactions very fast. And, in Ghana, bitcoin is valued higher than our local currency. So what happens is that people store bitcoins for maybe two months, three months on the exchanges. Then it appreciates and people change it to the local currency.

BC: So it』s not only used as a means of exchange but as a store of value to hedge against the volatility of the Ghanaian Cedi?

TD: Very good, and our company PMCedi exchanges bitcoins and other fiat currencies. We also exchange other crypto currencies such as Perfect Money and Litecoin.

簡單翻譯就是迦納人可以用只能手機買賣比特幣來參與全球的經濟,然後也可以用來對沖本國貨幣波動的風險。

Fair enough,用一個波動極高的比特幣來對沖本國法定貨幣的波動風險……

Step 4: 既然已經研究了Facebook,我們再來看看另一個不存在的網站Twitter

筆者針對twitter中的hashtag做了相關分析,得到了一些奇怪的東西。以太幣(Ethereum)作為業界老二情有可原,但是dogecoin, freebitcoin, robotcoingame都是啥?doge? 難道要再開一篇文章研究下整個電子貨幣的概況嗎?找出哪些是坑爹貨(如果不是全都坑爹的話)?

總結:

我們來回答下標題的問題,比特幣價格可以預測嗎?

經過一堆廢話,大家發現筆者只說明了一個問題,我們初步可以用google trends做為關鍵變數,預測比特幣的價格。(具體模型構建啥的,有時間再更新)

待填的坑:

  • reddit的點贊數,以及相關話題內容

其實在電子貨幣領域,有另一個網站比twitter更具有研究價值,那就是reddit。如果能分析時期reddit中比特幣的高票話題,可能會對接下來的研究有很大幫助。

Reddit是網頁新鮮事件和熱點事件的源頭,它也是互聯網最有趣的地方和有高度組織的鏈接集中處。

  • 其他新聞媒體

筆者這篇文章只分析了《華爾街日報》一家媒體,接下來準備嘗試《New York Times》和《Financial Times》兩家的報道。

  • 找到其他關鍵變數,實戰預測
  • NLP 自然語言分析

由於筆者時間有限,針對新聞內容沒有進行任何的分析,希望有時間能來填坑。

最後

大家什麼關於比特幣研究的歡迎提建議。而且,作為一個曾經學外語的寫這麼多代碼,你們不點個贊,給個打賞嗎。

熊本君新鮮出爐的公眾號

weixin.qq.com/r/yCnn-_j (二維碼自動識別)

熊本君的其他文章:

  1. 巴黎的地鐵/鐵路線路到底有多不靠譜?讓我們用數據說話
  2. 巴黎晚上去哪兒浪,讓python幫忙選

推薦閱讀:

TAG:比特币Bitcoin | 数据分析 | Python |