初探券商研報—基於網路爬蟲獲取2010-2016和訊網數據

眾所周知,儘管中國股票市場有大量的散戶存在,但是不可否認的是股票市場是一個非常專業的投資市場。其中證券公司的行業研究分析便是專業投資者的一員、行業研究員由於其較高的專業性和較高的工作強度,也被視為金融行業中的精英人才。根據和訊網的數據,當前每天券商發布研報數量大概在60份左右,一年有2萬多份(以前年度數量相比較少一些),那麼數量如此眾多的研報到底作用多大,哪家券商的研報質量評價高,各年度券商研報都有哪些規律。

本文對2010-2016年的券商研報進行了簡單分析,數據來源是通過python獲取的和訊網的研報信息,經過數據初步整理,獲得了90983條數據(由於個人技術原因,少部分研報信息並未獲取到)。數據格式整理如下:

Python數據輸出格式並不十分又好,基本信息有研報公司名稱、研報評級、發布券商、發布時間、研報公司股票代碼、研報公司行業、研報公司所屬省份、研報公司概念等,其中「henzhun」、「buzhun」和「yiban」是和訊網上關於每個券商研報質量評價佔比,分為「很准」、「一般」和「不準」三個選項,votesum是網友評價的的數量,時間截止為2017年8月18日,僅作為一定參考的依據,公司的行業分類和所屬地區數據來自於python的tushare庫。

1 看一下觀測期間各年度券商發布研報的數量:

由獲取的數據可以看出每年發布的研報數量在一萬份以上,研報數據在2012年達到15451份,2012年以後的研報數量減少且基本平穩,初步推測是基於2012年國際金融危機的影響。2016年研報數據較少,推測原因是基於2015年中國三次股災的影響,並且在2016年度股票市場的熔斷導致開盤時間不到1個小時,股票行情的萎靡不振影響了我們財經學子的就業,據悉當年度在許多券商出現2015級畢業生離職現象,當然一定程度上也影響力行業研究員發布研報的熱情,導致研報數量較少。

2 觀測各個月份券商發布研報的數量

可以看出各個月份發布研報數量存在明顯不同,3和4月份發布數量較多,原因是3和4月份為上市公司集中發布年報的時間,上市公司研報一經發布,很多公開的數據都出來,當然也是累壞了行研研究員們,從另一個角度來看,選擇在1和2月份發布年報的上市公司數量較少,可見多數上市公司存在「拖延」和「晚交作業」的情況。8月份研報數量較多,應該是上市公司發布半年報的密集時間,作為上市公司的期中考試成績,自然也受到行研研究員的關注。10月份的高數量原因暫時沒清楚,暫時猜測為股市所說的「金九銀十」行情?有研究的可以告知。

3 看一下券商行研研究員的勞模們到底有哪些

上圖是2010-2016年發布研報數量前十名的券商,從樣本數據可以看出,2010-2016年券商勞模為長江證券莫屬,長江證券發布的研報數量遙遙領先前十名的其他券商,並且是第4-10名的發布研報數量的2倍以上。作為中部最大的券商,長江證券近年來的發展有目共睹,自然和長江證券的辛勤努力是分不開的。從樣本數據來看,老牌券商如中信證券、中金和國泰君安的發布的研報數量並未進入前十,可能各個券商對各部分的發展重視程度不同。一些致力於發展債券市場、新三板等業務的券商發布的研報數量自然相對較少。

4 看一下各年度被券商看好的前十名的行業

從各年的行業分布圖來看,在各年度被券商被評為「買入」或「強烈推薦」評級的公司所屬的行業中,數量前十的行業大概佔據35%左右,表明前十名的行業集中度相對來說是比較高的(註:根據tushare庫的對行業的分類類似於新浪財經對行業的分類,細分行業大概有100多種)。從具體行業來看,1)2010年被看好的行業多數屬於傳統行業。 2)2011-2016年,各大券商最為看好的行業一直是軟體服務行業,足以看出高新技術產業在近年來一直受到重視。3)環境保護行業自從2014年進入前十以來,所佔比例一直在升高,可以看出券商對環保行業公司的重視程度,從側面反映國家層面對環保的重視。4)電器設備行業在觀測期間一直處在前十名,一定程度反映券商對製造業的關注和看好,畢竟製造業是國之根本。

5 看一下發布研報數量前十名的券商對行業的偏好程度

通過發布研報數量前十名的券商行業偏好的餅狀圖得到一些信息,比如對某一行業發布研報數量較多的券商很大概率對該行業研究比較深入,所以投資者在選取參考研報時可以有選擇的選取券商。由於券商研究中間存在一定程度的重合性,上表中前三名的行業存在一定重複性,所以只能起到一定程度的參考作用。如投資者想要研究的公司為百貨,可以優先選取光大證券和廣發證券的行業研報,此建議只作為參考。還要結合券商行業研究首席分析師的研究能力和券商的整體實力等因素綜合分析。

6 看一下各年度研報標的公司的地域分布情況:

從各個年度的地理區域熱力圖可以看出,觀測期間研報公司多數位於山東、江蘇、浙江、廣東、上海和北京幾個省市,一部分原因是由於這幾個省市上市公司數量較多,另一部分原因這幾個省市的經濟發展比較好,多數高科技行業公司多位於經濟發展比較好的低於。形成對比的是重工業上市公司較多的東三省,研報公司相對較少,西部地區更是稀少。可見地域差異還是非常明顯的

7.大家比較關注的一點,網友對於各個券商研報質量的評價。

文中選取網友投票數量大於4000的券商公司,然後將網友評價「很准」的公司進行分析。結果統計發現,被網友評價為研報發布質量最高的是東興證券,而「勞模」長江證券的排名也是高居第三,可見長江證券不僅勤奮而且成績也好。將評價前十名和發布研報數量前十名的公司進行比對發現,兩個指標存在大部分重合,表示越勤奮的券商發布的研報質量更可能得到網友好評。(really?)

8 從股價數據方面整體上看券商研報預測的準確性

基本思路上,將各年度所有券商評價為買入評級數量前十多的公司,獲取當年度該股票的當年開盤價和當年收盤價,獲取當年度滬深300指數當年開盤價和收盤價。比較股票的年漲幅是否高於滬深300指數年漲幅的15%以上。(註:多數券商將「買入」評級定義為標的公司股價漲幅高於滬深300指數漲幅15%及以上)。

經過整理獲取了每年10隻股票總共70隻股票,得到如下格式數據

然後分別計算股票的年度漲幅和滬深300指數的年度漲幅,比較股票的年度漲幅是否超過滬深300指數年度漲幅的15%。結果卻不盡如人意。70隻股票中只有34隻跑贏滬深300基準指數的15%以上(即符合券商對「買入」評級的定義),所以單從股價漲幅和指數漲幅來看,券商發布的研報質量在年度內的表現多數並不符合「買入」評級的定義。看來,券商的研報質量還是需要提高的。最後放出幾個達到券商「買入」評級的股票。

貴州茅台2016年漲幅超過滬深300指數漲幅15%還要多49%,所以好好學習,把工資用來買茅台絕對是一個不錯的投資選擇,參見現在茅台的股價,多少人的一個月工資購買1手茅台。

第一次做數據分析,做的也比較簡陋,希望大家提出意見在做修改。數據方面確實由於自己爬蟲技術還不夠精通,所以存在一些缺陷,不過樣本數量還可以,足以得出一些結論。互相學習,相互促進。


推薦閱讀:

做為一名大學生想了解自己感興趣的行業,但是行業研究報告買不起,請問有什麼好的方法?
未來 2 ~ 5 年,哪些領域將誕生千億級市值公司?
寵物行業的前景如何?
初級諮詢顧問如何提高思考問題的深度,產生自己的 insight?

TAG:爬虫 | 数据分析 | 行业研究 |