一條數據狗的上海房價研究

瘋狂的春天

年初上海的房價一夜沸騰,到處都是月上漲百萬的房子和日跳價十萬的交易,以及人滿為患的房地產交易中心。上月某日我打開滴滴快車,剛輸入虹口,居然發現自動補出』虹口區房地產交易中心』, 而且排名第一…

數據狗的俺自然去找分析報告了。但然而看起來大多有關地產的數據分析都比較宏觀,比如整個深圳的庫存和買賣的關係,銀行的政策和股市的興衰對房價的影響,各個城市的房價和收入比如何, 等等。

作為一個小市民,俺的問題就是那麼直白: 哪裡漲的快?! 有沒有更性感一點的回答呢?

先放個去年上海的房價增長地圖??

技術準備

有許多房價網站,有些亂的就像論壇,信息雜糅,也有些虛假繁榮,重複率很高,比如一套房子都能出現好幾次,還有很多已經關閉的交易仍然掛在網上,價格還是n年前的。

鏈家和搜房數據相對準確一些,但鏈家只做精做深一線城市,且早幾年的數據不多,也沒缺少租房數據(舊主頁有丁丁租房的連接)。相比搜房網是歷史久遠的老牌網站,積澱多,但傳說做低房價,數據不準,而且網站的組織比鏈家亂一些。

俺用node.js寫了個爬蟲框架,開始搜房和鏈家的數據之旅。

對於房子,宏觀而言,至少分為2個大的對象,一是小區,二是房源。一個小區有很多戶型,高低、面積、戶型、類型甚至年代各不相同,房源則涉及到具體的交易(當然複雜的情況下,一個房源在不同的時間能有多次交易)。每次交易有很多細節的信息,甚至細到最後一次看房的時間,一個月內看房的次數等等,但親身經歷告訴我,這些很細的指標有時也少登記漏登記,准性沒那麼高。

細的也不多談了,總之經過多次爬取或清洗,我的資料庫里存了幾張表,比如鏈家網的表有兩張:

小區表: 小區名字,經緯度,邊界信息,建成年代,物業公司,開發商,綠化率,容積率,樓房數,房間數,12個月的房價變化等。

交易表: 所屬小區,總價,均價,面積,戶型,樓層,房齡,裝修,七天里多少人看過,歷史上度少人看過,已經完成 & 歷史上交易時間等。

提前說一嘴,鏈家和搜房的數據是有所滯後的,正在交易的房子,很多已是過去的價格了,而已成交的房子,成交的時間要倒退幾個月才是發生交易的價格,何況為了避稅,很多人在簽署交易價格的時候會做低房價。

2000萬上海人有幾套房子?

從鏈家爬取的小區信息非常詳細,包括每個小區樓房的數量和房間的數量,其實搜房也有這些指標,估摸是從政府拿到的,因為即使某個小區沒有交易,這個小區的數據都還有,從這個數據,我count了上海房間總量,約600萬左右,上海的人口是2000萬,平均3點幾個人是能有一棟房子的。

這應該比較符合直覺吧,三口之家都應該有房,只不過有些人有幾套房子,而有些人擠隔板房。

政策的影子

所有正在交易的的房子里,89平的房子離奇的多,這是為啥呢?

這個答案很簡單,有一個政策是: 90平米以下契稅徵收為1%,90平米—144平米契稅為1.5%。144平米以上為3%,所以地產公司肯定料到,願意住90平和144平以上一點點的的人,肯定願意為了避稅,忍忍住小一點的房。所以,這就是這個曲線的中間和右邊的有兩個峰值的原因,而40-50平還有個峰值,老房子的標準大小就是這樣。

此外,這個政策出現在2006年,諢名『7090政策』,當年政府出來抑制房價上漲定的(2006年恰好也是近年來商品房建成最多的一年)。為了驗證這個,我們列一下2006年之前房屋面積的分布(還是有幾個小波峰,畢竟數據取自正在交易的房源,並非全量的房子,所以契稅政策還是會對交易政策產生一定的影響):

房價的骨骼

在知乎上眾多回答里,我很感興趣的是這個問題莫名的答案 中國樓市房價是否會崩潰?何時崩潰? - 房地產

複述一下,美國是一個州和州制度差異很大的地方,在不同的地區不同的制度,演化出了不同的房價。有研究對美國、澳州26個房價超高的城市的研究表明,其中有23個都有嚴格的「可持續發展」法案,比如舊金山灣區,5 / 6的土地是不能開發的,這麼整,房價怎麼會不高。

而一些城市,比如Houston,全美第4大城市,收入很高,但房價卻是美國前15的低, 有錢並沒有說明房價一定高。

我認同,供求關係才是王道。

看看我們的國家唄,這裡是上海,我們的數據也可以反推這一點,因為每個小區都有建成的年代和內含的樓房數和房間數,我們把近30年來按照年代進行累加,得到下圖了。

整個曲線橫跨1900年-2017年,沒錯,房子的建成年代還有2017年,因為鏈家已經把一些期房也考慮在裡面了。

06年以後,樓房的建設量一路往下走,13年之後,轉向更加劇烈的下滑。

事實上,這段時間裡,上海的人口也日趨飽和,直到去年出現負增長。有意思的是,知乎上還有答案從多角度論證上海市人口確實下跌。但房屋供應下降的更快,供需關係還是那麼強烈。在這個過程中,政府用壓低土地出讓量小心翼翼地維持著高房價。

這個曲線還有個問題,1994年建成房屋量超過了之後的任何時候。為什麼?直到俺問了地產行業的學弟蝦米皮同學才恍然大悟。1993年是全國性的房產熱。那時候全國都掀起了蓋房的熱潮,而很多房子了94年房價下跌和調控的時候才剛剛建成。

最貴的房在哪

感覺里,上海的發展比較分散,楊浦、徐匯、黃浦、浦東都有很多繁華的地段,各為中心。然而如果關注到均價十萬以上的近百個小區(別墅),這些點卻基本排列在一條東西走向的直線上, 西起佘山,路過西郊賓館一帶(如檀宮),最多的分布是在徐家匯的老洋房(還記得陳良宇當年的馬勒別墅么),然後穿過靜安區和黃浦區,浦東五道口周邊,最後一直到世紀公園周圍。

如果我們把低於十萬/平的房子去掉,這個線更加明顯。

對此,我忽然產生了一個猜測,上海十三五規劃,提到大力發展虹橋以西的地區,目前漲的也比較厲害,那這條最昂貴的線會不會一路向西,繼續填補版圖上的空白呢?

哪的房子最好賣

貴的房子不一定好賣,有些房子有價無市。比如北京的衚衕和上海的洋房,動輒上億不是誰都買的起,中產階級才是消費主力,他們決定了消費的高峰。

在搜房的數據里,對每個小區,有成交次數一項,因此我們可以看哪些盤買賣最多。

相對於高價房,交易量大的區域比較分散,比如莘庄、三林,之中也包含一些很貴的區域,比如新天地周邊的(不幸的是,看鏈家今年的數據,去年基本沒漲幅)

租房客在哪

好租的房子明顯又是另一道風景,掏空了市區點亮了郊區。

大部分亮點,都比較容易看到邏輯,比如張江園區附近的,上海交大附近的,浦東五道口附近的,松江大學城附近的,等等。

我想到的原因也比較明顯,第一是,小區大了,出租肯定就多,大小區當然郊區多,二是人口聚居地普遍在郊區,學校和大公司,現在都往郊區遷。

相信大家更關注房子漲價的邏輯。

7萬左右的房漲的快

許多人說,房價越貴,漲得越快。在收藏品、奢侈品上也是如此。

俺屌絲:去你丫的,匡我呢!買實惠點的不好么,1w5一平的房子能虧么?投資風險小啊!

然而,當我把上海市目前的房價按照1000分段,和在過去一年的上漲幅度畫成這麼張圖的時候,這個道理多少是對的,而且關係很明顯:

在上海,去年買今年7萬左右的房子是漲幅最快的,但過了7萬/平,這個收益就開始回落了。此外,我把交易總量也用灰線畫出來了,畢竟交易量很少的時候,可能一兩筆不正常的交易會影響平均價格。

對於這種情況,我是這麼理解的:

對於去年9月以來的房價漲價,多少是房屋置換引起的,所以300w以上的交易量很大。而賣掉的房子能套出很多現金,因此人們會利用30%的槓桿去買一套更大的房子,而他們能把握的現金決定了大部分人決定了房屋的大小和價格,以至於下面一段分析:

買市中心的房子好嗎

那麼,是不是地段越好,漲得越快呢?我把所有小區對了經緯度,畫在地圖上。由於去年上漲普遍比較兇猛,我以20%為界限,沒有到這個漲幅的,都標記成藍色,超過的是紅色,紅色越大上漲越多,藍色越大下跌越多。

我們看到,有幾個區域比較明顯,比如浦東陸家嘴及東、莘庄和七寶、青浦徐涇、普陀真如、楊浦新江灣城、寶山寶楊碼頭附近。

我放大兩個圖,第一個是浦東陸家嘴周邊,很有意思,陸家嘴的房子普遍漲了,但最好的江畔地段明顯漲價一般,而靠近東邊的地段卻漲勢洶洶,而這些房子,價格就在剛才提到的6-7萬左右。

所以,總體上,就去年而言,不適合買最好的地段,估值已經太高,退而求其次,周邊的地方漲幅倒是還不錯,我個人的猜測還包括了上面一段的觀點: 大部分改善型的置換,大家提供的資金也只能支持買市區但並不是最核心區域的房子。

開發商們,買誰家房子好

看這看那,房子tm太難選了,不過,房子是不是也有名牌效應呢,選了哪家造的房子,成功率就高一點呢?總有良心開發商選更好的地,造更好的樓,相對更低廉的價格。

因此,這裡統計了所有開發公司在上海的項目去年的平均漲幅。

不過真實的數據是,排在最前沿的都是在滬只有1-2個項目的公司,總讓人感覺這是運氣好的緣故,所以,我又加了一個條件,在滬必須開發過超過8個項目。

看完這個圖,你會吃驚嗎,很少聽過名字的兩家寶山打頭的企業,穩居房價漲幅榜的魁首,秒殺萬科、大華、綠地這樣的大開發商。

如果我們回憶一下房屋增長地圖,寶楊碼頭附近的區域也是非常厲害的,居於上海的前列。

直到一位地產公司的學弟一語道破:

去年寶鋼搬出上海呀…

沒錯,當你搜索寶鋼,很多網點就在寶楊碼頭附近,而這就是寶山房價漲的最凶的區域,這片區域的房子也是這幾個開發商建設的。

老房還是新房好

曾經住在老小區,周圍都是一群閑散的大爺大媽,每天出門,都有一種重返90年代或者提前32年後俺退休的感覺,無時不刻,我都想逃離這裡。

所以,俺的概念里,新小區必須比老小區居住舒適,價格昂貴,增值潛力大…..

數據好像殘忍地否定了我。

首先看均價和小區建成年代的關係,這個關係真是亮瞎了我的狗眼,房子越老,價格越高…

我只能這麼理解這件事了,城市擴張,越老的房子越位於城市的中心,在歷史的進程中,拆遷辦大浪淘沙,留下並在交易的老房子本身質量就就是老房子里比較好的,特別是解放前的…

去年一年的增長情況,也並沒有體現出新房子的絕對優勢,這條線好像是平的:

暫停鍵

好了,這篇就寫那麼多了。用數據粗粗地掃了眼上海的樓市,很多也就是印證了常識:

比如,房價取決於政策,並不是市場經濟完全能決定的。

比如,去年買5w左右的房子漲價最凶,你不要買最核心地段也不要買偏遠地段,買個比較貴的就可以了。

比如,有些事件很重要,寶鋼搬遷對房價的提升非常迅猛,搞得上海東北角各種指標一路往上走。

比如,房子真是個錯綜複雜的決策過程,有時候單獨的維度很難說明問題,比如房子的新舊。

可是,去年已經過去了,我再怎麼分析,也是歷史回放,知道了又怎麼樣,今年漲的快明年難道也漲的快么,你知道么親?

再者,每個人都有自己的限制,房子不是想買就買的商品:

比如我tm只有30w首付,你給我說400w房子漲價快這不是挑逗我么…

比如我公司在閔行區,你說半個上海外的寶楊碼頭的房子漲的快…

牛逼吹完,輪到俺賣關子了,下一步的探索能不能幫你解決一些問題呢??

先關注公眾號再說呀!!!

廣告

獸腦的世界: 記錄一條代碼狗下班後的發現之旅。

數據可視化 | 數據分析 | 演算法 | 數字藝術

如果覺得內容還行, 歡迎推薦給你的盆友圈????


推薦閱讀:

讓房子回歸消費品的本質

TAG:房子 | 大数据 | 数据分析 |