爬蟲數據分析【旅遊篇】

Kindle里有一本刷了3遍的書,一直不捨得刪,這本書的名字叫做《不去會死》,講述一個普通日本上班族在經歷了一場病痛之後,毅然拋下工作,去踐行他兒時環遊世界的夢想。

一人一車,接連穿越美洲、歐洲、非洲、中東,整場旅行耗時7年半。

有人問他得到了什麼,他去的時候兩手空空,回來的時候也空空兩手,但是,他去過瑪雅文明最早的遺迹 - 笛卡爾神殿,在清晨霧氣浮沉的時候,登上塔尖,等待神秘的金字塔群在迷霧中一座座浮現;他曾經駕著獨木舟,在加拿大的育空河裡賞著極光釣著鮭魚;他曾經駕著單薄的自行車,在非洲大陸,與大象、長頸鹿一同馳騁。

每次讀這本書,都有一種衝破枷鎖的衝動。

於是乎,我帶著對旅遊的嚮往,爬取了某旅遊網站國內和國外不同城市地區的遊記數據,目的在於洞察最受歡迎的旅遊地區,以及不同地區隨時間變化的遊記數量。

國內共計爬取了46個旅遊城市,從遊記數量來看,有以下分布:

Top10 旅遊城市分別是

如果你決定去北京旅遊,想避開旺季的話要怎麼做呢?

答案是避開7,8月,如果是杭州的話呢?

答案是避開3,4月。

爬取了 日本、泰國、蒙古、斯里蘭卡、台灣、新加坡、香港、馬來西亞、印度尼西亞、馬爾地夫、越南、尼泊爾、韓國、印度 11個國家和地區的數據,遊記數量有如下分布:

亞洲地區最受歡迎的旅遊地區是 香港,第二名是 韓國,第三名是 泰國,第四名是 台灣,第五名是 日本。

而從近兩年的數據看,韓國 已經取代 香港 成為亞洲第一受歡迎旅遊地區。

從近半年來的數據看更明顯,韓國 一騎絕塵,香港 跌到第三被 泰國 超過, 印尼 擠下 台灣 進入前5。

如果從節假日來看,今年五一勞動節,各個地方旅遊的分布是

最多人去 印度尼西亞,看來炎炎夏日大多數人還是選擇去海島玩。

去年的國慶節呢?

國慶節,天氣涼爽了許多,巴厘島立刻被大多數人拋棄,韓國 成了大多數人的選擇,不可忽視的是 台灣,很多人選擇國慶節過去。

春節呢?

泰國 是春節最熱門的旅遊地區,不可忽視的是衝進Top5的 新加坡。


想看更多的數據洞察,歡迎關注微信公號:washu66


推薦閱讀:

一個數據平台省了20個IT人力——敦奴數據平台建設案例分享
現在出去面試,開口閉口你會大數據嗎,你會分散式嗎。我要了解哪些專業術語才能顯得很懂的樣子?
送書|十年大數據,十年區塊鏈,兩技術如何共生演進?
萬億級的大數據市場緣何沒有誕生世界級巨頭?

TAG:数据分析 | 互联网 | 大数据 |