tableau數據可視化案例
文中的可視化圖均由tableau繪製。
1.1 數據展示
數據是來自美國紐約2016年5月份包括207個地鐵站點在不同時間節點以及不同天氣下的4.2649萬條人流量數據,共包含21個欄位。
1.2 數據說明
UNIT: Remote unit that collects turnstile information. Can collect from multiple banks of turnstiles. Large subway stations can have more than one unit.
DATEn: Date in 「yyyymmdd」 (20110521) format.
TIMEn: Time in 「hh:mm:ss」 (08:05:02) format.
ENTRIESn: Raw reading of cummulative turnstile entries from the remote unit.
EXITSn: Raw reading of cummulative turnstile exits from the remote unit.
ENTRIESn_hourly: Difference in ENTRIES from the previous REGULAR reading.
EXITSn_hourly: Difference in EXITS from the previous REGULAR reading.
datetime: Date and time in 「yyyymmdd hh:mm:ss」 format (20110501 00:00:00).
hour: Hour of the timestamp from TIMEn. Truncated rather than rounded.
day_week: Integer (0 6 Mon Sun) corresponding to the day of the week.
weekday: Indicator (0 or 1) if the date is a weekday (Mon Fri).
station: Subway station corresponding to the remote unit.
latitude: Latitude of the subway station corresponding to the remote unit.
longitude: Longitude of the subway station corresponding to the remote unit.
conds: Categorical variable of the weather conditions (Clear, Cloudy etc.) for the time and location.
fog: Indicator (0 or 1) if there was fog at the time and location. precipi Precipitation in inches at the time and location.
pressurei: Barometric pressure in inches Hg at the time and location.
rain: Indicator (0 or 1) if rain occurred within the calendar day at the location.
tempi: Temperature in ℉ at the time and location.
wspdi: Wind speed in mph at the time and location.
1.3 時間&人流量可視化分析
1.3.1 紐約市2016年5月每個地鐵站每天的人流量
顏色越深,人流量越大。
? 觀察2016年5月的每天每個站點平均人數變化情況,可以直接看出周末兩天搭乘地鐵的平均人數較少。
? 發現5月28日——5月30日這三天的平均人數較少。查閱資料發現: 五月份的最後一個星期一為Memorial Day 陣亡將士紀念日,放假一天。
? 59 St-Columbus,因為這邊下地鐵之後是中央公園,在這裡可以看到海獅表演,小企鵝和北極熊的中央公園動物園。
1.3.2 是否工作日&人流量關係圖
明顯工作日的地鐵人流量更大,而且工作日的人流量出現高峰,但是周末的人流量比較均勻,高峰不明顯。
1.4 站點&人流量可視化分析
將站點的經緯度導入工作表中繪製出站點地圖,圈的大小代表人流量的大小,據紐約市相關地鐵路線顯示,人流量較大的這幾個站點主要經過時代廣場、第五大道以及中央車站。時代廣場:是紐約市曼哈頓的一塊繁華街區,被稱為「世界的十字路口」,是全球最擁堵的地方之一。根據時代廣場的官方網站統計,每天有超過30萬人進入「時代廣場的中心」,人流量非常大。站點最密集且人流量最多的點都是集中在曼哈頓中城的區域,紐約曼哈形容為整個美國的經濟和文化中心,是紐約市中央商務區所在地,世界上摩天大樓最集中的地區,彙集了世界500強中絕大部分公司的總部,也是聯合國總部的所在地。曼哈頓的華爾街是世界上最重要的金融中心,有紐約證券交易所和納斯達克。
分析每個站點在工作日和周末的進出站的人流量情況。發現無論是工作日還是周末,紐約市地鐵站人流量最大的三個站點仍然為34 ST-PENN STA、34 ST-HERALD SQ以及42 ST-TIMES SQ,說明這三個站點處於紐約市繁華地段,是人們工作和娛樂的必經之路。
分析MAIN ST站點平均進出站的人流量,16-24點和0-4點是出站的人數更多此時很有可能是下班回家,4-16點是進站人數高於出站人數,有可能去上班。推測這個地方居住人數可能大於商業的人流數。
對MAIN ST在休息日和工作日各時間段的總的進出人流量對比,可以看到休息日出行人數減少,可以知道搭乘地鐵的人員當中,工作的人佔了很大的比重。在工作日可以看到4-12點是進站的高峰期,16-20點是出站的高峰期。工作日與休息日相比4-12點進站人數明顯增加,出站人數變化不大, 16-20點是出站人數明顯增加。
可以看到34St Herald Sq站點,進站高峰期跟前面的點是不一樣的。進站高峰期主要出現在16-20點。
在這個站點可以看到你工作日跟休息日,除了16-20點變化比較明顯,其他時間段的變化不像另外的兩個點這樣。工作日走勢整體走勢相同,同時區別於之前的站點。
查閱資料與前面的分析一致,法拉盛存在大量住戶,而34St Herald Sq主要為商業區。
? MAIN ST是屬於法拉盛,法拉盛是皇后區一個重要的交通樞紐,是7號地鐵的終點站,有24條巴士線路經過法拉盛,並且還能乘坐長島鐵路直通曼哈頓。成為紐約乃至全美最大的華人聚居地。
? 34St Herald Sq其位於曼哈頓,帝國大廈、梅西百貨和韓國城都位於Herald Square商圈,帝國大廈距離最近的地鐵站是在第6大道的34St Herald Sq站,有地鐵B、D、F、M、N、Q、R。梅西百貨是美國連鎖百貨商場,34街這家是紐約最大的一家。K-town是32街在第5大道和第6大道之間的部分,聚集了韓國餐廳、店鋪和超市等,並且大多數都是24小時營業。
1.5 天氣&人流量可視化分析
? 從前面6列可以看出總的平均人數較多,但是雨天的平均人數較少,而且大雨天周末平均人數明顯少於大雨天工作日的平均人數。
? 霧霾天氣的平均人數比在大雨天氣的平均人數影響小。
? 2016年5月的大霧天氣都在工作日,而薄霧天氣都在周末。
1.6 溫度&人流量可視化分析
https://www.zhihu.com/video/969498573200728064觀察2016年5月的每天每個站點平均人數隨溫度變化的情況,平均人流量隨溫度的升高而增加。(紐約五月份平均氣溫11-20度)。而且出現城市熱效應,越靠近城市中心溫度越高。
總結:
1、紐約地鐵人流量與經濟發展有關,從曼哈頓可以看出
2、紐約地鐵人流量與是否是工作日有關
3、紐約地鐵人流量與溫度、起霧、霧霾有關
(2016年5月的大霧天氣都在工作日,而薄霧天氣都在周末。)
4、紐約地鐵進出口高峰期與上下班時間有關
5、紐約地鐵進出口高峰期與區域有關
推薦閱讀:
※(R)如何利用plotly製作交互圖表,並導出為HTML文件
※Kaggle入門:House Prices Prediction
※這5款可視化利器,讓數據在屏幕上跳舞
※詞雲布局知多少