P3-用 Tableau 來做電影數據可視化
Version-2 Changlog
- 在Q1中,去掉了對電影類型的部分限制
- 添加了Q3的儀錶盤
- 重新提出Q4並回答
- 在Q4中增加了小圖組
- 添加了篩選交互工具
項目背景
你是一名業務分析師顧問,你的客戶是一個電影製作新公司,他們將製作一部新電影。客戶想確保電影能成功,從而使新公司立足市場。他們希望你能幫助他們了解電影市場趨勢,使他們能做出正確的決策。他們提供了指導,希望你能研究以下三大領域:
問題 1:電影類型是如何隨著時間的推移發生變化的?
問題 2: Universal Pictures 和 Paramount Pictures 之間的對比情況如何?
問題 3: 改編電影和原創電影的對比情況如何?(通過keywords變數中的based on novel欄位來判斷)
更重要的是,客戶請你根據提供的數據,額外回答第四個問題。
提出問題
問題 1:電影類型是如何隨著時間的推移發生變化的?
問題 2: Universal Pictures 和 Paramount Pictures 之間的對比情況如何?
問題 3: 改編電影和原創電影的對比情況如何?(通過keywords變數中的based on novel欄位來判斷)
問題 4: 收入排名前10的導演的出片量及受歡迎程度
使用變數
original_title:電影名稱
keywords:與電影相關的關鍵字,按 | 分隔,最多 5 個關鍵字
genres:風格列表,按 | 分隔,最多 5 種風格
vote_average:平均評分
release_year:發行年份
budget_adj:根據通貨膨脹調整的預算(2010 年,美元)
revenue_adj:根據通貨膨脹調整的收入(2010 年,美元)
數據清理
- 使用excel清理超出列範圍的錯誤數據
- 使用excel拆分genres風格列表
- 使用tableau進行genres數據透視
- 使用tableau篩選器去排除非法值
Tableau可視化鏈接
https://public.tableau.com/views/movies_42/Q1?:embed=y&:display_count=yes&publish=yes
問題分析結果
問題 1:電影類型是如何隨著時間的推移發生變化的?
電影類型隨時間前進成增長趨勢,排名前三位的Drama、Comedy、Thriiler類型增長較快,其中Drama領先優勢明顯。
問題 2: Universal Pictures 和 Paramount Pictures 之間的對比情況如何?
兩個工作室的收入雖時間前進均為上升趨勢,無論從預算還是收入看,Universal Pictures均高於Paramount Pictures。
問題 3: 改編電影和原創電影的對比情況如何?(通過keywords變數中的based on novel欄位來判斷)
改編電影的片量遠低於原創電影,電影公司熱衷於拍攝原創電影。
改編電影的預算及收入,也遠低於原創電影。
隨時間變化,從平均收入來看,1990-2015年間,改編電影的平均收入幾乎都高於原創電影。尤其是1994年的《Forrest Gump》,表現極佳。
問題 4: 收入排名前10的導演的出片量及受歡迎程度
收入排名前10的導演中,Steven Spielberg表現出眾,力壓群芳。
在這10位導演中,分析其出片量及受歡迎程度,基本與收入成正比。收入高的導演,出片量和受歡迎程度都較高。
推薦閱讀:
※如何避免自嗨型的數據分析?你必知的三大法則
※霍建銓:誰說菜鳥就不會數據分析?
※python 基礎
※2.2 使用Python獲取運營數據-2
※python入門第四課——數據類型轉換