P3-用 Tableau 來做電影數據可視化

P3-用 Tableau 來做電影數據可視化

Version-2 Changlog

  1. 在Q1中,去掉了對電影類型的部分限制
  2. 添加了Q3的儀錶盤
  3. 重新提出Q4並回答
  4. 在Q4中增加了小圖組
  5. 添加了篩選交互工具

項目背景

你是一名業務分析師顧問,你的客戶是一個電影製作新公司,他們將製作一部新電影。客戶想確保電影能成功,從而使新公司立足市場。他們希望你能幫助他們了解電影市場趨勢,使他們能做出正確的決策。他們提供了指導,希望你能研究以下三大領域:

問題 1:電影類型是如何隨著時間的推移發生變化的?

問題 2: Universal Pictures 和 Paramount Pictures 之間的對比情況如何?

問題 3: 改編電影和原創電影的對比情況如何?(通過keywords變數中的based on novel欄位來判斷)

更重要的是,客戶請你根據提供的數據,額外回答第四個問題。

提出問題

問題 1:電影類型是如何隨著時間的推移發生變化的?

問題 2: Universal Pictures 和 Paramount Pictures 之間的對比情況如何?

問題 3: 改編電影和原創電影的對比情況如何?(通過keywords變數中的based on novel欄位來判斷)

問題 4: 收入排名前10的導演的出片量及受歡迎程度

使用變數

original_title:電影名稱

keywords:與電影相關的關鍵字,按 | 分隔,最多 5 個關鍵字

genres:風格列表,按 | 分隔,最多 5 種風格

vote_average:平均評分

release_year:發行年份

budget_adj:根據通貨膨脹調整的預算(2010 年,美元)

revenue_adj:根據通貨膨脹調整的收入(2010 年,美元)

數據清理

  1. 使用excel清理超出列範圍的錯誤數據
  2. 使用excel拆分genres風格列表
  3. 使用tableau進行genres數據透視
  4. 使用tableau篩選器去排除非法值

Tableau可視化鏈接

public.tableau.com/view

問題分析結果

問題 1:電影類型是如何隨著時間的推移發生變化的?

電影類型隨時間前進成增長趨勢,排名前三位的Drama、Comedy、Thriiler類型增長較快,其中Drama領先優勢明顯。

問題 2: Universal Pictures 和 Paramount Pictures 之間的對比情況如何?

兩個工作室的收入雖時間前進均為上升趨勢,無論從預算還是收入看,Universal Pictures均高於Paramount Pictures。

問題 3: 改編電影和原創電影的對比情況如何?(通過keywords變數中的based on novel欄位來判斷)

改編電影的片量遠低於原創電影,電影公司熱衷於拍攝原創電影。

改編電影的預算及收入,也遠低於原創電影。

隨時間變化,從平均收入來看,1990-2015年間,改編電影的平均收入幾乎都高於原創電影。尤其是1994年的《Forrest Gump》,表現極佳。

問題 4: 收入排名前10的導演的出片量及受歡迎程度

收入排名前10的導演中,Steven Spielberg表現出眾,力壓群芳。

在這10位導演中,分析其出片量及受歡迎程度,基本與收入成正比。收入高的導演,出片量和受歡迎程度都較高。


推薦閱讀:

如何避免自嗨型的數據分析?你必知的三大法則
霍建銓:誰說菜鳥就不會數據分析?
python 基礎
2.2 使用Python獲取運營數據-2
python入門第四課——數據類型轉換

TAG:數據可視化 | 數據分析 |