票房數據脫水後,到底誰在裸泳?

眨眼就周二了,離周末已經不遠了。如果你想周五晚上先帶女朋友去看電影,訂票之前聰明的你肯定會查查評分和票房,對么?畢竟挑個好電影可不是件小事,這關係到小100塊錢的支出和兩個人的美好時光……

即使你不喜歡看電影,你也有可能比影迷更關注評分和票房:假如你在炒影視股。你不希望錯過在火爆片帶來的看漲行情中賺一筆,也不希望被大爛片帶來的下跌行情套牢。比如2017年8月與《戰狼2》票房爆棚同步的北京文化股價上漲。

可是你有沒有問過自己,把妹炒股這麼大的事,你查的電影評分票房數據可靠嗎?

關於評分的可信度,數據冰山去年專門做過豆瓣評分的數據分析。詳見:

  • 豆瓣的電影評分靠譜嗎? —— 一點數據分析的視角:通過豆瓣和參考基準IMDB對於同一組影片評分的對比,分析出豆瓣評分總體靠譜的結論,並指出在個別類型上豆瓣用戶與IMDB用戶有不同偏好。
  • 為什麼這部電影的豆瓣評分我不認可?—— 一點數據分析的視角:提醒查分者不光關注豆瓣平均分,同時關注一下高低分豆友分布,了解該片是有口皆碑,還是兩極分化。

關於票房的可信度,我們見過一些定性的爆料:

  • 2016年的中國電影票房到底「注了多少水」?
  • 如何評價馮小剛電影《我不是潘金蓮》的刷票房行為?
  • 如何看待捉妖記安排15分鐘一場的刷票房行為?

這些「刷票房」的相關報道提供了一些定性的證據和粗粒度的大致拍算,但是沒有就具體影片在某一時間段逐場次進行「票房可信度」定量分析的方法和結論。

本文以一部近期上映的國產影片為例,利用公開數據,提出從排片、票價和選座三個維度進行定量分析的方法,定義票房可信度並展示分析實例。文章包括六個部分:

  • 選片
  • 票房數據
  • 排片異常
  • 票價異常
  • 選座異常
  • 結論

一、選片

在剛過去不久的清明小長假的前一天,有這麼一部喜劇愛情片上映,三年前拍的,等到演員都紅了才上映,主演是最近當紅的馬思純跟張若昀,豆瓣顯示僅不到3000人「想看」,而貓眼的熱度竟有40000人標記「想看」。沒錯,我們說的正是這部《奇葩朵朵》。下圖是它的豆瓣及貓眼評分:

二、票房數據

我們這次篩選了四個一線城市以及三個具有代表性的二三線城市,對每個城市各區域電影院進行隨機抽取。具體來說,我們在北京、上海、廣州、深圳、鄭州、保定和石家莊這七個城市各隨機抽取了10%的影院,共279家,進行影片排片時間、價格、影廳與選座數據爬取分析。由於發生選座購票時影院會把數據同步到所有購票平台,所以我們僅對貓眼電影平台的公開選座購票數據進行爬取分析,時間段是從4月4日到4月12日共9天。

《奇葩朵朵》這部影片,從4月3日23:59起到4月4日上映當天,這279家影院里共排片1334場,是當天排片數量排第二的電影。排片最高的為當天同時上映的《暴裂無聲》,在同樣影院里共上映了1584場。從4月4日到4月12日,279家影院共上映5118場《奇葩朵朵》,下面是具體的排片數量變化:

(7座城市279家抽樣影院《奇葩朵朵》4月4日-4月12日排片數量。)

從場次規律上看,《奇葩朵朵》在上映第一天之後,就從1300多場急劇減少到800場以下,上映後首周維持著每天300到500場的排片數量,平均每家影院每天一兩場。截止至4月16日,在上映了13天之後,《奇葩朵朵》在全國的院線排片率已經低於1%。

下圖是《奇葩朵朵》在7個城市的排片數量對比,可以看到上海排片數量最多。雖然鄭州、石家莊和保定抽取的影院數量相當,但保定的場次數量比鄭州、石家莊兩個城市要少60%以上。相比之下,保定人對《奇葩朵朵》可能不那麼感冒?

( 279家抽樣影院《奇葩朵朵》4月4日-4月12日7城市排片數量分布。)

三、排片異常

正常電影放映,同一影廳,當然是上一個片子放完了,休息幾分鐘換場,然後再放下一個片子。但是,《奇葩朵朵》場次數據顯示,在同一天同一影院同一影廳,居然出現了前面場次的影片還沒結束,就繼續放映下一場的情況。這種重疊場次我們計為「排片異常」場次。

《奇葩朵朵》片長為98分鐘。排片異常的例子如下表,在某些影院同一天同一影廳,上一場的電影才放映了5分鐘馬上就開始下一場放映。

(《奇葩朵朵》排片異常場次實例)

當然,我們沒有實地考察,不能確認影院是真的只放了5分鐘片頭就重新再放一遍,還是安排了並無放映的「幽靈場」。這種排片異常存在於多個城市多個影院。下圖是排片異常場次在各城市的分布:

(279家抽樣影院《奇葩朵朵》排片異常場次在7座城市的分布。)

從圖中明顯看出,排片異常場次在上海出現最多,其次為深圳。在這些數據樣本中,我們發現有些異常場次,同一放映廳在15分鐘內放映兩次或更多次《奇葩朵朵》,並且連續場次的上座率都高達50%以上!真是奇葩盛開。希望有實地看過這種場次的朋友在評論區留言,說說看這種連場電影是怎樣一種體驗。

四、票價異常

我們知道影片的票價一般有如下規律:

  • 一線城市的票價總體比二三線城市的票價要高,市中心區的票價比郊區要高。
  • IMAX放映廳與VIP放映廳的票價比普通3D影廳高,普通3D影廳的票價比普通2D影廳高。
  • 晚上17點到22點的黃金時段比午夜場次高,中午12點之前的場次票價最便宜。

儘管有這些差異,國產2D影片非VIP廳網上優惠票很少超過50元。

《奇葩朵朵》是一部普通2D國產影片。通過北上廣深石鄭保7個城市的數據可以發現,除去VIP影廳外,它的平均票價僅為37元人民幣,標準差為7元。那麼問題來了:你會花50元或以上的單價在貓眼上購買一張《奇葩朵朵》的優惠票嗎?對於國產2D影片在貓眼平台的優惠票來說,50元的單價幾乎是均值以上兩倍標準差。即使是正態分布,高於50元的概率僅僅為3.2%。

而這些場次票價的真實分布如下:

這裡,我們暫不考慮影城地段和城市的差異,先簡單粗暴地把超過50元的票定義為「票價異常」進行統計分析。我們將來可以用更細緻的方法來分地段分影城定義票價異常的閾值。這裡重點是分析方法,如有誤判,正態分布的誤差上限為3.2% 。若有認為50元一張的普通2D廳《奇葩朵朵》優惠電影票不算貴的讀者歡迎留言~

我們統計出,在5077個非VIP場次中,有188場票價高於50元,佔比3.7%,超出正態分布0.5個百分點。其場次信息與上座率如圖:

我們可以看到,上海北京深圳的超過50元票價的場次最多。在188場中,有16個高價場次的上座率竟然高於40%。40%有多高?對比一下,《奇葩朵朵》這9天5118場的平均上座率才11%。平均每位觀眾會發現自己身邊有8個遼闊的空位,體會一下這個畫面。

五、選座異常

按常理來說,大家在選座看電影的時候會優先挑選靠近銀幕中間較為後排的座位。這些對於常人來說是「好座位」。較偏和最前面的座位是「差座位」。如果購票時發現大面積差座位比好座位還先出票,我們定義為「選座異常」。

具體地說,對於100人以上的中型影廳來說,最前3排、最靠左兩列和最靠右兩列我們定義為「差座位」。對於僅容納幾十人的小型影廳,我們定義最前2排、最靠左一列和最靠右一列為「差座位」。當出現「差座位」的上座率反而比「好座位」還要高時,我們就算「選座異常」。如下圖以前《捉妖記》的例子,第7排第8排中間的黃金座位居然大家都躲著:

經統計,在5118場放映場次里,共有262場出現「差座位」的上座率顯著高於「好座位」,出現「選座異常」,而且這些場次整體上座率都在25%以上。與之強烈對比的是,剩下的4856個場次里「好座位」的上座率都比「差座位」要高,屬於「選座正常」場次。

當我們對比正常場次和「選座異常」場次的總體上座率,我們發現異常場次的上座率反而高於正常場次。如前所述,《奇葩朵朵》在279家影院里的總體平均上座率為11%。有趣的是,「選座正常」場次平均上座率僅僅是9%,而「選座異常」場次的平均上座率卻高達43%。這些「高分學生」雖然只佔全班5%的名額,卻憑著「成績優秀」成功拉高了全班平均分。

這就是說,當影廳出現明顯異於常人的選座行為時,這些場次的上座率卻是正常場次上座率的將近5倍!看來主動把好座位留給後面觀眾的雷鋒們真的喜歡扎堆觀影。

那麼去哪些影院有更大的概率邂逅這些成群的雷鋒呢?下圖是按選座異常場次排名時名列前茅的影院:

我們發現,有9家影院9天內出現10場以上選座異常,平均超過一天一場。如廣州五月花電影城有52場《奇葩朵朵》出現選座異常,深圳星際銀河影城(坪山坑梓激光巨幕店)有19場,北京華誼兄弟影院(洋橋店)有13場。在這些場次里,不少非黃金時段上座率竟然高達80%甚至90%。

六、結論

根據以上排片異常、票價異常、和選座異常的場次識別以及各個場次的上座率,我們可以定義一個「票房可信度」,剔除異常場次帶來的票房銷量:

如果忽略各場次票價差異,這個用「票房銷量」計算的可信度可以近似「票房金額」的可信度。

對於《奇葩朵朵》,統計上述三種異常情況的交集,得出有顯著異常場次275場,平均上座率43%;總場次為5118場,平均上座率11%。代入上述定義公式,得出《奇葩朵朵》這9天在7城市近300家影院5000多場次的綜合票房可信度為79%。

反觀票房金額,《奇葩朵朵》在上映前兩天的的票房比同在4月4日上映的懸疑片《暴裂無聲》還高,雖然後面排片率與票房都持續走低,截至到上映12天,票房金額已經突破了3000萬,即使真的打八折,作為一部支付明星走紅前片酬的低成本愛情喜劇片來說也算是一個不錯的表現了。

「票房可信度」這個概念是我們以正常電影觀眾的行為習慣作為基準,剔除三種異常場次所銷售的座位比率而得到的。我們並沒有實地考察各種異常場次的深層原因。若院線或發行商對我們指出的「異常」有更為合理的解釋,請在討論區留言,我們非常願意不斷從行業專家那裡學習新知識來調整我們的分析方法和分析參數,使我們的「票房可信度」計算工具不斷優化,更加反映實際。

據環球網報道,「《奇葩朵朵》由霍爾果斯我行影業有限公司、北京金色名邦影業有限公司、上海金杖資產管理中心(有限合夥)、霍爾果斯眾合千澄影業有限公司、引泉影業(上海)有限公司、深圳火尚文化傳播有限公司聯合出品,上海電影(集團)有限公司、上海海上影業影視製作有限公司出品。霍爾果斯我行影業有限公司、霍爾果斯眾合千澄影業有限公司擔任發行。」霍爾果斯這個西北邊境城市由於有國家稅收優惠政策,近年來有不少影視公司在霍爾果斯註冊。

但是,時光網和貓眼網的信息並沒有這麼豐富。時光網的製作發行欄僅僅標出:「製作公司:1. 上海電影集團公司 [中國] ;2. 海上影業 [中國] 」。貓眼網僅僅標明出品人為任仲倫,「曾是中國作家協會全國委員會委員,上海文廣影視集團副總裁,上海電影集團公司黨委書記、總裁,上海電影製片廠廠長。」

有趣的是,在之前提及的排片異常場次中,有不少出現在SFC上影影城(世博店)、SFC上影影城(寶山店)、SFC上影影城(徐匯綠地濱江店)和SFC上影復星影城(宜川路店)這幾家影院里。

SFC是什麼?這是Shanghai Film Co., Ltd.的縮寫,見上海電影股份有限公司官網。

文: @Cheung 理查德

特別鳴謝: @張戎 @孫競

可視化支持:wentu.io

更多文章關註:數據冰山-知乎專欄

推薦閱讀:

TAG:電影票房 | 奇葩朵朵電影 | 數據分析 |