城市引力模型在預測客源中的應用
關於封面,我也不知道為什麼,反正百度搜「萬有引力」它就出來了,看來百度很了解我的口味嘛~
註:
以下內容無乾貨!
以下內容無乾貨!
以下內容無乾貨!
老實說,一般放在這的,都不怎麼會是乾貨……因為做出來的乾貨都被公司拿去了,屬於商業機密,我不敢放出來……所以放些私人濕貨吧,大家一起討論著玩。
城市引力模型是研究城市經濟影響力範圍從而城市區域辨識的方便工具。早在1858年,卡利(H.C.Carey)就參照牛頓萬有引力定律(兩物體間的引力與其質量的乘積成正比,與其距離的平方成反比),提出過兩地區的互動量公式:I = PiPj / d^2
,式中,I為互動量,PiPj為兩地的人口,可視為「城市質量」,d為兩地之間距離;1931年,瑞利(W.J.Reilly)又將該公式加以發展,提出分析城市之間的某地受二城市商業吸引力作用程度的公式:Si n/ Sj =(Pi n/ Pj)·(Dj / nDi)^2,式中,Si、Sj是i、j兩個城市對其中間某地的居民出售貨物的相對數量,由公式可知,它決定於兩城市間的人口(P)對比和與兩城市之間的距離的平方(約為銷售區)的共同作用。
空間相互作用表現為兩個不同區域之間的商品流動、資金流動、區間貿易、上下班通勤、旅遊流動、學生入學、人口遷移、參加會議、信息流動、公共設施和私人設施的利用乃至知識的傳播等等現象之間的關係,是研究城市經濟引力的入手點。這種空間相互作用的經濟效果主要和經濟作用點的區域規模、考察對象之間的距離和介質的連通性質緊密相關。例如,同樣距離為50公里的到上海的某地和到綿陽的某地,在購物便利性、工作機會的易獲得性、與博物館的鄰近性、與鄉村生活方式的接近程度等方面,分別受上海和綿陽的影響大不相同,因為上海、綿陽的經濟規模不同;其次,上海對蘇州和揚州的經濟作用、文化影響等有明顯差異,是由於上海距離蘇州和揚州的遠近程度不同的緣故;再次,南通、蘇州與上海距離相近,但是每天蘇州與上海之間的遊客明顯地大於上海與南通之間的遊客,這是因為上海與南通之間有長江的阻隔,空間介質不同。這些的差異說明空間相互作用受多種因素影響,但是主要的因素是空間某區域本身的經濟質量和它與能夠產生影響的地方的距離。依據這種事實,人們建立了引力模型:
Fij = GPiPj / Rij^2
式中,Pi、Pj為兩個城市的人口數量,表示城市規模;Rij表示兩個城市之間的距離;Fij表示兩個城市之間的引力。可見,城市間的引力與城市規模成正比,與城市間距離的平方成反比。
城市經濟學-城市引力模型
基於這個街知巷聞的公式,在網上很不認真地找來一份數據「2013-2014年中國最新城市人口排名及GDP排名」,結合2013-2014年深圳的進出港客流數據做了幾個初步檢驗。
套入公式,深圳與某地的客流量V=(GP深)*Px/Rx^2,V是兩地航空客流量,P深是深圳人口,GP深可以看作是常數係數,Px是目標城市人口數,Rx是深圳到目標城市航線距離,深圳人口既定,手上也沒別的城市的進出港數據,減掉一個變數值,同時把(Px/Rx^2)當作一個整體來看。因為手上沒有Matlab,用Excel畫圖還是盡量二維數據吧……
然而……出來的數據完全無法回歸……於是又換了GDP數據,不行……人均GDP也不行,什麼玩意嘛……差評啊……
考慮到相距較近的城市對之間的可替代交通工具太多,空路客流量不能準確反映整體流量,於是把相距一千公里以下的數據全都去掉(OS:你以為一千公里以上就沒有可替代交通工具了么,天真……),得到結果如下:
情況稍好一點,但是也沒得到理想的擬合效果。
仔細看第一個散點圖,散點主要分布在兩條直線上,於是猜想是否會有兩個類型的城市對,分別有不同的客源情況。
於是按著y = 291630x -n60113將數據分成兩組,結合此前拿到的另一份航線性質分類數據,可得以下。
第一組數據:散點位於 y = 291630x -n60113上方的城市。
深圳出發到上述城市的航線性質明顯偏公商務、旅遊。
第二組數據:散點位於 y = 291630x -n60113下方的城市。
深圳出發到上述城市的航線性質明顯偏返鄉、探親。
按著分組數據,再來一次。
擬合情況來,商務、旅遊城市出來的結果會好些,返鄉、探親城市的結果不算理想。分析:- 出發至商務、旅遊城市,選擇空路的幾率會大些, 樣本數據更能體現整體狀況,而出發至返鄉、探親城市,時間上不急切的話,結合經濟條件考慮出行性價比,選擇地面交通的概率會偏大;
- 數據只能採集到深圳的,深圳作為移民商業城市,特徵有二:本地人口並不佔城市人口大份額、商業發達。深圳與另一商業、旅遊城市的關係,能更加直接反映在數字上,而與返鄉、探親城市的關係,則視乎該城市民眾來深工作、移民的意願,這個一定程度上難以量化,有的時候,老鄉帶老鄉,一下子就在深圳形成一個集群……有機會的話,找到全國數據,或會能看出些端倪。
綜合上述來看,引力模型的確在一定程度能反映兩地城市客流量。 但有一定局限(數據樣本不足導致的局限忽略),就是引力模型只能預測同期客源,即只能根據採集到限時數據,計算某兩城市間現時或會有的客流量。如果非要預測未來客流量,可以從其他相同類型城市歷史客源數據入手,建模推算,得到結果後,代入根據引力模型計算到的當前預估客源值,從而得到某兩城市間的未來預估客源數據。
推薦閱讀: