淺談交通網路分析中的隨機用戶均衡模型(二):描述個體選擇行為的離散選擇模型

離散選擇模型(Discrete Choice Model)常用於描述人的選擇行為,是由加州大學伯克利分校的丹尼爾·麥克法登(Daniel McFadden)於20世紀70年代提出來的,到目前為止,離散選擇模型已經廣泛地應用於描述人的各種選擇行為,在交通中,包括路徑選擇、交通方式(私家車、計程車、地鐵等)選擇等在內的選擇行為大多是基於離散選擇模型來進行量化分析的。當然,正是離散選擇模型利用個體在不同選擇項中的選擇行為可以表徵出個體的隱性偏好,才使得該模型為個體的選擇行為提供了一個很好的量化途徑。

1 人的選擇行為與離散選擇模型

在理解離散選擇模型之前,我們可能需要先認同一個不公的事實:人的選擇行為包含著一定的隨機因素。通常,人的選擇行為包含兩方面:

  • 穩定的規律
  • 細微的隨機變化

簡單來說,我們想去看一場熱門的演唱會,是選擇自駕,還是乘坐計程車抑或地鐵呢?很明顯,如果平時習慣於自駕的人肯定會首選自己開車去,但是想到自駕可能要面臨著堵車或者停車難等問題,這時可能又會傾向於選擇乘坐計程車或地鐵。如果再加之選擇計程車可能會面臨著打車難的問題,而乘坐地鐵則在時間上更為穩定,這種情況下,我們就可能會毫不猶豫地選擇乘坐地鐵。

在這個例子中,我們可以窺探出人們面臨著比較「重要」的決策時,其內心可能是很複雜的,其自身也無意識地對幾個選擇項進行博弈,當然,這也就不難理解我們生活中常見的「選擇困難症」(即幾個選擇項給個體帶來的「好處」十分接近,很難做出快速的選擇),同時,我們也可以很明顯地看到這一決策過程實際上是在穩定的規律(即我們平時更習慣於選擇哪種交通方式,類似於「思維定式」)基礎上產生隨機性的「波動」(即對於某一特定場景,以往的選擇行為又不是完全可以照搬的)。

離散選擇模型的潛在假設是:當某一個體面臨著一個選擇時,個體對於每個選擇項的偏好可以用與每個選擇項本身有關的「效用」(utility)來度量。這裡的效用是一個關於選擇項屬性的函數,與決策者的個體特徵無關,個體之所以會作出選擇是因為選擇項會給該個體帶來某些效用,並且決策者被假設會選擇能達到最大效用的選擇項。然而,比較遺憾的是,每個選擇項的效用並不能被直接觀測到,效用本身是隨機的,這也意味著選擇模型能給出的僅僅是一個概率(即0leq Pleq 1的概率選擇問題),與已經被選擇的選擇項有關,並非這個選擇本身(即選中為1,未被選中為0)。

2 效用函數與概率選擇問題

在離散選擇模型中,效用這一概念通常用來描述選擇項的屬性,考慮到選擇項存在不可觀測的部分,可將每個選擇項的效用都用一個由確定項(deterministic component)V_{k}{left(vec r 
ight) }和隨機項(additive random "error term")xi_{k}{left(vec r 
ight) } 組成的隨機變數表示,k表示第k個選擇項,向量vec{r}表示選擇項的屬性向量,若將對應的效用記為U_{k}{(vec r)} ,則滿足

U_{k}{left( vec r 
ight) } =V_{k}{left(vec r 
ight) } +xi_{k}{left(vec r 
ight) } ,forall k

由於效用是關於屬性向量vec{r}的函數,因此,選擇項k被選擇的概率也與屬性向量vec{r}相關,即選擇項k被選擇的概率P_{k}=P_{k}left(vec r
ight)。在大樣本下,可用個體選擇選擇項k的比例來近似P_{k}left(vec r
ight)

另一方面,選擇概率P_{k}left(vec r
ight)的實質是U_{k}{(vec r)} 高於其他選擇項效用U_{l}{(vec r)} 的概率,可以寫成

P_{k}left(vec r
ight)=Pr left[U_k left(vec r
ight)geq U_l left(vec r
ight),forall l
ight],forall k

其中,0leq P_{k}left(vec r
ight)leq 1sum_{k}{P_{k}left(vec r
ight)} =1.

因此,當我們知道隨機項xi_{k}{left(vec r 
ight) } 的概率分布後,效用也就確定了,那麼選擇概率P_{k}left(vec r
ight)可以很清晰地計算出來。

【例1】當我們有兩個選擇項時,並且已知第一個選擇項的效用是U_{1}=3+xi ,第二個選擇項的效用是U_{2}=2,若將第一個選擇項被選擇的概率記為P_{1},則

P_{1}=Pr left(U_{1}geq U_{2}
ight)=Prleft(3+xi geq2
ight)=Prleft(xi geq-1
ight)

現假設xi服從-22的均勻分布,很明顯,Prleft(xi geq-1
ight)=frac{3}{4} ,那麼,P_{1}=0.75P_{2}=0.25。這個簡單的例子論證了選擇概率的本質,根據這個模型,總體中會有75%的個體會選擇第一個選擇項,並且滿足U_{1}geq U_{2}

若保持U_{1}不變,令U_{2}=3,則選擇第一個選擇項的概率將變成P_{1}=0.5,總體中會有50%的個體選擇第一個選擇項。

這個例子可以看出,選擇概率既依賴於隨機項的分布形式,又依賴於效用函數中屬性向量vec r作用的特徵。那麼隨機項中不同的分布形式到底對選擇概率有什麼影響呢?接下來,我們來介紹離散選擇模型。

對離散選擇模型有一定了解的讀者可能會立刻想到最經典的多元logit模型(multinomial logit),但除了多元logit模型外,還有一個常用的離散選擇模型,即多元probit模型(multinomial probit),接下來,我們來介紹這兩種特殊的離散選擇模型。

3 多元logit模型

在所有的離散選擇模型中,最常用的就是logit模型,正是由於logit模型很容易使用,這也是其相比於其他複雜的離散選擇模型的最大優勢。當我們假設每個效用函數的隨機項都獨立同分布於Gumbel分布,logit模型可以由隨機效用(random utility)和效用最大化(utility maximization)概念得到,即此時的選擇概率被定義為

P_{k}=frac{e^{V_{k}}}{sum_{l=1}^{K}{e^{V_{l}}} } ,forall k

當然,logit模型也可以寫成如下形式:

P_{k}=frac{1}{1+sum_{l
e k}{e^{V_{l}-V_{k}}} } ,forall k

當僅僅有兩個選擇項時,logit模型可以寫成

P_{1}=frac{e^{V_{1}}}{e^{V_{1}}+e^{V_{2}}} =frac{1}{1+e^{V_{2}-V_{1}}}P_{2}=1-P_{1}

註:Gumbel分布的概率分布函數為

Fleft( x 
ight) =expleft[-expleft( -x+E 
ight) 
ight] ,xin R

其中,E是歐拉常數(E=0.5708...)。

【例2】當我們要去某個地方時,有公交和私家車兩種交通工具,這時出行的交通方式可使用一個logit模型進行分析。給定公交的效用函數為U_{bus}=V_{bus}+xi,其中,V_{bus}left(t_{1}
ight)=-2t_{1}t_{1}表示公交車出行的行程時間;而私家車的效用函數為U_{auto}=V_{auto}+xi,其中,V_{auto}left(t_{2}
ight)=1-2t_{2}t_{2}表示自駕出行的行程時間。此時,選擇自駕出行的概率為

P_{auto}left(t_{1},t_{2}
ight)=frac{1}{1+e^{V_{bus}-V_{auto}}}=frac{1}{1+e^{-1-2left(t_{1}-t_{2}
ight)}}

在這裡,P_{auto}left(t_{1},t_{2}
ight)也可以看成是關於left(t_{1}-t_{2}
ight)的函數。

4 多元probit模型

通常,假設誤差服從正態分布是大家所熟知的做法,當然,這一做法也是probit模型的前提,在probit模型中,我們通常假設效用函數中隨機項xi_{k}{left(vec r 
ight) } 的聯合概率密度函數服從多元正態(multivariate normal, MVN)分布。

註:多元正態分布是正態分布概率密度函數的多元延伸,用於描述隨機向量vec xi,由均值向量vec mu(大小為1	imes K)和協方差矩陣 Sigma (大小為K	imes K)構成,即vec xisim MVNleft(vec mu, Sigma 
ight)

令效用向量vec Uleft(vec r
ight)=left[U_{1}left(vec r
ight),...,U_{K}left(vec r
ight)
ight],滿足vec Uleft(vec r
ight)sim MVNleft[Vleft(vec r
ight), Sigma
ight],則第k個選擇項被選擇的概率為

P_{k}left(vec r
ight)=Pr left[U_k left(vec r
ight)geq U_l left(vec r
ight),forall l
ight]

【例3】假設有效用向量vec U=left(U_{1},U_{2}
ight),其中,U_{1}=V_{1}+xi_{1}U_{2}=V_{2}+xi_{2};隨機向量vec xisim MVNleft(vec 0, Sigma 
ight),其中,vec xi=left(xi_{1},xi_{2}
ight)vec 0=left(0,0
ight) Sigma=left[ egin{array}{cc} sigma_{1}^{2} & sigma_{12} \ sigma_{21} & sigma_{2}^{2} \ end{array} 
ight],我們可以得到選擇第一個選擇項的概率為

P_{1}=Prleft(U_{1}geq U_{2}
ight)=Prleft[left(xi_{2}-xi_{1}
ight)leq left(V_{1}-V_{2}
ight)
ight]

根據多元正態分布的性質,left(xi_{2}-xi_{1}
ight)也是服從正態分布的隨機變數,並且均值為0,方差為sigma^{2}=sigma_{1}^{2}+sigma_{2}^{2}-2sigma_{12},即

P_{1}=Phi left( frac{V_{2}-V_{1}}{sigma} 
ight)

其中,Phi left( cdot 
ight) 為標準正態分布的累計概率函數。只要知道V_{1},V_{2},sigma的取值,我們就可以得到選擇第一個選擇項的概率。

需要指出的是,當選擇項數量大於2時,多元probit模型就不能像例3一樣可以直接求解了,需要用到其他求解演算法,如Mente Carlo simulation, method of successive averages (MSA)等,在此不作詳細介紹。

5 滿意度函數

前面介紹了效用函數和選擇概率的計算,與離散選擇模型相關的還有滿意度函數(satisfactory function),對於描述人的選擇行為也十分重要。滿意度常用於獲取一個個體從所有選擇項中所取得的期望效用,將滿意度函數記為	ilde{S},由於每個個體都被假定能夠選擇到效用最大的選擇項,因此,滿意度可以簡單地用最大效用選擇項的期望來表示,即

	ilde{S} =Eleft[max_{forall k}{left(U_k
ight)} 
ight]

6 回顧:離散選擇模型的提出與發展

離散選擇模型是一個有「故事」的數學模型,它的由來到遍及諸多應用領域確實存在一定的必然性。第一,離散選擇模型形式極其簡單,簡單到只要學過簡單的概率論就可以完全理解了;第二,離散選擇模型是有「背景」的,它在實際應用場景中具有可解釋性和很強的物理意義。正是如此,離散選擇模型的提出者丹尼爾·麥克法登(Daniel McFadden)在多年之後因此項工作而獲得諾貝爾經濟學獎(2000年)。

早期的離散選擇模型都是建立在隨機效用最大化原則(random utility maximization, RUM)基礎上,隨著研究人員不斷嘗試將離散選擇模型應用於人的各種選擇行為,也相應地出現了比簡單的logit模型和probit模型更為複雜的模型,這些模型大多還是基於效用理論,但Caspar G. Chorus於2010年從「遺憾」的角度提出了一套基於隨機遺憾最小化原則(random regret minimization, RRM)的離散選擇模型,如何理解理解「效用」和「遺憾」這兩個詞呢?

效用可以對應著「好處」,即個體希望做出的選擇能夠使得自己的「好處」達到最大,而遺憾對應著「壞處」,即個體希望做出的選擇能夠使得自己的「吃虧」達到最小。雖然兩者對於量化人的選擇行為過程中出發點不同,但隨機的效用和隨機的遺憾對應的離散選擇模型卻非常相似。

7 相關閱讀

本文主要參考了Yosef Sheffi於1985年出版的著作《Urban transportation networks: equilibrium analysis with mathematical programming methods》(鏈接:Urban Transportation Networks:)。當然,對離散選擇模型中的隨機遺憾最小化原則有興趣的讀者可以閱讀Caspar G. Chorus於2012年出版的著作《Random regret-based discrete choice modeling: a tutorial》(鏈接:springer.com/cn/book/97),該書篇幅較小、簡單易懂,書中介紹了基於隨機遺憾的離散選擇模型建模及其應用場景。

備註:全文僅僅是讀書筆記,如有不當之處,敬請指正。


推薦閱讀:

交通工程專業的前景如何?
淺談交通網路分析中的隨機用戶均衡模型(一):從經典的用戶均衡與系統最優說起
中山大學就讀交通工程是怎樣一番體驗?
交通工程專業必讀的著作有哪些?

TAG:城市交通 | 交通工程 | 离散选择模型 |