衛生經濟學(health economics)的效用指標測量靠譜嗎?

Health economics里要評價生命質量年(QALY)通常會使用一些量表評估效用(Utility),如SF-36, EQ-5D等。也可能通過interview,使用standard gambling或者是time-trade-off的方法,評價患者的效用信息。然而,這樣評估得到的結果多大程度上反映了真正的效用信息? 經濟學理論里常涉及到效用,還有哪些領域也用到了效用的測量,測量結果真實性又是如何?


謝邀~

這個問題其實一直是學界在探討的問題。目前的結論大致上是「雖然這個方法有各種各樣的缺點,但是這是目前最好的方法了」。許多人對於QALY的看法是「Awesome!」-&>「都是些什麼鬼?!」-&>「好吧,也想不出更好的方法了……」

我想大多數人應該都已經知道,之所以會有Utility的測量,是因為有效性(effectiveness)只用生死,或者Life-year saved來測量是不夠的,因為生活質量也是非常重要的。常常有這樣的情況,比如切除某部分身體,可能能保住生命但是卻會讓這個人的生命陷入困難,比如無法獨立生活,甚至不能自己吃飯或者清洗自己,這樣的生命真的是有意義的嗎?正是因為有這樣的思考,才會有Utility的存在。

但Utility的問題在於,「生存質量」是非常主觀的,因此也很難予以量化。另一方面,不同的人也會有不同的選擇(preference)。就算是患有同樣疾病的病人,由於生活經歷的不同,對於生活的認知不同,也會有完全不同的看法。另外,在interview的時候,是應該interview病人,還是沒有患病的人也有所爭論。病人可能會將自己的感受擴大化,而沒有患病的人也難以想像這個問題。我有同事在PhD的時候曾經親自去interview過,發現很多人根本無法回答諸如」你會用多少年壽命來換取沒有癌症「這樣抽象的問題。

而另一方面,到底某個病人的生存質量究竟是怎麼樣的,恐怕也沒有一個所謂」正確「的答案,一切都是subjective的。你很難說,針對某一種疾病的3個study,哪一個是更準確的。當然每個人都有自己心中的答案,並且都有理有據。但是要說服對方,恐怕也是很難的事情。

目前英國的NICE所傾向的測量方法是EQ-5D,相當簡單方便,考慮的比較全面,相對也比較objective,對於大多數疾病還是適宜的。但是仍然有人對此提出質疑,比如心理方面的因素較少(Anxious, depression)。最近我接手的ADHD(多動症)的臨床指南,也有醫生對於是否使用EQ-5D來反映患者的情況提出了疑問。畢竟ADHD的患者大多是孩童,並且心理上的影響遠大於生理上的影響。但是除了QALY,似乎也很難找出更為公平的方法來測量治療的有i效性。比如有人提出用患者在學校的表現作為有效性,但是以「成績由D變成A」來作為測量指標又顯得相當可笑。

而另一方面,有一些情況也很難用QALY來予以量化,比如生存末期的病人,當我們為他們選擇更為「有效」的治療方式的時候,由於這些人所剩下的生命已然不多,用常用的方式來進行測量是否適當也有學者提出了質疑。但是與此同時,他們也是將QALY的測量進行改良而不是全盤放棄。

對於醫療工作來說,這些年來我的心得就是不要去追求完美,應該說根本沒辦法達到「完美」。當一個研究到達完美才去實施(implement)的時候,往往社會已經發生了改變,而實施中永遠會遇到從沒想過的問題。所以當我們有一定的確定性的時候,我們就應該去嘗試,並且在過程中不斷進行思考,不斷進行改良。這一點和其它的課題並沒有太大的區別。當然,現在的QALY距離完美還有很大的距離,但是這並不代表它是無效的,畢竟比起只用生命年來測量已經有了很大的進步。接下來的,就是在細節上不斷監督,討論和改善。這也是我們唯一能做到的事情。


嗯,感謝邀請,我來嘗試回答一下吧。

在做cost-effectiveness analysis的時候,我們需要utility,有很多方法可以來直接或者間接測量utility。最開始方法是standard gamble或者time trade off, 不過這些方法因為回答者比較難以回答,所以漸漸不用了,這個時候,EQ-5D,SF-6D這些問卷誕生了,它們提供了一個更加容易回答的方法來計算病人的health utility,但是這裡有一個問題要提出來,就是從EQ-5D的回答到health utility的計算,需要用value sets,但是目前很多國家的value sets都還沒有,這個value sets的具體建立過程我只知道皮毛,具體似乎挺複雜的。上目前通用的一個是UK 3-level的,但是它表現出來的是UK的general population的preference,我們把這個推廣到UK的病人,或者推廣到其他國家是有爭議的,所以很多研究在做自己國家的value sets,尤其是EQ-5D 5-level。

目前的研究中如果需要health utility data的話,基本上都是在用EQ-5D, SF-6D (可以從SF-36/SF-12算出來)這些來訪問病人了,不再會直接拿standard gamble或者time trade-off了,所以不太會出現病人難以回答的情況了。至於EQ-5D的一大缺陷就是,問題太少...所以很多疾病specific的東西關注不到,據我的了解,有些研究會加多一個disease-specific的問題,叫做bolt-on item,可以顯著提高discriminatory power,所以這也是一個很有意思的方向。

還要提出的一點是,SF-36和EQ-5D 是不一樣的,SF-36是profile-based,而EQ-5D是preference-based,具體的區別還是建議你讀一下專門的教科書比較好,比我在這裡傳遞二手知識好。

希望對你有用啦。


感謝還沒回答就給我點贊的朋友,受之有愧。。。

這個話題其實非常大。「靠譜」,意味著有效,真實,全面,準確,可以反覆觀測,等等這樣的性質。我們可以分成好幾次來聊。

一,不同的測量工具

測量效用的工具有很多,常用的可以分成三類(譯名都是自己翻的,勿見怪):

standard gamble (標準化賭局)

time trade-off (時間權衡)

pre-scaled utility intrument (預製效用量表)

standard gamble先描述一個健康狀態,然後給你一個決策樹,如下圖:

如果選擇第一個分支,那麼有p的可能性完全健康,有1-p的可能立即死掉。如果選擇第二個分支,就是擁有之前描述的那個健康狀態。

問答題者,p多大的時候,兩個分支是無差別的?

Time Trade Off (TTO)也是先描述一個健康狀態,然後給人兩個選擇,比如:

健康狀態是肺癌晚期,(各種細節)

選擇一:在上述狀態下存活10個月

選擇二:享有完全的健康X個月

X應該是多少,才會讓你覺得兩個選擇無差異?

(比如你願意用損失八個月的壽命,換取兩個月的完全健康,那麼X就是2)

前兩類問題,總讓人覺得不是那麼直觀。雖然題目很簡單,還可以設置一些圖片讓其更容易理解,但是面對這樣的題目,回答者的思考壓力是很大的,也很費時間。在這樣的背景下,pre-scaled utility instrument 被發明出來。

這類量表就直觀多了。它就是把健康分解成各種指標,每個指標下面有不同的層級。患者在每一個指標下對號入座就行了。問卷雖然長了,但是每一個問題都很容易回答。

常用的量表有這麼幾個:Health Utilities Index (HUI),EuroQol 5-Dimension (EQ-5D),Short Form 6-Dimension (SF-6D),Quality of Well-Being (QWB)等。還有Assessment of Quality of Life (AQoL)不太常用。在每個疾病的領域,基本都有一個專門的效用測量的量表。但那個不是通用的,我們先不去討論。我們在這個問題里,重點對比HUI,EQ-5D,和SF-6D

EQ-5D主要有兩種,一種是每個指標有三個層級,另一種是五個層級。我看看最簡單的。它是這樣的一個量表:

SF-6D是這樣的(參照:http://www.scielo.br/pdf/ramb/v56n4/en_12.pdf)

HUI常用的有兩個版本,一個叫做HUI2,它是這樣的(Health Utilities Inc. "HUI2")

另一個叫做HUI3,是這樣的(Health Utilities Inc. "HUI3"):

幾個量表在選擇指標(domain)上有很大區別。如果用不同量表來衡量同一個健康狀態,結果有可能差別很大。

比如,我們假設有一個患者,幼時因為Hib感染得過腦膜炎。我們知道腦膜炎會影響人的腦部功能,進而影響到視覺、聽覺、語言能力等等。

如果採用EQ-5D和SF-6D,這一部分的病情就沒有辦法直接的反映出來。

如果採用HUI2,至少還有一個sensation這個指標可以反映這部分病情。

如果採用HUI3,就有vision,speech,hearing三個指標分別衡量這部分的病情,更加細緻準確。

類似於腦膜炎這樣的疾病還有很多。所以在決定採用哪種量表之前,一定要考慮這些因素:

1. 量表的指標確實都覆蓋了這個疾病的重要方面嗎?

2. 指標的層級是否有「屋頂效應」或「地板效應」?也就是說,最好的層級也無法描述你的好,最差的層級也無法描述你的差,那麼這個量表就失去了準確把握你的情況的能力。

3. 在一個國家適用的量表到了另一個國家是否依然適用?QWB在美國加州經常被使用,HUI在加拿大廣泛使用,EQ-5D和SF-6D是在英國大量使用。如果我們研究的是中國的病人,就要基於以往的研究,選擇最適合的量表。

4. 不同量表之間測出的utility差距過大怎麼辦?這個要在pilot study中解決,看看是因為什麼導致數據差別巨大。

(未完待續)


只在讀碩士時學過。

長時間不用,忘完了。

真抱歉!


推薦閱讀:

中了五百萬應該怎麼花?
如何看待中國幫助印度搞基建?
現在如何建立一個國家?第一步該幹什麼?
出口的物品比國內的便宜,這件事怎麼理解?
既然每個人都在努力掙錢,那麼「錢」是從哪裡多出來的呢???

TAG:經濟學 | 公共衛生 | 衛生經濟學HealthEconomics |