衛生經濟學（health economics）的效用指標測量靠譜嗎?

01-22

Health economics里要評價生命質量年（QALY）通常會使用一些量表評估效用（Utility），如SF-36, EQ-5D等。也可能通過interview，使用standard gambling或者是time-trade-off的方法，評價患者的效用信息。然而，這樣評估得到的結果多大程度上反映了真正的效用信息? 經濟學理論里常涉及到效用，還有哪些領域也用到了效用的測量，測量結果真實性又是如何?

謝邀～

這個問題其實一直是學界在探討的問題。目前的結論大致上是「雖然這個方法有各種各樣的缺點，但是這是目前最好的方法了」。許多人對於QALY的看法是「Awesome!」-&>「都是些什麼鬼？！」-&>「好吧，也想不出更好的方法了……」

我想大多數人應該都已經知道，之所以會有Utility的測量，是因為有效性（effectiveness）只用生死，或者Life-year saved來測量是不夠的，因為生活質量也是非常重要的。常常有這樣的情況，比如切除某部分身體，可能能保住生命但是卻會讓這個人的生命陷入困難，比如無法獨立生活，甚至不能自己吃飯或者清洗自己，這樣的生命真的是有意義的嗎？正是因為有這樣的思考，才會有Utility的存在。

但Utility的問題在於，「生存質量」是非常主觀的，因此也很難予以量化。另一方面，不同的人也會有不同的選擇（preference）。就算是患有同樣疾病的病人，由於生活經歷的不同，對於生活的認知不同，也會有完全不同的看法。另外，在interview的時候，是應該interview病人，還是沒有患病的人也有所爭論。病人可能會將自己的感受擴大化，而沒有患病的人也難以想像這個問題。我有同事在PhD的時候曾經親自去interview過，發現很多人根本無法回答諸如」你會用多少年壽命來換取沒有癌症「這樣抽象的問題。

而另一方面，到底某個病人的生存質量究竟是怎麼樣的，恐怕也沒有一個所謂」正確「的答案，一切都是subjective的。你很難說，針對某一種疾病的3個study，哪一個是更準確的。當然每個人都有自己心中的答案，並且都有理有據。但是要說服對方，恐怕也是很難的事情。

目前英國的NICE所傾向的測量方法是EQ-5D，相當簡單方便，考慮的比較全面，相對也比較objective，對於大多數疾病還是適宜的。但是仍然有人對此提出質疑，比如心理方面的因素較少（Anxious， depression）。最近我接手的ADHD（多動症）的臨床指南，也有醫生對於是否使用EQ-5D來反映患者的情況提出了疑問。畢竟ADHD的患者大多是孩童，並且心理上的影響遠大於生理上的影響。但是除了QALY，似乎也很難找出更為公平的方法來測量治療的有i效性。比如有人提出用患者在學校的表現作為有效性，但是以「成績由D變成A」來作為測量指標又顯得相當可笑。

而另一方面，有一些情況也很難用QALY來予以量化，比如生存末期的病人，當我們為他們選擇更為「有效」的治療方式的時候，由於這些人所剩下的生命已然不多，用常用的方式來進行測量是否適當也有學者提出了質疑。但是與此同時，他們也是將QALY的測量進行改良而不是全盤放棄。

對於醫療工作來說，這些年來我的心得就是不要去追求完美，應該說根本沒辦法達到「完美」。當一個研究到達完美才去實施(implement）的時候，往往社會已經發生了改變，而實施中永遠會遇到從沒想過的問題。所以當我們有一定的確定性的時候，我們就應該去嘗試，並且在過程中不斷進行思考，不斷進行改良。這一點和其它的課題並沒有太大的區別。當然，現在的QALY距離完美還有很大的距離，但是這並不代表它是無效的，畢竟比起只用生命年來測量已經有了很大的進步。接下來的，就是在細節上不斷監督，討論和改善。這也是我們唯一能做到的事情。

嗯，感謝邀請，我來嘗試回答一下吧。

在做cost-effectiveness analysis的時候，我們需要utility，有很多方法可以來直接或者間接測量utility。最開始方法是standard gamble或者time trade off, 不過這些方法因為回答者比較難以回答，所以漸漸不用了，這個時候，EQ-5D，SF-6D這些問卷誕生了，它們提供了一個更加容易回答的方法來計算病人的health utility，但是這裡有一個問題要提出來，就是從EQ-5D的回答到health utility的計算，需要用value sets，但是目前很多國家的value sets都還沒有，這個value sets的具體建立過程我只知道皮毛，具體似乎挺複雜的。上目前通用的一個是UK 3-level的，但是它表現出來的是UK的general population的preference，我們把這個推廣到UK的病人，或者推廣到其他國家是有爭議的，所以很多研究在做自己國家的value sets，尤其是EQ-5D 5-level。

目前的研究中如果需要health utility data的話，基本上都是在用EQ-5D, SF-6D （可以從SF-36/SF-12算出來）這些來訪問病人了，不再會直接拿standard gamble或者time trade-off了，所以不太會出現病人難以回答的情況了。至於EQ-5D的一大缺陷就是，問題太少...所以很多疾病specific的東西關注不到，據我的了解，有些研究會加多一個disease-specific的問題，叫做bolt-on item,可以顯著提高discriminatory power，所以這也是一個很有意思的方向。

還要提出的一點是，SF-36和EQ-5D 是不一樣的，SF-36是profile-based，而EQ-5D是preference-based，具體的區別還是建議你讀一下專門的教科書比較好，比我在這裡傳遞二手知識好。

希望對你有用啦。

感謝還沒回答就給我點贊的朋友，受之有愧。。。

這個話題其實非常大。「靠譜」，意味著有效，真實，全面，準確，可以反覆觀測，等等這樣的性質。我們可以分成好幾次來聊。

一，不同的測量工具

測量效用的工具有很多，常用的可以分成三類（譯名都是自己翻的，勿見怪）：

standard gamble （標準化賭局）

time trade-off （時間權衡）

pre-scaled utility intrument （預製效用量表）

standard gamble先描述一個健康狀態，然後給你一個決策樹，如下圖：

如果選擇第一個分支，那麼有p的可能性完全健康，有1-p的可能立即死掉。如果選擇第二個分支，就是擁有之前描述的那個健康狀態。

問答題者，p多大的時候，兩個分支是無差別的？

Time Trade Off （TTO）也是先描述一個健康狀態，然後給人兩個選擇，比如：

健康狀態是肺癌晚期，（各種細節）

選擇一：在上述狀態下存活10個月

選擇二：享有完全的健康X個月

X應該是多少，才會讓你覺得兩個選擇無差異？

（比如你願意用損失八個月的壽命，換取兩個月的完全健康，那麼X就是2）

前兩類問題，總讓人覺得不是那麼直觀。雖然題目很簡單，還可以設置一些圖片讓其更容易理解，但是面對這樣的題目，回答者的思考壓力是很大的，也很費時間。在這樣的背景下，pre-scaled utility instrument 被發明出來。

這類量表就直觀多了。它就是把健康分解成各種指標，每個指標下面有不同的層級。患者在每一個指標下對號入座就行了。問卷雖然長了，但是每一個問題都很容易回答。

常用的量表有這麼幾個：Health Utilities Index （HUI），EuroQol 5-Dimension （EQ-5D），Short Form 6-Dimension （SF-6D），Quality of Well-Being （QWB）等。還有Assessment of Quality of Life （AQoL）不太常用。在每個疾病的領域，基本都有一個專門的效用測量的量表。但那個不是通用的，我們先不去討論。我們在這個問題里，重點對比HUI，EQ-5D，和SF-6D

EQ-5D主要有兩種，一種是每個指標有三個層級，另一種是五個層級。我看看最簡單的。它是這樣的一個量表：