談談現代藥物研發 (一)從臨床實驗說起
也許很多人都聽說過,現代藥物研發如何如何耗資巨大,各大藥廠每年每個項目幾千萬幾億美金丟進去有時可能連水花都不見一個。這種印象總的來說是沒錯的,但是卻不是藥物研發的全部。縱觀知乎,中西醫之爭,有很大程度上在於人們並不了解現代藥物與傳統藥物的區別,並不了解現代醫學觀念下如何鑒定藥物有效與安全,更不了解在現代藥物研發與現代醫學研究的前沿領域人們正在取得多麼令人驚嘆的進展;同時,在臨床上,現代醫學又有哪些令醫生們感到摯肘的地方。現代醫學的先進性和局限性,與中醫等傳統醫學相比,完全不是在同一個語境下可以描述的,換句話說,傳統醫學最大的問題,還在圍繞著其方法論是否有意義這一話題,而現代醫學已經發展出一整套嚴密的邏輯體系和方法論來探索想要解決的問題,而其限制在於人類科技發展的前沿。想要了解這兩者的區別,我們需要先了解現代醫學的邏輯和方法論是怎麼樣的。
因此,我覺得專門寫一些文章來談談現代藥物研發的方法還是很有必要的。
現代藥物研發是一個規模遠遠超出一般人想像的系統工程,從時間跨度上來說,一般來說分為臨床前和臨床實驗兩個階段。臨床前階段一般分為分子發現階段和動物實驗階段,臨床試驗階段一般分為一期二期三期,有時還有四期。
舉個常見的TKI靶向治療藥物研發的例子,臨床前的分子發現階段就涉及到分子庫設計,靶點選擇,高通量篩選,分子化學修飾,細胞外/細胞內生物實驗驗證這幾個階段。而臨床前的動物實驗則包括動物體內的藥理毒理研究,動物病理模型研究,藥物相互作用研究等等,一般還會根據不同的疾病在多個不同的動物種類上進行。臨床前的研發其實是一個製藥公司最核心的技術,決定了一個公司有沒有能力發現一種新葯並將之帶入臨床階段。目前來說,中國只有屈指可數的幾個公司有這樣的實力,而大多數國內製葯公司還在苦苦奮鬥以期能夠在仿製葯技術上取得一定突破。這裡先不展開討論臨床前研究。
臨床實驗階段則分為1到3期,有時會有4期。能夠進入臨床階段的藥物,一般來說,製藥公司都是已經對其進行了大量的動物實驗,掌握了大量的在動物體內的藥理毒理數據,並對該藥物在人體內的葯代動力學進行過模擬計算,對藥物的合適劑量範圍和給藥方式有了大致的概念。
一期臨床實驗一般來說是專門研究藥物在人體內的藥理和毒理作用的,有時兼顧在小範圍內查看藥物的療效。如果不需要查看療效,大部分一期實驗只招募健康志願者。臨床一期的設計一般是劑量遞增法(dose escalation),即從最初安全劑量開始,幾人一組,逐漸採用增大的劑量,並觀察測試對象是否出現與藥物劑量有關的不良反應,以獲得能夠在不引起劑量相關的不良反應前提下的最大劑量(MTD)。同時,實驗還分為單劑量和多劑量實驗,單劑量只的是每個測試者只接受一次給葯(給藥劑量會不同),多劑量實驗指的是每個測試者會接受多次給葯。多劑量實驗能夠給研究人員提供藥物在一定給葯頻率下的葯代動力學數據,以為之後的二期實驗提供合適的給藥方案。一般來說,一起臨床試驗招募人數在十幾人到幾十人不等。
從二期臨床實驗開始,參與測試者就是病人了。二期實驗的目的一般是兩個,一是在小範圍內考察藥物的療效和安全性;二是繼續考察藥物在病人體內的葯代動力學和探索針對病人的合理治療方案。這是由於一期的測試對象主要是健康的志願者,藥物在這些人身上的作用可能和病人並不一樣。
由於從這一階段開始,實驗的目的很大程度上是考察藥物的安全和療效,說起來貌似很簡單,其實這件事非常複雜。
怎麼樣考察一個藥物的安全性呢?不毒死人?測試對象不會覺得不舒服?別忘了,這裡測試對象可是病人,很多病人本來就會有各種不舒服的癥狀,如何確定這些癥狀是疾病本身的自然狀態而不是藥物引起的不良反應?
對於有效性來說,問題就更多了,如何確定有效性?病人完全康復?癥狀稍微有所好轉?如果有些癥狀好轉了,有些癥狀惡化了算什麼?如果有的病人完全康復了,有的病人惡化了又算什麼?如果病人一開始好轉了,過了兩個月之後惡化了,那評價療效應該截取到那個時間點?另外,怎麼算好轉,怎麼算惡化?
對於所有這些問題,現代醫學都必須要考慮到,這就是現代醫學方法論的嚴密邏輯。那如何考慮這些問題呢?
首先一個概念,就是病人基線數據。每一個病人在進入臨床實驗前,必須經過一系列測試,不同的實驗有不同的測試標準,但目的是一樣的,就是獲得病人在接受臨床實驗藥物之前的各項指標狀態,尤其是與針對的疾病相關的各項指征。有時,為了排除病人之前所接受的治療的延時效應,臨床試驗在錄取病人時,會對病人在之前半年或一年內接受的治療和其生理數據有要求。有了準確的病人的基線數據,才能與病人接受治療之後的各個時間點的狀態進行比較。
第二個概念,就是臨床終點的選擇。臨床終點的意義,就是說,為了評價藥物的療效,需要先確定一個評價的標準,這個標準必須包括評價的對象和評價對象的時間節點。舉個例子,對於一些常見腫瘤治療來說,二期評價標準一般包括客觀響應率(ORR),疾病控制率(DCR),無進展生存期(PFS)等。客觀響應率指的是測試對象在接受藥物之後,腫瘤的變化情況滿足一定條件後,該測試對象被認為是對藥物有響應,統計了所有對藥物有響應的測試對象與總體治療對象相比,就得到了客觀響應率。衡量滿足客觀響應的腫瘤變化條件也是經過嚴格定義的,常見的標準包括RECIST1.1等。由於客觀響應率本身並沒有時間限制,因此在決定採用客觀響應率作為臨床終點時,研究人員一般會加上一個時間節點,比如48周或者24周。更複雜一些,比如還應該澄清,是48周最後一次測量時的客觀反應率,還是48周內的最佳客觀反應率。其他的DCR,PFS等就不一一展開,以後有機會專門寫一篇討論臨床終點選擇。
第三個概念就是安全性評價標準。具體來說,就是不良反應分級與原因追溯。前者是指在臨床實驗中,會將病人所經歷的所有不良反應進行分級,一般分為1到4級,其中1到2級為輕度不良反應,3級以上為重度不良反應,值得注意的是,這裡的分級與不良反應的種類無關,僅僅是在同一不良反應下,對程度進行分級。原因追溯指的是對不良反應發生的原因進行考察,一般來說,會分為治療相關與治療不相關,藥物相關與藥物不相關,有些涉及到特殊給葯途徑的,還分為給葯途徑相關與給葯途徑不相關。具體如何分級如何追溯涉及到不少臨床試驗設計技巧,這裡也暫時不展開了。
由於臨床實驗設計是一門非常複雜的學科,我這裡也只能對這幾個概念泛泛而談。如果要深入的話,每一個細節都可以寫一本書,本文目前先介紹個大概,以後有機會再逐步深入吧。
那麼在二期獲得了初步的藥物安全性和有效性的結論,當然如果這個結論是正向的,並且很有可能比目前市場上的藥物效果更好更安全的情況下,下一步就是要進行三期臨床實驗了。
三期臨床實驗的目的就是在一個大樣本上,全面評價一個藥物的療效和安全。從這個解釋可以看出,三期與二期的區別在於,一是樣本數量,而是評價的全面性。為什麼需要大的樣本數量呢?這裡就涉及到一些統計學的基本原理,簡單說來,就是樣本數量越大,犯一類錯誤(拒真)和二類錯誤(存偽)的可能性越小。而如何保證評價的全面性?這就需要幾個條件了,包括嚴格的受試者入選標準,隨機對照雙盲的實驗設計,多國多中心測試等。
關於受試者入選標準,之前二期臨床講病人基線的概念的時候已經提到過一些,這裡三期受試者入選標準一般來說會比二期更嚴格,因為在進行二期實驗時,研究人員還沒有在病人身上測試藥物的經驗,不了解對於什麼樣的病人藥物的效果最好,而對什麼樣的病人,藥物很可能是無效的或者效果有限的。經過二期實驗以後,對於實驗結果的分析與病人基線比較,研究人員就獲得了更多的對藥物的了解,知道符合某些基線條件的病人更可能受益於測試藥物,因此,為了儘可能保證測試藥物能夠在三期實驗中體現出超過對照組的療效,研究人員在入選受試病人的時候,會對病人的基線條件做進一步的限制;當然另一方面的考慮是,如果病人基線條件限制過多,則反過來影響了藥物所能治療的對象的範圍,即使將來藥物通過了臨床試驗測試並被FDA批准,藥物的應用也會被其在臨床試驗中治療的病人範圍限制。因此,研究人員必須精心考慮一切可能,選擇一個平衡點,使藥物儘可能在臨床試驗中展現出其療效,又儘可能在將來市場上使最多的患者受益。
多國多中心測試並不一定是所有三期臨床實驗所要求的,但是對於製藥公司來說,卻有不少意義。比如,多國多中心可以滿足樣本多樣性和滿足樣本容量需求,也有可能滿足未來需要在其他國家和地區上市,同時滿足多地區監管需求和針對當地人群的臨床經驗,最後還要商業化考慮,公司有機會接觸各地區大型醫療中心和醫生有助於未來藥物推廣。
隨機對照雙盲,很多人應該已經聽說過不少了。設計隨機對照雙盲臨床實驗其實是一個非常難的課題,這裡先簡單介紹一下。隨機指的是將受試者隨機分配到實驗組和對照組;對照只的是相對於實驗組,對另一組病人採用安慰劑或者有活性的藥物進行治療,以用於對測試藥物療效進行比較;雙盲指的是對於測試對象和直接接觸患者的研究人員來說,誰在測試組誰在治療組是未知的。隨機對照雙盲搞的這麼複雜,其根本目的其實很簡單,就是排除個體差異和安慰劑效應。但是就這一點,人類對其真正認識也就是最近幾十年的事,而對這個問題的認識,卻給現代醫學帶來了翻天覆地的革命,使人類真正掌握了衡量藥物療效的工具,也反過來促進了各種革命性的藥物的誕生。
具體如何設計隨機對照雙盲在這裡先不展開,以後可以專門寫文章討論,但是通過以上一些簡單的介紹,相信大家可以了解到,現代醫學臨床實驗並不僅僅是隨機對照雙盲,而是一整套嚴密的邏輯和方法論下,進行嚴格的實驗設計來排除一切可以考慮到的誤差和影響因素後,得出藥物有效性和安全性評價的體系。在現代醫學臨床試驗的設計中,各種技術細節和考量都值得大書特書,研究人員為了設計出合理的臨床實驗,也不斷進行創新,設計出如何選擇測量病人基線,如何確定考察範圍,臨床終點選擇,等等。
中醫等傳統醫學所謂的因為辨證施治而無法進行隨機對照雙盲實驗,其實是完全對現代臨床實驗缺乏了解,因為這根本就只是病人入選標準的問題而已,和隨機對照雙盲沒有關係。中醫所謂的個性化治療也是個偽概念,因為個性化並不是篩選病人的障礙。再個性化,有根據基因型進行病人篩選個性化么?要知道很多罕見病的臨床試驗,是需要從幾億人口中根據基因型找出幾十幾百個病人來做,不少也做成了三期,中醫們有什麼理由認為自己鑒別病人的難度更高?其實更多的原因是中醫根本就沒有統一的診斷標準罷了,每個中醫信口胡謅,同一個病人都會被診斷成不同的病症,當然沒法做臨床。
推薦閱讀: