第八卷 第九期 - 2009年五月十五日
二階段臨床試驗下反應率之區間估計
蔡偉彥1嵇允嬋2,*、陳嘉民2

1哥倫比亞大學生物統計系
2國立成功大學管理學院統計學系
ycchi@stat.ncku.edu.tw

Statistics in Medicine 2008, 27, 15-35

 
標準大小   字體放大
1.

在新藥研發的漫長過程中,第二期臨床試驗(Phase II clinical trials)的主要目的是要瞭解新藥的有效性與安全性,以決定一個新藥是否有療效,並作為進一步進行第三期臨床試驗(Phase III clinical trials)的依據。例如在一個關於肝癌的新藥研究中,研究人員想要知道此新藥是否可以有效延長肝癌病人的生命。首先,可根據病人服用藥物後腫瘤的反應,明確定義何謂有效的治療;因此,每位病人服用藥物後的反應可分為有效與無效兩種,為一個二元反應變數,有效機率為p。針對上述的問題,在第二期臨床試驗中,若臨床試驗結果達到預期效果,則表示此新藥值得進入第三期臨床試驗,做進一步地研究。

近年來,基於道德上的考量,為了避免提供無療效的藥給太多病人,Simon的二階段設計[1] 被廣泛地應用在第二期臨床試驗。作法如下:在第一階段中,招募n1個病人並等待全部治療結束,若這些病人中呈有效反應之病人人數Y1低於預設標準a時,則停止試驗,宣稱新藥無療效;反之則進入第二階段的試驗,增加n2個病人並等待治療結束。此時,這些病人呈有效反應之受試者人數為Y2。當兩個階段之有效反應人數和,Y1+Y2,超過臨界點,則宣稱新藥有療效;反之,則宣稱新藥無療效。通常當新藥在第一階段之有效反應人數小於a時,這些資料往往不會予以分析。反之,若進入第二階段,則會將兩個階段個別蒐集的資料合併,用以估計有效機率p

一般最常使用的估計方法為樣本比例 。然而,當第二階段允許進行時,Y1服從截斷的二項分配,因此以樣本比例估計有效機率p會高估。為了有效排除截斷所造成的影響,因此我們根據截斷的二項分配推導出最大概似估計式。此外,由於病人之間的差異,導致在量測病人服用藥物後的反應時會有個體上的差異,而信賴區間可以將個體上的差異對估計有效機率p的影響顯現出來,進一步告訴我們一個關於有效機率p更為合理的估計,所以在下一節中,我們亦將提供華德(Wald)信賴區間[2]和score信賴區間[3]等兩種建構信賴區間的方式。

2.推廣之統計方法

當第二階段允許進行時,Y1可能的值被限制必須大於或等於a,因此Y1的機率分配可寫成一截斷二項分配,其機率分配函數如下
        
此處p為有效機率,。而Y2的機率分配為二項分配且有相同的有效機率p,其機率分配函數如下
       
此處。令logL(p)= 表示Y1Y2的對數概似函數,並將LogL(p)對p微分求得其一階導函數U(P),接下來我們僅需解U(p)=0,即可求得有效機率p的最大概似估計值。由U(p)的圖形可以發現,只要y1+y2介於an1+n2之間,則U(p)=0必定存在一個唯一解。然而,此解並無法直接由公式求得,因此我們利用牛頓疊代法以求得p的數值解。在牛頓疊代法的應用上,首先我們必須將U(p)對p微分求得logL(p)之二階導函數,將此二階導函數取負號並以J(p)表示。接下來,應用迭代公式(iteration equation) p[j]=p[j-1]+U(p[j-1])/J(p[j-1]),若,則p的最大概似估計值即為p[j]

除了上述的最大概似估計式外,本文亦提供了建構信賴區間的方式,作法如下:根據最大概似估計式的特性,統計量的機率分配會漸近標準常態分配,其中I(p)表示J(p)的期望值。接下來,令zα/2為標準常態分配的第100(1-α/2)百分位點,則我們僅需由=zα/2=- zα/2解出信賴區間的上、下界,即可建構出華德信賴區間(Wald confidence interval)。以 表示。然而,由於Y1Y2的可能值為整數,因此我們利用1/(2(n-a))為連續修正項,以使統計量之機率分配更接近標準常態分配,進而得到修正後的華德信賴區間為, +1/(2(n-a))。根據Wilson [3] 的概念,若將I(p)取代,則在給定之下,利用兩條方程式,解出信賴區間的上、下界,即可建構出score信賴區間,以表示。當考慮利用連續修正項來進行修正時,利用相同的方法亦可建構出修正後的score信賴區間,以表示。

3.比較結果

針對不同的信賴區間估計方式,一般是以信賴區間涵蓋率(coverage probability)和信賴區間平均長度作為區間估計準確性的評估準則。其中信賴區間涵蓋率定義為CP(p)=∑I(x,p)P(X=x),此處I(x,p)為一指標函數,在給定X=x下,若信賴區間包含真正的pI(x,p)=1,反之則I(x,p)=0;而信賴區間平均長度則定義為EW(p)= ,其中為在給定X=x下所得之區間寬度。一般而言,在信賴區間的選擇上,一個準確的信賴區間是指其涵蓋率越接近信心水準1-α,同時信賴區間平均長度越短越好。

針對第二期臨床試驗而言,通常會考慮兩種不同的有效機率p1p0(<p1),用以計算所需的樣本個數與臨界點。若試驗結果顯示有效機率為p0,則表示新藥的有效機率不如預期;反之,則表示新藥值得進一步研究。在給定p0p1,α和β下,表一提供了在多種樣本個數與臨界點組合下的信賴區間涵蓋率和信賴區間平均長度。由表一可看出,若以最大概似估計式估計有效機率p會輕微的低估;反之,若以樣本比例估計有效機率p則會產生高估。值得注意的是當n2明顯大於n1時(例如n1=34且n2=5),以估計有效機率p時,低估的情況會較為明顯,且score信賴區間的涵蓋率會明顯低於95%信心水準。雖然score信賴區間之信賴區間平均長度一定會小於修正後的score信賴區間之信賴區間平均長度,然而兩者之間的差異幾乎是微乎其微。因此,根據信賴區間涵蓋率和信賴區間平均長度兩種評估準則,依據研究結果,本論文建議在Simon二階段設計中,宜以最大概似估計作為點估計同時以修正後的score信賴區間來建立有效機率p的信賴區間。
表一. 在Simon兩階段設計下,針對α= 0.05,β= 0.2且p1-p0= 0.2之涵蓋率,信賴區間平均長度和最大概似估計之偏誤。

參考文獻
  1. Simom R. Optimal two-stage designs for Phase II clinical trials. Controlled Clinical Trials 1989; 10:1-10.
  2. Casella G, Berger R. Statistical inference. Duxbury: Pacific Grove, 2002.
  3. Wilson EB. Probable inference, the law of succession, and statistical inference. American Statistical Association 1927; 22:209-212.
< 上一篇下一篇 >
Copyright National Cheng Kung University