癌症的發展是一個具複雜且異質性高的過程1。一般來說,基因被認為是造成癌症的成因之一。根據基因的功能,參與腫瘤的基因分為兩大類:致癌基因和抑癌基因。致癌基因多參與在控制細胞的增殖或壞死3;抑癌基因則可以保護正常細胞,避免其轉型成癌細胞4。科學家預測在人類基因體中約5-10%的基因與癌症的發生有關,而目前被實驗驗證的癌症基因只占人類基因體的1%。因此,仍然有許多的癌症基因尚未被證實。
利用生物資訊預測癌症基因
為了搜索新的致癌和促癌基因,我們開發了一個系統性的電腦計算流程來預測新的癌症基因,並建立了腫瘤相關基因(TAG)資料庫5。首先,我們收集PubMed數據庫中已知的癌症基因並建立一個半自動的信息檢索引擎從各種網絡資源來收集癌症基因的具體信息,將收集來的資訊存儲在TAG資料庫。其次,我們分析TAG所收錄的基因的蛋白序列,組成癌症基因蛋白的特殊區域(domain)資料庫。這資料庫包含366 domains。其中,49個存在於致癌和抑癌基因組中,而剩下的317個則分別屬於致癌或抑癌基因組。我們利用統計方法,將這些癌症蛋白區域給予權重分數,建立一個癌症蛋白區域分數表,利用這個表來計算出癌症基因所具有的致癌或抑癌蛋白指數。回推所有已知的致癌蛋白的指數落在0.1到18.08 (平均3.71); 抑癌蛋白的指數落在0.05到3.21 (平均0.86)。最後,我們利用這個癌症蛋白區域分數表在人類基因體中尋找新的癌症基因(圖一)。我們從90157個人類全長cDNA中找到33959個帶有癌症蛋白domain的RNA序列(指數落在1到11),其中8958為已知基因而498個則尚未命名。利用已知的癌症基因的癌蛋白指數設定成篩選標準並移除已知的TAG,我們一共找到183個新的癌症基因,包括78個致癌基因與105個抑癌基因。
為了揭示這些癌症基因的特性,我們利用MetaCore軟體進行蛋白訊息傳導與基因組特性分析(Gene Ontology)。在致癌基因部分,我們發現大部分的基因參予在蛋白磷酸化反應(71 objects, P-value 1.047E-105),其中60%的致癌蛋白具有磷酸酶活性(P-value 2.444E-82)。這些致癌蛋白與癌症的訊息傳導路徑 (圖二A)、基因缺失所造成的癌症形成、子宮頸癌、乳癌與肺癌都具有高度相關性(圖二B)。反之,抑癌基因的特性則大不相同,大部分基因參予在細胞附著反應(84 objects, P-value 9.323E-07)與細胞對外部刺激反應(73 objects, P-value 3.257E-10)。這些抑癌蛋白與發育時期的血管新生(圖二C)、動脈硬化(21 objects, P-value 3.532E-09)、攝護腺癌、肺癌及大腸癌高度相關(圖二D)。

圖二、致癌基因 (A與B) 與抑癌基因 (C與D) 的特徵分析與相關疾病調控網路分析。長條圖及其標示為癌症基因所參予的、具有差異性的主要訊息路徑及關疾病調控網路。
Fyn-related kinase (FRK) 促進Hep3B細胞生長、轉型與侵襲能力。
肝癌已知為全球第五大癌症且盛行於亞洲6與非洲7。我國國民健康局的資料也顯示肝癌是台灣人第二高發生率的癌症,在台灣男性則是高居第一位。雖然最近的研究已經發現因遺傳和表觀遺傳的變化而導致訊息傳導的異常活化與肝癌型成有關,但肝癌的發病機制在不同患者身上仍具有高度異質性8,這顯示肝癌發生的分子機制仍有待探討。為了驗證TAG,我們選擇具有異常肝組織表現並被預測為致癌基因的FRK作為研究標的。我們發現在52%的肝癌組織中FRK被高度表現(圖三A;P<0.001)並在一系列的癌症基因特性分析實驗中,我們證實高度表現FRK可以促進Hep3B細胞的生長(圖三B;P<0.05)、轉型(圖三C;P<0.001)與侵襲周邊組織能力(圖三D左;P<0.0001)及HepG2侵襲周邊組織能力(圖三E左;P<0.0001)。反之,抑制FRK表現則會抑制侵襲周邊組織能力(圖三D & E右;P<0.0001)。

圖三、FRK 參予在肝癌形成過程。 (A) FRK protein 在肝癌檢體具有較高表現量. HepG2及α-tubulin為control組. 底部數字代表成對肝癌組織的相對表現量。(B) Hep3B 細胞生長速率分析。FRK 高度表現(左), FRK 低度表現(右)。(C) 細胞轉型分析。轉型的Hep3B細胞數量(左)及colony大小(右)。(D&E) FRK 促進 Hep3B 及 HepG2細胞侵犯能力。上圖示為結晶紫呈色後的 Matrigel-coated transwells。長條圖示為相對細胞侵犯能力定量圖。
我們藉由生物資訊分析發現FRK的潛在致癌能力,並進一步證實FRK在肝癌的角色及可能的致病機制。這個研究為我們的原始假設提供重要的支持並顯示出這個生物資訊分析流程的準確性。綜合以上結果,我們相信其他藉由TAG資料庫所預測的癌症基因亦能應用在其他癌症相關研究中並為未來的癌症研究帶來正面發展。
Reference:
- Vogelstein,B. and Kinzler,K.W. (2004) Cancer genes and the pathways they control. Nat. Med., 10, 789–799.
- Bowden,G.T. et al. (1994) Oncogene activation and tumor suppressor gene inactivation during multistage mouse skin carcinogenesis. Cancer Res., 54,1882s–1885s.
- Croce,C.M. (2008) Oncogenes and cancer. N. Engl. J. Med., 358, 502–511.
- Sherr,C.J. (2004) Principles of tumor suppression. Cell, 116, 235–246.
- Chan,H.H. et al. (2007) TAG: a comprehensive database for cancer research. NAR., 35, Molecular Biology Database Collection, #992.
- Caldwell,S. and Park,S.H. (2009) The epidemiology of hepatocellular cancer: from the perspectives of public health problem to tumor biology. J. Gastroenterol., 44 (Suppl. 19), 96–101.
- Bosch,F.X. et al. (2004) Primary liver cancer: worldwide incidence and trends. Gastroenterology, 127, S5–S16.
- Cha,C. and Dematteo,R.P. (2005) Molecular mechanisms in hepatocellular carcinoma development. Best Pract. Res. Clin. Gastroenterol., 19, 25–37.