破译癌症密码
撰文 弗朗西斯·S·柯林斯(Francis S. Collins)
安娜·D·巴克(Anna D. Barker)
翻译 胡晨
利用现有的基因组数据和最新的基因技术,科学家将找出所有与癌症有关的基因突变,然后针对这些基因突变,研究出强力抗癌药物,彻底打败癌症!
“想摸清癌症的‘底细’,我们就必须从现在开始,密切关注细胞的基因组。” 20多年前,诺贝尔生理学或医学奖得主雷纳托·杜尔贝科(Renato Dulbecco)如是说。杜尔贝科是肿瘤研究的先驱,1986年,他在《科学》杂志上发表文章说:“我们正处在一个转折点上。”此前的研究已经清楚地表明,许多癌细胞的失常行为源于基因的损伤及其正常功能的改变。“我们有两个选择”,他在这篇文章中写道,“要么对基因进行逐个筛选,从中发现与恶性肿瘤相关的重要基因,要么……就对整个基因组测序。”对整个基因组测序,这正是后来举世瞩目的“人类基因组计划”,杜尔贝科可算是最早提出这一构想的科学家之一。
杜尔贝科和其他科学家都很清楚,虽然人类基因组计划的完成是一个里程碑,但想要完全阐明肿瘤的生物学机制,这不过是“万里长征第一步”。在获得了完整的人类基因组序列后,科学家接下来的工作就是根据功能,对基因进行分类,揭示它们在肿瘤中的作用。20年前,杜尔贝科的想法只是一个梦想,现在梦想已变成了现实。人类基因组计划完成还不到3年,美国国立卫生研究院又启动了一项试验性研究,目的是收集与肿瘤相关的基因变异数据,创建一个详尽的基因组分类数据库——癌症基因组图谱 (The Cancer Genome Atlas ,TCGA) 。
这是一个规模庞大的研究计划,人们之所以如此急切地踏上此次冒险之旅,主要因为肿瘤给人类带来了太多的痛苦。仅以美国为例,每天有1,500多人死于癌症,相当于每分钟就有一个美国人被癌症夺去生命。未来几年,美国的人口老龄化问题将更加严重,除非科学家能找到癌细胞的弱点,确定杀死癌细胞的新策略,癌症致死率可能还会继续上升。
然而,无论这个计划是多么宏伟,仅仅凭借减轻人类病痛的雄心壮志,根本无法越过前进路上的重重障碍。就算只为50种最常见的癌症绘制基因组图谱,工作量都将是人类基因组计划的一万多倍!因此,要实现这个梦想,既应该雄心万丈,又应该进行理性判断,以最巧妙的方式击败癌症。
启动癌症基因组计划
近年来,新思路、新工具和新技术不断涌现,很多科学家都认为,以系统、协作、综合的方式研究癌症基因组的时代已经来临。
任何癌症的产生,核心原因都是细胞内的基因组发生了改变,这种看法并不是今天才有的。自从1981年首次发现癌基因——H-RAS以后,科学家们越发肯定,癌症就是由某些基因突变引起的。细胞接触毒素、受到放射线辐射、DNA修复出现缺陷,以及在细胞分裂前DNA复制出错等因素,都有可能引发基因突变。在相对罕见的病例中,病人身上的致癌突变与生俱来,很可能遗传自祖先的基因突变体。
无论什么原因导致的突变,都会破坏细胞的正常生物机制,使它摆脱“生死轮回”,疯狂复制、增殖,更会“赐予”细胞强大的侵袭能力,扩散至其他器官甚至全身组织,这些都是癌细胞的典型特征。本来,细胞一旦有“出轨”行为,有些基因就会立即像警察一样“站”出来,“镇压”这些蠢蠢欲动的细胞。但某些突变的出现,却让“警察”基因失去活性,并唤醒了沉睡的破坏性基因。不过,对大多数细胞而言,至少要获得数个基因突变才能够转化成肿瘤细胞——这一过程往往要耗时数年之久。
在过去20年中,许多研究小组都在利用新型分子生物学技术,搜寻那些可能破坏细胞生长程序、扰乱正常细胞行为的基因突变。按照这种思路,科学家已经找到了大约350个与癌症相关的基因,让人们对癌症有了更多的认识。目前,这些基因突变的信息已经收集在一个名为“癌症体细胞突变便览”(缩写为COSMIC)的数据库里。英国剑桥维康信托-桑格研究所(Wellcome Trust Sanger Institute)的迈克尔·斯特拉顿(Michael Stratton)带领的一个研究小组负责数据库的维护工作。但是,人们认为这个数据库并未涵盖所有的基因突变信息。
今天,手工作坊般的研究规模已经落伍,探索癌症基因组需要全新的思路、更大的规模。近年来,新思路、新工具和新技术不断涌现,更重要的是,这3件“研究利器”融合成了一个整体。很多癌症研究和分子生物学领域的科学家都认为,以系统、协作、综合的方式研究癌症基因组的时代已经来临。
人类基因组计划绘制出了一幅宏伟的基因组图谱,包含了人类正常组织的30亿个碱基对的标准序列,这为癌症基因组图谱的绘制奠定了坚实的基础。现在,我们需要完成的工作就是比较——将正常细胞和癌细胞的基因组放在一起,看它们在DNA序列和物理特性方面有何异同,找出肿瘤标志性特征背后的遗传特征。在大规模生物学研究中,国际合作的重要性在于集成资源和加快科学发现,这一点在人类基因组计划的实施过程中得以体现,癌症基因组计划也在寻求类似的合作机制。
在人类基因组计划的促进下,测序和基因组分析技术取得了重大进展。1990年,人类基因组计划启动之初,每测定一个核苷酸碱基需要10美元,而今天,这一费用已经不到1美分。随着更先进的测序方法出现,这一价格肯定还要继续下降(参见《环球科学》2006年2月号,乔治·丘奇所著《1000美元测出你的基因组》一文)。随着技术的进步,大规模的技术方法开始在癌症基因组计划中应用,这在几年前还无法想象。
找出突变基因
癌症基因组计划才刚刚开始,科学家就发现他们要面对的困难远远超出了想象:癌细胞中的基因突变是预期的几十倍;不同癌细胞之间,基因突变的类型也不一样……不过,科学家们仍在努力,因为只要能解读癌症基因组,就可以挽救无数患者。
如果深入了解癌症的分子成因,并不能提升治疗水平,我们得到的成堆数据就会毫无价值。所幸,最近一些研究表明,只要能在癌细胞中找到特定的基因突变,那么对诊断、治疗和预防癌症都将大有裨益。这让人们看到了战胜癌症的曙光,同时,在研究中不断涌现的困难也让人们认识到,要实现这个目标并不容易,需要付出大量的时间和金钱。
2001年,当威康信托-桑格研究院利用基因组学技术研究癌症时,他们的短期目标只是对378个肿瘤样品中的20个基因进行测序,顺便优化正在试运行的自动化机器人和信息管理系统。但一年后,桑格研究院有了重大发现:70%左右经过检测的恶性黑色素瘤中(人类皮肤癌中致死率最高的类型),被称作B-Raf的基因都发生了突变。很多研究人员立即将目光集中到这个基因上。从传统的化学药物到现代的RNA干扰技术,他们采用了多种方法,不断进行细胞试验和动物试验,观察这些措施能否阻止或降低B-Raf基因的活性,或者说抑制MEK蛋白的活性(B-Raf基因发生突变后产生的蛋白质)。仅仅过了5年,有些方案就已经进入了临床试验阶段。
其他研究小组也有各自的目标。他们想找出与乳腺癌、结肠癌、白血病、淋巴瘤等癌症相关的基因突变,开发分子诊断和预后判断技术。预后判断技术可以帮助人们选择最有效的化疗药物。癌症基因组学还能直接促进一些最新疗法不断完善。
以抗癌药物格列卫为例,它能专门抑制一种酶的活性。这种酶是两个基因发生了融合突变而产生的,会导致慢性髓细胞性白血病。格列卫对这种疾病有非常好的疗效,而且对一些致病机理更复杂的恶性肿瘤,如胃肠道间质瘤等相对罕见的肿瘤,也有一定的疗效,这些肿瘤的发生也与类似的酶有关。赫赛汀是一种治疗乳腺癌的药物(参见《环球科学》2006年6月号加里·斯蒂克斯所著《抗癌先锋》一文),它的作用目标是细胞表面的一类蛋白质——HER2,乳腺癌的发生就是相关基因异常扩增而过度表达所致。
针对某些基因突变进行选择性治疗的策略,也在其他几种抗癌药物中得到了尝试应用,比如治疗肺癌的易瑞沙(Iressa)和得舒缓(Tarceva),治疗肺癌、结肠癌的阿瓦斯汀(Avastin)等。这些以基因为基础的新方法,在诊断、预后和治疗癌症方面都取得了一定的成绩。这是一个好消息,不过还不够,因为癌症是由多个基因突变引发的,而且不同的癌症,致癌突变也不同。如果科学家能将所有与癌症相关的基因突变都找出来,癌症就不再是绝症了。
最近,美国约翰·霍普金斯大学的科学家进行了一项研究,既领略了大规模基因组学在“勘察”癌基因方面蕴含的巨大潜力,也看到了绘制一幅详尽的癌症基因组图谱是一项何等艰巨的任务。这个研究小组找来了11位结肠癌患者和11位乳腺癌患者的肿瘤组织样本,对其中的1.3万个基因进行测序,结果发现,居然有大约有200个基因发生过重要突变!而在试验之前,只有十来个基因被认为是这两种癌症的“幕后真凶”,科学家最初对实验结果的期望,也只是想多找到“几个”突变基因而已。
研究人员面对的一大难题就是,对癌细胞的基因组测序时,很难区分肿瘤样品中的无义突变和致癌突变。令人惊讶的是,从早期的测序结果看,在不同肿瘤中几乎没有相同的基因突变,即使肿瘤样品来自身患同种肿瘤的不同患者,基因突变的方式也有本质差别。这一发现说明,多种突变组合均都可导致正常细胞转化为癌细胞。因此,即使肿瘤出现在相同的器官或组织上,在不同的病人体内,肿瘤的基因都可能有很大的差别。
要实现癌症基因组图谱的预期目标,科学家在研究的早期,就必须考虑到分辨基因突变的复杂性,可以想象,当研究对象扩展到100多种癌症时,他们将遇到多么艰巨的挑战。面对这样的困难,就算是经验丰富的肿瘤生物学家,甚至参与过人类基因组计划的“过来人”都会有些不知所措。然而,世界各地参与癌症基因组计划的开拓者们仍在努力,因为他们坚信,在复杂的癌症基因组背后,隐藏着挽救癌症患者生命的最大希望。
在基因组中,太多的突变可以把一个正常细胞转化为癌细胞,要把这些突变都找出来,并且分门别类地罗列出来,科学家肯定要花费多年时间。但是,在这项规模浩大的“整理工作”完成之前,可能会找到革命性的抗癌方法。随着研究的深入,每研究完一类癌症,找到的致癌突变就会多一些,癌症基因组图谱也会详细一些,科学家就能以这些基因突变为目标,开发更具针对性的治疗方法。
共同完成任务
癌症基因组计划汇集了4大研究机构、多名经验丰富的科学家,机构之间的协作与科学家之间的合作,是完成癌症基因组计划的最大保障。
在以前的人类基因组计划中,科学家成功地采取了分步实施的策略,也就是说先对研究方案和技术进行试点测试,然后再推广到全DNA测序的“生产线”上。同样,癌症基因组计划也在开展一个试验性的项目,目的是开发和测试最佳科学方法,为描绘全幅癌症基因组图谱做准备。
2006年,美国国立癌症研究院和国家人类基因组研究院展开合作,各挑选了一批科学家和设备加入这个试验项目,并选定了几类癌症作为测试对象。此后3年,两家研究机构将投入约10亿美元的经费,把3种肿瘤(脑胶质母细胞瘤、肺癌和卵巢癌)中的基因突变绘制成图谱。选择这3种肿瘤作为测试对象的原因有很多,比如它们具有代表性,可以检验研究方法是否可行、能否运用于其他癌症。事实上,只有在这个试验项目达到预期目标之后,美国国立卫生研究院才会全面启动癌症基因组计划。
这3种癌症的发病率也很高。仅在美国,每年就会有21万人身患这3种癌症,2006年,约有19.1万美国人因此死亡。这3种肿瘤样本的收集过程也符合科学、技术和伦理规范。2006年9月,两家研究院宣布,选择了3个生物标本库作为试验样本的来源,还会根据需要采集更多样本,同时收集同一位患者正常的组织样本作为对照。这些机构会把样本提交到生物样本中心资源库,这个资源库是癌症基因组计划试验项目的4大主要组成机构之一。
另外3大机构则是癌症基因组鉴定中心、基因组测序中心、数据协调中心(见右侧项目机构组成图),所有机构都会相互协作、交换数据。具体地说,7个癌症基因组鉴定中心运用多种技术,检测肿瘤样本中的基因活性,找出在癌症发生发展的过程中,整个基因组发生过的变化,比如染色体重排、基因拷贝数增加、表观遗传上的改变等,并一一归类。
具有进一步研究价值的基因和染色体区域,会被癌症基因组鉴定中心选出,成为3个基因组测序中心的测序对象。那些可能对肿瘤发生具有重要作用的基因家族,例如调控细胞周期的酪氨酸激酶(tyrosine kinases)和磷酸酶(phosphatases)基因,也会成为测序对象,以检查这些基因是否发生了突变,DNA密码是否发生改变。在目前的小规模试验中,我们拥有约1,500个肿瘤样本,估计每个样本中约有2,000个基因需要测序。当然,需要测序的确切基因数目取决于两个条件,一是获得的样本数,二是癌症基因组鉴定中心的最新发现。
虽然测序中心和鉴定中心的多数成员都曾参加过人类基因组计划,但癌细胞中的DNA要比正常细胞中的复杂得多,对他们而言,这仍是一项挑战。一旦正常化细胞转化为恶性细胞,内在的自控和修复机制就会失灵,很容易发生高频突变。在癌细胞之间,基因组成分存在巨大差异,即便是同一肿瘤中的癌细胞也是如此。研究团队还需要开发一种方法,有效区分“信号”和“噪声”,这里的“信号”是指具有重要生物学意义的突变,而“噪声”则是原本就有的突变,与肿瘤的发生没有太大联系。肿瘤中还会藏匿一些非恶性细胞,这些细胞会“稀释”肿瘤细胞的信号强度。如果非恶性细胞过多,一些重要的突变可能会被遗漏。
在人类基因组计划的引领下,再加上近年来医学基因组学取得的进展,所有的数据都将很快取得,而且供全球研究领域免费共享。为了进一步提高数据的实用性,方便基础研究人员、临床研究人员以及卫生保健专业人士进行查阅,科学家还在癌症基因组图谱的数据信息和基因组分析结果上,链接了样品捐献者的肿瘤特征和临床信息。开发生物信息学工具,在严密保护患者隐私信息的情况下,对这些海量数据加以收集、整合和分析,则是为了实现我们的预期目标而必须清除的另一障碍。
战胜癌症
在癌症基因组计划中,还有多少问题尚未发现?还有多少工作尚待完成?未来将会怎样?大家都不清楚。不过,科学家们坚信,癌症基因组计划将会帮助人类战胜癌症。
癌症基因组计划的未来仍然面临诸多困难,有来自科学技术层面的,还有来自政策方面的。新的测序技术是否像我们当初设想的那样经济可行?何时才能够改进和扩展研究手段,系统地检测肿瘤中的遗传改变,特别是促使癌细胞发生转移的部分?我们如何利用计算生物学的力量,为基础生物学家、临床学者以及卫生保健专家创造条件,便于他们充分利用这些数据?如何均衡地保护各方的知识产权,促进基础研究和新疗法的开发?美国国会何时通过禁止基因歧视的法案,从而使癌症基因组计划最大限度地保护人民的健康?还有很多问题也许我们至今尚未发现。
另外,人们也不能期望过高。尽管能为很多生物学研究提供资源,但癌症基因组图谱只是未来癌症研究的基础,并不能解决所有问题。目前,癌症基因组图谱中还存在大片空缺,如果能填补完整,肯定有助于人类打败癌症,然而“填补工作”极其浩大,需要科学家们付出数年的艰辛努力,而且各个学科的研究人员必须相互合作,创造性地解决问题。
这项工作将会指引我们走向何方,至今尚不明确,从这个意义上说,我们今天所处的位置,与19世纪探险家梅里韦瑟·刘易斯(Meriwether Lewis)和威廉·克拉克(William Clark)很相似。1804年,他们沿密苏里河进入当时未知的美国西北部探险,他们从当时的美国总统汤姆斯·杰斐逊那里接受的命令是,“在所有值得注意的地点测量经度和纬度……这样的探险会很艰辛,但获得的数据也很精确;要让别人和你们自己,都能看懂这些勘测数据”。
尽管刘易斯和克拉克最终未能实现最初的预期目标——发现横跨大陆的水路,但是令杰斐逊总统始料未及的是,两位探险家带回的详细地图让年轻的美国受益良多。为了拯救那些已经或即将受到癌症威胁的人们,我们只能希望21世纪的这次抗癌征程能够取得成功,甚至超越雷纳托·杜尔贝科的宏大梦想。
上一篇:群体生活使蜜蜂免疫力增强等14则
下一篇:未来的新型住宅