还在以基因工程为标志的现代生物科学蓄势待发的1970年代初,在美国国立卫生研究院任职的分子生物学家卢因(Benjamin Lewin)感受到时代的脉搏。他曾经在《自然》杂志担任过编辑,对那份已经有百年历史的学术期刊的保守和死板十分反感。1974年,卢因辞职“下海”,自己创办一份名为《细胞》1的新型生物学学刊。这份别具一格的杂志果然与随即而来的生物学黄金岁月相辅相成,赢得与老牌的《自然》和《科学》平起平坐地位。
不过纵使是新期刊也难免重蹈老字号的覆辙。《细胞》在2012年3月收到一篇描述细菌CRISPR免疫系统如何运作的论文。编辑部像十年前《自然》对待莫希卡发现CRISPR是细菌免疫系统的论文一样,未经同行评议程序就直接打了回票。他们的理由也如出一辙,都认为论文的价值不大。
《细胞》收到的论文来自偏僻遥远的立陶宛,通讯作者是那里一位名叫西斯尼斯(Virginijus Siksnys)的分子生物学家。他在西方不为人所知,但论文的作者中也有两个在CRISPR领域耳熟能详的名字:曾经以实验证明CRISPR确实是细菌免疫系统的巴兰古和霍瓦特。西斯尼斯是在读到他们那篇论文后写信联系,旋即展开跨越美国、法国和立陶宛的国际合作而有所斩获。惨遭《细胞》拒稿后,他们又将论文转投给《细胞》刚刚创立、档次稍逊一筹的《细胞报告》2,不料也没被接受。
两个多月的时间就这么耽误了。情急之下的巴兰古将论文摘要寄给杜德娜,恳请这位CRISPR新专家用她的科学院院士身份将论文推荐给《美国国家科学院院刊》尽快发表。院士在院刊上发表或推荐的论文无须同行评议,可以直接放行。3当然他不知道,杜德娜那时正与沙尔庞捷和她们的学生们开始起草同一个课题的论文。
为避免利益冲突,杜德娜婉拒巴兰古的请求。她也因此切实感受到时不我待的迫切,加急完成自己的论文后还屡次三番地催促《科学》编辑部加快动作。同样不愿意看到其它刊物捷足先登的《科学》以前所未有的速度加急发表杜德娜的论文。而西斯尼斯的论文还要在三个多月后才终见天日。
杜德娜的论文问世两星期后,2012年的CRISPR会议又回到伯克利举行。这个小型的年会已经吸引世界各地的著名生物学家高朋满座。痛失论文先机的西斯尼斯也不远万里赶来。巴兰古特意安排他在会上率先演讲,在杜德娜和沙尔庞捷团队之前介绍成果。不过杜德娜和沙尔庞捷在台下洗耳恭听之后倒大松一口气。她们这个差点抢先的竞争者讲述的只是Cas9如何与crRNA协同完成免疫运作。他们完全没能察觉tracrRNA在其中的关键角色。
伊尼克和奇林斯基在西斯尼斯之后联袂登台。两位年轻人既胸有成竹又紧张得手足无措。但他们展示的细菌免疫系统运作过程远比西斯尼斯的更为具体深入,赢得满堂喝彩。尤其是他们将crRNA和tracrRNA连接成单一的sgRNA,让自然世界中的CRISPR-Cas9摇身一变为人类实用工具的手笔更是巧夺天工。即使巴兰古和西斯尼斯也心悦诚服,无法再对失去优先权耿耿于怀。
然而,作为基因编辑的实用技术,CRISPR-Cas9的优先权之战那时才刚刚拉开序幕。
按照克里克的猜想,作为单数的物种——最原初的生命体——起源于平平无奇的RNA分子。也许只是碰巧,某些RNA分子中的碱基序列对应于有意义的氨基酸序列,由此产生出生命过程的主角:蛋白质。同时,这些RNA分子具备自我复制的能力。它们因而发展壮大,开启生命的历程。
但因为只是一条碱基单链,RNA分子很不稳定,极易发生变异甚至分解。它们显然不足以担当长久储存生命编码的重任。在其后漫长的进化中,生存下来的适者逐渐形成一整套保护基因的配备。
首先,RNA分子中的碱基找到与之互补的对象,变为稳定得多的DNA双螺旋结构。这些DNA分子再由各种蛋白质分子包裹,形成紧密的染色体。它们不再会轻而易举地散开、分解。这还不算,包裹着DNA的染色体又被置放于细胞核之内。它们闭门谢客,只是在细胞分裂而需要复制染色体时才会偶尔露峥嵘,让弗莱明在1882年首先探测到染色体的存在。在那之后,RNA分子退居二线,沦为只是将细胞核内DNA的编码信息传递到细胞核外组装蛋白质的中继信使。
DNA、染色体和细胞核等物质组成一道又一道的壁垒,护卫着至关重要的生命编码。当然这个系统并非十全十美。染色体不断复制中难免的差错、高能射线的照射、病毒的侵袭等等都可能造成DNA中的个别碱基对出现变异。但因为细胞内的这些保护以及纠错机制,突变发生的几率被降至非常之低。
高保真的生命编码遗传和极为偶然的个体突变正是进化论中两个必不可少却也似乎自相矛盾的前提。这个曾经困惑达尔文多年的怪圈在被克里克冠之以“中心法则”的体系面前却自然而然。于是,生命体既以龙生龙凤生凤的遗传繁衍生息,也同时逐步进化出千姿百态的生命之树,也就是作为复数的物种。
这个进化的过程最终造就出智慧的人类。他们不仅如饥似渴地认识自然,还孜孜不倦地以自己的意愿改造自然。在20世纪中叶认识并破解储存在DNA双螺旋中的生命编码之后,人类便处心积虑地寻求改写这个编码的方式。从只是简单引入外源基因的转基因技术开始,他们在21世纪之初终于找到能够精准剪切DNA的工具。不过,改写生命编码也就是人为地制造基因突变。那也需要突破细胞内保护DNA的层层障碍。
伊尼克和奇林斯基在伯克利向几百名专家讲解CRISPR-Cas9时,他们还只是在试管中演示其效用。在那个无细胞的“体外”环境里,携带着sgRNA的Cas9随时会与相应的DNA分子狭路相逢,毫无阻碍地通过碱基对互补确定DNA部位后剪断后者的双螺旋长链。在现实的链球菌细胞中,病毒的DNA也游离在细胞质之中,没有染色体、细胞核的保护。带着罪犯照片的警察捕捉这些入侵之敌时同样不会受到阻扰。其实,即使是链球菌自身的DNA亦是如此。细菌是没有细胞核的原核生物,它们自己的DNA与入侵的病毒DNA一样在细胞质中裸泳,也可以方便地被Cas9俘获。因而可以想象,只要在sgRNA中设定合适的编码,人类就能利用CRISPR-Cas9反其道而行之地改写细菌的DNA4。
只是这个手法只适用于最简单的细菌。在那之外,植物、动物乃至人类都属于细胞中具有细胞核的真核生物。它们的DNA有着染色体的包裹,被收藏在细胞核里。要改写其中的生命编码,手持sgRNA的Cas9警察不能只是消极地在细胞中巡游,等待目标的出现。它们必须主动出击,进入细胞核捕捉猎物。这是一个崭新的挑战。以往的各种基因工程都只是在细胞中进行,还从来没有进入过细胞核。CRISPR-Cas9是否能克服这一障碍,不仅杜德娜和沙尔庞捷尚未尝试,会议上也没有哪个专家敢下断言。然而毋庸置疑,仅仅针对细菌的基因编辑不会有太大的意义。CRISPR-Cas9要真正成为革命性的技术工具,必须能够直接对付人类细胞中的DNA。
虽然杜德娜和沙尔庞捷的团队已经先声夺人,她们都不是细胞学专家。在解决CRISPR-Cas9编辑真核生物细胞中DNA的难题上,在伯克利济济一堂的所有人都还站在同一条起跑线上。伊尼克和奇林斯基的报告无异于一声发令枪响。诸多教授们不待散会就已经在远程指示自己实验室人员着手准备实验,力图争得先机。
会上没有人知道,一位从来没有参加过CRISPR年会的圈外人早已悄悄地抢先跨过了那条起跑线。
1990年,曾经在20年前因《仙女座菌株》一举成名的作家克莱顿又推出新的科幻小说《侏罗纪公园》5。他这次描写的不是来自天外的微生物,而是在地球上早已绝迹的庞然大物:恐龙。故事中的生物学家找到一个年代久远的琥珀,里面禁锢着一只远古的蚊子。他们发现蚊子的肚里还留有恐龙的血液,从中可以提取恐龙的DNA。应用一系列基因工程手段,他们成功地重新孵育出活生生的恐龙。这部引人入胜的小说在三年后被改编为同名电影,以其惊险的故事情节和生动逼真的特技风靡全球。
当13岁的张锋(Feng Zhang)和同学一起观赏这部电影时,他们的注意力没有集中于银幕上那些活灵活现的恐龙。更让他们惊异的是影片里科学家如何复活恐龙,创造人间奇迹的过程。那其实是一次生动的课堂教学。虽然电影情节只是幻想的虚构,克莱顿在书中详尽描述的基因技术却有着扎实的科学根据,并非天方夜谭。多年以后,张锋还会开玩笑说《侏罗纪公园》是他看过的第一部“纪录片”。
张锋在1981年10月22日出生于中国河北省的石家庄市。那正是中国全面走向改革开放的年代。十年后,母亲得到机会独自去美国访问学习。在见识到那里中小学拥有的优越教学条件后,她在第二年将年仅11岁的张锋带去那个遥远陌生的国家。母子俩在美国中西部的爱荷华州安家。虽然他们身处州府,那也只是一个僻静的小城,完全无法与人口稠密的石家庄相提并论。母亲一边打工一边照顾儿子的生活和上学,以身作则地教导儿子自立、勤奋,同时还保持为人随和的个性。不到两年,张锋已经掌握英语,适应新环境。因为课业优秀,他被所在学校推荐到市里参加为天资聪颖学生专设的星期六兴趣班。正是在那里,他看到《侏罗纪公园》,也开始接触到生物科技。
因为父母都从事计算机工作,少年张锋那时着迷的是时髦的计算机技术。他已经自己学会拆解、组装个人计算机和编写各类程序。但在这个兴趣班里,他幡然醒悟:计算机已经是属于他父母那一代的旧技术。新的世纪即将到来,像《侏罗纪公园》里的生物学家那样编写生命的程序才是自己的未来。
高中时,张锋到医院义务劳动,协助一位分子生物学家做实验。他亲手从海蜇6的细胞里提取一个制造发荧光蛋白质的基因,将它植入人类的皮肤癌细胞。就像一个新写的计算机程序运行成功一样,张锋无比惊异地看到癌细胞也发出了荧光。进一步,他还发现被如此转基因的皮肤细胞犹如获得防晒霜,可以保护其DNA不被紫外线损伤。随后,他又在那位导师指导下以实验解析导致艾滋病的HIV病毒基因。2000年高中毕业时,他在全美国“英特尔科学人才竞赛”7中荣获第三名。同时,他也被哈佛大学录取,骄傲地用自己赢得的五万美元缴纳部分学费。
在哈佛得到物理、化学双学位后,张锋转战西海岸的斯坦福大学,在生物工程系攻读博士学位。导师戴瑟罗斯(Karl Deisseroth)是精神科医生出身,那时也刚刚成为助理教授。在戴瑟罗斯的指导下,张锋将一个对光敏感的蛋白质基因植入老鼠的神经细胞。被这么转基因后的老鼠变为听话的玩具,任由他用激光脉冲指挥着时而静若处子时而动若脱兔。
克里克早在20多年前已经预见到这个情形。他那时离开热门的生命编码,转向研究植物的光合作用和动物神经对光刺激的反应时曾设想过用光精准地控制动物的神经行为。这个“光遗传学”(optogenetics)8直到21世纪初才成为现实。张锋的实验便是奠定这门新兴学科分支的一个重要贡献9。
博士毕业后,张锋又回到东部的哈佛大学,在丘奇(George Church)的实验室里继续博士后研究。他那时已经不再满足于手法繁琐而效果有限的转基因技术,希望能找到直接修改生物体基因的途径。丘奇曾经是人类基因组计划的老将,也对基因编辑情有独钟。他有一个与《侏罗纪公园》相似的梦想,要以基因工程手段复活另一个绝迹的巨兽:猛犸象。与在斯坦福一样,张锋来得恰逢其时。丘奇那时正在紧锣密鼓地探索如何在细胞核中实施基因编辑。
19世纪初的布朗第一次在显微镜下观察到细胞核时曾将它比喻为一个裹着薄膜的小豆子。那层薄膜——“核膜”(nuclear membrane)——正是真核生物用来保护细胞核的屏障。细胞的外围也有类似的保护性细胞膜。它们像一个栅栏,以其中的缝隙允许小型的原子、离子和分子进出,但将个头太大的分子拒之门外。细胞核的核膜同样不是一个硬壳。细胞核内部的运作需要一些酶的协助。这些蛋白质必须在外边的细胞工厂中生产,然后再进入细胞核内履行职责。当然这些酶与其它无法进入细胞核的酶在大小上相差无几,说明核膜不是细胞膜那样的栅栏。分子生物学家在1980年代开始认识到核膜的奥秘:能够进入细胞核的分子携带有“通行证”。那是一个叫做“核定位信号”(nuclear localization signal)的特定氨基酸序列。只要带有这个序列,蛋白质分子就可以畅通无阻地进入细胞核。
张锋在丘奇的实验室里学会这个诀窍。他们一起用基因技术为各种能够剪切DNA的酶加上核定位信号,让它们蒙混过关进入细胞核。这样的操作固然颇有成效,但下一步基因编辑的结果却始终差强人意。那些酶最多只能固定地剪切DNA的某个位置,无法听从指挥指哪打哪。张锋的博士后很快结束,不过他也及时地在邻近找到自己的位置。
多年以来,在波士顿郊区比邻而居的哈佛大学和麻省理工学院保持着既友好合作又激烈竞争的关系。两所学校都曾在人类基因组计划中担当主力,因而在分子生物学领域的联系尤为紧密。在张锋从哈佛大学毕业的2004年,当地一对姓布罗德(Eli and Edythe Broad)的夫妇慷慨捐款建立一所新的生物研究所,由这两座美国东部传统“最高学府”共同管理,进一步深化两校之间的合作。2011年初,正在不断壮大中的布罗德研究所慧眼识才,招聘还未满30岁的张锋加盟。
张锋在那里继续基因编辑实验,仍然无所进展。终于有一天,他在一次讲座中听到演讲者顺带提到的细菌免疫系统,其中含有剪切病毒DNA的机制。张锋还从未听说过CRISPR,不得不动用谷歌搜索查找资料。第二天,他按计划飞到迈阿密市出席学术会议,却压根没在会场上露面。整个一星期,他把自己关在旅馆房间里阅读他能找到的所有CRISPR文献,尤其是丹尼斯科公司巴兰古和霍瓦特的那篇论文。
那是2011年的1月底,杜德娜还要再过一个多月才会与沙尔庞捷相逢。张锋没能在那时的文献中查找到CRISPR的具体运作机制,但他已经看到CRISPR比他过去尝试过的所有方法都更为优越的潜力。作为免疫系统,CRISPR必须能够随时更改目标,剪切新变异的病毒。因而那会是一个像计算机一样可以通过人为编写程序控制的工具。
为了保护生命编码的完善,细胞在几十亿年的进化中磨练出一整套的纠错能力。DNA的双螺旋不仅提供结构稳定性,其互补的两条碱基链也是一个互为重复的冗余设计。在真实的细胞环境里,一旦其中一条长链发生断裂、缺失,细胞中的酶会立即行动,根据另一条链中的完整序列修复损伤。杜德娜在哈佛的博士导师绍斯塔克早就指出:任何基因编辑工具必须同时在同一个位置剪断DNA的两条长链,才能致使细胞的修复机制束手无策而真正达到剪切的目的。张锋欣喜地看到CRISPR在这里正好具备先天优势。作为免疫系统,它们在剪除病毒DNA时也必须如法炮制才能避免入侵的DNA被修复而起死回生。因此,CRISPR早已在进化中学会了同时剪切双螺旋的两条长链。
在迈阿密的旅馆里,张锋频繁地以电子邮件与哈佛的研究生丛乐(Le Cong)联络。丛乐也来自中国,正在丘奇指导下攻读博士学位。但他无论在学业还是在生活上都与张锋关系更为密切。张锋告知丛乐,他们必须立即改变研究方向,全力以赴于CRISPR。同时,张锋还留了个心眼,特意嘱咐丛乐不要向丘奇透露他们的新举动。
回到波士顿后,张锋和丛乐悄无声息地开始了他们的CRISPR实验。他们不是杜德娜那样的生物化学家,对CRISPR系统中的各个化学成分以及它们在体外的试管环境中如何运作没有什么兴趣。张锋关心的只是这些来自原核生物的酶能不能在真核生物——尤其是哺乳动物——细胞中施展同样的功夫。因此,他和丛乐不由分说地直接开始细胞实验,为CRISPR的各种Cas酶人工添加上核定位信号,让这些带有罪犯照片的警察混入细胞核重地。
一年的时间很快逝去,他们还没能获得显著进展。被他们乔装打扮过的Cas酶的确能够进入细胞核,但还是难以完成缉拿罪犯——剪切DNA——的关键任务。张锋这才醒悟:CRISPR系统比他想象的复杂。他们需要细菌学家帮忙。2012年元旦刚过,张锋就急忙给洛克菲勒大学的马拉菲尼(Luciano Marraffini)发出一份电子邮件。简短地自我介绍之后,他直截了当地询问对方是否愿意合作。
三年前,还是博士后的马拉菲尼和他的导师一起证明CRISPR的功能与那时众人猜测的RNA干扰无关,它们是通过直接剪切病毒的DNA达到剿灭病毒的目的。张锋早已读过马拉菲尼的论文,知道他是这方面的专家。马拉菲尼则从来没听说过张锋。他动用谷歌搜索,赫然发现这个比自己还小七岁的年轻人非同小可。他们旋即开始友好合作。马拉菲尼很快指出张锋的困难在于他陷入CRISPR里各种不同的Cas酶的乱麻中不可自拔,建议他专攻Cas9这一种酶。沙尔庞捷那时已经指出Cas9和crRNA、tracrRNA一起足以构成最简单的细菌免疫系统。
有了马拉菲尼的协助,张锋和丛乐终于开始有了长足的进步。CRISPR-Cas9不仅可以在细菌的细胞里大显身手,也确确实实能够进入哺乳动物的细胞核,按照crRNA的指令剪切DNA。当杜德娜和沙尔庞捷等人的论文在2012年6月出现时,张锋又立即采用她们描述的Cas9和sgRNA组合,继续优化基因编辑的步骤。但他同时也明白自己必须立即发表论文。这个新领域已经热火朝天,稍有延迟便会被其它众多的研究组抢占先机。
2012年10月5日,张锋将写好的论文传送给《科学》杂志。两个多月后,论文顺利完成同行评议等手续,在2013年1月3日发表。CRISPR的伯克利会议才过去半年,那个圈子里除了马拉菲尼还没有人知道张锋这个名字。这个突如其来的变故不仅让远在西海岸的杜德娜目瞪口呆,更令近在咫尺的丘奇火冒三丈。
(待续)
Cell
Cell Reports
当年伽莫夫曾企图以这条途径发表他的DNA空穴论文,只因为他作为物理学院士跨界发表生物学论文导致怀疑而未能得逞。
细菌自制的Cas9倒是不会反过来剪切自己DNA中收集储存的病毒基因片段,因为那另有专门的保护机制。
Jurassic Park
jellyfish
Intel Science Talent Search;早年曾经叫做“西屋科学人才竞赛”(Westinghouse Science Talent Search)。
中文传统上将“基因学”(genetics)翻译为“遗传学”,“光遗传学”的译名由此而来。但这个学科分支的目的是综合光和基因工程手段研究、操纵生物体的神经活动,并不涉及后代的遗传。
戴瑟罗斯和他的研究生博伊登(Edward Boyden)通常被认作光遗传学的创立者。也是在1980年代从中国到美国的潘卓华(Zhuo-Hua Pan)可能更早完成这方面的实验,但因论文屡屡被拒失去优先权。