那年9月,伽莫夫没能在伦敦见到沃森或克里克。两位刚刚功成名就的年轻人已经离开剑桥大学。沃森的资助到期,在德尔布吕克安排下去加州理工学院继续博士后研究。克里克终于完成博士论文,按计划先去美国纽约市附近的布鲁克林理工学院1开始他的博士后生涯,准备一年后再应鲍林的邀请转往加州理工学院。那都还是他们在发现DNA结构之前所做的安排。相隔美洲大陆,他们不再能整天唇枪舌剑,也不再有他们的老鹰酒吧。
尽管各有各的任务,两人更为关注的还是伽莫夫一鸣惊人的新课题:DNA如何用它们的编码指导细胞组装蛋白质。那才是双螺旋之后的分子生物学核心所在。
其实,蛋白质中的氨基酸在肽链中如何排列、是否有一定之规在那个1950年代初期还没有定论。就在克里克和沃森全力对付DNA时,隔壁生物化学实验室的桑格(Frederick Sanger)正兢兢业业地实验,试图揭示蛋白质这个最为基本的内部结构。
桑格比克里克和威尔金斯小两岁,比富兰克林大两岁。他们都属于第二次世界大战前夕进入大学的年轻一代。桑格的父亲是剑桥培养的医生,毕业后不久即前往中国边行医边传教。他曾在中国南方创办一所学校,专为当地平民和穷人的孩子服务。1912年时,他因为染病不得不回国。那时的中国正走向推翻帝制后的军阀混战。
回到英国后,桑格的父亲继续行医,在40岁上才娶妻生子。桑格的母亲来自富商之家,为小家庭带来优裕的生活条件。桑格和哥哥、妹妹从小就读父亲皈依的“贵格”(Quakers)教会学校,习惯于安静、认真的生活方式。中学时,桑格跟随曾在卡文迪许实验室进修过的化学老师做实验,培养出对化学的浓厚兴趣。虽然父母希望他子承父业,桑格却不愿意重复父亲那没日没夜频繁出诊的辛苦。被剑桥大学录取后,他自主选择化学专业,并出于好奇选修自己从未听说过的生物化学。上大学后不久,他父母相继因癌症去世。
在那个动荡的岁月,桑格在学业之余积极投身校园内生机勃勃的学生活动,曾经与激进的大学生威尔金斯同属一个反战组织。不过他比威尔金斯幸运得多,在活动中结识志同道合的人生伴侣,毕业时共结连理。
桑格自认为学业平平,无法跻身学术界。他还是在报纸上看到那年剑桥毕业考试的一等学生名单中赫然有自己名字时才如梦初醒。那是威尔金斯和富兰克林都未能获得的荣誉。桑格赶紧亡羊补牢,抢在截止期前仓促申请研究生。
第二次世界大战已经爆发。作为信奉彻底和平主义的贵格教徒,桑格属于政府认可的“良心拒服兵役者”2,没有入伍参战的义务。因为母亲留下的丰厚遗产,他也不需要任何资助。凭借自己的好成绩和这两个独特优势,桑格顺利被剑桥接受。三年后,他获得博士学位。那时战火尤酣,克里克还在为英国军队研制水雷,要再等四年后才能来剑桥就读研究生。
桑格再也没有离开剑桥。他就近加入新来的奇布纳尔(Albert Chibnall)教授的实验室,在导师建议下研究“胰岛素”(insulin)的内在结构。那是动物胰腺分泌的激素,也是一种蛋白质。
糖尿病是人类最早认识、有文字记录的疾病之一,在古代的中国曾被称为“消渴”。它由病人时常口渴、尿中带有甜味得名。虽然历史悠久,千百年来医生对这一奇怪的顽疾束手无策,只能眼睁睁地看着饱受折磨的病人因之死去。直到19世纪末,医生才通过动物实验认识到糖尿病的病源在于病人体内缺乏胰腺中一些“小岛”状机体分泌的胰岛素,导致血液中的糖分过高。1922年,加拿大医生成功地将从狗的胰腺中提取、纯化的胰岛素注入糖尿病人体内,有效地控制病情。一年后,这项为全世界数以亿计糖尿病患者带来福音的成就赢得诺贝尔生理学或医学奖。
胰岛素因而成为医药界和科学界引人关注的蛋白质。奇布纳尔得到来自英国医学研究委员会和美国医药公司的大力资助。桑格因而摆脱“自带口粮”窘境,成为有薪金收入的正式科学家。当阿斯特伯里、威尔金斯等人为获得高质量的蛋白质、DNA样品费尽心机时,奇布纳尔和桑格可以方便地在街边的药店里购买高纯度的胰岛素晶体。
霍夫迈斯特和费舍尔早在1902提出蛋白质分子的基本结构:由氨基酸以肽键相连的长链。氨基酸虽然多达20种,它们的分子结构相当地一致:一颗“居中”碳原子的四个化学键各得其所,分别连接有氨基、羧基、氢和另一个基团。那个基团各有相异,是氨基酸有所不同的原因。两个氨基酸分子之间的氨基和羧基发生脱水缩合反应时形成肽键。更多的氨基酸如此接力而成长长的肽链,即为蛋白质分子。肽链是蛋白质最基本的一级结构。
在20世纪初期,这是一个被广泛接受但还没有直接证据的猜想。因为氨基酸分子结构的雷同,肽链中氨基酸——或者其中那个基团——的实际区别往往可以被忽略。鲍林后来便是如此解析出蛋白质的α螺旋和β折叠二级结构。他干脆把其中的氨基酸当作千篇一律的简单积木块。
当然蛋白质是生物体内种类最为繁多的分子。它们的千姿百态来自其不同的氨基酸构成。生物化学家可以在试管里重复动物消化道内的化学过程,用各种各样的酶切割蛋白质中的肽键,将其降解、分离成氨基酸以判定其成分比例。他们的化学分析技术在20世纪初也有了一个巨大的飞跃。与阿斯特伯里同在利兹大学的马丁(Archer Martin)和辛格(Richard Synge)发明使用过滤纸的“分配色谱”(partition chromatography)方法,可以既准确又高效率地分析蛋白质的氨基酸成分。因为这个成就,马丁和辛格在大战之后被授予1952年的诺贝尔化学奖。就连查戈夫也是从马丁那里获得过滤纸,将这个方法应用于分离核酸中的碱基时才发现碱基组成的查戈夫定律,为克里克和沃森最终发现DNA双螺旋结构立下汗马功劳。
桑格入伙时,奇布纳尔已经利用这些技术手段对胰岛素进行过精细的化学分析,知道那是一个相对而言很小的蛋白质分子,其中有着十多种氨基酸。他希望桑格能够再接再厉,分析这些氨基酸所组成的肽链。
正因为氨基酸分子大同小异,它们在肽链中的分布很难具体判定。化学家对肽链结构也众说纷纭,有些人甚至认为氨基酸在肽键中没有固定位置,可以互相随意替换。有些则认定氨基酸会在肽链中呈周期性发布,或者氨基酸之间另外还有或为吸引或为排斥的作用力决定着它们在肽链中的“亲近”或“疏远”。但这也都只是没有根据的猜测。在化学分析实验中,蛋白质被直接切割成单个的氨基酸,不再保留原有的肽链组成信息。
奇布纳尔知道肽链中至少有两个氨基酸分子比较特殊:位于长链两头的“末端”氨基酸分子。当其余所有氨基酸分子的氨基和羧基都已经脱水缩合成肽键时,那两个分子还分别保留着一个完整的氨基或羧基,形成肽链的“氨基末端”(N-terminus)和“羧基末端”(C-terminus)。如果用合适的化学试剂与这些剩余的氨基或羧基结合作为标记,就能在蛋白质被分解后继续识别出其肽链末端的氨基酸分子。通过末端分子的数量比例还能进一步推算出蛋白质中肽链的数量、大小等参数。
桑格不负师望,很快寻找到能有效地与氨基或羧基结合的不同试剂。他发现胰岛素分子中其实有着一长一短、以两颗硫原子组成的“二硫键”(disulfide bond)搭桥连接的两条肽链。长链的氨基末端和羧基末端分别是苯丙氨酸(phenylalanine)和丙氨酸(alanine);短链的尽头则是甘氨酸(glycine)和天冬氨酸(aspartic acid)。因为那些试剂只能标记最末端的氨基酸分子,他圆满地完成了导师交给的任务。
但细心的桑格还注意到实验中一个细节。如果减低酶的浓度,它们切割、降解胰岛素时不那么彻底,会留下少量的肽链碎片,其中有仍然相连着的两三个氨基酸分子。他的试剂同样会与这些小肽链的末端氨基酸分子结合成为标记。一个只有三个氨基酸的分子两端分别标记清楚后,三个分子的排列顺序即昭然若揭。如果收集到足够的不同碎片,他便能通过互相重合的氨基酸分子像玩拼接游戏一样复原出胰岛素的整个氨基酸序列。
虽然逻辑上直截了当,具体实施起来却是一个非常繁琐的过程。桑格带着几个学生几乎花费整整十年的光阴,才一点一点地理清胰岛素中氨基酸的序列。后来,他经常从实验室窗口看到克里克和沃森在外面走来走去,情绪激动地争论着。桑格不为所动。几十年后,已经退休的桑格回顾人生时承认:“在科学研究的三大主要活动——思考、言谈、动手——中,我最钟情也最为拿手的是最后一项。我思考尚可,但完全不善言谈。”3生性内敛、安静的桑格从来不与人争论,最喜欢莫过于自己在实验室里摸索,寻觅新的试剂、新的方法。那正是克里克和沃森的对立面。
在克里克和沃森发现DNA双螺旋分子结构的1953年,桑格也大致完成这个庞大的工程。胰岛素有两条肽链,分别由30和21个氨基酸分子组成。51个氨基酸分子的排列顺序已经解析就绪,只剩下连接两条肽链的二硫键还没能完全确定。
那年2月,桑格也是来到卡文迪许实验室103号络绎不绝的人流中一员。但他可能是最不引人注目的一位。默默地满足好奇心之后,桑格径直回到自己的实验室,一如既往地埋头苦干。他还需要两年的努力才在1955年全部完成胰岛素的一级结构。
因为成功解析胰岛素中的氨基酸排列次序,桑格在三年后赢得1958年诺贝尔化学奖。那年,他刚好40岁。
桑格最初的胰岛素样品来自现成的药物,由医药公司从牛身上采集而来。取得成功之后,他又相继测定来自狗、猪等哺乳动物的胰岛素,发现它们有着相同的双肽链结构。氨基酸的序列也完全一致,只是个别的氨基酸有所不同。这是从狗或牛身上提取的胰岛素能够直接造福人类的原因,也充分证明蛋白质中的氨基酸有着确定的次序。它们的序列既非随机也不是简单的周期性,更不可能由氨基酸分子自发形成。按照克里克和沃森的新发现,它只能来自DNA中的编码。
最早进行蛋白质和核酸X射线衍射实验的阿斯特伯里曾观察到角蛋白和胸腺核酸(DNA)有着极为相近的0.33纳米周期性。他觉得那绝非偶然,说明这两种分子之间存在有深刻的“立体化学”(stereochemistry)关联。伽莫夫仔细研究DNA的双螺旋结构后认定这个关联就在于DNA分子结构中的空穴与氨基酸分子的匹配。但他的设想过于简单化,在沃森看来不值一哂。
还在发现DNA双螺旋结构的半年前,沃森已经思考过这个问题。那时候,鲍林还没有完成他的三螺旋DNA模型,沃森和克里克都被禁止研究DNA。沃森有一次胃病发作,不得不连续几天窝在阴冷的剑桥学生宿舍里。在靠着壁炉随意翻阅学术刊物,思考DNA、RNA和蛋白质之间关系时,他突然意识到DNA在细胞中无法与蛋白质发生接触或立体关联。如果DNA拥有生命的编码,其指令必须通过RNA转送。
一个多世纪以前,米歇尔率先从细胞核中分离出与蛋白质迥然不同的有机分子,将它们称作“核素”。他的师弟科赛尔随后辨别出核素其实有两类:植物中的酵母核酸和动物中的胸腺核酸。然而,两类核酸其实在动物和植物中都会存在,因而又分别被改名为核糖核酸(RNA)和脱氧核糖核酸(DNA)。再后来,人们在细胞核外也发现了RNA。只有DNA才是真正的“核”酸,只存在于细胞核内。
细胞核外的细胞质才是蛋白质被大量生产的地方,那里却没有DNA。沃森因而认为DNA的指导必须通过中间媒介,那便是在细胞核内外通行无阻的RNA。他在纸上草草地写上“DNA --> RNA --> 蛋白质”的指令传送过程,贴在壁炉上方备忘。那时,他正奉布拉格之命研究烟草花叶病毒。那种病毒没有DNA,却也能用自己的RNA像肺炎球菌或噬菌体同样地劫持宿主细胞的蛋白质生产,也是RNA在这个过程中所扮演角色的例证。生物化学家还观察到被去除细胞核的细胞能够继续生产蛋白质。
伽莫夫横空出世的论文将还沉浸在发现双螺旋兴奋中的沃森拉回现实。虽然伽莫夫作为物理学家对细胞内部运作的复杂性缺乏认识,沃森也因此领悟解析RNA分子结构已经迫在眉睫。如果RNA在结构上与DNA足够相似,伽莫夫的蛋白质生成原理会同样适用。到加州理工学院后,沃森又一次自作主张将德尔布吕克安排的噬菌体课题置之不顾,找上鲍林的博士后里奇一起展开RNA的X射线衍射实验和模型构建。他们试图重现在DNA上的辉煌。
克里克在布鲁克林理工学院的博士后课题是用X射线衍射探测核糖核酸酶(ribonuclease)的分子结构。那是一种能够切割RNA的酶,也是蛋白质。但他对继续这样的实验分析已经毫无兴致,脑子里满是伽莫夫想象的空穴。无论应用于DNA还是RNA,克里克都认定空穴模型不切实际。不同氨基酸分子之间大小、形状的差异非常小,要在自然、优美的双螺旋结构中生成为每个氨基酸分子量身定做的空穴是一个过于苛刻的要求。但他更知道,否定伽莫夫匪夷所思的创见需要更为切实的证据。
伽莫夫提出空穴模型也并非一时心血来潮。他经过深思熟虑,包括如何实际检验这个模型。因为双螺旋中的空穴由一个碱基对和它们邻近两个碱基构成,每个空穴并非独立。每两个邻近的空穴都共享着同一个碱基。这个关联也会体现在组装后的蛋白质结构中:某些氨基酸序列将永远不可能出现。因为20种氨基酸的排列组合是一个天文数字,而已知的蛋白质结构序列只有胰岛素中那区区51个氨基酸,伽莫夫认为这样的检验尚且遥遥无期。但更为细致的克里克还是在桑格测定的序列中找出反例,宣告伽莫夫的空穴模型的破产。
于是,DNA中的编码如何指导蛋白质的组装这个分子生物学最基本问题依然是个谜。
伽莫夫的空穴理论先以快报方式在《自然》杂志上发4表。他随后更详细的论文却被《美国国家科学院院刊》拒稿。院刊编辑也拿不准这篇出自理论物理学家之手的生物学论文是否只是伽莫夫设计的又一个大乌龙,尤其是那论文赫然列有两位作者:伽莫夫和汤普金斯。伽莫夫弄巧成拙,后来将论文发表在不起眼的丹麦科学院院刊上。
在伦敦扑空后,伽莫夫锲而不舍,在美国分别找到克里克和沃森。他对沃森尤其亲近,觉得沃森瘦长的身材、突出的鼻梁和眼泡、放荡不羁的性格都与他当初在列宁格勒大学时的好朋友朗道(Lev Landau)如出一辙。20多年前,伽莫夫和朗道在大学里挥斥方遒,曾被定性为反革命遭受批判。后来,他们又都成为玻尔研究所的青年才俊,共同开拓量子物理学的前沿。
伽莫夫叛逃西方后,朗道留在苏联成为国际知名的一流物理学家。在1930年代的大整肃中,朗道曾经因为思想问题锒铛入狱,只因其他著名物理学家向斯大林求情才幸免于难。在随后斯大林和李森科的高压下,苏联的现代生物学界惨遭浩劫荡然无存。物理学家朗道遂成为一个消极抵制的象征。那些年,苏联知识界流传着一个笑话:李森科讲解获得性遗传理论后,在座的朗道举手提问:“你是说如果我们割掉母牛的耳朵,再割掉她生下的母牛的耳朵。这样一代代地割下去,我们迟早会看到母牛生下来就不会长耳朵?”得到肯定答复后,朗道不解地追问:那为什么现在的女孩子出生时都还长着有处女膜呢?
相隔着第二次世界大战之后的铁幕,伽莫夫与他当年的好朋友不再能有联络。在沃森这个美国小青年身上,他似乎找到些许慰籍。在沃森的影响下,伽莫夫也觉悟到RNA的分子结构才是当务之急。两位年龄相差悬殊的好事之徒共同发起“RNA领带俱乐部”5,邀集新老朋友为“揭开RNA结构之谜,弄懂它如何组合蛋白质”6的目标一同努力。
俱乐部的人数限定为20,与20种氨基酸对应。伽莫夫亲自设计、定制带有螺旋分子结构图案的领带。每个成员还得到刻有“自己那个”氨基酸名称的领带夹。伽莫夫当仁不让,给自己选定按字母顺序排列最前的丙氨酸。他自称为俱乐部“合成器”,将沃森和克里克分别指定为俱乐部的“乐观者”和“悲观者”。他们分别邀请的成员大都是生物学家或生物化学家,包括里奇、查戈夫、德尔布吕克等人。伽莫夫另外一位好友、物理学家和核武器专家泰勒(Edward Teller)以及加州理工学院的著名物理学家费曼(Richard Feynman)也都榜上有名。
德尔布吕克为俱乐部贡献一个壮怀激烈的座右铭:“作或死,否则别尝试。”7成败在此一举。这些科学前沿的弄潮儿真切地感受到,破解生命编码之谜已经指日可待。
(待续)
现在是纽约大学的工学院。
conscientious objector
Of the three main activities involved in scientific research, thinking, talking, and doing, I much prefer the last and and am probably best at it. I am all right at the thinking, but not much good at the talking
参阅《宇宙膨胀背后的故事(十三):宇宙万物始于“伊伦”》。
RNA Tie Club
to solve the riddle of RNA structure, and to understand the way it builds proteins.
Do or die, or don't try.