1929年9月的一天,美国新泽西州的文兰培训学校接收一名九岁的小女孩。这所曾经在优生学领域独树一帜的学校那时不再引人注目,曾经名噪一时的心理学家戈达德已经离开了十年。他那本《卡利卡克家族》的主角,自八岁时就来到这里的弱智女孩沃尔弗顿因为承担不起费用在成年后被转到附近一家州政府办的收养院。她那年已经40岁,在那里默默无闻与世无争地活着。
新来的小女孩名叫卡罗琳(Caroline Buck)。她出生于美国,却来自遥远的中国。她的妈妈赛珍珠(Pearl Sydenstricker Buck1)也同样地是在美国出生、中国长大。当年,赛珍珠的父母结婚后就去中国传教,只在怀孕后回美国分娩。赛珍珠出生后四个月时就被父母带“回”中国,在南京附近的江淮一带长大。虽然中文是她的第一语言,赛珍珠后来还是在美国接受大学教育。毕业后,她又回到中国任教,并在当地与一位美国青年结婚成家。1920年,28岁的赛珍珠有了女儿卡罗琳。与自己的父母一样,赛珍珠回美国分娩,然后带着初生的婴儿回到中国。
卡罗琳从小就明显表现出发育迟滞。孩子四岁时,他们举家返美到康奈尔大学深造。一年后,赛珍珠和丈夫分别获取英文和农学硕士学位。他们也为女儿四处求医,却得知卡罗琳的智力发育已经停止,不可能长成正常的成年人。回中国后,这个小家庭又在北伐战争中颠沛流离四处逃难。当他们在1929年重返美国时,赛珍珠选中文兰培训学校作为卡罗琳的归宿之地。
文兰学校条件优越,但不菲的收费绝非赛珍珠夫妇在中国教学的微薄薪金可以负担。为了孩子的福祉,与徐志摩、林语堂等作家名流私交甚笃的赛珍珠也走上文学道路,用英文写作以中国农民为主角的小说。这个新颖独特的题材在一位出版社编辑的慧眼识珠下轰动美国文坛。赛珍珠初出茅庐的长篇小说《东风西风》2和《大地》3相继洛阳纸贵,为她挣得丰厚的版税和接踵而来的荣誉。当她在1938年获知自己赢得诺贝尔文学奖时,嘴里冒出的是一句身边人不知所云的中文:“我不相信”。
成名后的赛珍珠在一天之内与丈夫离婚又与那位编辑结婚,开始她的新生活。她的大笔捐赠保证卡罗琳能在文兰学校得到终身的悉心照料。赛珍珠又领养了五个孩子,还致力于为文兰学校募捐、创办自己照顾不幸孩子的福利机构。但作为隐私和心病,她在日渐繁忙的社会活动中绝口不提卡罗琳。
直到1950年,已经58岁的赛珍珠才在友人劝说下创作《从未成长的孩子》4,公开卡罗琳的故事和自己作为母亲的心路历程。她借作品呼吁社会关注、尊重不幸的小生命以及他们的父母和家族。卡罗琳那时已经30岁,还是一个只会用蜡笔描画的“小女孩”。赛珍珠着重指出孩子父母都是高级知识分子,两个家族中也从来没有弱智者。显然,这个孩子的不幸并非遗传,与《卡利卡克家族》的故事背道而驰。赛珍珠因而认定戈达德将弱智完全归因于家族遗传极为不公平。
然而,赛珍珠万万没料到卡罗琳的命运确实来自父母的遗传。
卡罗琳还是个婴儿时,母亲赛珍珠注意到孩子的尿和身上总有一股怪异的霉味。直到《从未成长的孩子》出版七年后,她才得知那是一种罕见疾病的典型症状。1930年代初,挪威的医生佛林(Asbjorn Folling)在当地一位母亲的坚持下接诊两位有发育障碍的孩子时注意到他们尿中的异味,经过化验得知那来自尿中正常人不会有的苯丙酮酸(phenylpyruvic acid)。他怀疑那来自病人体内残留的苯丙氨酸。
苯丙氨酸是蛋白质中最常见的氨基酸之一。桑格检测牛胰岛素的氨基酸序列时,苯丙氨酸是他辨识出的第一个氨基酸,位于胰岛素长链的氨基末端。人的身体不会产生这种氨基酸,需要从食物中消化摄取然后用以组装自己需要的蛋白质。多余的苯丙氨酸会在肝脏内被一种特定的酶降解处理。佛林猜测他的病人体内缺少那种酶,过剩的苯丙氨酸未能得到妥善处理。它们有些转化为苯丙酮酸随尿排出,更多的则留在体内以某种方式阻碍大脑的发育。病孩的智力因此永久性地停留在婴儿状态。
尿中的苯丙酮酸可以很方便地用试纸鉴定。英国剑桥大学的医生彭罗斯(Lionel Penrose)得知后也在伦敦搜集病例展开调查,确认那是一种家族遗传病。他将该病正式命名为“苯丙酮尿症”(phenylketonuria,简称为PKU),其遗传表现完全符合孟德尔的遗传定律。像豌豆的矮茎或白花一样,苯丙酮尿症的背后有一个隐性因子。那些同时从父母双方获得这个因子的孩子才会表现出病症。他们的兄弟姐妹如果只从父母之一继承到该隐性因子,但从另一位父母得到的是相对应的显性因子,就会与父母一样长成健康的正常人。只是他们不知情地携带着那个隐性因子,有可能传递给下一代。
早在1939年时,彭罗斯曾在调研途中走访美国的文兰学校,诊断出卡罗琳患有苯丙酮尿症。但这位远来英国人的奇谈怪论没有被当回事。赛珍珠还要再等18年才获知女儿弱智的真实原因。
第二次世界大战后,彭罗斯被伦敦大学学院聘请为“高尔顿优生学教授”。那是优生学鼻祖高尔顿生前创办、捐赠的席位。5这让毕生反对高尔顿的优生学的他颇为尴尬。就任讲演时,彭罗斯即以苯丙酮尿症为例揭示优生学之荒唐:智力是一个外在“表现型”,背后有着多种内在的“基因型”因素,包括与智力没有直接关联的生理疾病。他估算英国有多达百分之一的人口携带着苯丙酮尿症隐性因子。对他们行使优生学的绝育等手段不仅牺牲面巨大,而且压根无从着手。
即使找出了病因,医生们对苯丙酮尿症也还是束手无策。唯一可行的办法是在幼童的发育尚未受影响时检查出病情以防患于未然。因为苯丙氨酸极为常见,几乎所有蛋白质对患者来说都无异于毒药。直到1949年——《从未成长的孩子》问世前夕——英国医生才研制出基本不含苯丙氨酸的特别食品。自1960年代开始,英美等国的初生婴儿普遍接受常规血检6。一旦发现病患即严格控制饮食,杜绝苯丙氨酸在体内积累阻碍大脑发育的机会。那个新时代的苯丙酮尿症患者固然从小无从享受普通人的美味食物,但他们不再重复卡罗琳的命运,在体力、智力上都正常发育成人。至少在这一病例上,人类终于以科学方式遏止病魔,无需诉诸残忍的优生学手段。
文兰学校里的卡罗琳对外面的世界浑然无知。她活到72岁,在1992年因肺癌去世。赛珍珠早已在1973年以80高龄辞世,死因也是肺癌。母女俩皆非吸烟者,她们的肺癌很可能也源自某个共同的遗传因子。
在人类历史长流中,卡罗琳的悲剧不过沧海一粟。与无数父母一样,赛珍珠在得知女儿病症真实来源后极为内疚。那已经是1950年代末期,克里克等人正在为生命编码的运作机制尽情地大胆假设。与豌豆茎的高矮、果蝇的变异一样,人类形形色色的遗传病也作为孟德尔式的遗传性状进入分子生物学的视野。
第二次世界大战临近结束时,化学家鲍林在一次展望战后科学规划的会议间隙听到医生们谈论一个名为“镰状细胞贫血”(sickle cell anemia)的遗传病。人体由数以几十万亿计的细胞组成,每个细胞每时每刻都在进行氧化“燃烧”产生能量。它们依赖遍布全身的血液循环带来由肺部吸入的氧。如果血液的输氧能力不足,细胞工厂无法正常运作,就会使人感觉疲劳虚弱、头晕及手脚冰凉等“贫血”(anemia)症状。造成贫血的原因很多,最常见的是营养不良,只要适当补充即可避免。但在非洲和美国南部的黑人中,医生发现很多人患有先天遗传的镰状细胞贫血症,无法通过营养改善。
曾饱受肾炎之苦的鲍林十分关心医学进展。他曾在战争期间积极研究对付传染病的人造抗体,更在那之前就已经开始研究血红蛋白:血红细胞中的蛋白质。血红蛋白的肽链折叠成圆球形,外围有铁原子可以与氧原子结合,是输送氧的得力运载工具。在显微镜下可见的血红细胞外形也近似圆盘状,因而俗称为红血球。但在镰状细胞贫血症患者的血液中,血红细胞只是在带有氧原子时像个圆盘。不带氧时,它们变成弯弯的月牙或镰刀形状。医生们因而将这种畸形的红血球称作“镰状细胞”(sickle cell)。这个外表形状的区别非同小可。镰状的血红细胞同时也比较僵硬,会在毛细血管中造成堵塞,为病人带来难以忍受的疼痛。它们也更容易自行分解而失去输送氧的能力,造成贫血。
对血红蛋白的结构和变性行为有所认识的鲍林立刻意识到这并非通常的生理疾病,更可能是人类尚未认识的“分子病”(molecular disease):因为体内某个分子的组成或结构发生异常而出现的疾病。鲍林指导学生进行系统的实验测定,发现镰状细胞与正常的血红细胞中的血红蛋白分子表面携带的电荷略有不同,证明它们的蛋白分子结构不一样。那只是一个分子尺度的微小差异,却为人类的健康和生命带来巨大威胁。他们在1949年发表论文,以《镰状细胞贫血:一个分子病》7的醒目标题宣告人类对疾病的认识也已进入分子层次。
血红蛋白的结构正是剑桥大学的研究项目。鲍林论文发表五年后,克里克领悟到镰状细胞与血红细胞中蛋白质的不同应该在于它们肽链中的氨基酸序列出现了差错。那时,桑格刚刚完成测定胰岛素的氨基酸序列不久。血红蛋白中的氨基酸数目超过500,如果同样逐一测定需要很多年的努力。但佩鲁茨组里的年轻研究员英格拉姆(Vernon Ingram)设计出一个巧妙的方法专门比较两个蛋白质序列的异同。他成功辨识出镰状细胞与血红细胞中蛋白质的500多个氨基酸几乎完全雷同,只有一个例外:一条肽链第六个位置上在正常的血红蛋白中是谷氨酸(glutamic acid),而在镰状细胞的蛋白中却变成了缬氨酸(valine)。正是这个细微差别改变肽链中氢键位置,形成不同的折叠方式而导致它们携带不同的电荷,造成血红细胞和镰状细胞的不同形状。
克里克尤其兴奋。蛋白质由细胞工厂组装而成,在500多个氨基酸的序列中出现这样一个孤立而又确定的区别不可能是组装过程中的随机差错。可以肯定那是细胞工厂所使用的设计蓝图本身——DNA、RNA中的碱基编码——出了问题。虽然还没有确实的证据,一个孤立的编码差错直接导致一个氨基酸的差错无疑为他那个DNA碱基序列和蛋白质氨基酸序列具备平行等同共线性的大胆假设提供了一个有力的根据。
达尔文提出进化论时很清楚这个“物竞天择适者生存”的过程需要一个似乎自相矛盾的遗传机制。生物的代代遗传必须忠实地延续“龙生龙凤生凤”的物种稳定性,同时却又需要提供随机的个体变异。二者既对立又互补,才能造就出在不同环境下接受天择的适者,让那颗生命之树枝繁叶茂。但在稳定的遗传中如何出现随机的个体变异却是一个谜。达尔文无所适从,只得抱怨“我们对遗传的规律几乎一无所知”。他不知道孟德尔那时已经发现遗传规律,只能自己臆造出一个“泛生假说”,却无法自圆其说。
19世纪末的德弗里斯将对进化过程至关重要的“变异”改称为“突变”。他和后来的摩尔根分别利用月见草和果蝇中的突变否定达尔文的泛生论,证实孟德尔定律。摩尔根的学生穆勒更发现突变不仅自然发生,也可以在X射线照射下被人为激发。德尔布吕克由此推断遗传的信息——基因——以编码形式储存在分子的结构中,其化学键会被高能的X射线光子破坏而改写编码。他还进一步猜想即使“自然”发生的突变也并非自发,可能是因为同样高能的宇宙射线轰击的结果。只是到达地球表面的宇宙射线过于稀疏,不足以激发出实际观察到的那么多突变。
直到有了DNA的双螺旋结构,这些困扰了遗传学家半个多世纪的难题才开始迎刃而解。生命的编码的确如德尔布吕克和薛定谔之想象储存在双螺旋中的碱基对中。当双螺旋打开时,每个碱基分子以它们的氢键找到与之互补的碱基分子,重新组装成新的双螺旋。因为碱基对的互补特性,这样的机制可以保证生命信息的忠实复制。但在他们那篇描述DNA自我复制的论文里,沃森和克里克也指出这个复制过程并非百分之百地可靠。作为编码的碱基分子本身结构就不稳定,随时可能从酮构型转变为与之互变异构的烯醇构型。那时,碱基分子中氢原子、氢键的位置突然变更,能与之结合的就不再是原来的互补碱基分子。如此复制出来的DNA所携带的基因便在那个碱基的位置上出现了编码错误。
人类DNA分子中的碱基对多达几十亿,堪称天文数字。单独一个碱基对出现错误似乎不足为道。但如果这个差错恰恰出现在定义血红蛋白第六个氨基酸的位置上,就可能将应有的谷氨酸编码变成缬氨酸编码。因为这一图纸差错,兢兢业业的细胞工厂不再能生产正常的血红蛋白,只能生产出以缬氨酸取代谷氨酸的次品。那便是镰状细胞贫血症的来源。
由于“一个基因一个酶”的特定性,编码中一个类似的小差错也足以导致细胞工厂无法生产出分解苯丙氨酸的酶,从而造成苯丙酮尿症的悲剧。因为生物体内的细胞总是在不断地分裂、基因在不停地被复制,这种差错出现的几率远远大于宇宙射线的影响。沃森和克里克认为这才是生物体自发突变的真正原因。
按照魏斯曼的分类,当这样的差错出现在普通的体细胞中时,它们只会影响到生物体自身。但如果差错出现在生殖细胞里,该个体的子子孙孙都可能继承到这份发生了突变的基因,成为物种中的变异。也许这个突变正好更为适应后代们所处的环境,让它们成为适者而生存壮大,甚至演变成为新的物种。但更为可能的是突变导致类似苯丙酮尿和镰状细胞贫血的病症,为后代带来无尽的痛苦和悲哀。有意思的是,这两个极端情形也不总是非此即彼。遗传学家那时已经发现镰状细胞对疟疾(malaria)病症有一定的防护能力。在两害相权取其轻的物竞天择中,镰状细胞在疟疾肆虐的热带环境中生活的黑人来说会略占生存优势,故而得以延续至今。
在鲍林发表镰状细胞贫血论文的那一年,遗传学家通过调查证实这个疾病的遗传也符合孟德尔定律。他们更发现多达百分之八的黑人血液中有着镰状细胞,但只有千分之二的人口患有由此而来的贫血症。在其他那些健康的人体内,镰状细胞与正常的血红细胞和平共处,数量上各占一半。
我们每个人都来自父亲精子和母亲卵子结合而成的受精卵,身上也都有着分别来自父母的两套染色体、DNA。如果只是其中一套的DNA存在差错而另外一套有着正常的血红蛋白基因,身体内的细胞工厂会尽职尽责地按照两份不同图纸同时生产出两种稍微不同的血红蛋白。这样,虽然正常的血红细胞只占半数,也足够维持血液循环中的输氧任务。这样的“病人”因而安然无恙,不会表现出贫血症状。只是他们仍然携带着制造镰状细胞的基因,有可能通过生殖细胞传递给下一代。当某位子女不幸地从父母双方得到的两套染色体的DNA都带有错误的基因,他的细胞工厂便只会生产镰状细胞,不再有正常的红血球。他也就在劫难逃地患有镰状细胞贫血症。
基因正是这样通过蛋白质的合成引领、操纵着生命体的进程。苯丙酮尿症也同样。如果孩子从父母那里只继承到一个带有差错的基因,那另一个正常的基因已经足以让细胞生产出分解苯丙氨酸所需要的酶。像赛珍珠本人一样,这样的孩子只是突变基因的携带者,自己正常健康。只有像卡罗琳那样同时得到两份同样的错误基因的孩子才会因为缺乏必须的酶而深受病害。
这便是孟德尔早就观察到的隐性因子行为。豌豆的矮茎是一个隐性因子,与显性的高茎豌豆杂交后都长成高茎,不会表现出矮茎的性状。只在继续杂交的第三代中,四分之一的豌豆才会以矮茎出现,因为它们同时得到了两份矮茎因子。摩尔根早已指出孟德尔的遗传因子就是染色体上的基因。随着人类对生命编码的组成和功能的认识,隔代遗传和隐性因子也不再神秘。它们有着清晰的分子生物学基础。
鲍林不知道卡罗琳。但在加州理工学院附近的一所精神病院里,他亲眼目睹众多被收留的智力和精神残障孩子。他们之中相当一部分与卡罗琳同样患有苯丙酮尿症。在1955年的夏天,鲍林已经从科学文献中认识到这个与镰状细胞贫血症类似的分子病。看到那些孩子悲惨的命运,作为化学家的鲍林有了新的使命感。他相信绝大多数弱智或精神疾病其实都是分子病,来源于人体内部某种化学不平衡或“失调”。在一次精神病学术会议上,他甚至毫无根据地宣称最为怵目惊心的“精神分裂症”(schizophrenia)也应该是一种分子病。为了治病救人,鲍林特意申请到一大笔基金资助,在他的加州理工学院化学部成立专攻精神病之分子来源和对策的研究项目。
在英国的剑桥,克里克则为镰状细胞中蛋白质与正常的血红蛋白只相差一个氨基酸,从而意味着DNA中的碱基序列与蛋白质中氨基酸序列的确存在共线性而欢欣鼓舞。但他更想知道DNA的碱基序列究竟是以怎样的一个差错将血红蛋白中的谷氨酸置换成缬氨酸。
薛定谔曾经在《生命是什么?》中设想,如果人类能够读懂染色体中的生命编码,就能预先知道一个受精卵的未来会是一只黑公鸡还是一朵杜鹃花。伽莫夫在看到DNA双螺旋结构后也立即指出其中的编码可以用来精确定量地为生物物种分类。当克里克论述他的中心法则时,桑格的测序技术已经开始推广应用,越来越多的蛋白质氨基酸序列将被展现在人类眼前。克里克因而预测一个以蛋白质的氨基酸序列研究物种的“蛋白质分类学”(protein taxonomy)的诞生。
但是,人们那时还无法窥探核酸中的碱基序列。生命的编码仍然是一个未解的神秘。
(待续)
Sydenstricker 是她原来随父亲的姓,在中国简化为“赛”。她第一次结婚后改随夫姓 Buck。
East Wind: West Wind
The Good Earth
The Child Who Never Grew
在改学医之前,彭罗斯曾学习数学和心理学,是一个通才。他有四个杰出的孩子,其中二儿子 Roger Penrose 是著名数学家和物理学家,2020年诺贝尔物理奖获得者。
查血比查尿能更早发现病症。
Sickle Cell Anemia, a Molecular Disease