1942年时,50多岁的好莱坞著名影星卓别林(Charlie Chaplin)遇到麻烦。一名年方22的女演员起诉他始乱终弃,要求法庭裁决卓别林为他们的孩子支付抚养费。卓别林断然否认自己是孩子的父亲,指出该女演员另外还有几位情人。这场桃色官司一时风靡全国。
亲子认证是古已有之的难题。人们通常只能凭借相貌和传言胡乱猜测,即使清官也难断这个家务事。不过在卓别林的年代,可靠的科学工具已经出现。奥地利医生兰德斯坦纳(Karl Landsteiner)在20世纪到来时发现人体内的血液并不都一样,有被他分作A、B、O的三种血型1。它们的区别来自血红细胞表面一种蛋白质的差异。输血时如果血型不合适会发生血液凝固和免疫系统反应,危及病人生命。兰德斯坦纳因为这个发现赢得1930年的诺贝尔生理学或医学奖。
那也正是孟德尔实验重见天日的年月。医生们很快证实血型类别与豌豆的高茎矮茎一样符合孟德尔的遗传定律,其中的A和B血型为显性因子,O型则是隐性因子。人的血型因而决定于父母。卓别林案子里的孩子血型为B,母亲的却是A,可以确定孩子的B型血来自父亲。但卓别林的血型是O,不可能是亲生父亲。这几乎是无可争辩的铁证,却没能赢得陪审团的认可。他们在孩子的面容中依稀看到大明星的影子,或许也出于对孤儿寡母的同情,判定卓别林败诉。
卓别林输掉的不仅是官司。他的声誉一落千丈,万念俱灰地从好莱坞销声匿迹。这个判案随即遭到举国上下的谴责和嘲讽。加利福尼亚州议会赶紧亡羊补牢,立法要求州法庭尊重血型证据。不过血型在亲子鉴定中的作用也十分有限。任何与那位女演员有染的B型血男人都可能是孩子的父亲。假如卓别林碰巧也是B型血,就会跳进黄河也洗不清。血型种类屈指可数,最多只能排除一部分人的嫌疑。真正的亲子鉴定还要等待基因时代。
家族关系在1980年代成为基因研究的热门。遗传学家忙于利用人体DNA中的“限制性片段长度多态性”(RFLP)作为分子标记追踪各种遗传病的致病基因。1984年的一天,英国年轻生物学家杰弗里斯(Alec Jeffreys)在观察一个家庭众多成员的RFLP图谱时意识到它们互相之间极为相似,却也各有各的不同。他灵机一动,意识到RFLP在追踪遗传病以外也大有用途。
第二年夏天,一名律师读到报纸的报道后上门求助。他的客户是一位母亲,儿子独自去加纳探亲回来时被英国海关拒绝入境。他们怀疑来人不是那个儿子,被掉包为母亲在加纳某个姐妹的孩子。母亲没有办法证明孩子的确是自己的儿子,陷入困境。杰弗里斯出手相助,通过对他们及家人DNA中RFLP的比较证明两人确为母子,而那孩子属于母亲姐妹的可能性只有六百万分之一。因为这个强有力的证据,母子终得团圆。
一年后,杰弗里斯又应邀协助当地警局侦破奸杀案。警察已经破案,但想知道抓获的嫌疑犯是否也是三年前另一起奸杀案的凶手。比较两桩案件中的DNA样品,杰弗里斯确认那是同一人所为,却不是那位已经认罪的嫌疑犯。通过对当地3600多男人的DNA普查,他们在一番周折后找到真正的凶手。
杰弗里斯把他发现的分子标记命名为“DNA指纹”2。手指尖上的指纹是人们早已熟悉的体征。每个人都有自己独特的指纹,因而是破案和安全措施中常用的身份识别标志。DNA指纹亦是如此。除了DNA一模一样的同卵双胞胎,不会有两个人具备相同的DNA指纹。相比于传统的指纹,罪犯很难避免在现场留下自己的DNA痕迹,即使极少量的样品也会在PCR放大过程中暴露无遗。于是,DNA指纹很快成为警察不可或缺的得力工具。就连美国总统也难逃厄运。DNA证据在1998年显示克林顿确实曾与白宫实习生莱温斯基(Monica Lewinsky)关系暧昧,揭穿他的弥天大谎。那还是克林顿冠冕堂皇地宣布人类基因组测序完成的两年前。
因为血液、体液、唾液等样品中的DNA可以保存多年,其中的“指纹”协助破获大批尘封已久的悬案。在缉拿元凶的同时,它们也帮助一些张冠李戴的历史冤案得以纠正。
传统的指纹只能识别个人,没有遗传特征。DNA指纹在这里技高一筹。正如杰弗里斯在英国海关初试牛刀的杰作,DNA指纹也是精确的血缘认证手段。随着“23和我”等基因服务公司的出现,广义的亲子鉴定成为日常生活中的司空见惯。人们借此验证或发掘自己的真实血缘,还经常意外地找到失散多年甚至浑然不知的亲属。
弗莱明在显微镜下观察到染色体不久就发现生殖细胞与体细胞的重大区别:体细胞中有两两成对的两套染色体,生殖细胞却只有其中之一。他因此将体细胞分裂成生殖细胞的过程称为“减数分裂”。体细胞中的两套染色体分别来自父母,但生殖细胞只为后代取其一,在受精卵中与配偶同样贡献的另一套重新组合成后代的两套染色体。
染色体在减数分裂中既保持整体性又带随机选择的行为正是孟德尔“量子”式遗传规律的来源。然而,摩尔根和他苍蝇屋的小伙伴们随后观察到减数分裂也不是直接从现成的染色体中二选一,而是由一对染色体中随机地选取片段再组合成一根新染色体。这样,后代的染色体并非直接来自祖父或祖母,而是二者的交叉混合,更多地增加生命的多样性。只要不是同卵双胞胎,同一父母的亲兄弟姐妹也不会有完全相同的DNA。他们都会有自己的“指纹”。
每个人有特定的DNA指纹固然有助于警察捉拿罪犯,却也为年代久远的血缘认证增加难度。因为每一代父母的染色体都会在下一代的减数分裂中交叉互换,祖先的DNA指纹在后代身上会因不断的混杂而难以辨认。人类学家因此需要“一脉单传”的DNA,能在历经无数代的继承中保持原形。幸运的是,这样的DNA的确存在。
女性有23对染色体。男性却只有22对,外加一根X和一根Y染色体。那两根性染色体不成对,各自有着完全不同的基因。它们无法在减数分裂时交叉互换,只能随机取其一原封不动地传给下代。男性的生殖细胞是精子,其中只能有或者是X或者是Y的性染色体。当一个携带Y染色体的精子成功地与只会有X染色体的卵子结合时,受精卵会孕育新的男孩。只要没有发生随机突变,这个儿子的Y染色体与他父亲的没有区别。那也是他祖父、曾祖父、曾曾祖父……有过的Y染色体,保存着相同的“指纹”。因为女性没有Y染色体,这是一个现成的父系遗传标记。
2003年时,遗传学家在欧州和亚州各地开展Y染色体抽查,看到百分之八的男性带有某种共同的DNA指纹。他们认定这个指纹来自近1000年前的蒙古皇帝成吉思汗(Genghis Khan),估算出这位当年在欧亚大陆不可一世的枭雄在今天的世界上有着多达1600万的直系男性后裔。3这项研究轰动一时,但成吉思汗也绝非一枝独秀。后续研究又在欧亚大陆找到更多广泛存在的Y染色体指纹,分别出自十来位同样子孙满地的“成吉思汗”。他们之中包括清朝皇帝努尔哈赤(Nurhaci)的祖父觉昌安(Giocangga)。
同样的方法却无法用来估算成吉思汗或觉昌安的某位嫔妃留下多少后代。女性的23对染色体在每一代都发生交叉重组,不可能长期保持遗传标记。其实,女性体内也有着一脉单传的DNA,只是不在细胞核中的染色体里。那是游离于细胞质中的线粒体,也是人类遗传的一部分。除了张进等医生以线粒体替代疗法人为制造出的三亲婴儿,线粒体也都来自父母的遗传。更准确地说,它们来自母亲。
卵子和精子分别为雌雄两性的生殖细胞,也分属人体中最大和最小的细胞。卵子在结构上与其它细胞没有差别,有着微小的细胞核和大量的细胞质。精子比卵子小20倍,基本上只是一个细胞核和一个蛋白质尾巴。细胞核外只带有极少量必要的细胞质。它们只有一个使命,齐心协力像病毒一样将细胞核内的染色体送进卵子细胞。而除了染色体,其它物质都不得其门而入。即使有少量细胞质顺势混入,也会在卵子细胞里被尽数分解,对受精卵毫无贡献。4这样,受精卵的细胞质以及其中的线粒体完全来自女方。与Y染色体的父系遗传一样,线粒体中的DNA与母亲、外祖母、曾外祖母等等完全一致,是纯洁的母系遗传。
借助Y染色体和线粒体的DNA指纹,法医专家在1992年鉴定在苏联革命早期被处决的沙皇(Tsar Nicholas II)、皇后及他们子女被毁坏后埋葬70多年的遗体。在美国,当年国父杰斐逊(Thomas Jefferson)总统与他的黑人女奴海明斯(Sally Hemings)的私生子后代也在DNA证据的支持下获得正名。
成吉思汗的1600万直系后裔固然叹为观止,但研究人类遗传的专家并不为之惊讶。他们早已注意到一个不可思议的诡异。
每一个人都有两位父母、四位祖父母、八位曾祖父母、16位曾曾祖父母……,如此形成个人的寻根图。那是每个节点都有两个分叉的树形图,一个与细胞分裂同样迅速的指数增长过程。只要上溯30代,这个人的祖辈就会多于10亿。那是成吉思汗驰骋疆场的1000年前,当时地球上的总人口也不到这个数目。继续往前追溯,这个咄咄怪事便愈显荒唐。地球上不可能有足够的人充当这个人的祖辈。唯一的解释只能是个人寻根树上每个节点并不都由不同的人占据。过去相当多的人与这位后代有多重的亲属关系,即有过大量的近亲或远亲繁殖。但无论如何,某个时刻地球上所有的人,以及在那之前的所有人,都会是这个人的祖先。前提只是那些人曾经有过延续其血脉的后代。
这样一来,今天地球上全部人口都是遗传意义上的亲属。他们各自的寻根树早晚会在某个时刻发生重叠,出现共同的祖先。达尔文和高尔顿是表兄弟。达尔文的父亲和高尔顿的母亲是同父异母的兄妹。他俩的寻根树只需上溯三代便开始出现重叠,即达尔文的爷爷和高尔顿的外祖父是同一人,正是那位与拉马克同时期探讨物种进化、启发雪莱夫人创作《弗兰肯斯坦》的医生兼诗人。换成两位在今天“没有血缘关系”的陌生人,他们的寻根树迟早也会重叠,只是需要追溯更多代。数学家为此设计统计模型,推算出大约5000年前生存在地球上的人只要有后代就都是今天地球上所有人的祖先。这个结论也在DNA分析中得到证实。那是我们“最近的共同祖先”5。他们远比成吉思汗久远,生活在古埃及文明和中国传说中的黄帝年代。
鲍林最早意识到DNA中的生命编码不仅是生命运作的设计蓝图,同时也是生命进化历程的忠实记录。那还是1960年代初,人类刚刚认识DNA,尚未能一窥其中秘籍。鲍林指导一位博士后从动物园里的大猩猩、黑猩猩和猴子到日常生活中的马、牛、猫、狗等动物身上采集血红蛋白,运用桑格发明不久的方法测出氨基酸序列。血红蛋白很小,只有141个氨基酸。他们看到黑猩猩与人的血红蛋白几乎完全相同,只有一个氨基酸分子相异。而马与人的血红蛋白相比则有18个氨基酸不同。鲍林指出这些动物曾经有过相同的血红蛋白,来自共同的祖先。血红蛋白中的差异只是在进化的分道扬镳后才逐渐出现。差别越大,说明它们各奔前程的时间越早,在达尔文的生命之树上相距越远。结合已有的古生物学知识,他们估算出血红蛋白的氨基酸序列大约每1450万年出现一个变异。人类与马最近的共同祖先远在两亿多年前。黑猩猩则是人类近亲,迟至1100万年前才相揖而别。
十来年后,伯克利的威尔逊和他的研究生、后来的乳腺癌基因发现者金运用统计方法全面比较人与黑猩猩各种蛋白质的氨基酸区别,发现二者的相似度高达99%。他们证实鲍林的直觉和远见不限于血红蛋白,并将人与黑猩猩分离的时间更精确地定位于500万年前。
一个多世纪前,年轻的达尔文在加拉帕戈斯群岛观察到不同岛上生存着不同的雀,同时运回大量的化石标本。化石是那个年代研究古生物及其演化的唯一资料。借助放射性碳定年法(radiocarbon dating),化石能够告诉人们什么样的生物曾经在哪个年代生存过。考古学家由此确定达尔文生命之树上各个枝桠出现的大致年代。通过对蛋白质氨基酸序列的比较,鲍林在20世纪后期率先将分子生物学带进考古领域,另辟验证、发现生命进化历史的蹊径。氨基酸序列中的差异便是进化的“分子钟”6,与化石中的放射性碳含量一样能够量度生命进化的速度。
DNA测序技术出现后,鲍林的分子钟自然而然地更上一层楼,由蛋白质的氨基酸序列转为直接比较DNA中碱基序列的差异。1987年元旦,威尔逊又有了新的发现。他与两位研究生一起在《自然》杂志发表论文,宣称今天地球上所有人的线粒体都来自20万年前生活在非洲的一位女性。
这个比成吉思汗子孙数目更为惊人的结论就是将分子钟应用于线粒体的成果。通过对174名包括非裔、亚裔、欧裔和澳大利亚、新几内亚土著人线粒体样品7中的差异描绘出一幅全人类的“家族树”。结果显示人类有两大分支。一是非洲东部一个不大地域范围内的人,另一分支则遍布全世界,也包括非洲。分子钟显示前一分支的历史稍长,说明人类的共同祖先来自非洲那个区域。
借助这个分子钟,威尔逊还可以判断今天人类彼此间的线粒体差异来自20万年间的承继旅程,在那之前没有区别。它们因而都来自彼时彼地彼群人中的同一位女性——除非那时候所有人都有着同样的线粒体。那位堪称人类“祖母”的神秘女性随即被仿照《圣经》故事冠以“线粒体夏娃”8的称号。
又过十多年后,人类已经全面掌握基因组测序技能,分子钟技术也如虎添翼。斯坦福大学两位遗传学家以父系遗传的Y染色体代替母系遗传的线粒体重复威尔逊的步骤,也获得几乎雷同的人类家族树。与线粒体夏娃对应,历史上也曾有过一位“Y染色体亚当”9。
20万年前的非洲东部当然绝非《圣经》中仅仅几千年前的伊甸园。Y染色体亚当和线粒体夏娃在那个时代并不孤单,只是人类祖先群体中的两位普通人。他们很可能生活在不同的年代,谈不上相识、联姻生子。两人的Y染色体和线粒体在遗传中得以保留至今只是历史的偶然。他们也不是通常意义上的人类祖先,所提供的Y染色体和线粒体都只是人类基因中极小一部分。人体内另外22对染色体以及女性的一对X染色体,或者那之中的每一个基因都另有各自的亚当和夏娃。他们在几十万年的交叉互换中失去本色,无可分辨。取而代之的是人类今天各有不同而丰富多彩的生命编码。其超越让人争执不修的种族之别的多样性才是人类世代传承的宝贵遗产。
非洲是人类发源地的观点早已有之。《物种起源》问世12年后,达尔文曾在《人类的由来及性选择》一书中探讨过这个可能性。他的依据是人类的“近亲”黑猩猩、大猩猩都出自非洲,猜测那里可能是三者的共同祖先之所在。但人类是否有单一的起源也是历史悠久的争议。不同种族的人在不同地域分别出现的“多地起源说”往往显得更为合乎情理。线粒体夏娃和Y染色体亚当的相继“出现”终于为人类“单地起源说”提供第一个科学佐证。
威尔逊的发现也让人类学界目瞪口呆。他们早已在世界各地收集到更为古老的人类化石。即使非洲是单一发源地,人类早已在两百万年前走出那个故乡。区区20万年前的Y染色体亚当和线粒体夏娃还在非洲的几率应该不会很大。好在威尔逊的DNA传承并不与化石记录水火不容。人类可能曾经多次分批走出非洲,只有20万年前那一波中两位男女的Y染色体和线粒体有幸保留到今天。
曾经在威尔逊实验室担任三年博士后的瑞典遗传学家佩博(Svante Paabo)志在寻求人类早期历史的实际证据。为此他只能求助于化石,从中寻觅几十万年前的DNA。有着由氢键相连双螺旋结构的DNA结构相当稳定,不会自行降解。但生物体死后的遗骸会在环境影响下腐化衰败,细胞中的DNA同时被各种化学物和微生物破坏。只有在理想条件下,部分DNA还会残留在化石之中。那正是佩博热衷狩猎的对象。
1997年,佩博的研究生克林斯(Matthias Krings)首先取得突破,在尼安德特人(Neanderthal)的骨化石中找到DNA。尼安德特人的化石早在1856年在德国出土,因其骨骼与人类非常接近但也有一些明显不同而被以发现地点命名为不同的人种。同样的化石随后在欧洲、中东和北非等地出现,显示尼安德特人曾经在那片广柔地域长期生存和迁徙,直至大约三万年前突然消失。人类那时也正在同一片土地上生生不息。二者的关系引人暇思,也在学界争执不下。佩博和克林斯的发现终于为这场争论提供切实的根据。他们发现尼安德特人的DNA与人类的相似度远大于黑猩猩,确实属于人类进化的分支。但DNA中没有二者互相交融的迹象。
佩博没有满足。克林斯找到的只是尼安德特人的线粒体,没有染色体中的DNA。后者才是遗传的主体,也更具备说服力。随后十来年里,佩博锲而不舍,一边收集更多的化石样品,一边完善提取、鉴别古生物DNA的技术。化石曾历经几十万年沧桑,其间混杂大量环境微生物的DNA。开采、处理化石的现代人也会不可避免地留下自己的痕迹。佩博为此专门建立比制造半导体芯片要求更高的洁净实验室,开发出一整套辨识污染DNA的方法和步骤。他终于在2010年大功告成,寻找到尼安德特人基因组的一半以上并为之测序。通过与人类基因组的比较,佩博确定现代人不只与尼安德特人擦肩而过,还曾与之交配,生育共同的后代。今天人类的基因组中有着百分之一到百分之四来自尼安德特人的贡献。
在这个过程中,佩博还意外地在化石DNA中发现过去未知、3万年前生活在西伯利亚一带的丹尼索瓦人(Denisovan)。在生命之树上,他们是尼安德特人的分支。
由于这些“绝迹古人类基因组和人类进化的发现”,佩博在2022年赢得诺贝尔生理学或医学奖。他参与开创的“古遗传学”(paleogenetics)已经硕果累累,在化石和DNA这两个古老和现代科学方法中游刃有余。人类的“家谱”因之不断地被充实,对起源和早期历史的认识也随之深入到没有文字记录或代代相传记忆的史前时代。
综合化石、基因和古代地理、气候及植被条件的研究,起源于非洲的人类至少有过三次大规模走出非洲的经历。“直立人”(Homo erectus)最早在两百万年前离开非洲,10抵达今天的中东和亚洲南部。尼安德特人(Homo neanderthalensis)紧随其后,足迹遍布今天的欧洲。现代“智人”(Homo sapiens)则要晚得多,迟至十几万年前才在非洲出现,六万至九万年前开始走出非洲。他们在欧洲与已经在那里安居乐业良久的尼安德特人和由之分化而出的丹尼索瓦人相遇并交配,但终究以自己更适应环境的优势取代那些早期人种。在随后的几万年里,现代智人勇往直前,足迹逐渐遍布整个地球并彻底改变这个星球的面貌。他们之中包括Y染色体亚当和线粒体夏娃。
从亲子血缘到人类历史到物种起源,达尔文的进化论和孟德尔的遗传规律都在生命编码中生动地体现着。DNA这个曾经十分不起眼的有机分子犹如深藏不露的化石,时刻等待着人类开掘、发现和认识保存其中的奥秘。
(待续)
后来又连续发现更多、更细致的血型之分。
DNA fingerprinting
没有人知道成吉思汗的陵墓所在,也就不可能得到他的DNA作比较。研究者根据的是一些最可能是成吉思汗后裔群体的DNA。
迪亚斯在他的条件反射实验中特意采用雄性老鼠的精子生育后代,显示获得性遗传的根源的确在染色体内部。
Most Recent Common Ancestor
molecular clock
那时候还没有放大少量DNA的PCR技术。他们采用的是富含线粒体的胎盘,来自各种族母亲的捐献。
Mitochondrial Eve
Y-chromosomal Adam
1974年在埃塞尔比亚发现的,生活在320万年前的古人类化石“露西”(Lucy)曾被认作最早的“人类祖母”(the grandmother of humanity)。但后来还发现有更早的同类化石。