人類基因組是一部用遺傳密碼寫就的人類自傳。自生命誕生之日起,就用“基因語言”記錄了人類所經(jīng)歷的世事更迭與滄桑變遷。
中國科學家通過創(chuàng)新構建的全基因組分析方法和理論,研究發(fā)現(xiàn)在距今93萬年前,人類祖先在早、中更新世過渡期,由于劇烈的氣候變化,短期內喪失了98.7%成員個體;在此后長達11.7萬年的時間里,人類祖先平均成年個體數(shù)僅為1280。國際學術期刊《科學》(Science)9月1日在線發(fā)表了相關研究論文。
93萬年前人類遭遇了嚴重的“群體瓶頸”幾近滅絕?這一研究成果引起社會各界廣泛關注、甚至質疑。本報記者專訪了論文的共同通訊作者、中國科學院上海營養(yǎng)與健康研究所李海鵬研究員。
“群體瓶頸”與人類學和古氣候學一系列證據(jù)時間吻合
“我是誰?我從哪里來?我要到哪里去?”面對這三個終極追問,科學家從未停止探索人類自身的起源之謎。
根據(jù)目前考古成果,人類進化始于靈長類的森林古猿,隨后歷經(jīng)南方古猿、能人、直立人、智人四個階段,其中“智人”就是目前世界上現(xiàn)存的人類。最近100萬年是人類進化的關鍵時期,但由于分析方法的局限,對人類祖先群體數(shù)量變化歷史的研究多局限于最近的30萬至10萬年內。
化石是研究人類進化的最直接證據(jù)。古生物學家發(fā)現(xiàn)非洲古人類化石存在“缺失的環(huán)節(jié)”,在距今95萬至65萬年之間的化石極為稀缺,但在距今95萬年之前和距今65萬年以內的則相對較為豐富。在非洲發(fā)現(xiàn)的多個直立人化石,都是距今約90萬年之前的,在距今約90萬年之內的,則沒有發(fā)現(xiàn)過,取而代之的是另外一個新的人類物種。
“我們通過對現(xiàn)代人基因組分析,發(fā)現(xiàn)人類祖先在距今93萬年至81.3萬年的時間里,經(jīng)歷了一個長達11.7萬年的群體瓶頸。這一時間段正好解釋了非洲人類祖先化石缺失的環(huán)節(jié)、非洲直立人化石消失的謎團。因為根本就沒有化石留下來?!崩詈yi說。
根據(jù)研究結果,在大約81.3萬年前,人類祖先從人口衰減過程中快速恢復,相對應的是一個新的古人類物種的形成。
“基于我們的分析,這是一個新的古人類物種,而不是一個古人類物種取代另外一個古人類物種。”李海鵬說,“如何命名這一新的古人類物種?目前化石界爭議很大。為了避免爭議,我們將其命名為LCA,即現(xiàn)代人、尼安德特人和丹尼索瓦人的最近共同祖先。”
染色體數(shù)目的變化,對于生物體的影響極大。染色體的融合或斷裂,是進化過程中一個重要事件。人類是猿類的后代,和黑猩猩有共同的祖先。但自從600萬年前黑猩猩和人類在進化樹上分道揚鑣之后,在人類這一支發(fā)生了形成現(xiàn)代人2號染色體的染色體融合事件,即人類的2號染色體,是由兩個中等大小的猿染色體融合而成。
“通過統(tǒng)計人類2號染色體融合區(qū)域AT到GC的轉換率,并與黑猩猩同源區(qū)域進行比較,可估計兩條古人類2號染色體的融合時間。國際上有兩個研究組分別對古人2號染色體的融合時間進行了估計。其中一組研究的估計結果為74萬年前,另外一組的估計結果為90萬年前。因此,這一染色體融合時間很可能發(fā)生在74萬-90萬年前,這也與我們研究的遠古嚴重瓶頸時間段相對應?!崩詈yi說。
創(chuàng)新構建“快速極小時間溯祖(FitCoal)”理論和方法
近年來,雖然古DNA測序技術迅猛發(fā)展,但由于炎熱條件不利于DNA的保存,科學家無法從30萬年前非洲人類祖先化石中提取古DNA。這一研究成果的取得,源于李海鵬和華東師范大學腦功能基因組學研究所潘逸萱,帶領胡王杰、郝子謙等團隊成員,創(chuàng)新構建了“快速極小時間溯祖(FitCoal)”新理論。
這一基于群體遺傳學和計算生物學交叉的新理論,可在百萬年這一大時間尺度上,實現(xiàn)高精度的時間回溯,準確估算遠古的群體歷史,從而對古人類群體進行“人口普查”。
史前雖然沒有文字記載群體數(shù)量,但有效群體大小會影響每個世代的“溯祖率”,也就是兩個譜系在上一世代來自同一祖先的概率。因此,人類祖先曾在群體基因組中留下印記,反映當時的群體大小。群體歷史越久遠,留存至今的印記信號越微弱。
李海鵬和潘逸萱研究團隊根據(jù)這一原理創(chuàng)建了FitCoal理論。遵循這一理論進行數(shù)學推導,獲得在任意群體模型下各突變類型(即突變頻譜)對應溯祖樹枝長期望值的解析解,就獲得精確的似然值,即在群體歷史條件下觀察到樣本突變頻譜的概率。因此,無需事先獲得群體歷史的先驗知識,F(xiàn)itCoal即可自動快速搜尋出極大似然值,從而估算群體歷史。
研究一開始遇到了非常大的困難?!拔覀兊乃悸肥峭ㄟ^計算任意模型下突變頻譜的期望值,與觀察到的突變頻譜相互比較來推斷群體歷史。突變頻譜的期望值等于溯祖樹對應枝長的期望值和突變速率的乘積。然而,對于如何計算溯祖樹對應枝長的期望值,我們起初是完全不知道的。”李海鵬說。
經(jīng)過近一年的艱辛數(shù)學推導和計算機編程之后,研究人員發(fā)現(xiàn)自己陷入了一望無際的泥潭,根本看不到出路在何方。發(fā)現(xiàn)理論推導的方向是錯誤的,程序內存開銷極大,完全沒有實用價值,而且計算的結果也是錯誤極大。后來經(jīng)過許多次討論,潘逸萱當時建議:“與其耗時解開一個亂線團,還不如重新繞一個線團。”
“研究團隊最終決定將所有代碼刪除,從頭開始進行數(shù)學推導,從頭開始編程。此后,研究回到正軌上,基本上沒有碰到太大問題,并且經(jīng)過日常的討論機制,避免了很多彎路。科研的過程就是痛苦和快樂并存?!崩詈yi說。
對研究結果進行七年驗證并發(fā)布論文預印本
經(jīng)過三、四年時間構建起“快速極小時間溯祖(FitCoal)”新理論方法后,研究團隊在2016至2017年開始進行人群數(shù)據(jù)分析,并且很快“看到了”遠古時期的人類群體瓶頸。
在長達11.7萬年的時間里,人類祖先平均成年個體數(shù)僅為1280?“回想起來,我們第一次看到這個結果的時候,不是吃驚,而是有點沮喪。因為這太令人不可思議了,或許代表著我們程序有錯。畢竟這樣明顯的一個群體歷史事件,為什么前人沒有發(fā)現(xiàn),難道是我們哪些地方算錯了?”李海鵬說。
胡王杰、郝子謙、李海鵬、潘逸萱等團隊成員反復檢查理論方法、檢查代碼,經(jīng)過好幾個月無數(shù)次嘗試之后,始終沒找到錯誤。這時,他們才意識到這個人類群體瓶頸有可能是真實存在的。
此后,他們用了近七年時間證實這個群體瓶頸的存在。從分析千人基因組數(shù)據(jù),到分析另外一個測序倍率高、但樣本相對較小的人類基因組多樣性計劃(HGDP-CEPH)數(shù)據(jù),都檢測到了同樣的群體瓶頸。并且兩組獨立的、共50個現(xiàn)代人類群體的基因組數(shù)據(jù),獲得的群體瓶頸時間和人數(shù)的估計,幾乎完全一樣。
接著,研究人員又采用HGDP-CEPH數(shù)據(jù)集的兩個南部非洲群體做了進一步驗證,雖然樣本量僅為6個和8個個體,但依然檢測到了遠古群體瓶頸。對非洲群體樣本重抽樣的研究結果表明,僅需3個非洲個體的基因組,即可檢測到這一遠古群體瓶頸,進一步表明“快速極小時間溯祖(FitCoal)”理論創(chuàng)新帶來的這一重大發(fā)現(xiàn)。
“群體遺傳學在群體歷史估計的領域,有標準的證偽流程??梢院唵卫斫鉃?,群體數(shù)量的變化,是一個統(tǒng)計學意義上發(fā)生的事件,相當于一個假設檢驗。因此,我們通過了大量的模擬實驗來驗證我們的結論。論文附錄有100多頁,其中很大一部分都是對于遠古時期群體瓶頸的驗證,所有的驗證結果都是支持我們的結論。”李海鵬說。
他說:“這十年來,我們絕大部分的時間都是圍繞著我們的發(fā)現(xiàn),做進一步驗證。就像福爾摩斯的名言:排除一切不可能的,剩下的即使再令人難以置信,那也是真相。目前網(wǎng)絡上出現(xiàn)的批評建議,都沒有超出我們過去六、七年在反復驗證過程中考慮過的范疇?!?
即使經(jīng)過反復的交叉驗證確認發(fā)現(xiàn)了一個重要的人類群體瓶頸,但依然缺乏古生物學證據(jù)。研究團隊經(jīng)過討論之后,2021年5月決定通過發(fā)布預印版的方式,開誠布公聽取學術界的反饋并尋求合作。
預印本發(fā)布幾天之后,意大利羅馬大學、佛羅倫薩大學的古人類學家Giorgio Manzi教授和Fabio Di Vincenzo教授,很快主動來聯(lián)系,告知這一發(fā)現(xiàn)與他們化石考古學上現(xiàn)象一致。經(jīng)過認真討論和交流,大家決定聯(lián)合起來,進一步完成這個課題。最終,經(jīng)過近一年緊密合作和修改之后,于2022年4月28日將文章投寄給了《科學》(Science)。
在正式發(fā)表的論文中,研究團隊將眾多技術細節(jié)放到了100多頁的補充材料中。為了便于學術界重復和驗證他們的結果,還特地提供了模擬程序具體的參數(shù),排版好了便于同行使用。
中山大學生命科學學院教授、博士生導師吳仲義評價說:“這篇論文,理論架構全部在附件里。正文只是刊登了結論。這是個買櫝藏珠的故事,也是近年來CNS期刊(Cell、Nature和Science三個期刊的簡稱)上鳳毛麟角的理論論文?!?
人類自古就是命運共同體
通過現(xiàn)代人群的基因組數(shù)據(jù)回溯到的進化信息,均代表了現(xiàn)代人類祖先的信息(包括基因漸滲)。
“我們研究中看到的遠古群體瓶頸,代表了現(xiàn)代人類的直接祖先,在一個很短的時間內快速喪失了98.7%的成員個體,降低到原有數(shù)量的1.3%,這是一個非常強烈的沖擊,與目前許多瀕危物種中觀察到的群體數(shù)量變化現(xiàn)象一致。人類祖先曾經(jīng)瀕臨滅絕的結論,不依賴于分子鐘假設。”李海鵬說。
他認為,當時如果人類祖先沒有任何實際行動,不做出任何改變,任由群體數(shù)量快速衰減,必然是全員絕滅的結果。只有緊密團結在一起,更加有效、公平地獲取并分配極為有限的食物,才能夠使得我們的祖先,在長達11.7萬年的時間里渡過難關。
除了文化上和相互合作方面的改變,生存壓力也讓人類祖先產(chǎn)生許多改進性的進化。例如,腦容量的增加、兩條染色體的融合、新的古人類物種形成等。此外,人類控制火的早期考古記錄,與人類祖先種群開始快速恢復的時間也非常接近,或許也對恢復群體大小有著重要作用。
“人類自古就是命運共同體,面對嚴酷的生存環(huán)境,我們的祖先團結應對,才有了今天人類在地球上的生命繁華。”李海鵬說,“今天,我們面對嚴峻的極端氣候和紛繁復雜的紛爭,我們更應該回歸到人類的本源,秉持人類命運共同體理念,團結協(xié)助、共同發(fā)展,才能更好地在地球上世代繁衍、生生不息?!?
美國南佛羅里達大學人類遺傳學家劉曉明教授,西湖大學統(tǒng)計遺傳學實驗室負責人、生命科學學院楊劍教授等專家認為,人類在93萬年前遭遇“群體瓶頸”這一里程碑事件,對于人類進化具有重要影響,可能決定了現(xiàn)代人類許多關鍵表型的形成。人類祖先在這一遠古時期群體數(shù)量的急劇衰減,還降低了65.85%現(xiàn)代人群的遺傳多樣性,也對人類生命和健康產(chǎn)生了深遠影響。這是一個“新理論帶來新發(fā)現(xiàn)”的研究典范。
(編輯:映雪 )