人類和黑猩猩的基因組只有些微不同,但是科學家在其中找到了人類獨有的DNA片段,這些片段在腦、手與其他部位作用,讓人類與黑猩猩大不相同。
重點提要
■人類和演化血緣最近的黑猩猩有將近99%的DNA序列是相同的。
■找出人類和黑猩猩的譜系分開之後基因組改變最多的區域,將有助於確認讓人之所以為人的DNA序列。
■這些發現也提供了一些重要的線索,來解釋為何黑猩猩和人類DNA藍圖幾近相同,卻呈現出如此大的差異。
六年前,我把握機會加入了黑猩猩(Pan troglodytes)基因組的國際團隊,為黑猩猩的DNA定序。身為生物統計學家,又一直對人類的起源充滿好奇,我興致勃勃地將這個現存與我們演化血緣最近的生物,和人類的DNA序列排在一起、逐一比對,然後發現了讓人謙卑的事實:人類和黑猩猩的基因藍圖有將近99%是一樣的;也就是說,在600萬年前人類和黑猩猩的譜系分開後,人類基因組的30億個核酸中,僅有約1%,也就是約1500萬個核酸鹼基改變了。
演化理論認為,這些改變大部份不會造成影響,然而在那將近1500萬個鹼基中,必定含有讓人之所以為人的差異,我下定決心要找出這些差異。從那時起,我們的研究有了許多重大的進展,找到了幾個讓人類有別於黑猩猩的DNA序列。
電腦快速比對序列差異
雖然上千萬個鹼基在人類基因組中所佔的比例極低,但真要搜尋起來仍然很多,因此我撰寫了電腦程式來掃描人類基因組,找尋在人類和黑猩猩譜系分開後變化最大的DNA片段。生物的DNA序列會以一定速度累積隨機突變,大部份突變對生物而言無關痛癢,我們可以從這些突變推算出兩種生物是在多久以前自共同祖先分出來的(序列改變的速度常稱為「分子時鐘的轉動」)。然而,基因組中有些改變較快的區域,是受到了正向天擇的記號,那些突變有利於生物的生存和繁衍,因此更有可能傳給後代。換句話說,在人類和黑猩猩分開後變化最多的編碼,就是最有可能塑造我們成為人類的序列。
我花了幾個月來修改程式,然後在2004年11月將它放到美國加州大學聖克魯茲分校的電腦叢集上執行,讓程式列出演化速度加快的序列。我的指導教授郝斯勒(David Haussler)站在我身後,迫不及待一起看結果,排名第一的是長118個核酸、稱為第一號人類加速區(human accelerated region 1, HAR1)的序列。利用這所大學的基因組瀏覽器(一種讀取人類基因組的工具,會根據公共資料庫的資訊幫序列標上註釋),我標定了HAR1的序列資料,瀏覽器則顯示出人類、黑猩猩、大鼠、小鼠和雞的HAR1序列,這些脊椎動物的DNA序列都已經定出來了,瀏覽器還標明大規模篩檢實驗中曾發現到HAR1在兩種人類腦細胞中會表現,不過當時科學家並未研究這段序列或是為它命名。當我們看到HAR1可能是在大腦活躍的新基因時,都高喊:「太棒了!」
我們中了頭獎。人和黑猩猩的腦部在大小、結構和複雜度等性狀上,都有明顯的差異,然而我們對這些人類獨有特徵的演化與發育的機制所知甚少,或許HAR1能揭露人類生物學中這個最神秘的範疇。
接下來這一年,我們比對了多種生物的HAR1區域,包括在這段期間完成定序的12種脊椎動物,希望盡量拼湊出HAR1的演化史。我們發現在人類出現前,HAR1演化得很慢,雞和黑猩猩這兩種生物大約在三億年前分開,在118個鹼基中僅有2個不同;人類和黑猩猩是最近才分開的,卻有18個鹼基不同。HAR1在前幾億年的期間沒有改變,代表它具有非常重要的功能,而在人類基因組中的快速變化,則暗示著它在人類的功能可能有重大修改。
2005年,另一個有關HAR1功能的重要線索出現了。和我們合作的比利時布魯塞爾自由大學的范德海根(Pierre Vanderhaeghen)趁來訪聖克魯茲時,帶回去一小瓶HAR1分子,他利用這些DNA設計了分子螢光標籤,讓表現HAR1(將DNA的序列轉錄成RNA)的細胞能發出螢光。當基因活化時,會先合成可移動的信使RNA,細胞再以這個RNA為模版來製造所需要的蛋白質。螢光標示實驗顯示,HAR1會在某一類的神經元中活化,而這種神經元會影響大腦皮層(大腦最外層的皺摺構造)發育時的模式和架構。倘若這些神經元出錯,將會造成嚴重、通常會致命的平腦症(lissencephaly)。這種先天性疾病患者的大腦缺乏一般的皺摺構造,皮層面積縮小。此外,成人精神分裂症的發病也與這類神經元的失常有關。
因此HAR1在適當時間和部位表現,有助於形成健康的大腦皮層構造(其他證據顯示它可能還參與了精子的製造過程)。我和同事們都急於想知道這段遺傳密碼是如何影響大腦皮層的發育,畢竟HAR1近期發生的多處鹼基置換,可能大幅改變了人類的腦。
除了演化史值得一提,HAR1另一個特點是它並不會轉譯出蛋白質。幾十年來,分子生物學研究的焦點多放在細胞基本建材的蛋白質基因,但在「人類基因組計畫」完成人類DNA的定序之後,科學家才知道蛋白質編碼基因只佔全部DNA的1.5%,另外98.5%所謂的「垃圾DNA」,則屬於通知基因何時啟動和關閉的調節序列,以及會轉錄出RNA但不會轉譯為蛋白質的基因,科學家才剛開始要了解這些DNA的作用。
我們從HAR1序列的模式,推測這段序列會用來製造RNA分子。2006年,美國加州大學聖克魯茲分校的薩拉瑪(Sofie Salama)、伊格爾(Haller Igel)和亞雷斯(Manuel Ares)的實驗證實了我們的推測。事實上,科學家發現HAR1位於兩個重疊基因之上,而兩個基因共有的HAR1序列會形成一種全新的RNA構造,成為第六類RNA基因,這六類基因涵蓋了1000多群RNA基因,每群基因轉錄出來的RNA都各有不同的結構和功能。此外,HAR1也是已知第一個可能受到正向天擇的RNA編碼序列。之前沒有人注意過人類基因組上這驚人的118個鹼基,看來似乎很奇怪,但在以前缺乏比對整個基因組的技術時,研究人員無從得知HAR1是不是垃圾DNA。
【欲閱讀更豐富內容,請參閱科學人2009年第88期6月號】