大家好,這里是專注表觀組學(xué)十余年,多組學(xué)科研服務(wù)的易基因。
表觀遺傳學(xué)在細(xì)胞調(diào)控過程中起著關(guān)鍵作用,對(duì)于理解復(fù)雜人類疾病至關(guān)重要。其中,DNA甲基化是被廣泛理解的表觀遺傳機(jī)制之一。在哺乳動(dòng)物基因組中,CpG二核苷酸中的胞嘧啶(C)在嘧啶環(huán)的5位發(fā)生甲基化(mC)。通過TET家族的2-氧戊二酸依賴性雙加氧酶的作用,mC可以被氧化為5-羥甲基胞嘧啶(5-hydroxymethylcytosine,簡稱5hmC),甚至進(jìn)一步氧化為5-甲酰基胞嘧啶(fC)和5-羧基胞嘧啶(caC)。這些發(fā)現(xiàn)揭示了一種長期難以捉摸的主動(dòng)DNA去甲基化機(jī)制,并推動(dòng)了哺乳動(dòng)物表觀遺傳學(xué)調(diào)控領(lǐng)域的研究浪潮。本綜述對(duì)DNA中hmC形成和轉(zhuǎn)化的生化和化學(xué)方面的數(shù)據(jù)進(jìn)行批判性評(píng)估,分析用于檢測和繪制哺乳動(dòng)物基因組中5hmC的分析技術(shù),以及hmC在DNA復(fù)制、轉(zhuǎn)錄、細(xì)胞分化和人類疾病中的表觀遺傳學(xué)作用。
要點(diǎn):
(1) DNA 5-羥甲基胞嘧啶的發(fā)生和轉(zhuǎn)化機(jī)制理解。
(2) 研究哺乳動(dòng)物基因組中5-羥甲基胞嘧啶發(fā)生和分布的不同方法的優(yōu)勢和局限性。
(3) 5hmC修飾和相關(guān)的表觀遺傳學(xué)修飾在DNA修復(fù)、復(fù)制、轉(zhuǎn)錄和細(xì)胞分化中發(fā)揮的主要調(diào)控作用。
(4) 5-羥甲基胞嘧啶作為疾病標(biāo)志物和治療靶點(diǎn)的潛在效用。
1、Introduction
基因組的關(guān)鍵功能是存儲(chǔ)、復(fù)制和傳遞編碼的遺傳信息。通過使用一種(表觀)遺傳“書簽”系統(tǒng),可以有意義且及時(shí)的read不同類型細(xì)胞中數(shù)十億(M)重復(fù)的G:C或A:T堿基對(duì)組成的基因組,這是一種允許生物體在發(fā)育過程中或響應(yīng)環(huán)境時(shí)保持或重新編程每個(gè)細(xì)胞身份的機(jī)制。此過程中的關(guān)鍵參與者是DNA甲基化,它通過酶催化將甲基基團(tuán)從普遍存在的輔因子S-腺苷-1-甲硫氨酸(SAM)轉(zhuǎn)到DNA的特定靶標(biāo)上。DNA甲基轉(zhuǎn)移酶的三個(gè)主要產(chǎn)物是N6-甲基腺嘌呤、N4-甲基胞嘧啶或5-甲基胞嘧啶(mC)。值得注意的是,生物體安裝的甲基基團(tuán)不會(huì)改變目標(biāo)核苷酸的配對(duì)特異性,從而保留基因組的原始基因組內(nèi)容。甲基基團(tuán)暴露在DNA螺旋的主槽中(圖1),通過的細(xì)胞蛋白質(zhì)、酶或大型多組分復(fù)合體read這些“立體”基團(tuán)。這些特征使修飾堿基非常適合作為生物信號(hào)的表觀遺傳標(biāo)記,作為基因組“之上”的額外調(diào)控層進(jìn)行生物信號(hào)傳遞。三種類型的DNA甲基化均在微生物中發(fā)現(xiàn),且呈序列特異性。在脊椎動(dòng)物中,主要的甲基化產(chǎn)物是mC(圖2a);mC甲基化以序列特異性(主要但不限于CpG二核苷酸)和位點(diǎn)特異性的方式發(fā)生。DNA甲基化水平在發(fā)育過程中變化很大,但在體細(xì)胞組織中,除了在CpG島(CpG位點(diǎn)高度富集的基因組區(qū)域)中的CpG外,大多數(shù)(70-80%)CpG均甲基化。當(dāng)定位于CpG島時(shí)是基因啟動(dòng)子的重要轉(zhuǎn)錄沉默子。三種主要類型的DNA甲基轉(zhuǎn)移酶在哺乳動(dòng)物基因組中具有活性。初始甲基化模式由de novo DNA甲基轉(zhuǎn)移酶Dnmt3a和Dnmt3b建立,而細(xì)胞分裂中CpG甲基化標(biāo)記的保持則由維持甲基轉(zhuǎn)移酶Dnmt1進(jìn)行。鑒于其重要性,mC通常被稱為DNA的第五堿基。
圖1:真核生物DNA中的堿基對(duì)和表觀遺傳學(xué)修飾。生物胞嘧啶-5修飾(xC,x=甲基、羥甲基、羧基甲?;┲赶?/span>B螺旋DNA的主槽,不干擾G:C堿基對(duì)互作(左)。鞭毛原生動(dòng)物DNA中存在的堿基J(5-(β-d-葡糖基)氧甲基尿嘧啶)結(jié)構(gòu)(右)。
a. C5 Mtase酶通過將磺基結(jié)合的甲基SN2轉(zhuǎn)移到共價(jià)活化的靶胞嘧啶殘基上進(jìn)行胞嘧啶甲基化;
b. 哺乳動(dòng)物TET雙加氧酶氧化DNA中的mC產(chǎn)生化學(xué)穩(wěn)定的hmC,hmC進(jìn)一步氧化為fC或caC,被專用糖基化酶去除;
c. DNA烷基化損傷產(chǎn)物O6-甲基鳥嘌呤通過將O6-甲基轉(zhuǎn)移到甲基鳥嘌呤DNA甲基轉(zhuǎn)移酶(MGMT)蛋白的半胱氨酸殘基上的SN2而直接還原為鳥嘌呤;
d. DNA中代表性N-烷基化堿基(N3甲基胞嘧啶、N6甲基腺嘌呤)被AlkB雙加氧酶家族氧化,產(chǎn)生相應(yīng)的N-羥甲基衍生物,然后自發(fā)水解釋放甲醛,直接產(chǎn)生未修飾的堿基。
2、DNA中5-羥甲基化堿基的存在
5-羥甲基胞嘧啶(5-hydroxymethylcytosine,5hmC)在DNA中的存在最初是在某些噬菌體中觀察到的。在T-even噬菌體中,5-羥甲基胞嘧啶在DNA合成過程中被摻入基因組中,隨后由噬菌體α-和β-葡萄糖基轉(zhuǎn)移酶修飾,產(chǎn)生含有5-葡糖基氧基甲基胞嘧啶(glc-hmC)殘基的高度糖基化DNA。這種DNA對(duì)宿主限制性內(nèi)切酶的切割具有抗性。類似的修飾堿基J(5-(β-d-葡萄糖基)氧甲基尿嘧啶)(圖1)存在于鞭毛原生動(dòng)物(包括寄生蟲Trypanosoma brucei和Leishmania sp.)的DNA中,以及與之密切相關(guān)的單細(xì)胞藻類。它取代了高達(dá)1%的胸腺嘧啶,主要存在于端粒重復(fù)序列中。Base-J通過JBP1/JBP2 2-氧戊二酸依賴性雙加氧酶氧化DNA中的胸腺嘧啶殘基,然后通過酶促糖基化產(chǎn)生hmU。Base-J已被證明對(duì)Leishmania及相關(guān)錐蟲的多順反子基因簇末端的轉(zhuǎn)錄終止至關(guān)重要。
在20世紀(jì)70年代初,報(bào)道了成年小鼠、大鼠和青蛙大腦基因組DNA中存在hmC。然而在接下來的近40年里,其他實(shí)驗(yàn)室未能證實(shí)這一發(fā)現(xiàn)。2009年,兩個(gè)獨(dú)立研究小組重新證實(shí)了小鼠腦細(xì)胞和小鼠胚胎干細(xì)胞(ESC)中hmC的存在。Kriau?ionis和Heinz通過薄層色譜法發(fā)現(xiàn),在Purkinje細(xì)胞中hmC占總核苷酸的0.6%,在顆粒細(xì)胞中約占0.2%。基于上述錐蟲蛋白JBP1和JBP2的知識(shí),Rao及其同事確定了哺乳動(dòng)物的同源蛋白,即ten-eleven轉(zhuǎn)位(TET)蛋白TET1、TET2和TET3作為mC修飾對(duì)hmC的潛在修飾酶(圖2b)。這三個(gè)同源蛋白包含2-氧戊二酸(2OG)和Fe(ii)依賴性雙加氧酶的共同特征。兩年后,Zhang和Xu的研究小組證明了TET酶能夠在體外和體內(nèi)將mC和hmC進(jìn)一步轉(zhuǎn)化為5-甲酰胞嘧啶(fC)和5-羧基胞嘧啶(caC),同時(shí)Carell研究小組獨(dú)立地在小鼠ESC中鑒定出低水平的基因組fC。所有這些證據(jù)和隨后的研究令人信服地證明了hmC確實(shí)是哺乳動(dòng)物基因組DNA的內(nèi)源性生物成分(也稱為DNA的第六堿基),在長期尋找的主動(dòng)DNA去甲基化通路中扮演關(guān)鍵中間體的角色。
除了已經(jīng)確立的TET介導(dǎo)通路外,hmC的另一個(gè)可能來源是DNA中胞嘧啶的直接羥甲基化。這一化學(xué)先例來自于代表性的SAM依賴性C5-MTases體外實(shí)驗(yàn),這些實(shí)驗(yàn)意外地揭示了這些酶能夠催化甲醛共價(jià)添加到DNA中靶胞嘧啶殘基的C5位點(diǎn),產(chǎn)生hmC。甲醛是哺乳動(dòng)物細(xì)胞、組織和液體中自然存在的必需代謝產(chǎn)物,濃度約為0.1 mM,盡管濃度可能因細(xì)胞類型和生理?xiàng)l件而異,然而這種化學(xué)-酶促通路在體內(nèi)的重要意義尚未得到證實(shí)。
hmC進(jìn)入DNA的另一種潛在方式是通過核苷酸補(bǔ)救通路(NSP)(圖3)。除了de novo合成,細(xì)胞還回收DNA分解(DNA修復(fù)、細(xì)胞凋亡等)或營養(yǎng)攝取產(chǎn)生的核苷酸。類似于脫氧胞苷,修飾的胞嘧啶可以通過酶促磷酸化級(jí)聯(lián)反應(yīng)進(jìn)入脫氧核苷酸池,該級(jí)聯(lián)反應(yīng)涉及脫氧胞苷激酶(DCK)產(chǎn)生單磷酸,然后由胞嘧啶單磷酸激酶(CMPK)轉(zhuǎn)化為二磷酸,再由一系列核苷二磷酸激酶磷酸化為三磷酸。然而,形成5-修飾dCTPs和修飾胞嘧啶進(jìn)入DNA的關(guān)鍵障礙是CMPK對(duì)未修飾dCMP的高選擇性,導(dǎo)致排除攜帶C5修飾的核苷酸。然而與mC一樣,hmC在dNMP(或dN,取決于細(xì)胞類型)水平上容易脫氨基化為hmU,產(chǎn)生hmU 5'-單核苷酸。由于胸苷酸激酶(DTYMK)對(duì)5-修飾具有普適性,hmdUMP可以被磷酸化,然后被摻入DNA中,hmU隨后成為SMUG1或TDG靶向切除。為了避免與hmU出現(xiàn)相關(guān)的細(xì)胞毒性并發(fā)癥,細(xì)胞部署了一種專用酶——2'-脫氧核苷酸5'-單磷酸N-糖苷酶(DNPH1,也稱為RCL),該酶可降解hmdUMP,從而將其從核苷酸池中去除。NSP的兩個(gè)主要的NSP屏障保護(hù)哺乳動(dòng)物DNA免受5-羥甲基化嘧啶的偶發(fā)摻入,從而防止它們干擾由mC衍生的表觀遺傳修飾介導(dǎo)的調(diào)控機(jī)制。這種保護(hù)系統(tǒng)在快速增殖的癌細(xì)胞中通常被削弱,使它們易于用修飾的胞嘧啶作為潛在的治療因子進(jìn)行治療。
圖3:dC和修飾的2'-脫氧胞苷(mdC和hmdC)的核苷酸挽救通路。DCK,脫氧胞苷激酶;CMPK,胞苷單磷酸激酶;NDPKs,核苷二磷酸激酶;DNPH1,2'-脫氧核苷5'-單磷酸N-糖苷酶;CDA,胞苷脫氨酶;TK1/2,胸苷激酶1和2;DTYMK,脫氧胸苷酸激酶;DCDT,脫氧胞苷脫氨酶;Pol,DNA聚合酶。CMPK和DNPH1的作用可以防止hmC和hmU摻入DNA。
3、基因組5-胞嘧啶甲基化的可逆性
基因組DNA中5-甲基胞嘧啶(mC)丟失可以通過被動(dòng)或主動(dòng)DNA去甲基化發(fā)生。在被動(dòng)去甲基化中,子鏈上沒有甲基化維持活性的情況下,甲基化標(biāo)記以復(fù)制依賴性方式從DNA中稀釋。當(dāng)DNMT1被下調(diào)或去除時(shí),這種機(jī)制已經(jīng)在許多情況下得到了證實(shí)。另外,mC可以在同一DNA鏈上“主動(dòng)”轉(zhuǎn)化成未修飾的C,而不依賴于DNA復(fù)制。植物中存在主動(dòng)DNA去甲基化已被廣泛報(bào)導(dǎo)。在擬南芥(Arabidopsis thaliana)中,名為Demeter的DNA糖基酶通過切割N-糖基鍵來切除mC,從而在DNA鏈上產(chǎn)生一個(gè)無堿基位點(diǎn)。隨后AP裂解酶和AP內(nèi)切酶形成一個(gè)單核苷酸缺口,隨后通過DNA聚合酶和連接酶的作用填充。然而,尚未發(fā)現(xiàn)此類糖基酶直接作用于哺乳動(dòng)物的mC。脊椎動(dòng)物主動(dòng)去甲基化的現(xiàn)實(shí)長期以來一直難以捉摸,但隨著DNA中hmC的發(fā)現(xiàn),一切突然變得清晰起來。
3.1 DNA去甲基化的化學(xué)過程
生物甲基化通過DNA MTase進(jìn)行,DNA MTase催化磺結(jié)合甲基從輔因子SAM到DNA上確定位置的SN2轉(zhuǎn)移(圖2a)。盡管理論上所有反應(yīng)都是可逆的,但迄今為止,只有一個(gè)通過SN2反應(yīng)直接進(jìn)行DNA去甲基化的例子。O6-甲基鳥嘌呤是外源性或內(nèi)源性化合物對(duì)DNA烷基化損傷的產(chǎn)物,通過將O6-甲基轉(zhuǎn)移到甲基鳥嘌呤DNA甲基轉(zhuǎn)移酶(MGMT)蛋白的半胱氨酸殘基上直接還原為鳥嘌呤(圖2c)。這種反應(yīng)需要化學(xué)計(jì)量的蛋白質(zhì),這對(duì)細(xì)胞來說是一個(gè)昂貴的負(fù)擔(dān),可能是由于病變的稀有性和嚴(yán)重程度(堿基配對(duì)改變)所致。這似乎表明,直接的SN2去甲基化僅對(duì)O結(jié)合的甲基有幫助,并且由于N–CH3和C–CH3鍵的高熱力學(xué)穩(wěn)定性,在N或C甲基化的情況下可能在化學(xué)上不可行。實(shí)際上,在所有其他報(bào)道的去甲基化情況下,都部署了基于自由基氧化還原化學(xué)的多步驟機(jī)制。后者的反應(yīng)是由一大類2OG依賴性雙加氧酶進(jìn)行的。對(duì)于N-烷基化堿基(N3-甲基胞嘧啶,N6-甲基腺嘌呤),AlkB家族加氧酶的酶促氧化產(chǎn)生相應(yīng)的N-羥甲基衍生物(圖2d),然后從氮中自發(fā)水解釋放甲醛以直接產(chǎn)生原始的未修飾堿基。組蛋白中生物N-甲基標(biāo)記的去甲基化通過類似通路發(fā)生。然而,事實(shí)證明,在胞嘧啶的C5位產(chǎn)生的羥甲基在生理?xiàng)l件下化學(xué)上非常穩(wěn)定且壽命長。在這種情況下,需要額外的酶促羥基化循環(huán)才能產(chǎn)生類似DNA損傷“出現(xiàn)”的修飾堿基,并且可以通過修復(fù)機(jī)制進(jìn)一步處理以最終產(chǎn)生未修飾的胞嘧啶(圖2b)。
DNA去甲基化的化學(xué)過程涉及多種機(jī)制,這些機(jī)制在不同的生物體和不同的甲基化位點(diǎn)上有所差異。在哺乳動(dòng)物中,DNA甲基化由DNA甲基轉(zhuǎn)移酶(DNA MTases)催化,這些酶通過SN2反應(yīng)將輔因子S-腺苷甲硫氨酸(SAM)中的甲基基團(tuán)轉(zhuǎn)移到DNA的特定位點(diǎn)(圖2a)。盡管理論上所有反應(yīng)可逆,但目前已知的直接通過SN2反應(yīng)進(jìn)行DNA去甲基化的例子只有一個(gè)。O6-甲基鳥嘌呤是外源性或內(nèi)源性化合物對(duì)DNA烷基化損傷的產(chǎn)物,通過甲基鳥嘌呤DNA甲基轉(zhuǎn)移酶(MGMT)蛋白的半胱氨酸殘基直接轉(zhuǎn)移O6-甲基基團(tuán),還原為鳥嘌呤(圖2c)。這種反應(yīng)需要化學(xué)計(jì)量的蛋白,對(duì)細(xì)胞來說是一個(gè)昂貴的負(fù)擔(dān),可能因?yàn)檫@種損傷的罕見性和嚴(yán)重性(bp變化)所致。這似乎表明,直接的SN2去甲基化僅適用于O-甲基基團(tuán),而對(duì)于N-或C-甲基化,由于N-CH3和C-CH3鍵的高熱力學(xué)穩(wěn)定性,這種化學(xué)過程可能不可行。實(shí)際上,在所有其他報(bào)道的去甲基化案例中,都采用了基于自由基氧化還原化學(xué)的多步驟機(jī)制。這些反應(yīng)由一大類2OG依賴性雙加氧酶執(zhí)行。對(duì)于N-烷基化堿基(N3-甲基胞嘧啶,N6-甲基腺嘌呤),AlkB家族加氧酶催化的酶促氧化產(chǎn)生相應(yīng)的N-羥甲基衍生物(圖2d),然后這些衍生物自發(fā)地從氮原子水解釋放甲醛,直接生成原始的未修飾堿基。組蛋白中生物N-甲基標(biāo)記的去甲基化也通過類似通路進(jìn)行。在胞嘧啶C5位點(diǎn)產(chǎn)生的羥甲基基團(tuán)在生理?xiàng)l件下化學(xué)穩(wěn)定性很高且壽命長。在這種情況下,需要額外的酶促羥基化循環(huán)來產(chǎn)生類似DNA損傷的修飾堿基,這些堿基可以被修復(fù)機(jī)制進(jìn)一步加工處理,最終產(chǎn)生未修飾的胞嘧啶(圖2b)。
如上所述,TET蛋白在哺乳動(dòng)物中被鑒定為將mC修飾為hmC的酶,并且也被證明能夠?qū)⑿纬傻?span>hmC氧化為fC和caC(統(tǒng)稱為ox-mC)。He等人揭示了mC和hmC幾乎(90%)被TET1和TET2轉(zhuǎn)化為caC,而沒有出現(xiàn)fC,而Ito等人報(bào)告說fC相對(duì)于caC會(huì)積累。隨后的酶學(xué)和結(jié)構(gòu)研究表明,TET2可以通過與含有mC的DNA單一作用產(chǎn)生fC和caC,而不釋放hmC中間體;但一旦釋放,hmC是不如mC的底物??傊挥幸恍〔糠?span>hmC被進(jìn)一步氧化為fC/caC,使hmC成為一種相對(duì)穩(wěn)定的胞嘧啶修飾。這些結(jié)果表明TET蛋白氧化步驟的效率和最終產(chǎn)物取決于多種尚未理解的條件。
3.2 TET活性調(diào)控因子
TET蛋白的酶活性受到其催化反應(yīng)中的小分子可用性影響,這些小分子包括氧(O2)、2-氧戊二酸(2OG)和Fe(ii)(圖4)。TET酶活性通常在缺氧環(huán)境下降低,這是癌癥進(jìn)展和潛在治療靶點(diǎn)的關(guān)鍵因素之一。同樣,外源性2OG可增加培養(yǎng)的小鼠胚胎中的TET活性和hmC/mC比值,在成年小鼠的不同組織中也是如此,并且顯著通過表觀遺傳調(diào)控改善抗癌治療效果。細(xì)胞內(nèi)2OG水平是誘導(dǎo)胚胎干細(xì)胞(ESC)分化的時(shí)機(jī)。另一方面,某些代謝成分,如N-草酰甘氨酸(NOG)和2-羥基戊二酸(2HG),可以作為2OG依賴性氧酶的強(qiáng)效抑制劑。細(xì)胞培養(yǎng)中補(bǔ)充Fe(ii)會(huì)導(dǎo)致hmC水平升高。神經(jīng)發(fā)育期間的鐵缺乏飲食導(dǎo)致大鼠大腦TET活性降低和整體羥甲基化降低。除了反應(yīng)底物,研究發(fā)現(xiàn)維生素C可以增強(qiáng)各種細(xì)胞培養(yǎng)中ox-mC豐度,從誘導(dǎo)多能干細(xì)胞(iPSCs)和ESCs到癌細(xì)胞系,并且激活Jhdm的組蛋白去甲基化。雖然維生素C最初被認(rèn)為在維持Fe(ii)的還原形式中發(fā)揮作用,但沒有發(fā)現(xiàn)其他還原劑對(duì)加氧酶活性產(chǎn)生類似的刺激。生化研究表明,這種化合物與TET2的催化域有直接互作。水合形式的維生素C本身可以作為藻類TET同源物CMD1催化的氧化mC修飾的底物。這一發(fā)現(xiàn)強(qiáng)調(diào)了2OG和抗壞血酸水合物之間的結(jié)構(gòu)相似性(都含有2-氧羧酸基團(tuán)),可能指出除了維持鐵在還原狀態(tài)之外,抗壞血酸誘導(dǎo)TET刺激的其他機(jī)制;例如如果TETs可以直接利用抗壞血酸代替2OG生成活性氧,那么反應(yīng)將產(chǎn)生將產(chǎn)生5-碳l-lyxonic和/或l-木糖酸(C4的立體異構(gòu)體),這是很久以前就被確定為維生素C的代謝產(chǎn)物。
圖4:DNA中5-mC甲基化的TET定向羥基化(上)和CMD1定向甘油基化(下)機(jī)制。
3.3 ox-mC修飾加工處理
在去甲基化通路的進(jìn)一步加工中,原本主要被認(rèn)為修復(fù)mC隨機(jī)脫氨基產(chǎn)生的T-G錯(cuò)配的胸腺嘧啶DNA糖基酶(TDG)被發(fā)現(xiàn)可以直接切除fC和caC,而對(duì)mC和hmC不產(chǎn)生影響。DNA中的產(chǎn)生的無堿基位點(diǎn)隨后通過堿基切除修復(fù)(BER)的酶促級(jí)聯(lián)進(jìn)行修復(fù),其中核苷酸被新合成的未修飾核苷酸取代。基于這些結(jié)果,提出了一種TET蛋白與TDG介導(dǎo)的BER偶聯(lián)的迭代mC氧化的主動(dòng)去甲基化通路(圖5)。但這種機(jī)制在密集甲基化位點(diǎn)或在CG/CG位點(diǎn)的雙鏈上發(fā)生去甲基化時(shí),可能會(huì)產(chǎn)生雙鏈DNA斷裂。通過在體外重建的TET-TDG-BER系統(tǒng)中對(duì)對(duì)稱甲基化的CG進(jìn)行有效的順序去甲基化,可以避免DNA雙鏈斷裂形成??梢源_定的是,BER和核苷酸切除修復(fù)(NER)通路在小鼠受精卵中的主動(dòng)DNA去甲基化中起著核心作用。
圖5:hmC在哺乳動(dòng)物DNA中的形成和轉(zhuǎn)化。胞嘧啶(C)通過DNMT家族的內(nèi)源性DNA MTase(綠色)的作用轉(zhuǎn)化為5-甲基胞嘧啶(mC)。提出了幾種DNA去甲基化的機(jī)制,其中5-甲基胞嘧啶(mC)被轉(zhuǎn)化回C。紅色箭頭表示由產(chǎn)生5-羥甲基胞嘧啶(hmC),5-甲酰基胞嘧啶(fC)和5-羧基胞嘧啶(caC)的TET雙加氧酶進(jìn)行的基于氧化通路,還可以產(chǎn)生少量的5-羥甲基尿嘧啶(hmU)。藍(lán)色箭頭顯示了基于去氨通路,其中hmC通過AID/APOBEC或其他脫氨酶脫氨為hmU?;疑^表示由TDG,SMUG1糖基化酶和DNA復(fù)制啟動(dòng)的堿基切除修復(fù)(BER)通路。黑色虛線箭頭表示胞嘧啶-5甲基轉(zhuǎn)移酶在體外進(jìn)行的羥甲基化和去羥甲基化反應(yīng),以及fC和caC的假定去甲?;兔擊确磻?yīng),產(chǎn)生未修飾的C.BER,堿基切除修復(fù);NER,核苷酸切除修復(fù);NSP,核苷酸補(bǔ)救通路。
基于某些DNA糖基化酶切除hmU的能力,提出了hmC加工的另一條通路,這可能通過hmC的脫氨作用發(fā)生(圖5)。一些DNA糖基化酶,單鏈單功能尿嘧啶DNA糖基化酶1(SMUG1)和MBD4對(duì)caC或hmC的切除沒有顯著活性,但它們能有效去除hmU。TDG也被證明在雙鏈DNA中對(duì)hmU-G錯(cuò)配具有切除活性。該通路依賴于AID/APOBEC脫氨酶(或其他一些未知脫氨酶)可以在體內(nèi)有效地使雙鏈DNA中的hmC脫氨酶的假設(shè),盡管體外研究表明這些酶對(duì)單鏈DNA中的未修飾胞嘧啶具有強(qiáng)烈的偏好。一些研究表明,hmU可能不是由hmC脫氨產(chǎn)生的,因?yàn)?span>DNA中的大多數(shù)hmU都來源于TET催化的胸腺嘧啶氧化。因此脫氨介導(dǎo)的通路仍然需要強(qiáng)大的生化支持。
另一種方式是通過C–C鍵斷裂將hmC、fC或caC直接轉(zhuǎn)化為C,從而避免了與無堿基位點(diǎn)產(chǎn)生的相關(guān)問題。例如,研究表明在某些情況下,TDG丟失可能會(huì)發(fā)生主動(dòng)去甲基化。DNA C5 MTase提供了一個(gè)早期提示,它不僅能夠?qū)⒓兹┡c胞嘧啶偶聯(lián),還可以在體外促進(jìn)hmC或caC的序列特異性轉(zhuǎn)化為未修飾C。Mtase介導(dǎo)的反應(yīng)通過C6處的共價(jià)中間體進(jìn)行(圖6a),類似于硫醇介導(dǎo)或亞硫酸鹽介導(dǎo)的caU脫羧基化和fC的去甲?;▓D6)。這些化學(xué)先例表明,某些DNMT或某些專用酶原則上可以去除氧化基團(tuán)(5-羥甲基,5-甲酰基或5-羧基)以產(chǎn)生未修飾的胞嘧啶殘基。在哺乳動(dòng)物細(xì)胞提取物和體內(nèi)報(bào)道了去甲酰化和脫羧活性,似乎在某些情況下是可行的,但目前尚未鑒定出直接負(fù)責(zé)這些反應(yīng)的酶或其他細(xì)胞成分。
圖6:嘧啶環(huán)C6處的瞬時(shí)親核加成反應(yīng)促進(jìn)了5-羥甲基或5-羧基的去除。
a. DNA胞嘧啶-5甲基轉(zhuǎn)移酶將hmC轉(zhuǎn)化為DNA中的C殘基。
b-d. 親核基(nucleophile)分別促進(jìn)fC去甲?;?span>caC脫羧。
4、體外DNA中hmC的產(chǎn)生和分析
4.1 體外DNA中hmC的產(chǎn)生
研究這種修飾核苷酸的化學(xué)-酶轉(zhuǎn)化以及開發(fā)和驗(yàn)證新的分析技術(shù)需要生產(chǎn)含有hmC殘基的DNA底物。含有hmC的寡脫氧核糖核苷酸的化學(xué)合成于1997年提出,它使用具有可逆2-氰基乙基O-衍生化的5-羥甲基和經(jīng)典外環(huán)胺N-苯甲?;牧柞0非绑w。最近,基于兩個(gè)外環(huán)基團(tuán)的N,O-氨基甲?;鶚蚪拥奶娲呗蕴岣吡四繕?biāo)低聚物的產(chǎn)率和純度。兩種類型的磷酰胺前體均可商購并用于DNA合成服務(wù)。
類似于細(xì)胞反應(yīng),理論上可以通過使用TET加氧酶氧化mC殘基在從甲基化體外DNA產(chǎn)生hmC修飾的DNA,但應(yīng)嚴(yán)格調(diào)控反應(yīng)以避免進(jìn)一步氧化產(chǎn)物。這已經(jīng)通過人類TET2加氧酶65的催化合成能力的定向工程以及進(jìn)一步開發(fā)一系列允許mC及其氧化形式相互轉(zhuǎn)化以用于分析應(yīng)用的反應(yīng)來證明。產(chǎn)生的hmC殘基位點(diǎn)將由原始mC位點(diǎn)確定。使用DNA-C5甲基轉(zhuǎn)移酶的非典型化學(xué)-酶促反應(yīng),可以在DNA中直接序列特異性地組成hmC,在體外催化甲醛與其靶胞嘧啶殘基的可逆偶聯(lián)。該反應(yīng)對(duì)甲基轉(zhuǎn)移酶靶位點(diǎn)具有高度特異性,盡管所用每種酶的羥甲基化效率可能不同。通過在DNA聚合酶依賴性鏈延伸反應(yīng)(包括PCR)中提供2'-脫氧核苷-5'-三磷酸(hmdCTP),可以在體外或體內(nèi)中實(shí)現(xiàn)DNA中C與hmC的隨機(jī)替換。
4.2 hmC的檢測和定量
已經(jīng)開發(fā)或改進(jìn)了幾種技術(shù)來檢測和定量DNA中的hmC。放射性標(biāo)記核苷酸的薄層色譜法以前已廣泛用于分析包括hmC 在內(nèi)的RNA和DNA修飾。盡管靈敏度很高,但由于在標(biāo)準(zhǔn)實(shí)驗(yàn)室中處理和處置放射性物質(zhì)的風(fēng)險(xiǎn),其使用越來越受限。
分析未標(biāo)記DNA樣品的整體核苷組成的金標(biāo)準(zhǔn)是液相色譜與UV或MS檢測相結(jié)合?,F(xiàn)代MS/MS檢測器可以實(shí)現(xiàn)更高的選擇性和靈敏度,并且可以使用合成的穩(wěn)定同位素標(biāo)記的內(nèi)標(biāo)對(duì)核苷進(jìn)行可靠的定量。這些方法非常適合定量基因組DNA中的整體hmC、fC和caC水平,但需要專用設(shè)備。已經(jīng)使用使用直接進(jìn)樣質(zhì)譜MS開發(fā)了一種高通量版本,無需對(duì)核苷酸進(jìn)行色譜分離即可進(jìn)行定量分析。
由于fC和caC的稀有性,有時(shí)還包括hmC,樣品處理過程中需要特別注意,可以使用基于堿基的特異性衍生化來提高靈敏度(通過質(zhì)譜或光學(xué)檢測),并從大量基因組DNA中富集目標(biāo)片段。hmC的一種特別有用的分析修飾是使用T4 β-葡萄糖基轉(zhuǎn)移酶(BGT)和尿苷-5'-二磷酸-D-葡萄糖(UDP-glc)輔因子或其類似物,將其酶促糖基化為更大且的5-葡萄糖酰氧化基-甲基胞嘧啶殘基。BGT反應(yīng)對(duì)hmC(或hmU)的5-羥甲基具有強(qiáng)大和高選擇性。這種處理可以用來將UDP-(3H)葡萄糖中的氚標(biāo)記葡萄糖殘基連接到DNA上,通過閃爍計(jì)數(shù)直接定量hmC。
近年來,已經(jīng)開發(fā)了涉及熒光策略的新hmC檢測方法,如熒光共振能量轉(zhuǎn)移、通過酶促和化學(xué)功能引入的熒光標(biāo)簽。這些方法具有高靈敏度、特異性、通常無擴(kuò)增,它們與不同的擴(kuò)增技術(shù)結(jié)合,如滾動(dòng)循環(huán)擴(kuò)增、環(huán)介導(dǎo)等溫?cái)U(kuò)增和等溫指數(shù)擴(kuò)增,以更高靈敏度、簡單省時(shí)的方式實(shí)現(xiàn)hmC檢測。此外,將MTase催化的反應(yīng)與熒光、電化學(xué)發(fā)光和光電化學(xué)方法相結(jié)合,用于在組織中檢測hmC的敏感生物傳感器。
5、基因組DNA中hmC的檢測技術(shù)
大量研究表明,盡管所有哺乳動(dòng)物組織都含有相似水平的mC(來自C的4-6%),但hmC含量是組織依賴性的,從0.03%到1.2%不等。在小鼠Purkinje神經(jīng)元、負(fù)責(zé)認(rèn)知功能的大腦部分(0.6-1.3% hmC/C)和胚胎干細(xì)胞(高達(dá)0.5%)中檢測到hmC最富集,而在其他組織中的含量要低得多(0.03-0.3% hmC/C)。hmC水平隨年齡增長而增加,且在腫瘤樣本中被強(qiáng)烈耗竭,表明hmC作為預(yù)后生物標(biāo)志物的效用。其他形式的ox-mC、fC和caC的含量低100-1000倍,fC含量從0.00002%到0.002%不等,而caC含量不超過C的0.0003%
ox-mC在基因組中的稀疏性給開發(fā)通用方法帶來了挑戰(zhàn),該方法將具有靈敏性和特異性的檢測每個(gè)CpG的胞嘧啶修飾狀態(tài)。在發(fā)現(xiàn)hmC后的幾年中,已經(jīng)開發(fā)了多種方法來研究其基因組譜,可以分為基于富集的方法和單核苷酸分離方法(圖7)。這些方法在基因組覆蓋率、實(shí)驗(yàn)和分析策略以及成本方面存在很大差異。
圖7:hmC和相關(guān)DNA胞嘧啶修飾的全基因組圖譜分析方法。
黑色方框顯示一條泳道上的堿基;紅色方框顯示通過減去相關(guān)信號(hào)堿基。ODN,寡脫氧核糖核苷酸。
5.1 基于親和富集的方法
基于親和富集的方法依賴于將含有hmC的短DNA片段(通常為200-500 bp)選擇性結(jié)合到hmC特異性抗體,其他hmC結(jié)合蛋白或hmC與報(bào)告基團(tuán)的衍生化,從而允許從其余DNA中物理提取,然后使用定量PCR、DNA微陣列或測序進(jìn)行分析。片段化基因組DNA長度決定了所有基于富集方法的分辨率極限。類似于甲基化DNA免疫沉淀(MeDIP),針對(duì)hmC開發(fā)了抗體,用于hmC DNA的免疫沉淀,隨后通過hMeDIP(羥甲基化DNA免疫沉淀)方法進(jìn)行測序(圖7b)。然而,不同研究的結(jié)果甚至在相同基因組的分析中也顯示出相當(dāng)大的差異,這可能是由于基于抗體的下拉方法的典型缺陷,如可能與甲基化和未修飾的胞嘧啶發(fā)生交叉反應(yīng),因?yàn)檫@些堿基幾乎在化學(xué)上的差異很少。最近,目前DIP方案的可靠性受到了質(zhì)疑,因?yàn)檠芯勘砻饔捎?span>IgG抗體對(duì)短的未修飾DNA重復(fù)序列的內(nèi)在親和會(huì)產(chǎn)生差異。
共價(jià)hmC修飾的發(fā)展顯著提高了基于富集策略的靈敏度和特異性。為了區(qū)分mC和hmC,許多這樣的方法涉及使用BGT將hmC高選擇性地酶促糖基化為更大且的殘基glc-hmC。泛使用的技術(shù)是hMe-Seal,其中BGT通過從化學(xué)修飾的輔因子類似物UDP-glc-azide轉(zhuǎn)移疊氮化物修飾的葡萄糖來催化hmC衍生化。隨后通過點(diǎn)擊化學(xué)連接生物素,并用于選擇性鏈霉親和素-生物素下拉含hmC的DNA并進(jìn)行測序(圖7b)。這種技術(shù)已經(jīng)在各種細(xì)胞系、組織和cfDNA中進(jìn)行了大量研究以繪制hmC全基因組圖譜。其進(jìn)一步的進(jìn)展,Nano-hmC-Seal展示了超低量基因組DNA的hmC比對(duì)能力。
Liutkevi?iūt?等人提出了一種不需要UDP-glc-azide輔因子的hmC替代化學(xué)-酶促衍生化方法。發(fā)現(xiàn)M.SssI(和其他一些DNA C5 MTase)可以hmCpG位點(diǎn)中5-羥基團(tuán)與帶有功能性氨基基團(tuán)的烷硫基團(tuán)的序列特異性替換。連接的脂肪族氨基允許NHS生物素試劑的化學(xué)連接,以選擇性富集和分析含hmC的DNA。
5.2 束縛寡核苷酸引物測序(Tethered Oligonucleotide-Primed Sequencing, TOP-Seq)
為了將基于富集方法提供的分辨率極限從200-500 bp提高到單核苷酸水平,提出了一種稱為TOP-seq(Tethered Oligonucleotide-Primed sequencing,束縛寡核苷酸引物測序)的方法(圖7b)。該方法的顯著特征是,DNA寡核苷酸被共價(jià)連接而不是生物素基團(tuán),以使DNA聚合酶鏈合成能夠在共價(jià)標(biāo)記的CpG基因組位點(diǎn)進(jìn)行非同源誘導(dǎo)。在其進(jìn)一步更新優(yōu)化中,hmTOP-seq,DNA寡核苷酸通過銅(i)促進(jìn)的疊氮-炔烴點(diǎn)擊化學(xué)連接在BGT疊氮衍生的糖基化hmC殘基上,然后作為引物生成擴(kuò)增子,其中起始序列標(biāo)記基因組中初始hmC的精確位點(diǎn)。hmTOP-seq初步研究表明,該方法在哺乳動(dòng)物基因組樣本和cfDNA中高分辨率和成本效益的hmC分析方面具有廣泛的適用性。亦有研究人員獨(dú)立的提出一種類似的方法,利用無銅點(diǎn)擊化學(xué)將DNA發(fā)夾連接到hmC上,以在修飾的胞嘧啶周圍(20 bp窗口)進(jìn)行序列read;此時(shí)產(chǎn)生了更大的束縛基團(tuán),與銅(I)促進(jìn)的標(biāo)記相比,這似乎對(duì)聚合酶引導(dǎo)的精確度和效率產(chǎn)生了負(fù)面影響。
5.3 基于化學(xué)轉(zhuǎn)化的堿基分辨率方法
多年來,單C分辨率進(jìn)行全基因組mC(5-甲基胞嘧啶)分析的金標(biāo)準(zhǔn)方法是亞硫酸鹽測序(BS-seq)。亞硫酸鹽處理下mC和C的差異反應(yīng)性構(gòu)成該方法的基礎(chǔ):mC對(duì)亞硫酸鹽促進(jìn)的脫氨基作用非常穩(wěn)定,隨后讀作為正常的C堿基,而未修飾的C讀作為T堿基。隨著ox-mCs(氧化甲基胞嘧啶)的發(fā)現(xiàn),標(biāo)準(zhǔn)亞硫酸鹽處理的信息量顯得不足,因?yàn)閬喠蛩猁}在5-羥甲基基團(tuán)會(huì)產(chǎn)生一種水解穩(wěn)定的5-磺酰甲基胞嘧啶(smC,也稱為胞嘧啶5-亞甲基磺酸鹽),無法與mC區(qū)分(圖7a和8)。此外,hmC進(jìn)一步氧化的產(chǎn)物caC和fC被解釋為未修飾的C(T)。mC和hmC或caC和fC在BS中的不可區(qū)分行為很可能是ox-mC在DNA修飾分析中長期被忽視的原因。因此,由于標(biāo)準(zhǔn)亞硫酸鹽化學(xué)僅提供mC + hmC信號(hào)與未修飾胞嘧啶(加上非常罕見的fC和caC)的總和,這引發(fā)了對(duì)特定預(yù)處理方法以檢測hmC的需求。目前使用的兩種方法是基于在標(biāo)準(zhǔn)BS之前對(duì)hmC進(jìn)行酶促或化學(xué)氧化(圖7a和8)。TET輔助的亞硫酸鹽測序TAB-seq是一種化學(xué)酶法方法,利用糖基化保護(hù)hmC,隨后通過小鼠TET1酶將mC氧化為caC。在亞硫酸鹽測序后,hmC讀作為C堿基,而所有其他胞嘧啶形式被解釋為未修飾的C(T)。在另一種稱為氧化亞硫酸鹽測序的方法OxBS中,hmC通過高釕酸鉀(KRuO4)氧化為fC,然后轉(zhuǎn)化為T,而mC保持為C。OxBS中hmC的和基因組位點(diǎn)通過從標(biāo)準(zhǔn)BS信號(hào)中減去hmC軌跡來確定,因此,需要并行處理兩個(gè)樣本。在TAB-seq中也需要基于減法分析策略來區(qū)分hmC和mC(從BS信號(hào)中減去TAB-seq信號(hào)),增加了分析成本,因?yàn)槊糠N胞嘧啶的測序深度必須非常高才能在兩種方法中檢測到低水平的hmC。
圖8:C5修飾胞嘧啶的化學(xué)轉(zhuǎn)化,用于DNA測序進(jìn)行分析。
用亞硫酸氫鹽處理DNA(向左反應(yīng))后,hmC形成水解穩(wěn)定的5-磺?;谆奏ぃ?span>smC),不能與未反應(yīng)的mC區(qū)分開來(均在泳道C〈C〉),而caC和fC被脫氨基并解釋為未修飾的C(T)。hmC可以被過釕酸鉀(K2RuO4)氧化成fC,并直接測序(C),或使用1,3-茚二酮(fC-AI)的疊氮基衍生物進(jìn)一步衍生,用于生物素下拉測序(T)。在基于吡啶-處理的方法中,mC和hmC首先轉(zhuǎn)化為caC,然后caC還原為二氫尿嘧啶(DHU),并被read為T,而C在吡啶鍛煉期間不受影響(右下)。
盡管亞硫酸鹽處理是DNA甲基化分析金標(biāo)準(zhǔn),但也存在一些缺點(diǎn)。亞硫酸鹽處理會(huì)導(dǎo)致input DNA降解,而所有未修飾胞嘧啶的脫氨基作用會(huì)導(dǎo)致序列復(fù)雜度降低,從而帶來分析挑戰(zhàn)。這促使了替代性的無亞硫酸鹽單堿基分析方法的出現(xiàn)(圖7a和8)。新穎的化學(xué)策略被用于一種稱為TET輔助吡啶測序(TAPS)的化學(xué)酶法無亞硫酸鹽方法:TET蛋白將mC和hmC轉(zhuǎn)化為caC,然后caC被吡啶(PB)還原為二氫尿嘧啶(DHU),并以T形式進(jìn)行測序。吡啶化學(xué)的重要進(jìn)展是直接read修飾堿基,同時(shí)保持未修飾C的完整性,其破壞性較小,與BS相比,能夠提供更好的序列質(zhì)量、比對(duì)率和覆蓋度。盡管TAPS的最初協(xié)議提供了關(guān)于mC + hmC信號(hào)的信息,但最近引入的優(yōu)化方法通過使用高釕酸鉀(K2RuO4)處理代替TET介導(dǎo)的氧化,以及在PB(或吡咯基pic-borane))轉(zhuǎn)化之前對(duì)hmC進(jìn)行糖基化保護(hù),使得CAPS和TAPSβ方法能夠分別獨(dú)立比對(duì)hmC和mC。另一種新穎的無亞硫酸鹽化學(xué)策略用于檢測hmC稱為hmC-CATCH,基于使用高釕酸鉀(K2RuO4)選擇性氧化hmC為fC,然后使用1,3-吲哚二酮衍生物對(duì)新生成的fC進(jìn)行標(biāo)記,這導(dǎo)致hmC在測序中轉(zhuǎn)化為T,而內(nèi)源性fC在氧化反應(yīng)之前被阻斷(圖7a)。hmC-CATCH的DNA降解最小,并且能夠在低input DNA下提供單堿基hmC分析,如在循環(huán)游離DNA(cfDNA)分析中的應(yīng)用所示。
5.4 酶輔助的堿基分辨率方法
與BS(亞硫酸鹽測序)相比,ACE-seq(APOBEC-coupled epigenetic sequencing)和EM-seq(Enzymatic Methyl-Seq)方法對(duì)DNA的處理更為溫和,它們都利用AID/APOBEC家族的DNA脫氨酶將C水解為U(圖7a)。ACE-seq方法提供直接hmC測序,而EM-seq檢測常見的mC + hmC信號(hào),并要求通過ACE-seq獲得的信號(hào)進(jìn)行減法以定位mC。盡管基于APOBEC脫氨酶的方法都具有非破壞性特征,但它們?nèi)匀豢赡苁艿?span>C脫氨后堿基含量低復(fù)雜度的影響,因此,低DNA量的分析可能會(huì)變得復(fù)雜。最近提出的一個(gè)測序平臺(tái)使用了類似的酶促核苷酸轉(zhuǎn)化,可以在不進(jìn)行泳道減法的情況下推導(dǎo)出四種遺傳堿基和兩種胞嘧啶的表觀遺傳狀態(tài)(mC和hmC)。通過在一個(gè)實(shí)驗(yàn)工作流程中連接和復(fù)雜處理每個(gè)基因組片段的兩條鏈來實(shí)現(xiàn)。
限制性內(nèi)切酶切割長期以來一直用于DNA修飾分析,作為一種簡單易行且具有成本效益的策略。由于限制性內(nèi)切酶的嚴(yán)格序列特異性,這些方法提供了堿基分辨率的DNA修飾分析。但是,由于它們的靶位點(diǎn)長于兩個(gè)核苷酸(通常為4-6 bp),因此該方法只能檢測所有基因組CpG位點(diǎn)的一小部分。已經(jīng)開發(fā)了幾種hmC分析方法,將限制性內(nèi)切酶消化與hmC的酶促葡糖基化相結(jié)合。其中適用于全基因組分析hmC利用HpaII和MspI限制性核酸內(nèi)切酶對(duì)其靶序列CCGG內(nèi)胞嘧啶修飾的差異敏感性。BGT介導(dǎo)的糖基化使ChmCGG位點(diǎn)對(duì)MspI切割具有抗性,可以通過qPCR、微陣列或下一代測序?qū)ζ溥M(jìn)行富集和分析。
更近期的策略包括Aba-seq方法和Pvu-Seal-seq。在Aba-seq中,AbaSI限制性內(nèi)切酶在識(shí)別的糖基化hmC附近切割一定距離的DNA片段,然后將切割的片段被下拉并測序。Pvu-Seal-seq中的PvuRts1l限制性內(nèi)切酶識(shí)別羥甲基化的目標(biāo)位點(diǎn),并在下游11-12bp處切割(圖7b)。PvuRts1l切割進(jìn)一步與BGT和UDP-疊氮葡萄糖對(duì)hmC的共價(jià)標(biāo)記相結(jié)合,用于特異性分離修飾DNA,如上述的hmC選擇性化學(xué)標(biāo)記方法hMe-Seal所述。盡管所有基于限制性內(nèi)切酶的方法都無法定量檢測全基因組hmC,但它們的固有特征是能夠靈敏地檢測低度羥甲基化的目標(biāo)位點(diǎn),而無需BS方法的深度測序。
5.5 單分子長讀長生物物理檢測
有幾種方法允許在DNA的原始片段上進(jìn)行表觀遺傳修飾單分子分析。其中一種方法是在原生染色體DNA中光學(xué)比對(duì)hmC。該方法使用熒光團(tuán)對(duì)hmC進(jìn)行兩步標(biāo)記,然后通過納米通道拉伸DNA鏈進(jìn)行熒光圖像分析。熒光團(tuán)沿著線性DNA鏈的物理定位產(chǎn)生亞兆堿基規(guī)模的長DNA分子的表觀遺傳譜,可以獨(dú)立解釋或與遺傳(序列特異性)熒光圖譜一起解釋。通過檢測顯微鏡技術(shù)和納米通道中DNA鏈的物理波動(dòng)來確定1 kb的比對(duì)分辨率,如在固體表面上進(jìn)行DNA拉伸和dSTORM成像的試點(diǎn)實(shí)驗(yàn)中表明可以達(dá)到10 nm或僅20 bp。
第三代測序技術(shù)通常避免DNA衍生化和DNA擴(kuò)增,直接對(duì)DNA片段進(jìn)行測序。在Oxford Nanopore Technologies(ONT)商業(yè)提供的納米孔測序中,通過讀取核酸鏈通過納米孔時(shí)的離子電流分布來實(shí)現(xiàn)測序。Pacific Biosciences提供的單分子實(shí)時(shí)(SMRT)測序跟蹤固定在零模波導(dǎo)中的DNA聚合酶摻入熒光標(biāo)記的dNTP(圖7C)。在這種情況下,模板鏈上存在的堿基修飾會(huì)改變核苷酸摻入的動(dòng)力學(xué)(dNTP到達(dá)和停留時(shí)間),從而可以在多個(gè)測序輪次中進(jìn)行鑒定。在這兩種情況下,DNA修飾都會(huì)導(dǎo)致測量信號(hào)的細(xì)微和背景相關(guān)的偏差。因此使用體外制備的training DNA底物進(jìn)行廣泛的信號(hào)處理和機(jī)器學(xué)習(xí),以破譯修飾堿基的存在和身份。盡管已經(jīng)證明了在某些CpG環(huán)境中通過其納米孔信號(hào)特征區(qū)分五種胞嘧啶變體的原理,通過將mC和hmC分別酶促轉(zhuǎn)化為caC124和glc-hmC,可以實(shí)現(xiàn)選擇性信號(hào)增強(qiáng),以改進(jìn)mC和hmC的SMRT檢測。ONT和PacBio都將其工具集成到了默認(rèn)的測序軟件中。對(duì)于原生DNA,目前的檢測于CpG位點(diǎn),僅適用于mC和hmC(ONT Remora)或mC(PacBio)。第三代測序的進(jìn)一步動(dòng)態(tài)發(fā)展似乎即將帶來單分子靈敏度,可靠的原生胞嘧啶修飾區(qū)分,長讀長和高通量自動(dòng)化優(yōu)勢。
6、hmC-DNA的結(jié)構(gòu)和相互作用
hmC(5-羥甲基胞嘧啶)在B型或A型DNA的螺旋結(jié)構(gòu)上不會(huì)引起顯著的結(jié)構(gòu)變化,這一點(diǎn)通過X射線晶體學(xué)或NMR觀察得到證實(shí)(圖9)。一般來說,當(dāng)C被mC或hmC取代時(shí),存在減少的扭轉(zhuǎn)和增加的滾動(dòng)角度的趨勢,這可能是由于胞嘧啶5位取代基的空間位阻所致。hmC在修飾位點(diǎn)導(dǎo)致主溝槽寬度增加了0.8 ?(4.5%),這與mC或其他C5修飾類似。
圖9:DNA中C5修飾的胞嘧啶結(jié)構(gòu)。
上:C和5修飾的胞嘧啶以及堿基對(duì)(灰色虛線)和3'鄰近(CpG)鳥嘌呤殘基的棒狀圖。hmC有兩種主要構(gòu)象:a(占70-80%)和b(占20-30%)。
下:DNA主溝槽中胞嘧啶變體的空間填充表示。淺灰色–Dickerson Drew dodecamer。(修飾)胞嘧啶第9號(hào)位(PDB ID 3u2n,4glg,4i9v,4pwm,4qc7)的C5位灰色(碳原子)、紅色(氧原子)。
7、hmC在哺乳動(dòng)物中的生物學(xué)作用
發(fā)現(xiàn)的主動(dòng)和被動(dòng)mC去除提供了證據(jù),表明DNA甲基化是一個(gè)雙向的、動(dòng)態(tài)調(diào)節(jié)的過程;甲基化和去甲基化事件發(fā)生在不同的發(fā)育程序和環(huán)境線索下的不同時(shí)間和基因組區(qū)域。經(jīng)過十多年的hmC研究,其生物學(xué)意義開始出現(xiàn),仍在廣泛討論中。盡管hmC是由其前體mC在TET介導(dǎo)的主動(dòng)去甲基化通路中產(chǎn)生的,但hmC似乎在許多細(xì)胞類型中持續(xù)存在,反駁了hmC僅是去甲基化中間體的觀點(diǎn)。
7.1 hmC在復(fù)制、修復(fù)和重組中的作用
hmC和DNA修復(fù)的密切相互作用源于BER/NER通路參與TET誘導(dǎo)的DNA去甲基化(圖5)。導(dǎo)致hmC水平提高的TET活性也會(huì)產(chǎn)生更多的fC和caC,從而激活BER。與mC相比,這一想法與hmC富集區(qū)域突變頻率降低一致,mC標(biāo)記了mC→ T突變導(dǎo)致基因組CpG耗竭熱點(diǎn)。與相關(guān)堿基hmU、U、fC和caC不同,hmC不是堿基切除機(jī)制的底物,因此可以在基因組DNA中積累到相當(dāng)高的水平。
基因組分析研究檢測到DNA損傷位點(diǎn)和停滯的復(fù)制叉處的hmC水平升高。在配子減數(shù)分裂重組期間的DNA雙鏈斷裂處也發(fā)現(xiàn)了hmC的存在。有人提出,mC到hmC的轉(zhuǎn)化可能阻止了對(duì)mC親和因子的結(jié)合。然而,改變TET活性以改變hmC水平的實(shí)驗(yàn)并沒有明確指出產(chǎn)生的hmC是否直接參與招募DNA修復(fù)組分到問題位點(diǎn),或者只是與積極切除的fC和caC一起產(chǎn)生的被動(dòng)旁觀者。
哺乳動(dòng)物的復(fù)制起始點(diǎn)沒有明顯的DNA甲基化、特定組蛋白修飾或共有序列明確標(biāo)記,已被證明hmC富集。hmC似乎介導(dǎo)G1和M期前體復(fù)制復(fù)合物的組裝,然而在復(fù)制起始點(diǎn)的激活之前或期間,hmC必須被移除,然后在新復(fù)制的DNA中重新組裝。因此,hmC水平升高會(huì)延遲G1期的進(jìn)程,減少細(xì)胞分裂。這些觀察結(jié)果指向hmC在細(xì)胞周期調(diào)控中的直接參與,并可能解釋為什么非分裂神經(jīng)元群體顯示出hmC含量,而快速分裂的神經(jīng)前體細(xì)胞幾乎沒有hmC。
另一方面,有人提出,基因組hmC含量實(shí)際上可能取決于細(xì)胞周期的持續(xù)時(shí)間。哺乳動(dòng)物細(xì)胞和組織中對(duì)DNA中胞嘧啶衍生物的代謝同位素標(biāo)記表明,hmC發(fā)生在復(fù)制期間或復(fù)制后,hmC在DNA合成后的30小時(shí)內(nèi)緩慢形成。這種延遲的hmC出現(xiàn)可以解釋為什么快速分裂的細(xì)胞會(huì)含有較少的hmC,這與觀察到的hmC整體水平與細(xì)胞增殖速率之間的負(fù)相關(guān)關(guān)系一致。
7.2 hmC參與轉(zhuǎn)錄
Rausch等人在活細(xì)菌、酵母和哺乳動(dòng)物細(xì)胞中檢測了mC和hmC全基因組轉(zhuǎn)錄和復(fù)制的影響。研究結(jié)果表明,雖然mC穩(wěn)定了DNA螺旋并降低了DNA解旋酶和RNA/DNA聚合酶的速度,但hmC將雙鏈穩(wěn)定和基因組代謝效應(yīng)恢復(fù)到未修飾的胞嘧啶水平。在生化實(shí)驗(yàn)中,ICV啟動(dòng)子上的hmC強(qiáng)抑制轉(zhuǎn)錄,而其在基因體中的存在幾乎對(duì)轉(zhuǎn)錄沒有影響。
不同的hmC分析研究發(fā)現(xiàn)其優(yōu)先分布在活性基因的基因體、3'UTR,活性或待激活的增強(qiáng)子、發(fā)育相關(guān)基因的啟動(dòng)子以及轉(zhuǎn)錄因子結(jié)合位點(diǎn)周圍。hmC參與表觀遺傳調(diào)控已經(jīng)表明hmC和fC/caC在全基因組中的差異積累。例如,在小鼠ESC中,>90%的hmCG位點(diǎn)與fC和caC位點(diǎn)存在差異,只有約19%的fC/caC位點(diǎn)與hmC重疊。與可變剪接外顯子相比,hmC在外顯子-內(nèi)含子邊界的定位及其在組成型外顯子中的豐度提出了其在可變剪接中的作用的想法,表明主要的基因組絕緣子和多功能調(diào)控甲基敏感蛋白CTCF與替代外顯子中的基因內(nèi)hmC結(jié)合,并與替代外顯子包含相關(guān)。且hmC水平在正義鏈上更高?;蝮whmC與基因表達(dá)的關(guān)聯(lián)已得到廣泛證實(shí),盡管其影響是雙向的:例如,它促進(jìn)ESC和許多其他細(xì)胞類型的基因表達(dá),但與神經(jīng)元祖細(xì)胞的轉(zhuǎn)錄負(fù)相關(guān)。而高表達(dá)基因通常在許多細(xì)胞類型的啟動(dòng)子上表現(xiàn)出hmC耗竭。
hmC和其他ox-mC作為獨(dú)立的表觀遺傳調(diào)節(jié)因子間接得到了結(jié)合蛋白差異的支持,這些結(jié)合蛋白主要是轉(zhuǎn)錄調(diào)節(jié)因子。例如,MeCP2可以結(jié)合mC和hmC,從而改變?nèi)旧|(zhì)結(jié)構(gòu)并促進(jìn)神經(jīng)細(xì)胞中的基因表達(dá)。而MBD1可以特異性結(jié)合mC,但不能與ox-mC結(jié)合。mC結(jié)合的MBD1可以招募組蛋白甲基轉(zhuǎn)移酶SETDB1,從而促進(jìn)H3K9甲基化和基因抑制。此外,基因體上的hmC分布調(diào)節(jié)H3K36me3標(biāo)記沉積,表明活性轉(zhuǎn)錄,從而集體改變了異染色質(zhì)和/或常染色質(zhì)區(qū)域基因活性的染色質(zhì)構(gòu)象。
7.3 hmC在細(xì)胞分化和重編程中的作用
在定義TET蛋白和hmC在干細(xì)胞多能性中的作用方面存在一定爭議。在小鼠ESC中,TET1高表達(dá)、TET2缺失或TET1/TET2雙缺失并未影響多能性或發(fā)育,盡管會(huì)降低hmC水平并誘導(dǎo)轉(zhuǎn)錄變化。然而,TET1/TET2缺失可能會(huì)延遲分化過程中的轉(zhuǎn)錄變化,或誘導(dǎo)ESC特定譜系。此外,三重突變體(TET1、TET2和TET3)mESC是可行和多能的,盡管顯示出hmC缺失、啟動(dòng)子高甲基化和分化潛能受損,支持DNA主動(dòng)去甲基化在分化中的重要作用。
TET介導(dǎo)的氧化在ESC中的主要作用是維持調(diào)節(jié)區(qū)的去甲基化狀態(tài),特別增強(qiáng)子和啟動(dòng)子是重編程的主要靶標(biāo)。在ESC中,高水平的hmC標(biāo)記沉默的二價(jià)啟動(dòng)子,其分別含有抑制性和活化性組蛋白標(biāo)記H3K27me3和H3K4me3,并且通常在分化時(shí)被激活。TET和DNMT蛋白拮抗以調(diào)節(jié)增強(qiáng)子和啟動(dòng)子的甲基化狀態(tài); TET1可以從TET1優(yōu)先結(jié)合ESC的啟動(dòng)子中排除DNMT3A1。此外,TET蛋白與轉(zhuǎn)錄因子緊密結(jié)合,介導(dǎo)mC的逐步氧化并調(diào)控發(fā)育基因的基因表達(dá)。例如TET1和TET2與多能性因子Nanog互作以提高重編程效率,或與各種異染色質(zhì)相關(guān)蛋白(如HDAC組蛋白脫乙酰酶)一起重塑染色質(zhì)并調(diào)控轉(zhuǎn)錄。
其他研究表明,TET蛋白和ox-mCs對(duì)于端粒長度的維持很重要,這對(duì)于維持多能性、自我更新和基因組穩(wěn)定性很重要。例如,TET1/TET2雙突變體導(dǎo)致DNMT3b和mC/hmC比率升高,從而導(dǎo)致端??s短。
有趣的是,通過突變工程使TET2活性傾向于產(chǎn)生hmC,可以剖析在誘導(dǎo)多能細(xì)胞(iPSC)重編程過程中hmC與其他ox-mCs的生物學(xué)意義。hmC本身的增加似乎不足以驅(qū)動(dòng)表觀遺傳變化,而fC/caC的形成對(duì)于促進(jìn)重編程位點(diǎn)的快速變化是必要的。此外,在多能干細(xì)胞分化為神經(jīng)元、膠質(zhì)細(xì)胞和肝細(xì)胞的過程中,檢測到細(xì)胞特異性基因啟動(dòng)子中caC含量的增加,因此,caC通路可能作為一種通用的表觀遺傳重編程機(jī)制,用于建立細(xì)胞譜系。
在小鼠合子重編程中,大多數(shù)hmC由新生mC產(chǎn)生,表明hmC在早期胚胎發(fā)育中具有特定的作用。通常hmC的表觀遺傳作用在細(xì)胞分化的背景下變得明顯。在紅細(xì)胞生成過程中,觀察到整體hmC水平下降,但盡管進(jìn)行了多次DNA復(fù)制,某些基因組位點(diǎn)的hmC仍然高度富集。在不對(duì)稱分裂的干細(xì)胞中,較高的hmC已被證明可以鑒定保守的DNA鏈染色體。在神經(jīng)元細(xì)胞中,TSS的hmC缺失,無論基因表達(dá)水平或CpG含量如何。有人提出,在早期發(fā)育中,大腦特異性增強(qiáng)子最初會(huì)被羥甲基化,但后來,增強(qiáng)子的羥甲基化和去甲基化階段都以細(xì)胞類型特異性方式受到差異調(diào)控??傮w而言,這些數(shù)據(jù)表明需要正確功能的TET介導(dǎo)的DNA去甲基化來進(jìn)行分化、重編程和細(xì)胞命運(yùn)決定。
7.4 hmC作為診斷和預(yù)后標(biāo)志物
適當(dāng)?shù)?span>DNA甲基化和去甲基化之間的平衡維持了健康細(xì)胞的DNA甲基化譜,而在癌癥中這種平衡被嚴(yán)重破壞。有充分證據(jù)表明,在許多癌癥類型中,hmC的整體水平顯著降低,表明hmC具有潛在的臨床相關(guān)性。有人可能會(huì)認(rèn)為,在癌細(xì)胞等密集分裂的細(xì)胞中,hmC降低可能與通過被動(dòng)DNA去甲基化去除hmC有關(guān)。然而,在健康發(fā)育的細(xì)胞中,盡管進(jìn)行了多次DNA復(fù)制并降低了整體hmC水平,但某些基因組位點(diǎn)的hmC仍然高度富集。在許多癌癥中不存在TET遺傳變化,因此hmC整體丟失的基礎(chǔ)并不清楚。一些腫瘤表現(xiàn)出異檸檬酸脫氫酶活性增加(IDH1或IDH2的功能獲得突變),導(dǎo)致產(chǎn)生2HG,一種代謝產(chǎn)物和TET功能抑制劑。此外,在缺乏營養(yǎng)的腫瘤條件下,葡萄糖/谷氨酰胺水平的降低可能會(huì)影響細(xì)胞內(nèi)2OG/琥珀酸比,即使沒有遺傳性TET和IDH突變,細(xì)胞內(nèi)2OG/琥珀酸比也會(huì)下調(diào)TET并引起hmC丟失。其他因素如缺乏Fe(ii)、抗壞血酸或缺氧也可能會(huì)減弱TET活性。用抗壞血酸補(bǔ)充癌細(xì)胞可以恢復(fù)hmC水平并抑制癌癥的生長和遷移。一般來說,癌癥中hmC丟失機(jī)制可能比TET或IDH酶的異常功能所定義的更具整體性。研究表明簡單地重編程hmC和TET酶可能會(huì)降低腫瘤的生長和侵襲性。多項(xiàng)研究表明hmC降低與腫瘤侵襲性之間的相關(guān)性,提出了hmC水平可用于預(yù)測轉(zhuǎn)移、復(fù)發(fā)和預(yù)后。有研究人員嘗試通過cfDNA中的hmC數(shù)量或hmC組織特異性分布來預(yù)測癌癥的類型或階段。除了hmC與癌癥之間廣泛證實(shí)的聯(lián)系外,組織特異性hmC監(jiān)測的臨床相關(guān)性也被證明適用于其他復(fù)雜疾病,例如非侵入性診斷胎兒唐氏綜合癥、阿爾茨海默病和2型糖尿病。
除了作為疾病標(biāo)志物的價(jià)值外,hmC還可能具有一些治療價(jià)值。細(xì)胞部署了一個(gè)雙層保護(hù)系統(tǒng),以避免通過核苷酸補(bǔ)救實(shí)驗(yàn)將修飾的核苷零星摻入DNA中(圖3)。然而,這個(gè)系統(tǒng)在快速增殖的癌細(xì)胞中更加混雜,這使它們更容易接受修飾的胞嘧啶治療,從而為調(diào)控癌癥的潛在治療選擇開辟了新的途徑。
8、結(jié)論
從生物學(xué)角度來看,hmC呈現(xiàn)胞嘧啶的表觀遺傳狀態(tài),其中嚴(yán)格意義的5-甲基標(biāo)記不再存在,但C5位點(diǎn)上仍存在外環(huán)基團(tuán),阻止其再甲基化。胞嘧啶的這種化學(xué)穩(wěn)定的表觀遺傳狀態(tài)(功能去甲基化)是如何解決的?值得注意的是,hmC不被某些甲基CpG結(jié)合結(jié)構(gòu)域蛋白識(shí)別,例如轉(zhuǎn)錄抑制因子MBD1和MBD2,表明mC向hmC的轉(zhuǎn)化可能會(huì)減弱mC的基因沉默效應(yīng)。在存在維持性MTase如Dnmt1的情況下,hmC模式將部分復(fù)制到子鏈上的mC中(被動(dòng)還原)??梢院侠淼丶僭O(shè),盡管由主要表觀遺傳標(biāo)記mC產(chǎn)生,但hmC可能作為次要表觀遺傳標(biāo)記發(fā)揮其調(diào)節(jié)作用;在許多情況下,它可能表現(xiàn)為DNA中的減弱(部分沉默,降低)甲基基團(tuán)。
需要考慮的其他幾個(gè)因素如下。hmC在全基因組中的分布不均勻,與其他修飾胞嘧啶的分布不同。hmC的豐度低于mC,但在某些細(xì)胞類型和遺傳位點(diǎn)上,其豐度相當(dāng)高,足以作為致病的表觀遺傳標(biāo)記持續(xù)存在。一個(gè)嚴(yán)格的保護(hù)系統(tǒng)防止了hmC核苷酸通過NSP在哺乳動(dòng)物DNA中的零星摻入(圖3)。所有這些都表明,在某些位點(diǎn)和某些時(shí)間點(diǎn)上,hmC的存在或缺失(而不是mC丟失)具有功能重要性。有多個(gè)已經(jīng)確立的例子表明,hmC與細(xì)胞機(jī)制的直接互作導(dǎo)致了對(duì)細(xì)胞的明確后果。因此似乎可以公平地得出結(jié)論,除了作為去甲基化通路中的中間體的明確作用外,hmC還用來作為哺乳動(dòng)物細(xì)胞中生物過程的生物標(biāo)記和/或調(diào)控因子發(fā)揮其他表觀遺傳作用。
參考文獻(xiàn):
Kriukien? E, Tomkuvien? M, Klima?auskas S. 5-Hydroxymethylcytosine: the many faces of the sixth base of mammalian DNA. Chem Soc Rev. 2024 Jan 11. doi: 10.1039/d3cs00858d. PubMed PMID: 38205583
相關(guān)產(chǎn)品
免責(zé)聲明
- 凡本網(wǎng)注明“來源:化工儀器網(wǎng)”的所有作品,均為浙江興旺寶明通網(wǎng)絡(luò)有限公司-化工儀器網(wǎng)合法擁有版權(quán)或有權(quán)使用的作品,未經(jīng)本網(wǎng)授權(quán)不得轉(zhuǎn)載、摘編或利用其它方式使用上述作品。已經(jīng)本網(wǎng)授權(quán)使用作品的,應(yīng)在授權(quán)范圍內(nèi)使用,并注明“來源:化工儀器網(wǎng)”。違反上述聲明者,本網(wǎng)將追究其相關(guān)法律責(zé)任。
- 本網(wǎng)轉(zhuǎn)載并注明自其他來源(非化工儀器網(wǎng))的作品,目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點(diǎn)和對(duì)其真實(shí)性負(fù)責(zé),不承擔(dān)此類作品侵權(quán)行為的直接責(zé)任及連帶責(zé)任。其他媒體、網(wǎng)站或個(gè)人從本網(wǎng)轉(zhuǎn)載時(shí),必須保留本網(wǎng)注明的作品第一來源,并自負(fù)版權(quán)等法律責(zé)任。
- 如涉及作品內(nèi)容、版權(quán)等問題,請(qǐng)?jiān)谧髌钒l(fā)表之日起一周內(nèi)與本網(wǎng)聯(lián)系,否則視為放棄相關(guān)權(quán)利。