最xin血漿蛋白質(zhì)組學(xué)圖譜,揭示血漿蛋白質(zhì)組、遺傳學(xué)和疾病之間的關(guān)聯(lián)
高通量蛋白質(zhì)組學(xué)平臺(tái)SomaLogic和Olink是兩個(gè)基于親和力的高通量蛋白質(zhì)組學(xué)研究平臺(tái),它們通過(guò)對(duì)結(jié)合靶蛋白進(jìn)行測(cè)量,在血漿蛋白等數(shù)千種蛋白質(zhì)的測(cè)量方面具有重要作用,有助于理解基因組與疾病之間的關(guān)系。SomaLogic的平臺(tái)使用單個(gè)適體來(lái)測(cè)量目標(biāo)蛋白,而Olink的平臺(tái)則需要結(jié)合兩種不同抗體進(jìn)行免疫分析,這兩個(gè)平臺(tái)在測(cè)量蛋白質(zhì)方面具有一定的差異,也是近年來(lái)科學(xué)家們關(guān)注的重點(diǎn)問(wèn)題。
近日,來(lái)自deCODE Genetics /安進(jìn)公司和冰島大學(xué)的Kari Stefansson團(tuán)隊(duì)在國(guó)際頂刊《Nature》上在線(xiàn)發(fā)表了題為“Large-scale plasma proteomics comparisons through genetics and disease associations"的研究性論文(圖1)。
在這項(xiàng)研究中,他們比較了基于Olink Explore 3072平臺(tái)和SomaScan v4平臺(tái)的數(shù)據(jù),分析了由英國(guó)生物銀行(UKB)和冰島生成的血漿樣本數(shù)據(jù),并使用可用基因型和表型數(shù)據(jù)來(lái)比較它們與平臺(tái)上蛋白質(zhì)水平的關(guān)聯(lián),發(fā)現(xiàn)選擇不同的平臺(tái)在疾病研究的背景下會(huì)對(duì)結(jié)果和結(jié)論產(chǎn)生實(shí)質(zhì)性的影響。這項(xiàng)研究深入理解了SomaLogic和Olink平臺(tái)在高通量蛋白質(zhì)組學(xué)研究中發(fā)揮的重要作用,加深了對(duì)序列變異與疾病和其他性狀之間關(guān)系的理解。
圖1
通過(guò)對(duì)Olink Explore 3072中的1474個(gè)樣本和SomaScan v4中的419個(gè)樣本進(jìn)行重復(fù)測(cè)量,研究人員發(fā)現(xiàn),Olink平臺(tái)的中位CV比低于SomaScan平臺(tái)(分別為0.35和0.50),這表明Olink平臺(tái)的測(cè)定更加精確。這與之前的研究結(jié)果相反,之前的研究發(fā)現(xiàn)對(duì)照樣品的SomaScan測(cè)定的CV值低于Olink測(cè)定的CV值。這表明對(duì)照樣品的CV值并不一定反映測(cè)定的精度,而CV比率則更準(zhǔn)確。
圖2
根據(jù)SomaScan和Olink兩個(gè)平臺(tái)的研究結(jié)果,研究人員發(fā)現(xiàn)兩個(gè)平臺(tái)之間的水平相關(guān)性為0.33,分布呈現(xiàn)兩種模式,一種略高于0,另一種略低于0.6(圖2)。Olink平臺(tái)由早期版本1536和附加后續(xù)檢測(cè)集Expansion組成,其中1536組的中位數(shù)相關(guān)性顯著高于擴(kuò)展組,分別為0.36和0.27。相比之下,兩個(gè)平臺(tái)上所有可能檢測(cè)到的中位數(shù)相關(guān)性為-0.01,Olink平臺(tái)內(nèi)的中位數(shù)相關(guān)性為0.08,SomaScan平臺(tái)內(nèi)的中位數(shù)相關(guān)性為-0.01。在兩個(gè)平臺(tái)上檢測(cè)到的cis pQTLs分析中,蛋白質(zhì)水平的總體方差更為一致,但單個(gè)平臺(tái)上是否存在cis pQTLs沒(méi)有顯示出明顯的趨勢(shì)。
Olink和SomaScan平臺(tái)在檢測(cè)血漿蛋白質(zhì)時(shí),顯示出不同稀釋組間的蛋白質(zhì)豐度和相關(guān)性差異,且大部分蛋白質(zhì)水平低于檢測(cè)限。兩個(gè)平臺(tái)都缺乏細(xì)胞內(nèi)蛋白而富含分泌蛋白。組織之間的蛋白質(zhì)水平相關(guān)性差異較大,且與測(cè)量精度相關(guān)。樣本年齡、性別和BMI與許多蛋白質(zhì)水平顯著相關(guān),且兩個(gè)平臺(tái)在某些疾病中蛋白質(zhì)關(guān)聯(lián)結(jié)果一致,但也有不一致的結(jié)果,這可能與不同平臺(tái)間的測(cè)量差異和可能存在的不同蛋白質(zhì)形態(tài)有關(guān)。
在pQTL分析中,研究人員使用更多序列變體和數(shù)據(jù)歸一化方法,鑒定了大量順式和反式pQTL。在Olink和SomaScan數(shù)據(jù)中,超過(guò)98%的順式pQTL僅與一種蛋白質(zhì)相關(guān),但少數(shù)pQTL與多個(gè)蛋白質(zhì)相關(guān)。研究人員還注意到在RNA水平上存在cis基因表達(dá)的共同調(diào)控,但不影響pQTL檢測(cè)性能。他們還發(fā)現(xiàn)特定蛋白質(zhì)的cis pQTL檢測(cè)與高于LOD的測(cè)定分?jǐn)?shù)和高于LOD的中位數(shù)歸一化蛋白表達(dá)值呈正相關(guān),但這并不意味著低于LOD的測(cè)量值不能提供信息。
研究人員還對(duì)不同祖先群體進(jìn)行pQTL分析,評(píng)估了更大的序列多樣性和LD的可變模式,將關(guān)聯(lián)信號(hào)細(xì)化到更少的變體。他們分別使用Olink Explore 1536平臺(tái)和SomaScan平臺(tái)對(duì)非洲人血漿中的1472種蛋白質(zhì)水平進(jìn)行分析,并檢測(cè)了順式pQTL。發(fā)現(xiàn)不同祖先群體之間存在pQTL的差異,非洲血統(tǒng)的測(cè)試者中較為常見(jiàn)與低水平的低密度脂蛋白膽固醇相關(guān)的PCSK9功能缺失變體,研究人員還發(fā)現(xiàn)了與血紅蛋白β亞基編碼基因HBB中的鐮狀細(xì)胞貧血變體相關(guān)的高水平HMOX1。UKB-AF組的順式pQTL具有較高的LD和平均變異數(shù)較少,與非洲血統(tǒng)人群具有更高的序列多樣性和較低的LD相一致(圖3)。在共有的893個(gè)蛋白中,有62個(gè)蛋白在UKB-AF中實(shí)現(xiàn)了順式pQTL位點(diǎn)的大量改進(jìn),暗示在非洲血統(tǒng)人群中研究與相同變體的疾病相關(guān)性可能會(huì)獲得潛在收益。這些結(jié)果表明不同祖先群體之間存在pQTL的差異,并對(duì)疾病相關(guān)性研究具有潛在價(jià)值。
圖3
研究人員還發(fā)現(xiàn)Olink和SomaScan兩個(gè)平臺(tái)檢測(cè)到的蛋白質(zhì)數(shù)量相差不大,且大部分蛋白質(zhì)都有cis pQTL存在。然而,兩個(gè)平臺(tái)檢測(cè)到的pQTL主要是trans pQTL,且反式的pQTL關(guān)聯(lián)多于順式,但順式的次要關(guān)聯(lián)多于反式。他們探討了順式pQTL的檢測(cè)比例受多種因素影響,包括稀釋組、亞細(xì)胞位置和CV比。此外,蛋白質(zhì)的豐富程度和檢測(cè)精度也會(huì)影響順式pQTL的檢測(cè)比例。在分析儀器匹配的蛋白質(zhì)方面,Olink平臺(tái)比SomaScan平臺(tái)的獨(dú)聯(lián)體pQTL檢測(cè)比例更高,而Olink和SomaScan平臺(tái)之間的相關(guān)性也較高(r = 0.48),但低于cis pQTL的相關(guān)性(r = 0.17)。最后,研究人員通過(guò)全基因組測(cè)序的數(shù)據(jù),發(fā)現(xiàn)了與罕見(jiàn)序列變異相關(guān)的蛋白質(zhì)水平在兩個(gè)平臺(tái)上的差異。
研究人員深入探索了Olink和SomaScan兩個(gè)平臺(tái)檢測(cè)的pQTL之間的關(guān)聯(lián)性和差異。他們發(fā)現(xiàn)雖然兩個(gè)平臺(tái)對(duì)pav引起的表位效應(yīng)同樣敏感,但當(dāng)一個(gè)平臺(tái)的pQTL在另一個(gè)平臺(tái)沒(méi)有找到相應(yīng)的pQTL時(shí),或者兩個(gè)平臺(tái)的pQTL處于高LD時(shí),它們之間的相關(guān)性較低。此外,研究人員還指出了即使在兩個(gè)平臺(tái)上都檢測(cè)到一種蛋白質(zhì)的pQTL,也不能輕易地認(rèn)為它們玩全相同,因?yàn)樗鼈兛赡苁艿讲煌募夹g(shù)、樣本、數(shù)據(jù)質(zhì)量等因素的影響。此外,一些在SomaScan數(shù)據(jù)中與多個(gè)蛋白質(zhì)相關(guān)的pQTL在Olink數(shù)據(jù)中并不與任何蛋白質(zhì)相關(guān),反之亦然。盡管兩個(gè)平臺(tái)上都檢測(cè)到了多效性pQTL,但它們并不玩全相同??偟膩?lái)說(shuō),盡管在兩個(gè)平臺(tái)上都檢測(cè)到多種蛋白質(zhì)的pQTL,但它們之間的關(guān)聯(lián)性和差異需要謹(jǐn)慎地考慮。
因此,研究使用了三種方法來(lái)建立這種關(guān)系:一種是分析pQTL和疾病相關(guān)變異之間的高LD(連鎖不平衡),另一種是將疾病相關(guān)變異包含在具有pQTL的高LD的可信基因集合中,蕞后一種是對(duì)于具有必要統(tǒng)計(jì)數(shù)據(jù)的特定示例,進(jìn)行統(tǒng)計(jì)共定位分析。在Olink-UKB-BI和冰島的SomaScan兩個(gè)數(shù)據(jù)集中,都分別檢測(cè)到了大量的順式和反式pQTL,并且一些疾病相關(guān)的變異被發(fā)現(xiàn)在可信基因集合中。此外,研究人員還發(fā)現(xiàn)了一些具有疾病相關(guān)變異的高LD的順式pQTL,例如在IL10位點(diǎn),rs3024493的次要等位基因(A)與其相關(guān)的rs3024505與IBD34的風(fēng)險(xiǎn)增加相關(guān)(圖4)。這個(gè)變異與較低的IL-10水平相關(guān),而IL-10被認(rèn)為是該區(qū)域蕞有可能的候選基因。總的來(lái)說(shuō),這些研究結(jié)果有助于更好地理解疾病相關(guān)變異與蛋白質(zhì)水平變化之間的聯(lián)系,以及這種聯(lián)系可以更好的預(yù)測(cè)疾病風(fēng)險(xiǎn)。
圖4
此外,研究人員還對(duì)腫瘤壞死因子配體超家族成員11 (TNFSF11)、ERBB4、GRP和IL2RB的順式pQTL與一些疾病相關(guān)性進(jìn)行了研究。這些變異與原發(fā)性膽汁性肝硬化、較低的BMI和2型糖尿病風(fēng)險(xiǎn)、哮喘風(fēng)險(xiǎn)等有關(guān)。此外,他們還討論了在兩個(gè)平臺(tái)上檢測(cè)到的順式pQTL與疾病相關(guān)變異高LD的情況,并解釋了反式pQTL與疾病關(guān)聯(lián)的可能機(jī)制。
研究人員還發(fā)現(xiàn)反式pQTL通常與受疾病影響的組織中表達(dá)豐富的蛋白質(zhì)相關(guān),這些發(fā)現(xiàn)可能指向潛在的疾病生物標(biāo)志物。例如,DEFB4A和PRSS2的水平在兩個(gè)平臺(tái)之間高度相關(guān),而且在兩個(gè)平臺(tái)上都觀察到cis pQTL。為了評(píng)估哪些與疾病相關(guān)的反式pQTL可能對(duì)應(yīng)于同一途徑中蛋白質(zhì)之間的相互作用,他們根據(jù)STRING數(shù)據(jù)庫(kù)評(píng)估了受反式pQTL影響的每個(gè)蛋白質(zhì)是否與蕞接近變體的基因編碼的蛋白質(zhì)相互作用。對(duì)于具有疾病或性狀相關(guān)變異的高LD中約9%的反式pQTL,已知這兩種蛋白之間高度相互作用。例如,TLR3的變異與自身免疫性甲狀腺疾病和IFNL1的反式水平相關(guān),帶有IFNL1的反式pQTL強(qiáng)烈支持TLR3在自身免疫性甲狀腺疾病發(fā)病機(jī)制中的變異位點(diǎn)的作用。因此,這項(xiàng)研究的結(jié)果支持通過(guò)反式pQTL來(lái)研究潛在的疾病生物標(biāo)志物和藥物靶點(diǎn),以幫助更好地了解和治療疾病。
總結(jié)
以上文章來(lái)源于Being科學(xué) ,作者鳶尾與半夏