01 當(dāng)前中國(guó)蛋白組學(xué)格局如何?
D一,中國(guó)還沒有一家蛋白組學(xué)上市公司。
歐美二級(jí)市場(chǎng)有幾家蛋白組學(xué)上市公司,包括Quanterix、Olink、SomaLogic、Seer。國(guó)內(nèi)A股還沒有一家蛋白組學(xué)公司,很接近的是杭州景杰生物。根據(jù)其招股書,景杰成立于2011年,2023年初剛剛過會(huì)創(chuàng)業(yè)板,目前還在排隊(duì)中。同時(shí)也可以看到,中國(guó)蛋白組學(xué)目前營(yíng)收以質(zhì)譜服務(wù)為主,跟國(guó)外Olink、Quanterix等公司通過售賣試劑盒和自動(dòng)化設(shè)備有很大區(qū)別。第二,中國(guó)市場(chǎng)上的蛋白組學(xué)公司,處于混沌狀態(tài),沒有產(chǎn)業(yè)鏈分工。今天的自稱蛋白組學(xué)的公司,大致兩個(gè)來源:一是傳統(tǒng)存在的質(zhì)譜服務(wù)商,強(qiáng)于服務(wù)和渠道,二是新興的生物科技公司,強(qiáng)于技術(shù)和產(chǎn)品。本來這兩類公司應(yīng)該是處于產(chǎn)業(yè)鏈上下游的關(guān)系:生物科技公司給服務(wù)商提供產(chǎn)品。但由于中國(guó)蛋白組學(xué)市場(chǎng)處于早期萌芽階段,出于各種原因,這兩類公司目前基本都自己既做服務(wù),又做產(chǎn)品。第三,中國(guó)蛋白組學(xué)市場(chǎng)格局,以質(zhì)譜路線占據(jù)主導(dǎo)地位。這跟歐美蛋白組學(xué)以親和試劑占主導(dǎo)地位形成明顯差異。歐美蛋白組學(xué)市場(chǎng),以O(shè)link和SomaLogic為代表的親和試劑路線占主導(dǎo)地位,大多數(shù)蛋白組大隊(duì)列都是用這兩家公司的產(chǎn)品開展的,以至于質(zhì)譜蛋白組行業(yè)大牛,德國(guó)馬普所Matthias Mann教授都寫文章感慨:親和試劑遠(yuǎn)比質(zhì)譜要貴,為啥大隊(duì)列都用親和試劑呢?
質(zhì)譜儀對(duì)于蛋白組學(xué),就如同測(cè)序儀對(duì)于基因組學(xué)。但是蛋白組學(xué)大隊(duì)列竟然質(zhì)譜都不占上風(fēng),其中的原因,值得所有質(zhì)譜蛋白組學(xué)人反思。
02 蛋白組學(xué)限速因素還有什么?
蛋白組學(xué)zui大的一個(gè)應(yīng)用場(chǎng)景就是多重蛋白生物標(biāo)志物發(fā)現(xiàn),基于多重蛋白標(biāo)志物,可以開發(fā)疾病早篩、診斷、臨床病人分層、伴隨診斷、用藥指導(dǎo)等諸多應(yīng)用。但多重蛋白標(biāo)志物發(fā)現(xiàn)是D一位。蛋白標(biāo)志物發(fā)現(xiàn)有一個(gè)“倒三角"框架,分為三個(gè)階段。D一階段:未知蛋白標(biāo)志物篩選 (biomarker discovery)。這個(gè)階段目的就是從樣本中發(fā)展?jié)撛诘牡鞍踪|(zhì)標(biāo)志物,常用的方法是不需要標(biāo)記的非靶向質(zhì)譜蛋白組學(xué) (DIA)。特點(diǎn)是要在盡可能多的樣本中(1000個(gè)以上)盡可能地篩選更多的蛋白(比如5000種)。第二階段:標(biāo)志物驗(yàn)證(biomarker validation)。D一階段可能從5000個(gè)蛋白里面篩選到50個(gè)潛在蛋白標(biāo)志物,就需要在第二階段進(jìn)一步驗(yàn)證。常用的方法是基于有標(biāo)記的靶向質(zhì)譜法(PRM)或者基于抗體的免疫分析法(immunoassay)。通常第二階段得到驗(yàn)證的蛋白標(biāo)志物能用于科學(xué)研究,但是想進(jìn)一步成為臨床指標(biāo),則需要到第三階段。
第三階段:臨床標(biāo)志物驗(yàn)證(clinical biomarker validation)。這個(gè)階段通常需要多個(gè)中心的樣本來驗(yàn)證蛋白標(biāo)志物的可靠性、穩(wěn)定性、標(biāo)準(zhǔn)化流程。常用的方法包括基于標(biāo)記的靶向質(zhì)譜法(SRM)或者基于抗體的免疫法(如化學(xué)發(fā)光)。如上文所述,質(zhì)譜儀對(duì)于蛋白組學(xué),就如同測(cè)序儀對(duì)于基因組學(xué)。但目前蛋白組學(xué)沒有被大規(guī)模應(yīng)用,主要是長(zhǎng)期以來三個(gè)要素的不到位而導(dǎo)致的,即:高通量、標(biāo)準(zhǔn)化、低成本。要素一:高通量。質(zhì)譜的通量一直是一個(gè)被長(zhǎng)期詬病的大難題。在2023年6月份之前,蛋白組學(xué)樣本都需要耗費(fèi)一個(gè)小時(shí)的質(zhì)譜時(shí)間,無論是用布魯克的g端版質(zhì)譜儀Tims TOF Pro2和賽默飛的Orbitrap 480。一臺(tái)價(jià)值800萬的高分辨質(zhì)譜儀一天只能跑20個(gè)樣本,低通量的問題同時(shí)帶來了高成本。假設(shè)一年一臺(tái)能跑300例樣本,每年折舊200萬,則平攤到每例樣本的費(fèi)用就超過300元。但是質(zhì)譜通量的問題隨著今年6月份賽默飛發(fā)布新款的Orbitrap Astral而被解決了。Astral一臺(tái)一年能夠處理2萬個(gè)樣本,未來3年,中國(guó)市場(chǎng)上會(huì)有100臺(tái)Astral,每年能處理的樣本量超過200萬個(gè)。未來3年,世界將會(huì)有超過1000臺(tái)Astral裝機(jī)量,每年能處理的樣本超過2000萬個(gè)。即便有世界20家藥企和英國(guó)樣本庫(kù)加持,Olink在世界也不過做了100萬個(gè)樣本。隨著Astral的快速普及,質(zhì)譜能滿足市場(chǎng)上任何想做的大隊(duì)列樣本。同時(shí),每個(gè)樣本大概產(chǎn)生4個(gè)Gb的蛋白組學(xué)數(shù)據(jù),未來每年將有可能產(chǎn)生8000萬個(gè)Gb的蛋白質(zhì)數(shù)據(jù)。在如此浩瀚的蛋白大數(shù)據(jù)面前,將產(chǎn)生非常豐富的蛋白組學(xué)的大模型。類似于DeepMind這樣的公司將層出不窮。要素二:標(biāo)準(zhǔn)化。質(zhì)譜蛋白組學(xué)被人長(zhǎng)期詬病的第二個(gè)問題就是前處理流程麻煩,難以自動(dòng)化標(biāo)準(zhǔn)化。隨著實(shí)驗(yàn)室自動(dòng)化行業(yè)的發(fā)展,以及新冠帶來的自動(dòng)化的認(rèn)知普及,目前這個(gè)問題已經(jīng)得到解決。國(guó)外行業(yè)巨tou包括哈Hamilton、Tecan都推出了自己的蛋白組學(xué)前處理工作站,但目前價(jià)格還是太貴,沒有得到很好的市場(chǎng)普及。國(guó)內(nèi)自動(dòng)化工作站產(chǎn)品的面世,前處理標(biāo)準(zhǔn)化正在得到普及。要素三:低成本。基因組學(xué)的發(fā)展,也是伴隨著二代測(cè)序成本的斷崖式下降而發(fā)展起來的。根據(jù)美國(guó)國(guó)家衛(wèi)生研究院(NIH)公布的數(shù)據(jù),2007年人類全基因組測(cè)序的成本是100萬美元,到2020年這個(gè)成本降低到1000美元,到現(xiàn)在已經(jīng)接近1000人民幣。
數(shù)據(jù)來源:ARK Invest 2023 Big Ideas
從中心法則來講,蛋白質(zhì)組的確可以做很多基因組做不到的事情。但是蛋白組學(xué)行業(yè)的發(fā)展,也必須要跟基因組一樣實(shí)現(xiàn)成本的快速下降。2023年的今天,蛋白組學(xué)的成本還是相對(duì)比較高。
拿芝加哥大學(xué)質(zhì)譜蛋白組學(xué)平臺(tái)的對(duì)外服務(wù)報(bào)價(jià)來舉例,對(duì)工業(yè)客戶,常規(guī)的DIA蛋白組分析就需要378美元/例,用TiO2富集的全磷酸化蛋白組收費(fèi)是535美元/例,如果是酪氨酸磷酸化修飾蛋白組,則費(fèi)用達(dá)到了驚人的1417.5美元/例。
數(shù)據(jù)來源:Rates | Proteomics Platform
對(duì)于組學(xué)來說,沒有幾百個(gè)樣本,很難做出非常令人信服的數(shù)據(jù)。這樣高的成本,對(duì)于大多數(shù)研究機(jī)構(gòu)和企業(yè)研發(fā),都是一筆需要仔細(xì)考量的支出。有沒有一種可能,通過技術(shù)創(chuàng)新,讓蛋白組成本進(jìn)一步降低,使得蛋白組成為一個(gè)不由分說的選項(xiàng),默認(rèn)就要去做的選項(xiàng)?這需要全行業(yè)的參與者來共同努力實(shí)現(xiàn)。
03 中國(guó)蛋白組學(xué)向何處去?
預(yù)測(cè)未來永遠(yuǎn)都是一個(gè)自找打臉的事情。麥肯錫和中金的行業(yè)精英們也從來沒有預(yù)測(cè)準(zhǔn)確過。但有些行業(yè)趨勢(shì),又似乎已經(jīng)非常明顯。
D一,中國(guó)蛋白組學(xué)產(chǎn)業(yè)鏈分工會(huì)更加明細(xì)。
未來5年,中國(guó)蛋白組學(xué)公司將會(huì)迅速分化。一部分企業(yè)將會(huì)專注做上游工具(試劑、設(shè)備、軟件),一部分企業(yè)將會(huì)專注做中游服務(wù)(服務(wù)商),還有一部分企業(yè)將會(huì)專注做下游應(yīng)用(診斷、制藥)。沒有核心技術(shù)的、想做大而全的蛋白組學(xué)公司將被市場(chǎng)出清。
未來5年,形勢(shì)依舊不容樂觀。每一家蛋白組學(xué)公司,必須要想清楚自己在產(chǎn)業(yè)鏈的定位是什么?自己團(tuán)隊(duì)zui大的優(yōu)勢(shì)在哪里?如何做大自己的優(yōu)勢(shì),選擇在哪里建設(shè)自己的護(hù)城河,是每家公司需要考量的決定生死的D一要素。
第二,質(zhì)譜蛋白組大隊(duì)列將井噴式激增。
隨著質(zhì)譜蛋白組三要素(高通量、標(biāo)準(zhǔn)化、低成本)同時(shí)得到滿足,基于質(zhì)譜的蛋白組大樣本隊(duì)列將呈現(xiàn)井噴式發(fā)展。1000例、2000例、3000例的大隊(duì)列將成為常規(guī),1萬人甚至10萬人的質(zhì)譜蛋白組大隊(duì)列將會(huì)涌現(xiàn)。
在今年的中國(guó)蛋白組學(xué)大會(huì)上,國(guó)家蛋白質(zhì)科學(xué)中心就宣布,未來10年,國(guó)家將在蛋白組學(xué)上投入330億人民幣。這足以媲美任何一個(gè)歐美大科學(xué)項(xiàng)目。
第三,中國(guó)蛋白組學(xué)公司將會(huì)出海競(jìng)逐海外市場(chǎng)。
中國(guó)企業(yè)在基因組學(xué)上吃過的虧,在蛋白組學(xué)上會(huì)長(zhǎng)一智?;蚪M學(xué)快速發(fā)展的時(shí)候,中國(guó)生命科學(xué)行業(yè)尚在襁褓之中,從來都是歐美企業(yè)跑到中國(guó)來銷售產(chǎn)品,中國(guó)企業(yè)只有接受他們定價(jià)的份。
現(xiàn)在蛋白組學(xué)發(fā)展的時(shí)候,中國(guó)整個(gè)基礎(chǔ)領(lǐng)域(物理、化學(xué)、材料、自動(dòng)化)已經(jīng)發(fā)展起來,硬科技實(shí)力比20年前大幅增強(qiáng)。優(yōu)質(zhì)的中國(guó)蛋白組學(xué)公司,尤其掌握核心技術(shù)的上游產(chǎn)品,將有機(jī)會(huì)搶占海外市場(chǎng)。同時(shí),海外客戶更高的產(chǎn)品要求、更好的付費(fèi)意愿和付費(fèi)能力,也能反過來要求中國(guó)企業(yè)打磨更優(yōu)質(zhì)的產(chǎn)品、培養(yǎng)更優(yōu)秀的團(tuán)隊(duì)。
第四,圍繞基因蛋白組的AI for Omics將成為熱點(diǎn)。
未來5年,隨著海量蛋白組數(shù)據(jù)的積累,結(jié)合過去積累的基因組數(shù)據(jù),以基因組-蛋白組為中心的多組學(xué)將成為創(chuàng)新的熱點(diǎn),AI for Omics將成為生物大數(shù)據(jù)新的研究范式。屆時(shí),基于多組學(xué)的大模型將出現(xiàn),行業(yè)將誕生類似DeepMind這樣的公司,配合強(qiáng)大的算力和優(yōu)異的算法來整合海量多組學(xué)數(shù)據(jù),把現(xiàn)在在各個(gè)高校實(shí)驗(yàn)室里面的技術(shù)帶入到現(xiàn)實(shí)應(yīng)用場(chǎng)景中來,就如當(dāng)年的蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)工具AlphaFold。
本文轉(zhuǎn)載自 吳昊