使用高光譜受激拉曼散射在乳腺活檢中基于鈣化評估腫瘤惡性程度
基于組織鈣化可對乳腺腫瘤惡性程度進行精確評估,這對疾病診斷及了解腫瘤發(fā)展過程非常關(guān)鍵。傳統(tǒng)的X光鉬靶可提供鈣化的整體形態(tài)但缺乏化學信息。自發(fā)拉曼光譜可提供詳細的化學數(shù)據(jù)但缺乏空間分布信息。復(fù)旦大學研究人員Yifan Yang等基于光譜和空間域分析,應(yīng)用高光譜受激拉曼散射(SRS)顯微術(shù)來提取微鈣化的化學和形態(tài)特征。成像了23例患者的共211個鈣化點,并用基于支持向量機(SVM)的分類算法對結(jié)果進行了分析。通過優(yōu)化微鈣化的化學及幾何特征組合,使良性和惡性病例的區(qū)分精度能達到98.21%,召回率100.00%,相較基于純光譜學或成像的方法有顯著改善,可實現(xiàn)新鮮組織的快速準確評估。文章以“Microcalcification-Based Tumor Malignancy Evaluation in Fresh BreastBiopsies with Hyperspectral Stimulated Raman Scattering"為題發(fā)表于Analytical Chemistry。
背景
乳腺癌是女性癌癥相關(guān)死亡的第二大原因,每年占所有癌癥病例的23%。惡性腫瘤的早期和準確診斷可極大幫助降低發(fā)病率和死亡率,減輕患者經(jīng)濟負擔。目前早期檢測的主要篩查工具是X光鉬靶(X-ray mammography),其中鈣化被認為是了解和評估疾病的重要特征。這些鈣沉積物中包含豐富的化學成分混合物(如磷酸鹽、草酸鹽和碳酸鹽),以及與腫瘤發(fā)展和惡性腫瘤密切相關(guān)的各種形態(tài)信息(大小、形狀和分布)。然而X光鉬靶僅能提供鈣化的形態(tài)學特征而沒有化學成分信息,并不足以精確評估腫瘤狀態(tài)。因此結(jié)合乳腺鈣化的化學和組織學特征的方法對于提高診斷準確性至關(guān)重要。
基于分子鍵振動的指紋光譜特征的拉曼光譜可提供zhuoyue的化學識別能力。與用于表征乳房鈣化的其他光學方法相比,拉曼散射的特點在于揭示內(nèi)在的組織和生物礦物的化學成分。已經(jīng)證明根據(jù)草酸鈣(CAO)、羥基磷灰石(Hap)和碳酸鹽的光譜特征,拉曼光譜可區(qū)分不同類型乳房鈣化。已知I型鈣化是透明的,由CAO晶體組成,這種鈣化只發(fā)現(xiàn)于良性導(dǎo)管囊腫中,癌中很少發(fā)現(xiàn);而II型鈣化是不透明的,主要由鈣Hap組成,鈣Hap存在于良性和惡性疾病中,但Hap中碳酸鹽的豐度顯示與惡性腫瘤呈負相關(guān)。此外鈣化中的蛋白質(zhì)水平也與惡性腫瘤相關(guān)。但自發(fā)拉曼散射截面成像速度過慢(約每幀一小時),不能提供足夠的被認為與疾病狀態(tài)相關(guān)的形態(tài)學信息。如根據(jù)乳腺成像報告和數(shù)據(jù)系統(tǒng)(BI-RADS),放射技師會將“爆米花樣"鈣化物歸入低風險類別。沒有空間分辨率的情況下,自發(fā)拉曼光譜僅能提供關(guān)于異質(zhì)鈣化復(fù)合體的空間平均化學信息。
為將光譜和空間域信息連接起來,研究人員應(yīng)用高光譜受激拉曼散射(hyperspectral stimulated Raman scattering, SRS)顯微術(shù)來研究微鈣化。作為一種新的化學成像方式,SRS信號強度和成像速度提高了幾個數(shù)量級,同時保持了化學分析的不失真譜線形狀。與傳統(tǒng)自發(fā)拉曼散射不同,當泵浦(ωp)和斯托克斯脈沖(ωs)同時與鍵振動(頻率Ω)相互作用時,SRS從受激發(fā)射過程中得到增益,鍵振動與兩個激光束之間的拍頻共振(Ω = ωp - ωs)。SRS在各研究領(lǐng)域顯示出廣泛的應(yīng)用潛力,特別是生物和生物醫(yī)學研究領(lǐng)域,包括腫瘤的無標記診斷、化學分析、細胞代謝、藥物輸送、生物燃料等。當進一步與機器學習算法結(jié)合時,SRS在自動與智能診斷的快速無標記組織學應(yīng)用方面顯示出巨大成功。雖然已有研究嘗試過用SRS光譜分析在薄組織切片中評估乳房鈣化,但還沒有過將化學和組織病理學信息集成到一起用在腫瘤評估中。另外新鮮組織活檢更適合形態(tài)學成像和特征提取,沒有通常在冷凍組織切片中出現(xiàn)的切片及冷凍偽影。因此對新鮮組織中的微鈣化進行高光譜SRS成像,將為乳腺腫瘤的惡性程度評估提供新思路。
本文使用高光譜SRS評估良性和惡性乳腺病變的各種微鈣化中,腫瘤惡性和多維SRS特征之間的相關(guān)性。從新鮮人乳腺活檢樣品中獲取鈣化的指紋SRS光譜(900-1100cm-1)和化學選擇性圖像。使用光譜分析提取檢測窗口內(nèi)的主要化學成分(Hap、碳酸鹽和蛋白質(zhì)),處理圖像以提取每個鈣化點的主要形態(tài)特征(幾何和紋理)。最后,利用支持向量機(SVM)對乳腺病變進行分類,通過組合并優(yōu)化化學和形態(tài)學特征,使分類精度得到顯著提高。
結(jié)果
01-新鮮乳腺活檢的SRS成像
全乳X光鉬靶成像后,顯示出了分散鈣化(圖1A左),芯針抽吸可能包含豐富鈣化的病變進行組織活檢。在SRS顯微鏡下,可對不同化學成分進行選擇性成像以揭示其空間分布。在高頻C-H拉伸區(qū)可以看到整個組織的組織病理學(圖1A右),拉曼頻率2845cm-1(CH2拉伸)和2930cm-1(CH3拉伸)處可見脂質(zhì)(綠色)和蛋白質(zhì)(藍色)分布,而在指紋頻率區(qū),962cm-1(白色)處可檢測到乳腺組織內(nèi)鈣化物(Hap)的分布。同時采用SHG通道對膠原纖維成像(紅色)。放大的微鈣化部位、細胞區(qū)域和結(jié)締膠原纖維等細節(jié)處可很容易地觀察到乳房組織內(nèi)的強烈不均勻性(圖1B)。
圖1 乳腺活檢的典型高光譜SRS成像結(jié)果。(A)從X光鉬靶區(qū)域獲取的活檢樣本多色SRS圖像。(B)圖A三處放大,顯示有鈣化、密集細胞和富含脂質(zhì)(綠色)、蛋白質(zhì)(藍色)、膠原纖維(紅色)和Hap(白色)的結(jié)締組織區(qū)域。(C)乳腺組織、標準BSA和Hap中微鈣化的SRS光譜。
除每個特定化學圖像中顯示的空間信息之外,超光譜SRS還可提供任何給定感興趣空間區(qū)域的光譜信息。圖1C為具有四個主要拉曼活性峰的鈣化的典型SRS光譜。通過比較純Hap和BSA的SRS光譜,可確定鈣化主要由Hap組成(962cm-1處有代表性的磷脂振動模式),并混合有一定量的蛋白質(zhì)(1005 cm-1和1032cm-1處的特征苯丙氨酸環(huán)呼吸振動模式)。約1072cm-1處的峰可歸因于磷灰石復(fù)合物中嵌入的碳酸鹽(CO32-)的υ1振動模式,與先前的研究一致。已知碳酸鹽取代會影響Hap的拉曼光譜,并且良性和惡性乳腺組織微鈣化物中的碳酸鹽豐度存在差異。這些微鈣化的光譜特征為基于SRS光譜的化學成分分析奠定了基礎(chǔ)。因為Ⅰ型鈣化僅存在于良性病例中,且檢測頻率窗口(900-1100cm-1)中沒有出現(xiàn)草酸鈣,所以本研究中僅關(guān)注Ⅱ型鈣化的診斷價值。
為收集和分析大量的微鈣化點,首先需要在新鮮活檢組織中有效地搜索它們。利用單通道SRS以962cm-1成像快速定位富含Hap的鈣化點,圖2展示了良性和惡性組織中嵌入的微鈣化圖像,同時還有脂質(zhì)、蛋白質(zhì)和膠原纖維的化學圖像用以說明整個組織結(jié)構(gòu)。這些圖像可能已經(jīng)顯示出明顯的形態(tài)差異,良性鈣化顯得更密集和聚集,而惡性鈣化則顯得更分散,有大量更小的微結(jié)構(gòu)(毛玻璃樣)。在900-1100cm-1光譜范圍內(nèi)逐一對這些鈣化點進行高光譜SRS掃描。在所有23例患者中,共研究了211個鈣化點(101個良性,110個惡性),含用于定量分析的光譜和形態(tài)學信息。
圖2 帶有微鈣化的乳腺組織的典型SRS圖像。A、B為惡性組織,C、D為良性組織。綠色,脂質(zhì);藍色,蛋白質(zhì);紅色,膠原纖維;白色,Hap。
02-微鈣化點的光譜和形態(tài)特征提取
首先根據(jù)鈣化的SRS光譜分析了其中的化學成分。圖3A為標準BSA、Hap、裸組織以及良性和惡性鈣化的自發(fā)拉曼光譜,用以確認峰值分配。良性和惡性鈣化的SRS光譜如圖3B和C??梢娒總€光譜由四個窄拉曼峰組成,Hap(962cm-1)、Phe 1(1005cm-1)、Phe 2(1032cm-1)和CO32-(1072cm-1),位于寬XPM背景光譜之上。擬合所有上述峰,并提取與腫瘤惡性相關(guān)的三種主要化學物質(zhì)Hap、蛋白質(zhì)和碳酸鈣的相對豐度。如良性和惡性病例間,蛋白質(zhì)與Hap(Phe1/Hap)的比率、碳酸鹽與蛋白質(zhì)(CO32-/Phe 1)的比率有顯著差異(圖3B和C)。良性鈣化中的碳酸鹽含量往往較高,而惡性鈣化中總蛋白質(zhì)水平似乎更豐富。
圖3 鈣化乳腺組織的自發(fā)和受激拉曼光譜分析。(A)標準BSA、Hap、裸組織和良性及惡性乳腺組織鈣化的自發(fā)拉曼光譜。(B,C)良性和惡性鈣化的SRS光譜,擬合峰值代表Hap、Phe1、Phe2、CO32和XPM背景。
基于Hap的SRS圖像定量表征了Ⅱ型鈣化的形態(tài)學特征。良性(圖4A)和惡性(圖4B)鈣化的典型強度圖進一步轉(zhuǎn)換為二值圖像,以提取zuixiangguan的幾何特征,包括圓形度、面積、周長和傅立葉描述子。統(tǒng)計結(jié)果表明這些特征在良性和惡性病例間表現(xiàn)出顯著差異(圖4C和D)。例如,良性鈣化傾向于表現(xiàn)出面積更大、表面更光滑、圓形度更高和傅立葉描述子,與SRS圖像中直接觀察到的一致。X光鉬靶顯示在大鈣化中有類似的特征,但很難觀察到微鈣化。此外紋理特征也可以從原始強度圖像中提?。o需二進制轉(zhuǎn)換),但診斷價值并不高。
圖4 從鈣化的SRS圖像中提取形態(tài)學特征。(A,B)良性和惡性鈣化結(jié)果二值化的 SRS圖像。(C,D)所有測量乳房鈣化中提取的兩種形態(tài)特征的統(tǒng)計分布的箱線圖。
03-功能排序和選擇
從SRS光譜圖像中提取鈣化點的所有特征后,包括化學和形態(tài)學特征。Table 1列出了所有18個特征(2個光譜、8個幾何和8個紋理)。其中一些特征的區(qū)分性較高,如平均面積和化學比率。因此需要選擇信息量最大的特征,減少冗余信息,實現(xiàn)最佳計算效率。
應(yīng)用RFE算法對這些特征進行排序,如Table 1最后一列所示。似乎幾何特征總體上paimingzui高,而紋理特征排名較低。為找出區(qū)分乳腺惡行腫瘤的最佳特征組合,測試了五組特征進行訓(xùn)練與驗證,即2F、6F、8F、10F和18F。2F代表兩種化學/光譜特征。6F代表純幾何特征,包括paimingqian五的特征。8F包含光譜和幾何特征,均在前八排名內(nèi)。10F開始包含紋理特征。18F包含所有特征。旨在尋找產(chǎn)生最佳評估結(jié)果的特征組合。
04-基于機器學習的微鈣化點SRS評價
在上述特征組合選擇的基礎(chǔ)上,應(yīng)用SVM對所有實驗數(shù)據(jù)進行訓(xùn)練與驗證,以醫(yī)院的診斷結(jié)果作為基本事實。訓(xùn)練與驗證數(shù)據(jù)集以兩種方式進行比較:基于鈣化和基于患者。使用了不同的驗證方法:LOONCV和10倍嵌套交叉驗證,并根據(jù)準確性、精確度、召回率和F評分生成結(jié)果。
訓(xùn)練和驗證結(jié)果如圖5。總體而言,基于患者的數(shù)據(jù)集結(jié)果比基于鈣化的數(shù)據(jù)集結(jié)果更差,表明后者中存在過度擬合,因為同一患者的鈣化數(shù)據(jù)在訓(xùn)練集及驗證集之間交叉;因此基于病人的方法更適合。此外LOONCV性能最好,訓(xùn)練集比10倍方法更大,這特別適合于小規(guī)模數(shù)據(jù)集。此外SVM訓(xùn)練包含更多的特征并不一定會產(chǎn)生更高的評估精度。雖然從2F到8F的驗證結(jié)果越來越好,但當特征數(shù)進一步增加到10F和18F時,驗證結(jié)果通常會下降。詳細觀察表明,純化學特征(2F)預(yù)測結(jié)果適中(準確率82.94%;精度85.58%),而純幾何特征(6F)效果更好(準確率95.26%;精度92.37%),二者的組合(8F)結(jié)果最好(準確率99.05%;精度98.21%)(圖5A和B)。圖5C和D顯示了基于鈣化和基于患者的LOONCV結(jié)果的ROC曲線,證明當包含化學和幾何特征時該SVM模型的評估性能近乎wanmei。
圖5 不同特征組合的SVM模型評價結(jié)果。(A)基于鈣化和(B)基于患者的訓(xùn)練和驗證結(jié)果,包括純化學、純形態(tài)學、10倍和LOONCV的組合特征。每個雷達圖有八個軸:精度、召回率、精確度和訓(xùn)練與驗證結(jié)果的F分數(shù)。誤差線以相應(yīng)的顏色顯示。(C)基于鈣化和(D)基于患者的SVM模型的ROC曲線。
純形態(tài)特征和組合組的曲線下面積(AUC)值都達到了同樣的好結(jié)果,接近理想值1,這主要是因為它們近100%的高召回率(靈敏度)。意味著兩種模型產(chǎn)生的假陰性事件可以忽略不計。但完整的驗證結(jié)果可更全面地評估這些模型,表明組合特征確實表現(xiàn)最好,尤其是在精度和準確度方面(圖5A和B)。而包含紋理特征并不能幫助改善驗證結(jié)果,可能表明鈣化的紋理與疾病狀態(tài)的相關(guān)性要小得多。
結(jié)論
本研究發(fā)現(xiàn),整合鈣化的化學和形態(tài)學信息可顯著提高乳腺腫瘤惡性評價效果,這也表明微鈣化的化學組成和結(jié)構(gòu)特征是相互關(guān)聯(lián)的。鈣沉積的形成過程與鈣化復(fù)合體的具體組成有關(guān),進一步由不同疾病狀態(tài)的潛在生化性質(zhì)確定。SRS高光譜成像提取的特征包含有關(guān)鈣化的多維信息,可能會幫助對疾病進行準確分類。未來可側(cè)重于將這些SRS特征以較大規(guī)模數(shù)據(jù)集與不同類型和級別的乳腺腫瘤相關(guān)聯(lián),以及開發(fā)相應(yīng)的機器學習算法。
利用新鮮的活檢樣本快速評估腫瘤惡性程度對術(shù)中診斷有重要實用價值。傳統(tǒng)的組織病理受限于耗時的組織制備程序。SRS無需處理樣本即可提供天然組織的內(nèi)在分子對比和組織結(jié)構(gòu),以無標記的方式高速得到化學和形態(tài)學信息。光學技術(shù)和深度學習算法也不斷推進著超光譜SRS顯微術(shù)的發(fā)展,這對腫瘤評估中微鈣化的快速分析大有裨益。另外手持式SRS檢測和小型化設(shè)備提高了實用性,使該技術(shù)有望向臨床轉(zhuǎn)化。
參考文獻:Yifan Yang, Yinlong Yang, etal. Microcalcification Based Tumor Malignancy Evaluation in Fresh Breast Biopsies with Hyperspectral Stimulated Raman Scattering. Analytical Chemistry. 2021,93,15,6223-6231.