請(qǐng)輸入產(chǎn)品關(guān)鍵字:
郵編:200431
聯(lián)系人:王小姐
電話:021-56640936
傳真:021-33250231
手機(jī):13122441390 15900755943
留言:發(fā)送留言
個(gè)性化:www.shifengsj.com
網(wǎng)址:www.shfeng-edu.com
商鋪:http://www.syzwkj.com/st236594/
士鋒生物基于基因表達(dá)譜的基因調(diào)控網(wǎng)絡(luò)研究模型
點(diǎn)擊次數(shù):1549 發(fā)布時(shí)間:2014-2-19
基因表達(dá)存在組織特異性、細(xì)胞周期特異性和外界信號(hào)的響應(yīng)特異性等特性,這些特異性都是由細(xì)胞內(nèi)復(fù)雜而有序的調(diào)控機(jī)制實(shí)現(xiàn)的。對(duì)基因表達(dá)調(diào)控機(jī)制的研究具有非常重要的理論和應(yīng)用價(jià)值,研究的目的是要回答以下問(wèn)題:在特定的細(xì)胞轉(zhuǎn)態(tài)下,有哪些基因發(fā)生了表達(dá)?它們是通過(guò)何種方式被調(diào)控的?它們的表達(dá)量是多少?這些基因的產(chǎn)物對(duì)細(xì)胞的生理活動(dòng)會(huì)產(chǎn)生什么影響?諸如這些問(wèn)題的答案將揭示生命奧秘和指導(dǎo)臨床實(shí)踐,例如,可以通過(guò)測(cè)量基因的表達(dá)調(diào)控產(chǎn)物來(lái)診斷疾病、指導(dǎo)治療;可以人為干擾細(xì)胞的調(diào)控路徑來(lái)改變細(xì)胞的狀態(tài)等?;虮磉_(dá)調(diào)控的研究是后基因組時(shí)代的核心內(nèi)容,是系統(tǒng)生物學(xué)的主要研究?jī)?nèi)容?;虮磉_(dá)的過(guò)程包括染色質(zhì)結(jié)構(gòu)改變和基因活化、轉(zhuǎn)錄、 mRNA 加工和轉(zhuǎn)運(yùn)、翻譯和蛋白質(zhì)修飾、 mRNA 降解等過(guò)程,這些過(guò)程的實(shí)現(xiàn)都是通過(guò)蛋白質(zhì)與蛋白質(zhì)、蛋白質(zhì)與核酸的相互作用來(lái)實(shí)現(xiàn)的。因此,基因表達(dá)調(diào)控的研究可以歸結(jié)為物質(zhì)之間相互作用以及物質(zhì)的代謝過(guò)程,可以形成物質(zhì)之間相互連接的網(wǎng)絡(luò)。如果抽象為數(shù)學(xué)問(wèn)題,則可以用有向圖來(lái)表示,圖的頂點(diǎn)表示物質(zhì)(蛋白質(zhì)或核酸),邊表示為相互作用。對(duì)于每個(gè)頂點(diǎn),有狀態(tài)的切換或者是物質(zhì)濃度的變化,這種變化反映了網(wǎng)絡(luò)的動(dòng)力學(xué)特性。對(duì)于穩(wěn)定系統(tǒng),每個(gè)頂點(diǎn)的狀態(tài)zui終可以達(dá)到相對(duì)平衡。作為網(wǎng)絡(luò)的整體特性可能是單穩(wěn)態(tài),或者是具有多個(gè)吸引子的混沌態(tài)。要了解細(xì)胞的基因表達(dá)調(diào)控過(guò)程,必須對(duì)細(xì)胞內(nèi)的各類物質(zhì)進(jìn)行全面和系統(tǒng)的測(cè)量,根據(jù)各種物質(zhì)的變化來(lái)構(gòu)建復(fù)雜的調(diào)控網(wǎng)絡(luò)。但是,就目前的生物大分子測(cè)量技術(shù)而言,尚不能得到所有生物大分子和相關(guān)物質(zhì)的這些數(shù)據(jù)。因此,要對(duì)生物學(xué)分子網(wǎng)絡(luò)進(jìn)行研究,在現(xiàn)階段還存在數(shù)據(jù)缺乏的問(wèn)題;同時(shí),細(xì)胞內(nèi)的基因、蛋白質(zhì)等物質(zhì)的數(shù)量非常大,要構(gòu)建如此龐大的網(wǎng)絡(luò)對(duì)于網(wǎng)絡(luò)理論和計(jì)算性能也提出了挑戰(zhàn)。
DNA 微陣列的廣泛應(yīng)用提供了海量的基因表達(dá)譜數(shù)據(jù),即細(xì)胞內(nèi) mRNA 的相對(duì)或數(shù)量,反映了基因轉(zhuǎn)錄的調(diào)控機(jī)制,而基因轉(zhuǎn)錄在基因表達(dá)環(huán)節(jié)中起著非常重要的作用?;蛟谵D(zhuǎn)錄過(guò)程中,轉(zhuǎn)錄因子(蛋白質(zhì))與 DNA 的結(jié)合以激活基因的轉(zhuǎn)錄,而基因的表達(dá)產(chǎn)物有可能是轉(zhuǎn)錄因子,它又能激活或抑制其它基因的轉(zhuǎn)錄,如此繼續(xù)下去,就形成一個(gè)基因調(diào)控路徑 (gene regulatory pathway) 。一條路徑中的基因在表達(dá)水平上存在某種相關(guān)性,例如受同一個(gè)轉(zhuǎn)錄因子調(diào)控的基因往往是共表達(dá)的,這些生物學(xué)原理可以用于指導(dǎo)基因調(diào)控路徑的構(gòu)建。從表達(dá)譜數(shù)據(jù)出發(fā),可以建立基因相互作用的網(wǎng)絡(luò)模型,這種方法也稱反向工程 (reverse engineering) , 如圖 8.8 所示 。zui常用的基因調(diào)控網(wǎng)絡(luò)模型是 Boolean 網(wǎng)絡(luò)、連續(xù)模型、線性組合模型、加權(quán)矩陣模型、互信息關(guān)聯(lián)模型等。
讀作“如果 A 基因表達(dá),并且 B 基因不表達(dá),則 C 基因表達(dá)”。以有向圖 G= ( V , F )表示布爾網(wǎng)絡(luò),其中 V 是圖的節(jié)點(diǎn)集合,每個(gè)節(jié)點(diǎn)代表一個(gè)基因,或者代表一個(gè)環(huán)境刺激。環(huán)境刺激可以是任何相關(guān)的生物、物理或化學(xué)因素,但不是基因或基因的產(chǎn)物,它影響調(diào)控網(wǎng)絡(luò)。而 F 是有向邊的集合,每條邊代表基因之間的相互作用關(guān)系。上例所對(duì)應(yīng)的網(wǎng)絡(luò)見(jiàn) 圖 8.9 。
布爾網(wǎng)絡(luò)從初始狀態(tài)開(kāi)始,經(jīng)過(guò)一系列狀態(tài)轉(zhuǎn)換,zui后到達(dá)系統(tǒng)的穩(wěn)定狀態(tài)。從不同的初始狀態(tài)出發(fā),布爾網(wǎng)絡(luò)會(huì)到達(dá)不同的終止穩(wěn)定狀態(tài),而這些不同的終止?fàn)顟B(tài)對(duì)應(yīng)于細(xì)胞相對(duì)穩(wěn)定的生化狀態(tài)。如果在布爾網(wǎng)絡(luò)的一個(gè)穩(wěn)定狀態(tài)下,所有基因的狀態(tài)不變,則稱該穩(wěn)態(tài)是“點(diǎn)吸引子”;如果網(wǎng)絡(luò)的一個(gè)穩(wěn)態(tài)是多個(gè)狀態(tài)的周期切換,則稱該穩(wěn)態(tài)為“動(dòng)態(tài)吸引子”,此時(shí)網(wǎng)絡(luò)系統(tǒng)處于相對(duì)穩(wěn)定狀態(tài)。具體來(lái)說(shuō),穩(wěn)定狀態(tài)分兩種情況,一是單穩(wěn)態(tài),即系統(tǒng)狀態(tài)不再改變。如 圖 8.10(a) 所示,系統(tǒng)從狀態(tài)( 1 ,0 ,0 )出發(fā),經(jīng)過(guò)一系列中間狀態(tài),到達(dá)單穩(wěn)定狀態(tài)以后,系統(tǒng)一直駐留在狀態(tài)( 0 ,0 ,0 )。另一種穩(wěn)定狀態(tài)是所謂多穩(wěn)態(tài),即系統(tǒng)狀態(tài)沒(méi)有穩(wěn)定,只是相對(duì)穩(wěn)定,系統(tǒng)在若干個(gè)狀態(tài)之間循環(huán)往復(fù)。如 圖 8.10(b) 所示,系統(tǒng)達(dá)到相對(duì)穩(wěn)定,在狀態(tài)( 0 ,0 ,1 )和狀態(tài)( 1 ,1 ,0 )之間切換。
(8-47)
其中,Xi(t + D t) 是基因 i 在 t + D t 時(shí)刻的表達(dá)水平,Xj(t) 是基因 j 在 t 時(shí)刻的表達(dá)水平,而 wij 代表基因 j 的表達(dá)水平對(duì)基因 i 的影響。在這種基因相互關(guān)系表示形式中,還可以增加其它數(shù)據(jù)項(xiàng),以逼近基因調(diào)控的實(shí)際情況。例如,可以增加一個(gè)常數(shù)項(xiàng),反映一個(gè)基因在沒(méi)有其它調(diào)控輸入下的活化水平。
將上述表達(dá)式轉(zhuǎn)換為線性差分方程,描述一個(gè)基因表達(dá)水平的變化趨勢(shì)。這樣,在給定一系列基因表達(dá)水平的實(shí)驗(yàn)數(shù)據(jù)之后,即給定每個(gè)基因的時(shí)間序列 Xi(t) ,就可以利用zui小二乘法或者多重分析法求解整個(gè)系統(tǒng)的差分方程組,從而確定方程中的所有參數(shù),即確定 wij 。zui終,利用差分方程分析各個(gè)基因的表達(dá)行為。實(shí)驗(yàn)結(jié)果表明,該模型能夠較好地?cái)M合基因表達(dá)實(shí)驗(yàn)數(shù)據(jù)。
加權(quán)矩陣模型
加權(quán)矩陣模型與線性組合模型相似,在該模型中,一個(gè)基因的表達(dá)值是其它基因表達(dá)值的函數(shù)。含有 n 個(gè)基因的基因表達(dá)狀態(tài)用 n 維空間中的向量 u(t)表示, u(t)的每一個(gè)元素代表一個(gè)基因在時(shí)刻 t 的表達(dá)水平。以一個(gè)加權(quán)矩陣 W 表示基因之間的相互調(diào)控作用, W 的每一行代表一個(gè)基因的所有調(diào)控輸入, w ij 代表基因 j 的表達(dá)水平對(duì)基因 i 的影響。在時(shí)刻 t ,基因 j 對(duì)基因 i 的凈調(diào)控輸入為 j 的表達(dá)水平(即 uj(t) )乘以 j 對(duì) i 的調(diào)控影響程度 Wij 。基因 i 的總調(diào)控輸入 ri(t) 為:
(8-49)
這種函數(shù)是神經(jīng)網(wǎng)絡(luò)中常用的 Sigmoid 函數(shù),其中 a 和 b 是兩個(gè)常數(shù),規(guī)定非線性映射函數(shù)曲線的位置和曲度。通過(guò)上式,計(jì)算出 t+1 時(shí)刻基因 i 的表達(dá)水平。在zui初階段,加權(quán)矩陣的值是未知的。但是可以利用機(jī)器學(xué)習(xí)方法,根據(jù)基因表達(dá)數(shù)據(jù)估計(jì)加權(quán)矩陣中各個(gè)元素的值。
對(duì)于這樣的模型,可以利用成熟的線性代數(shù)方法和神經(jīng)網(wǎng)絡(luò)方法進(jìn)行分析。實(shí)驗(yàn)表明,該模型具有穩(wěn)定的和周期穩(wěn)定的基因表達(dá)水平,與實(shí)際生物系統(tǒng)相一致。在這種模型中還可以加入新的變量,模擬環(huán)境條件變化對(duì)基因表達(dá)水平的影響。
數(shù)據(jù)整合分析
從基因表達(dá)譜出發(fā),構(gòu)建基因調(diào)控網(wǎng)絡(luò),在不考慮由于實(shí)驗(yàn)過(guò)程產(chǎn)生的技術(shù)噪聲等因素對(duì)建模的影響之外,zui大的問(wèn)題就是維度問(wèn)題,以上所述的布爾網(wǎng)絡(luò)等模型隨著變量(基因數(shù)目)的增加,所需要的數(shù)據(jù)將呈指數(shù)級(jí)增長(zhǎng),計(jì)算復(fù)雜度也快速增長(zhǎng)。對(duì)于推斷 N 個(gè)基因的基因網(wǎng)絡(luò),我們需要多少個(gè)數(shù)據(jù)點(diǎn)?如果是*沒(méi)有條件約束的,對(duì)于全連接的布爾網(wǎng)絡(luò)模型,需要測(cè)量所有
的規(guī)模。要解決這個(gè)問(wèn)題,一個(gè)有效的方法是降低網(wǎng)絡(luò)的規(guī)模,即降低模型中節(jié)點(diǎn)之間的連結(jié)數(shù)目。很多研究表明,對(duì)于基因調(diào)控網(wǎng)絡(luò)、蛋白 - 蛋白作用網(wǎng)絡(luò)、代謝網(wǎng)絡(luò),沒(méi)有必要構(gòu)建全連接的網(wǎng)絡(luò)結(jié)構(gòu),這些網(wǎng)絡(luò)都屬于無(wú)尺度網(wǎng)絡(luò)( Scale-free network ),即具有 k 條邊的節(jié)點(diǎn)分布幾率 p(k) 滿足泊松分布,
<img alt="基于基因表達(dá)譜的基因調(diào)控網(wǎng)絡(luò)研究模型" 基于基因表達(dá)譜的基因調(diào)控網(wǎng)絡(luò)研究模型"="" align="middle" border="1" height="25" data-cke-saved-src="http://www.bio1000.com/uploads/allimg/120625/160612I57-10.png" src="http://www.bio1000.com/uploads/allimg/120625/160612I57-10.png" width="118" style="vertical-align: middle; border: 0px;">
。
基因調(diào)控網(wǎng)絡(luò)反映的是基因之間的相互關(guān)系,除了可以在基因表達(dá)數(shù)據(jù)中發(fā)現(xiàn)這種關(guān)系外,還可以在 DNA 序列、轉(zhuǎn)錄因子與順式調(diào)控元件相互作用、蛋白 - 蛋白相互作用、蛋白在細(xì)胞中的定位等層面上反映出來(lái)。是否可以將這些生物學(xué)背景知識(shí)應(yīng)用于基于表達(dá)譜的基因調(diào)控網(wǎng)絡(luò)分析中呢?答案是肯定的。充分利用現(xiàn)有的生物學(xué)知識(shí),與表達(dá)數(shù)據(jù)相結(jié)合將成為基因調(diào)控網(wǎng)絡(luò)研究的主流思路。隨著生物信息學(xué)和分子生物信息檢測(cè)技術(shù)的發(fā)展,我們對(duì)基因關(guān)系的認(rèn)識(shí)日益增多,利用這些知識(shí)可以構(gòu)建初步的基因調(diào)控網(wǎng)絡(luò),進(jìn)而用表達(dá)數(shù)據(jù)進(jìn)行仿真和模擬;根據(jù)模擬結(jié)果修改模型,再結(jié)合生物學(xué)實(shí)驗(yàn)驗(yàn)證,可以完善基因調(diào)控網(wǎng)絡(luò)。經(jīng)過(guò)若干次的建模—模擬—實(shí)驗(yàn)循環(huán)可以逼近真實(shí)的生物學(xué)基因調(diào)控網(wǎng)絡(luò)。
基因的表達(dá)是反式調(diào)控因子與順式調(diào)控元件相互作用后啟動(dòng)的,調(diào)控因子和調(diào)控元件的結(jié)合具有序列特異性,利用這種特異性,結(jié)合基因表達(dá)數(shù)據(jù),可以發(fā)現(xiàn)基因之間的相互調(diào)控關(guān)系,建立基因調(diào)控路徑,構(gòu)建基因調(diào)控網(wǎng)絡(luò)。
全基因組定位分析( genome-wide location analysis )是一種新的研究蛋白質(zhì)與 DNA 片段結(jié)合的分子生物學(xué)技術(shù),利用微陣列技術(shù),可以高通量研究轉(zhuǎn)錄因子與全基因組的基因間區(qū)序列結(jié)合的親和力,從實(shí)驗(yàn)結(jié)果可以發(fā)現(xiàn)轉(zhuǎn)錄因子的調(diào)控基因,這些實(shí)驗(yàn)數(shù)據(jù)可以用來(lái)明確基因之間的相互關(guān)系。
蛋白質(zhì)是基因調(diào)控的產(chǎn)物,蛋白質(zhì) - 蛋白質(zhì)之間的結(jié)合能反映基因的相互作用關(guān)系。酵母雙雜交等實(shí)驗(yàn)可以高通量地獲取蛋白之間相互作用的數(shù)據(jù)。蛋白質(zhì)的結(jié)合可能是構(gòu)成蛋白復(fù)合體,也可能是參與共同的生物學(xué)過(guò)程。雖然這些數(shù)據(jù)和知識(shí)不能反映它們的編碼基因之間的直接調(diào)控關(guān)系,但是可以反映基因之間的相互關(guān)系,例如,共調(diào)控關(guān)系、或功能具有相關(guān)性等。
基因表達(dá)的時(shí)空特異性是一個(gè)重要特性,空間特異性表現(xiàn)在蛋白質(zhì)定位在細(xì)胞中的不同位置。從蛋白質(zhì)定位信息出發(fā),可以得出編碼位于相同位置的蛋白質(zhì)編碼基因之間的關(guān)系,這種關(guān)系也可以用于指導(dǎo)基因網(wǎng)絡(luò)的構(gòu)建。
以上所有信息都有助于構(gòu)建基因調(diào)控路徑和網(wǎng)絡(luò),在具體的應(yīng)用中可以整合相關(guān)數(shù)據(jù),但是,仍需要發(fā)展新的方法?;蛘{(diào)控路徑和網(wǎng)絡(luò)的研究對(duì)于生物信息學(xué)來(lái)說(shuō)是一個(gè)重大挑戰(zhàn),它不僅需要有效的數(shù)據(jù)挖掘方法來(lái)整合和充分利用海量的異質(zhì)和異源數(shù)據(jù),還需要對(duì)基因調(diào)控的生物學(xué)知識(shí)有深層次的理解。