生物網(wǎng)絡(luò)分析及比對概述
《生物網(wǎng)絡(luò)分析及比對概述》由會員分享,可在線閱讀,更多相關(guān)《生物網(wǎng)絡(luò)分析及比對概述(9頁珍藏版)》請在裝配圖網(wǎng)上搜索。
.生物網(wǎng)絡(luò)分析及比對概述 收稿日期:2016-03-10 通信作者:路東方(1991),男,碩士研究生,研究方向為生物信息學(xué)等. E-mail:ludongfangshu.edu.cn路東方(上海大學(xué) 計算機工程與科學(xué)學(xué)院,上海200072)摘要:生物網(wǎng)絡(luò)是復(fù)雜網(wǎng)絡(luò),也是以系統(tǒng)科學(xué)的思想研究生命科學(xué)的橋梁。網(wǎng)絡(luò)中的節(jié)點可以是蛋白質(zhì),基因,RNA或DNA等,網(wǎng)絡(luò)的邊對應(yīng)節(jié)點之間的物理、生化或功能上的相互作用。生物分子之間的相互作用并不是一成不變的,反映在基因調(diào)控網(wǎng)絡(luò)上,則節(jié)點之間的邊會因時間、空間或外部環(huán)境的變化而發(fā)生變化。網(wǎng)絡(luò)比較和分析是生物網(wǎng)絡(luò)的研究重點。網(wǎng)絡(luò)中生物分子及其相互作用的顯著變化,形成差異性網(wǎng)絡(luò),這種差異性變化對細(xì)胞信號傳導(dǎo)、細(xì)胞發(fā)育、環(huán)境壓力、藥物治療以及疾病狀態(tài)的轉(zhuǎn)變具有重大的參考價值。本文對生物網(wǎng)絡(luò)進行總結(jié),并介紹近年來采用的不同分析方法。關(guān)鍵詞:生物網(wǎng)絡(luò);基因調(diào)控;差異性網(wǎng)絡(luò);中圖分類號:文獻標(biāo)志碼:AA survey ofbiological network analysis and comparisonLu Dongfang(School of Computer Engineering and Science, Shanghai University, Shanghai 200072, China)Abstract: Biological network is not only a complex network, but also to bridge research idea of life of system science. The nodes in the network can be protein gene, RNA, or DNA, between the physical network edge corresponding to nodes, biochemical interaction or function. The interaction between the biological molecules is not immutable and frozen, reflected in the gene the regulation of the network, the node between the side because of the time, space or changes in the external environment changes. The comparison and analysis of the network is the focus of research on biological networks. Significant changes in biomolecular networks and their interactions in the formation of different network, change the difference of cell signal transduction, cell growth, environmental pressure change, drug therapy and disease status is of great reference value. This paper summarizes the biological network, and introduces the different analysis methods used in recent years. Key words: biological networks; gene regulation; differential network1 背景介紹生物網(wǎng)絡(luò)是復(fù)雜網(wǎng)絡(luò),也是以系統(tǒng)科學(xué)的思想研究生命科學(xué)的橋梁1, 2。網(wǎng)絡(luò)中的節(jié)點可以是蛋白質(zhì),基因,RNA或DNA等,網(wǎng)絡(luò)的邊對應(yīng)節(jié)點之間的物理、生化或功能上的相互作用。目前備受關(guān)注的包括基因調(diào)控網(wǎng)絡(luò)3-6(gene regulatory network)、蛋白質(zhì)相互作用網(wǎng)絡(luò)7-10(protein-protein network)、轉(zhuǎn)錄調(diào)控網(wǎng)絡(luò)11-13(transcription regulatory network)、代謝網(wǎng)絡(luò)14-15(metabolic network)等。生物分子之間的相互作用并不是一成不變的,反映在基因調(diào)控網(wǎng)絡(luò)上,則節(jié)點之間的邊會因時間、空間或外部環(huán)境的變化而發(fā)生變化,或者說,生物網(wǎng)絡(luò)中的邊具有不確定性,只是以一定的概率存在,在特定的情況下,生物網(wǎng)絡(luò)具有“重布線”(rewiring) 的能力。而且,網(wǎng)絡(luò)中不僅節(jié)點之間存在依賴關(guān)系,邊之間也存在依賴關(guān)系,即一種調(diào)控關(guān)系的出現(xiàn)或消失往往伴隨著其它調(diào)控關(guān)系的消失或出現(xiàn)。所以生物網(wǎng)絡(luò)是屬性依賴網(wǎng)絡(luò)(Dependency Network)。21世紀(jì)是系統(tǒng)科學(xué)的時代,如何通過生物實驗數(shù)據(jù)挖掘出生物網(wǎng)絡(luò)的潛在變化,一直是以系統(tǒng)的方法研究生命現(xiàn)象的熱點和難點16。據(jù)美國國家醫(yī)學(xué)圖書館PubMed數(shù)據(jù)庫的統(tǒng)計,研究生物網(wǎng)絡(luò)的文獻一直呈上升趨勢,特別是2000年以來,更是以每五年翻一番的速度在增長。其中,通過網(wǎng)絡(luò)研究干細(xì)胞的文獻也在近幾年急劇上升(圖1)。歷年與生物網(wǎng)絡(luò)有關(guān)的文獻數(shù)圖1 生物網(wǎng)絡(luò)相關(guān)研究近年受到越來越多的關(guān)注(PubMed,2016.2.15)網(wǎng)絡(luò)比較和分析是生物網(wǎng)絡(luò)的研究重點。2000年以來,國內(nèi)外眾多研究機構(gòu),包括中國科學(xué)院數(shù)學(xué)與系統(tǒng)科學(xué)研究院及上海生命科學(xué)研究院17、中國科技大學(xué)18、電子科技大學(xué)19、西安電子科技大學(xué)20,以及麻省理工學(xué)院小組21-23、斯坦福大學(xué)24、英國帝國理工學(xué)院25- 26等都在這一領(lǐng)域做出了杰出的貢獻。然而,我們更希望了解“生物系統(tǒng)(網(wǎng)絡(luò))的哪些部分最容易受到擾動的影響”的答案。科學(xué)界于是展開了差異性網(wǎng)絡(luò)分析的研究。網(wǎng)絡(luò)中生物分子及其相互作用的顯著變化,形成差異性網(wǎng)絡(luò)(Differential Network),這種差異性變化對細(xì)胞信號傳導(dǎo)、細(xì)胞發(fā)育、環(huán)境壓力、藥物治療以及疾病狀態(tài)的轉(zhuǎn)變具有重大的參考價值27。近年來,各種差異性網(wǎng)絡(luò)分析通過測量不同條件下的生物網(wǎng)絡(luò)并進行比較,確定不同網(wǎng)絡(luò)間相互作用模塊的增加、減少或更改28。類似于差異表達(dá)分析,差異性網(wǎng)絡(luò)分析主要針對不同實驗條件下兩個網(wǎng)絡(luò)的“減法”過程29。該減法過程過濾了普遍存在的相互作用(即“看家”相互作用),通過選擇性地提取相關(guān)研究條件或表型的相互作用,降低了代表性靜態(tài)網(wǎng)絡(luò)的復(fù)雜性30-32,但差異性網(wǎng)絡(luò)分析致力于網(wǎng)絡(luò)的動態(tài)“重布線”,這于靜態(tài)網(wǎng)絡(luò)是無法完成的。如前文所述,由于生物網(wǎng)絡(luò)的特殊生物學(xué)意義,網(wǎng)絡(luò)的邊在具有不確定性的同時,網(wǎng)絡(luò)拓?fù)溆志哂械湫偷膶傩砸蕾囮P(guān)系,簡單地進行“減法”很難完成差異性的度量。大多數(shù)的生物網(wǎng)絡(luò)差異性的分析方法依賴于不同的相關(guān)性來衡量網(wǎng)絡(luò)中頂點對之間的關(guān)聯(lián)強度,其研究的重點在于相關(guān)性的度量和差異性指標(biāo)的提取、差異性度量方法和先驗知識的融合。Zhang提出差異依賴網(wǎng)絡(luò)(DDN),應(yīng)用Lasso算法提取特征來表示網(wǎng)絡(luò)的局部結(jié)構(gòu),通過機器學(xué)習(xí)局部網(wǎng)絡(luò)結(jié)構(gòu)以檢測有統(tǒng)計學(xué)意義的拓?fù)渥兓霓D(zhuǎn)錄網(wǎng)絡(luò)33;Ryan Gill等人通過基因芯片數(shù)據(jù),構(gòu)建不同條件下的網(wǎng)絡(luò),并進行差異分析,該方法的核心是以計算的連通分?jǐn)?shù)代表基因相關(guān)性或基因之間的相互作用的強度,然后根據(jù)這個分?jǐn)?shù),確定兩個網(wǎng)絡(luò)的整體模塊化結(jié)構(gòu)是否不同,一組特定基因的連通性是否發(fā)生改變,以及某一個基因的連通性是否發(fā)生變化34;Trey Ideker等人則特別關(guān)注了“差異性相互作用”的打分,提出基于統(tǒng)計學(xué)信息建立定量的差異評分35;Przulj提出采用圖元(graphlet)36及圖元向量提取網(wǎng)絡(luò)節(jié)點間的拓?fù)潢P(guān)系,研究生物網(wǎng)絡(luò)與隨機網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)差異,國內(nèi)劉文斌等人則在此基礎(chǔ)上定義了二種節(jié)點變化的差距度量方法,并以此挖掘網(wǎng)絡(luò)中模塊內(nèi)和模塊間的變化基因簇37。2015年提出的DINGO38考慮到跨組數(shù)據(jù)之間的保守關(guān)系,通過將網(wǎng)絡(luò)分解為全局和種群特異性成分,聯(lián)合估計特異性種群的條件依賴關(guān)系,基于通路的基因組學(xué)進行差異性網(wǎng)絡(luò)分析和推理差異網(wǎng)絡(luò);在最新的研究中,Diffany39是一個本體驅(qū)動的框架,用以推斷、可視化和分析任意條件下網(wǎng)絡(luò)狀況的具體變化,它提出了一個綜合的標(biāo)準(zhǔn)化方法,該方法可以通過一個統(tǒng)一的角度來分析并促進兩個網(wǎng)絡(luò)的可比性。先驗知識正逐漸融入到生物網(wǎng)絡(luò)的差異性分析中。KDDN是一個知識融合的差異屬性依賴網(wǎng)絡(luò)方法,可以集成數(shù)據(jù)和先驗知識同時構(gòu)建通用的和差異性網(wǎng)絡(luò),它試圖通過機械論的原理為網(wǎng)絡(luò)“重布線”提供新的見解40;發(fā)表在2016年P(guān)SB上的文獻41將先驗知識用于網(wǎng)絡(luò)推導(dǎo),利用先驗知識為依賴關(guān)系帶來的額外信息,明顯提高了結(jié)果的可解釋性,且識別的目標(biāo)基因依賴于特定的條件。綜上所述,生物網(wǎng)絡(luò)是研究生物機體的重要途徑,其核心問題是屬性依賴網(wǎng)絡(luò)的距離度量、特異性屬性依賴子網(wǎng)的提取?;趩渭?xì)胞數(shù)據(jù),在構(gòu)建生物網(wǎng)絡(luò)的基礎(chǔ)上研究特異性屬性依賴,其網(wǎng)絡(luò)距離度量方法、特異性屬性依賴關(guān)系的評價指標(biāo)是關(guān)鍵。2 生物網(wǎng)絡(luò)構(gòu)建2.1 生物網(wǎng)絡(luò)重建概念生物的基因組序列類似于含有一系列組件的電路,不同的是許多組件之間關(guān)系、組件自身的功能仍然有許多是不明確的。系統(tǒng)生物學(xué)的一個方面就是致力于解決這些不明確(謎團)。半個世紀(jì)中基因?qū)W、分子生物學(xué)和生物化學(xué)方面的研究進展,使得在已經(jīng)被熟悉研究(well-studied)的細(xì)胞功能(如新陳代謝)領(lǐng)域,能夠進行基因組水平的生物網(wǎng)絡(luò)重構(gòu)(這里的重建reconstruction應(yīng)該意指構(gòu)建一個網(wǎng)絡(luò)去還原原本的實際生物過程)。一個有著效用良好的(quality-controlled)的重建網(wǎng)絡(luò)能將生物體在基因組水平進行數(shù)學(xué)建模。因此產(chǎn)生了一系列基于自底向上這一原則的方法來進行系統(tǒng)生物學(xué)研究。Bottom-up系統(tǒng)生物有助于在基因組水平解釋和理解“基因型-表現(xiàn)型關(guān)系”。一個生物體的所有基因型包含著決定生物體形式和功能的信息,因此,理解和使用“基因型-表現(xiàn)型”關(guān)系是系統(tǒng)生物學(xué)的基石。圖2 生物分子到生物體與電子元器件到收音機的類比重建網(wǎng)絡(luò)的過程其實就是根據(jù)bottom-up方法推斷網(wǎng)絡(luò)結(jié)構(gòu)的過程。生物學(xué)家和化學(xué)家在分子層面確定它們之間反應(yīng),同時將輸入輸出特殊化(characterize)。輸出往往是屬于所有的生物體而不是某一特定生物,應(yīng)該手動確定一個某一個反應(yīng)是否屬于某一特定網(wǎng)絡(luò)成為一個最耗時的過程。使用計算工具和算法來進行網(wǎng)絡(luò)的重建成為一個重要的課題。重建出來網(wǎng)絡(luò)往往不具有完全網(wǎng)絡(luò)的所有特性,因此標(biāo)準(zhǔn)系統(tǒng)確認(rèn)技術(shù)被用于擴展模型適應(yīng)性和推斷網(wǎng)絡(luò)遺失內(nèi)容。2.2 蛋白質(zhì)相互作用網(wǎng)絡(luò)研究蛋白質(zhì)相互作用網(wǎng)絡(luò)進化,在蛋白質(zhì)層次上,主要是研究蛋白質(zhì)相互作用網(wǎng)絡(luò)對蛋白質(zhì)個體進化性質(zhì)的影響。其中,頗具爭議并且被研究最多的問題便是探討蛋白質(zhì)相互作用是否會減慢蛋白質(zhì)進化速率。早在 2002 年,通過評估酵母同線蟲中的直系同源蛋白的進化距離,F(xiàn)raser 等42發(fā)現(xiàn),在酵母蛋白質(zhì)相互作用網(wǎng)絡(luò)中,蛋白連接度(與該蛋白質(zhì)發(fā)生相互作用的蛋白質(zhì)數(shù)目)與其進化速率呈顯著負(fù)相關(guān) 他們進一步指出,那些具有更多相互作用對象的蛋白質(zhì)之所以進化更慢是因為它們承受了更強烈的選擇壓力但這些蛋白質(zhì)之所以承受更強烈的選擇壓力不是因為它們對生物體更重要,而是因為它們的氨基酸序列中有更多的位點參與了更多的相互作用在隨后幾年,蛋白連接度同其進化速率的關(guān)系受到了學(xué)術(shù)界的廣泛關(guān)注。2003 年,使用另一種進化距離計算方法,利用在進化上更近的參考物種和可信度更高的相互作用數(shù)據(jù)集43。2005 年,通過對高質(zhì)量的酵母和線蟲相互作用數(shù)據(jù)集分別作分析,Agrafioti 等44再次肯定了Bloom 等關(guān)于蛋白質(zhì)表達(dá)水平在蛋白連接度同其進化速率負(fù)相關(guān)中起重要作用的觀點。他們又進一步將蛋白質(zhì)功能、參與的生物學(xué)過程和細(xì)胞組分等因素引入了分析。2007 年,Kim 等45將研究視野擴展到整個網(wǎng)絡(luò),研究蛋白質(zhì)在整個網(wǎng)絡(luò)中的位置與其自身所受選擇壓力的關(guān)系。通過衡量種內(nèi)單核苷酸多態(tài)性、種間序列分歧以及檢測基因組結(jié)構(gòu)變量來衡量蛋白質(zhì)所受的選擇壓力,發(fā)現(xiàn)處于正向選擇的蛋白質(zhì)趨向于定位在相互作用網(wǎng)絡(luò)的外圍。由此推測,這種現(xiàn)象的出現(xiàn)是由于網(wǎng)絡(luò)外圍蛋白暴露面較多或者有更多的對外界環(huán)境變化的適應(yīng)性事件發(fā)生??梢灶A(yù)見,作者觀察到的這種現(xiàn)象對網(wǎng)絡(luò)數(shù)據(jù)的完整性和質(zhì)量應(yīng)該很敏感??v觀近些年來蛋白質(zhì)相互作用網(wǎng)絡(luò)聚類研究的發(fā)展, 人們借助復(fù)雜網(wǎng)絡(luò)、圖論以及信息論等理論和方法取得了豐碩的成果。但隨著研究的深入和認(rèn)識的加深, 在蛋白質(zhì)相互作用網(wǎng)絡(luò)的聚類研究中還有許多亟待解決的問題, 蘊藏著極大的研究潛力。雖然目前借助聚類分析對蛋白質(zhì)相互作用網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)已經(jīng)有了一定程度的了解, 但對于這種結(jié)構(gòu)的形成機理以及進化和自然選擇在蛋白質(zhì)相互作用網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)形成方面所起的作用還不十分清楚。因此將聚類分析與生物的進化過程相結(jié)合研究蛋白質(zhì)相互作用網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)形成將是今后的研究趨勢之一。其次, 隨著系統(tǒng)生物學(xué)研究的不斷深入和生物學(xué)網(wǎng)絡(luò)整合程度的不斷加深, 蛋白質(zhì)相互作用網(wǎng)絡(luò)的聚類研究也將更多地考慮基因調(diào)控、信號轉(zhuǎn)導(dǎo)、代謝等其他網(wǎng)絡(luò)的信息和網(wǎng)絡(luò)間的聯(lián)系。因此整合各種生物網(wǎng)絡(luò)的信息, 并根據(jù)生物體的特點, 考慮網(wǎng)絡(luò)中存在的正負(fù)反饋環(huán)的影響, 從系統(tǒng)生物學(xué)角度進行蛋白質(zhì)相互作用網(wǎng)絡(luò)的聚類研究將成為今后研究的一個重要方向。2.3 基因調(diào)控網(wǎng)絡(luò)基因調(diào)控網(wǎng)絡(luò)(Gene Regulatory Networks,GRN)是一種表示基因間復(fù)雜調(diào)控關(guān)系的生物網(wǎng)絡(luò),也是理解基因功能的最重要手段之一。通過構(gòu)建基因調(diào)控網(wǎng)絡(luò)可以全面分析和了解基因之間的相互作用關(guān)系,認(rèn)識并掌握細(xì)胞生命活動的運作機制,已成為生物信息學(xué)和系統(tǒng)生物學(xué)的一個研究熱點。近年來,基因調(diào)控網(wǎng)絡(luò)越來越多地應(yīng)用到疾病基因預(yù)測、藥物靶標(biāo)的篩選等領(lǐng)域,并對疾病早期診斷、個性化治療、藥物研制產(chǎn)生了深遠(yuǎn)的影響。因此,基因調(diào)控網(wǎng)絡(luò)構(gòu)建及其應(yīng)用在理論與實踐兩方面均具有重要的價值和意義?;蛘{(diào)控網(wǎng)絡(luò)中節(jié)點間的調(diào)控作用是有向的,有促進和抑制兩種,因此,基因調(diào)控網(wǎng)絡(luò)可以用有向圖來表示。所有生物的生長發(fā)育和分化過程,以及對外部環(huán)境的反應(yīng),都與各種相關(guān)基因有條不紊的表達(dá)有著至關(guān)重要的關(guān)系。從理論上講,基因表達(dá)調(diào)控可以發(fā)生在遺傳信息傳遞過程的各個水平上。基因調(diào)控研究的重點主要有 DNA 水平上的調(diào)控、轉(zhuǎn)錄水平上的表達(dá)調(diào)控以及翻譯水平上的表達(dá)調(diào)控。其中轉(zhuǎn)錄調(diào)控是基因表達(dá)調(diào)控中最重要、最復(fù)雜的一個環(huán)節(jié),也是當(dāng)前研究的重點。最早的基因調(diào)控網(wǎng)絡(luò)模型可以追溯到 20 世紀(jì) 60 年代 Jacob 和 Monod 關(guān)于乳糖操縱子的調(diào)控研究46。隨著近幾十年的發(fā)展, 發(fā)展的基因調(diào)控網(wǎng)絡(luò)數(shù)學(xué)模型主要有有向圖、布爾網(wǎng)絡(luò)、貝葉斯網(wǎng)絡(luò)模型、微分方程模型、隨機模型、混合模型等。相對來講,有向圖和布爾網(wǎng)絡(luò)是較為簡單的模型,對系統(tǒng)的模擬是定性的、較為粗糙的;貝葉斯網(wǎng)絡(luò)是一種概率模型,可以定量地、隨機地描述調(diào)控網(wǎng)絡(luò);微分方程則可以定量、精確地預(yù)測系統(tǒng)的行為,但隨著網(wǎng)絡(luò)規(guī)模增大, 面臨參數(shù)估計及計算難度大的問題;隨機模型能夠?qū)W(wǎng)絡(luò)中物種分子數(shù)目進行精細(xì)的擬合,但是同樣由于計算量較大,往往難于應(yīng)用到實際大型網(wǎng)絡(luò)中去。所有的這些模型,都是在一定假設(shè)的基礎(chǔ)上,對原有的生物過程進行了簡化。3 差異網(wǎng)絡(luò)分析差異分析對于揭示生命體的生長、發(fā)育和衰老過程及疾病發(fā)生具有重大的意義,基于網(wǎng)絡(luò)的差異分析方法已經(jīng)成為系統(tǒng)生物學(xué)的一個研究熱點。網(wǎng)絡(luò)節(jié)點往往通過與局部結(jié)構(gòu)作用實現(xiàn)某種功能,其與局部結(jié)構(gòu)的關(guān)系變化,很可能影響其功能。在生物網(wǎng)絡(luò)中,節(jié)點往往通過與局部結(jié)構(gòu)作用實現(xiàn)功能,其與局部結(jié)構(gòu)的關(guān)系發(fā)生變化,可能會影響其功能。因此,如何理解和刻畫網(wǎng)絡(luò)節(jié)點的局部結(jié)構(gòu)特征及變化,對于認(rèn)識生物系統(tǒng)的結(jié)構(gòu)和功能的關(guān)系具有非常重要的意義。將不同條件下獲得的數(shù)據(jù)構(gòu)建靜態(tài)網(wǎng)絡(luò),可以用于解釋各種基因調(diào)控機制。然而,基因調(diào)控網(wǎng)絡(luò)是動態(tài)的,在不同的特定條件下,網(wǎng)絡(luò)表現(xiàn)出不同的調(diào)控模式,當(dāng)然也就有不同的轉(zhuǎn)錄網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)。因此,研究轉(zhuǎn)錄網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)變化可以促進對細(xì)胞發(fā)育的理解,并對某些疾病的病理生理過程提供新的見解,這有助于確定的關(guān)鍵基因,也可以作為生物標(biāo)志物或藥物靶標(biāo)。2009年,B. Zhang 等人介紹一個差異依賴網(wǎng)絡(luò),提出DDN算法,以檢測有統(tǒng)計學(xué)意義的拓?fù)渥兓霓D(zhuǎn)錄網(wǎng)絡(luò)。這個依賴于局部的模型通過一組條件概率,應(yīng)用Lasso算法(Lasso 的基本思想是在回歸系數(shù)的絕對值之和小于一個常數(shù)的約束條件下,使殘差平方和最小化,從而能夠產(chǎn)生某些嚴(yán)格等于0 的回歸系數(shù),得到可以解釋的模型),來表示網(wǎng)絡(luò)的局部結(jié)構(gòu)。隨后進行的置換檢驗,估計每個學(xué)習(xí)的局部結(jié)構(gòu)的統(tǒng)計學(xué)意義。在模擬數(shù)據(jù)集測試中,該算法準(zhǔn)確地檢測到所有的基因與網(wǎng)絡(luò)拓?fù)渥兓1疚膶⒃摲椒☉?yīng)用于雌激素依賴的T-47D雌激素受體陽性(ER+)的乳腺癌細(xì)胞系的數(shù)據(jù)集和人類及小鼠胚胎干細(xì)胞的數(shù)據(jù)集。在這兩個實驗中使用基因芯片數(shù)據(jù),產(chǎn)生了有意義的生物結(jié)果。作者認(rèn)為,DDN適合于基因調(diào)控網(wǎng)絡(luò),也適用于具有類似特征的其他生物網(wǎng)絡(luò)。DN通過網(wǎng)絡(luò)活性和拓?fù)浣Y(jié)構(gòu)對有向圖的分析提供了系統(tǒng)級的視角,該方法提取網(wǎng)絡(luò)節(jié)點間的拓?fù)潢P(guān)系,以推斷網(wǎng)絡(luò)活性。網(wǎng)絡(luò)活性的分析依賴于偏相關(guān)理論(偏相關(guān)是指當(dāng)兩個變量同時與第三個變量相關(guān)時,將第三個變量的影響剔除,只分析另外兩個變量之間相關(guān)程度)。該局部依賴模型通過Lasso選取自變量個數(shù),來學(xué)習(xí)局部網(wǎng)絡(luò)結(jié)構(gòu)。然后對兩個不同條件下的局部依賴模塊執(zhí)行置換檢驗,并賦予相應(yīng)的P-value。同時,指出網(wǎng)絡(luò)中表現(xiàn)出網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)變化的“熱點”基因。最后,提取和可視化該DDN。2010年,Gill等人提出了使用與基因或模塊相關(guān)聯(lián)的分?jǐn)?shù),來評估網(wǎng)絡(luò)的整體差異性47。2011年,Roy等人在基因上述DDN的基礎(chǔ)上,延伸出了多重條件下的動態(tài)網(wǎng)絡(luò)學(xué)習(xí)的方法48。2015年,B. Zhang等人在基于DDN的基礎(chǔ)上,融合了先驗知識,提出基于知識融合的kDDN算法49。生物網(wǎng)絡(luò)建模作為系統(tǒng)生物學(xué)的一個主要研究目標(biāo)及有效的工具,有助于了解細(xì)胞中基因產(chǎn)物的協(xié)調(diào)性。事實上,生物網(wǎng)絡(luò)是動態(tài)且上下文相關(guān)的。為了系統(tǒng)的描述某些活躍的調(diào)節(jié)組分和機制,建模工具必須能夠從隨機的波動背景中有效識別有意義的“重布線”(rewiring)。然而,差異性網(wǎng)絡(luò)的構(gòu)建不能依賴于現(xiàn)有的知識,結(jié)合先驗知識的數(shù)據(jù)驅(qū)動方式則更能有效提高網(wǎng)絡(luò)推理的魯棒性和生物相關(guān)性。盡管如此,仍有很多未解決的障礙,主要包括:解空間大但樣本小,網(wǎng)絡(luò)的高復(fù)雜性,不完善的先驗知識,缺乏有意義的評判標(biāo)準(zhǔn)以及啟發(fā)式結(jié)構(gòu)參數(shù)的學(xué)習(xí)等。本文中制定的差異性依賴網(wǎng)絡(luò),將條件數(shù)據(jù)和先驗知識作為一個凸優(yōu)化問題,提出了一個可以通過不同條件下數(shù)據(jù)推斷保守的(conserved)生物網(wǎng)絡(luò)和有意義“重布線”(rewiring)的學(xué)習(xí)算法(“重布線”事件的驗證是基于已發(fā)表的文獻結(jié)果)。同時,使用一種新的抽樣方案根據(jù)隨機理論來估計預(yù)期的錯誤率。該方案充分利用了挖掘了集成數(shù)據(jù)知識的好處。文章通過仿真數(shù)據(jù)證明和驗證了該方法性能,然后,對酵母細(xì)胞系和乳腺癌基因芯片數(shù)據(jù)進行分析,得到了不錯的生物結(jié)果。4 展望與總結(jié)問題生物網(wǎng)絡(luò)已經(jīng)成為生物學(xué)基本研究對象之一。過去的一個世紀(jì)里,在簡化原則的指導(dǎo)下,生物研究多專注于單個細(xì)胞分子結(jié)構(gòu)和功能的探索,積累了大量知識,與此同時,人們也越來越清晰的意識到,蛋白很少單獨發(fā)揮作用,細(xì)胞狀態(tài)的改變往往涉及多個基因的表達(dá)變化,例如復(fù)雜疾病一般是多基因致病50-56。得益于高通量實驗技術(shù)和組學(xué)的發(fā)展,研究人員可在全基因組水平同時觀測成千上萬基因或蛋白的表達(dá)變化情況,生物學(xué)研究對象也由單基因轉(zhuǎn)變成為特定功能基因集合。然而基因集合本身并不能揭示其背后機制,為了回答基因是如何組織的,因果關(guān)系怎樣的問題,人們傾向于用分子相互作用網(wǎng)絡(luò)描述特定細(xì)胞狀態(tài),如疾病網(wǎng)絡(luò)表征疾病生理狀態(tài),藥物作用網(wǎng)絡(luò)和藥物代謝網(wǎng)絡(luò)刻畫藥物作用后細(xì)胞反應(yīng),近年來,生物網(wǎng)絡(luò)成為生物學(xué)研究新的“寵兒”。正如基因不是單獨發(fā)揮作用一樣,生物網(wǎng)絡(luò)之間存在著相互依存關(guān)系,一個重要體現(xiàn)是信號傳導(dǎo)通路之間的串?dāng)_,這就導(dǎo)致細(xì)胞對外界刺激做出非線性應(yīng)激反應(yīng),并進一步影響細(xì)胞免疫、代謝、疾病發(fā)生、發(fā)展和疾病并發(fā)等多個生物過程,同時是藥物設(shè)計,尤其是小分子激酶抑制劑類藥物效果預(yù)測必須考慮的重要因素。一個重要的科學(xué)問題是信號通路之間的串?dāng)_“密度”有多大,目前生物研究普遍采用的“分而治之”的研究策略是否可行。系統(tǒng)生物學(xué)經(jīng)歷了從單個分子到通路再到單個細(xì)胞水平以及細(xì)胞群落的過程。在這種尺度能夠?qū)蛐?表現(xiàn)型之間的關(guān)系進行前所未有的闡述57-61。為建立全面的基因組水平重建網(wǎng)絡(luò)模型,必須使用盡量多的獨立數(shù)據(jù),數(shù)種工作流已經(jīng)被設(shè)計來完成數(shù)據(jù)到計算模型的對接。使用新的數(shù)據(jù)流基于對這些工作流修正構(gòu)建的重建網(wǎng)絡(luò)飛速地增長,越來越多的生物性質(zhì)被加入到網(wǎng)絡(luò)分析中,如蛋白質(zhì)結(jié)構(gòu)。如今系統(tǒng)生物學(xué)面臨的挑戰(zhàn)就是如何使用現(xiàn)有的大數(shù)據(jù)來進一步提高我們對生物學(xué)的理解。致謝 感謝王嬌老師辛勤的授課以及對我研究的大力支持,在此表示感謝!參考文獻:1 鐵流, 李亦學(xué): 系統(tǒng)生物學(xué)的現(xiàn)狀與展望, 中國科學(xué)基金, 2005, 19, (5), pp. 282-2862 勝利: 系統(tǒng)生物學(xué)研究進展, 中國科學(xué)院院刊, 2004, 19, (1), pp. 31-343Davidson E, Levin M; Levin (April 2005). Gene regulatory networks. Proc. Natl. Acad. Sci. U.S.A. 102 (14): 4935. doi:10.1073/pnas.0502024102. PMC 556010. PMID 158094454Florian Leitner, Martin Krallinger, Sushil Tripathi, Martin Kuiper, Astrid Lgreid and Alfonso Valencia, Mining cis-Regulatory Transcription Networks from Literature, Proceedings of BioLINK Special Interest Group, 5-12, ISBM/ECCB, 20135Vibhor Kumar, Masafumi Muratani, Nirmala Arul Rayan, Petra Kraus, Thomas Lufkin, Huck Hui Ng and Shyam Prabhakar, Uniform, optimal signal processing of mapped deep-sequencing data, Nature biotechnology, 20136Chu D, Zabet NR, Mitavskiy B; Zabet; Mitavskiy (April 2009). Models of transcription factor binding: sensitivity of activation functions to model assumptions. J. Theor. Biol. 257 (3): 41929. doi:10.1016/j.jtbi.2008.11.026. PMID 19121637.7De Las Rivas, J; Fotanillo, C. (2010). Protein-protein interactions essentials: key concepts to building and analyzing interactome networks. PLoS Comput Biol 6 (6): e1000807. doi:10.1371/journal.pcbi.1000807. PMC 2891586. PMID 205890788Herce, Henry D.; Deng, Wen; Helma, Jonas; Leonhardt, Heinrich; Cardosoa, M. Cristina (2013). Visualization and targeted disruption of protein interactions in living cells. Nature Communications 4: 2660. doi:10.1038/ncomms3660. PMC 3826628. PMID 241544929Cooper, G.M. (2000). The cell : a molecular approach (2nd ed.). Washington DC: ASM Press. ISBN 0-87893-106-6.10 MacPherson, R.E.; Ramos, S.V.; Vandenboom, R.; Roy, B.D.; Peters, S.J. (2013). Skeletal muscle PLIN proteins, ATGL and CGI-58, interactions at rest and following stimulated contraction. American Journal of Physiology. Regulatory, Integrative and Comparative Physiology 304 (8): R64450.11 周超平, 李鑫輝. 單細(xì)胞轉(zhuǎn)錄組研究進展J. Progress in Biochemistry and Biophysics, 2013, 40(12): 1193-1200.12 吳松鋒, 朱云平, 賀福初. 轉(zhuǎn)錄組與蛋白質(zhì)組比較研究進展J. 生物化學(xué)與生物物理進展, 2005, 32(2): 99-105.13 張艷君, 朱志峰, 陸融, 等. 基因表達(dá)轉(zhuǎn)錄分析中內(nèi)參基因的選擇 JJ. 生物化學(xué)與生物物理進展, 2007, 34(5): 546-550.14 趙靜, 俞鴻, 駱建華, 等. 應(yīng)用復(fù)雜網(wǎng)絡(luò)理論研究代謝網(wǎng)絡(luò)的進展J. 科學(xué)通報, 2006, 51(11): 1241-1248.15 王暉, 馬紅武, 趙學(xué)明. 基因組尺度代謝網(wǎng)絡(luò)研究進展J. 生物工程學(xué)報, 2010, 26(10): 1340-1348.16 郭杏, 高琳, and 陳新: 生物網(wǎng)絡(luò)比對的模型與算法, 軟件學(xué)報, 2010, 21, (9), pp. 2089-210617 Li, Z., Zhang, S., Wang, Y., Zhang, X.S., and Chen, L.: Alignment of molecular networks by integer quadratic programming, Bioinformatics, 2007, 23, (13), pp. 1631-163918 Liang, Z., Xu, M., Teng, M., and Niu, L.: Comparison of protein interaction networks reveals species conservation and divergence, BMC Bioinformatics, 2006, 7, (1), pp. 45719 Guo, Z., Li, Y., Gong, X., Yao, C., Ma, W., Wang, D., Li, Y., Zhu, J., Zhang, M., and Yang, D.: Edge-based scoring and searching method for identifying condition-responsive proteinprotein interaction sub-network, Bioinformatics, 2007, 23, (16), pp. 2121-212820 趙建邦, 董安國, and 高琳: 一種用于生物網(wǎng)絡(luò)數(shù)據(jù)的頻繁模式挖掘算法, 電子學(xué)報, 2010, 38, (8), pp. 1803-180721 Chindelevitch, L., Liao, C.S., and Berger, B.: Local optimization for global alignment of protein interaction networks, Pac Symp Biocomput, 2010, 15, pp. 123-13222 Liao, C.S., Lu, K., Baym, M., Singh, R., and Berger, B.: IsoRankN: spectral methods for global alignment of multiple protein networks, Bioinformatics, 2009, 25, (12), pp. i253-i25823 Singh, R., Xu, J., and Berger, B.: Global alignment of multiple protein interaction networks with application to functional orthology detection, Proceedings of the National Academy of Sciences, 2008, 105, (35), pp. 12763-1276824 Flannick, J., Novak, A., Do, C., Srinivasan, B., and Batzoglou, S.: Automatic parameter learning for multiple local network alignment, Journal of Computational Biology, 2009, 16, (8), pp. 1001-102225 Hayes, W., Sun, K., and Prulj, N.: Graphlet-based measures are suitable for biological network comparison, Bioinformatics, 2013, 29, (4), pp. 483-49126 Kuchaiev, O., and Prulj, N.: Integrative network alignment reveals large regions of global network similarity in yeast and human, Bioinformatics, 2011, 27, (10), pp. 1390-139627 Xie, J., Zhou, Z., Ma, J., Xiang, C., Nie, Q., and Zhang, W.: Graphics Processing Unit-Based Alignment of Protein Interaction Networks, IET Systems Biology, 2015, 9, (4), pp. 120-12728 Zhang, S., Xie, J., Xia, Y., Yu, S., Gu, Z., Feng, R., Luo, G., Wang, D., Wang, K., Jiang, M., Cheng, X., Huang, H., Zhang, W., and Wen, T.: LK6/Mnk2a is a new kinase of alpha synuclein phosphorylation mediating neurodegeneration, Scientific Reports, 2015, 1256429 Mitra, K., Carvunis, A.R., Ramesh, S.K., and Ideker, T.: Integrative approaches for finding modular structure in biological networks, Nature Reviews Genetics, 2013, 14, (10), pp. 719-73230Lichtenberg, U.D., Jensen, L.J., Brunak, S., and Bork, P.: Dynamic complex formation during the yeast cell cycle, Science, 2005, 307, (5710), pp. 724-72731Ideker, T., and Krogan, N.J.: Differential network biology, Molecular Systems Biology, 2012, 8:56532Bandyopadhyay, S., Mehta, M., Kuo, D., Sung, M.-K., Chuang, R., and Jaehnig, E.: Rewiring of genetic networks in response to DNA damage, Science, 2010, 330, (6009), pp. 1385-138933Zhang, B., Li, H., Riggins, R.B., Zhan, M., Xuan, J., Zhang, Z., Hoffman, E.P., Clarke, R., and Wang, Y.: Differential dependency network analysis to identify condition-specific topological changes in biological networks, Bioinformatics, 2009, 25, (4), pp. 526-53234Gill, R., Datta, S., and Datta, S.: A statistical framework for differential network analysis from microarray data, BMC Bioinformatics, 2010, 11:9535Bean, G.J., and Ideker, T.: Differential analysis of high-throughput quantitative genetic interaction data, Genome Biology, 2012, 13:R12336Prulj, N.: Biological network comparison using graphlet degree distribution, Bioinformatics, 2007, 23, (2), pp. e177-e18337肖碧玉, 李先斌, and 劉文斌: 基于圖元向量的差異共表達(dá)分析研究, 電子學(xué)報, 2015, 43, (10), pp. 2009-201338Ha, M.J., Baladandayuthapani, V., and Do, K.-A.: DINGO: differential network analysis in genomics, Bioinformatics, 2015, 31, (21), pp. 3413-342039Landeghem, S.V., Parys, T.V., Dubois, M., Inz, D., and Peer, Y.V.d.: Diffany: an ontology-driven framework to infer, visualise and analyse differential molecular networks, BMC Bioinformatics, 2016, 17:1840Tian, Y., Zhang, B., Hoffman, E.P., Clarke, R., Zhang, Z., and Shih, l.-M.: KDDN: an open-source Cytoscape app for constructing differential dependency networks with significant rewiring, Bioinformatics, 2015, 31, (2), pp. 287-28941Speyer, G., Kiefer, J., Dhruv, H., Berens, M., and Kim, S.: Knowledge-assisted approach to identify pathways with differential dependencies, Pac Symp Biocomput, 2016, 21, pp. 33-4442 Fraser H B, Hirsh A E, Steinmetz L M, et al. Evolutionary rate in theprotein interaction network. Science, 2002, 296(5568): 75075243 Jordan I K, Wolf Y I, Koonin E V. No simple dependence betweenprotein evolution rate and the number of protein-proteininteractions: only the most prolific interactors tend to evolveslowly. BMC Evol Biol, 2003, 3(1): 144 Agrafioti I, Swire J, Abbott J, et al. Comparative analysis of theSaccharomyces cerevisiae and Caenorhabditis elegans proteinnteraction networks. BMC Evol Biol, 2005, 5(1): 2345 Kim P M, Korbel J O, Gerstein M B. Positive selection at the proteinnetwork periphery: Evaluation in terms of structural constraints andcellular context. Proc Natl Acad Sci USA, 2007, 104(51): 202742027946 Jacob F, Monod J. Genetic regulatory mechanisms in the synthesis of proteins. Journal of Molecular Biology, 1961, 3(3): 31835647 Gill R, Datta S, Datta S. A statistical framework for differential network analysis from microarray dataJ. BMC bioinformatics, 2010, 11(1): 1.48 Roy S, Werner-Washburne M, Lane T. A multiple network learning approach to capture system-wide condition-specific responsesJ. Bioinformatics, 2011, 27(13): 1832-1838.49 Tian Y, Zhang B, Hoffman E P, et al. Knowledge-fused differential dependency network models for detecting significant rewiring in biological networksJ. BMC systems biology, 2014, 8(1): 1.50 陳竺. 系統(tǒng)生物學(xué)21 世紀(jì)醫(yī)學(xué)和生物學(xué)發(fā)展的核心驅(qū)動力J. 世界科學(xué), 2005 (3): 2-6.51 蔣太交, 薛艷紅, 徐濤. 系統(tǒng)生物學(xué)生命科學(xué)的新領(lǐng)域J. 生物化學(xué)與生物物理進展, 2005, 31(11): 957-964.52 嚴(yán)詩楷, 趙靜, 竇圣姍, 等. 基于系統(tǒng)生物學(xué)與網(wǎng)絡(luò)生物學(xué)的現(xiàn)代中藥復(fù)方研究體系J. 中國天然藥物, 2009, 7(4): 249-259.53 周明眉, 劉平, 賈偉, 等. 基于代謝網(wǎng)絡(luò)變化的中藥整體效應(yīng)評價方法研究J. 世界科學(xué)技術(shù): 中醫(yī)藥現(xiàn)代化, 2007, 8(6): 113-119.54 譚璐, 姜璐. 系統(tǒng)生物學(xué)與生物網(wǎng)絡(luò)研究J. 復(fù)雜系統(tǒng)與復(fù)雜性科學(xué), 2005, 2(4): 1-9.55 趙靜, 俞鴻, 駱建華, 等. 應(yīng)用復(fù)雜網(wǎng)絡(luò)理論研究代謝網(wǎng)絡(luò)的進展J. 科學(xué)通報, 2006, 51(11): 1241-1248.56 石鐵流, 李亦學(xué). 系統(tǒng)生物學(xué)的現(xiàn)狀與展望J. 中國科學(xué)基金, 2005, 19(5): 282-286.57 Mangel, M., and Bonsall, M.B.: Phenotypic evolutionary models in stem cell biology: Replacement, quiescence, and variability, PLoS ONE, 2008, 3, (2), pp. e159158 Dingli, D., Traulsen, A., and Pacheco, J.M.: Stochastic dynamics of hematopoietic tumor stem cells, Cell Cycle, 2007, 6, (4), pp. 461-46659 Rodriguez-Brenes, I.A., Komarova, N.L., and Wodarz, D.: Evolutionary dynamics of feedback escape and the development of stem-cell-driven cancers, Proc Natl Acad Sci U S A, 2011, 108, (47), pp. 18983-1898860 Gupta, P.B., Fillmore, C.M., Jiang, G., Shapira, S.D., Tao, K., Kuperwasser, C., and Lander, E.S.: Stochastic state transitions give rise to phenotypic equilibrium in populations of cancer cells, Cell, 2011, 146, pp. 633-64461 Sehl, M.E., and Jszhou, S.: Differential destruction of stem cells: implications for targeted cancer stem cell therapy, Cancer Research, 2009, 69, (24), pp. 9481-9489.- 1.請仔細(xì)閱讀文檔,確保文檔完整性,對于不預(yù)覽、不比對內(nèi)容而直接下載帶來的問題本站不予受理。
- 2.下載的文檔,不會出現(xiàn)我們的網(wǎng)址水印。
- 3、該文檔所得收入(下載+內(nèi)容+預(yù)覽)歸上傳者、原創(chuàng)作者;如果您是本文檔原作者,請點此認(rèn)領(lǐng)!既往收益都?xì)w您。
下載文檔到電腦,查找使用更方便
10 積分
下載 |
- 配套講稿:
如PPT文件的首頁顯示word圖標(biāo),表示該PPT已包含配套word講稿。雙擊word圖標(biāo)可打開word文檔。
- 特殊限制:
部分文檔作品中含有的國旗、國徽等圖片,僅作為作品整體效果示例展示,禁止商用。設(shè)計者僅對作品中獨創(chuàng)性部分享有著作權(quán)。
- 關(guān) 鍵 詞:
- 生物 網(wǎng)絡(luò)分析 概述
鏈接地址:http://ioszen.com/p-12934516.html