摘要:針對在蛋白質(zhì)相互作用網(wǎng)絡(luò)上的關(guān)鍵蛋白質(zhì)識別只關(guān)注拓撲特性,蛋白質(zhì)相互作用數(shù)據(jù)中存在較高比例的假陽性數(shù)據(jù)以及基于復合物信息的關(guān)鍵蛋白質(zhì)識別算法對節(jié)點的鄰域信息和復合物的挖掘?qū)﹃P(guān)鍵蛋白質(zhì)的識別影響效果考慮不夠全面等導致的識別準確率和特異性不高的問題,提出一種基于復合物參與度和密度的關(guān)鍵蛋白質(zhì)預測算法PEC。首先融合GO注釋信息和邊聚集系數(shù)構(gòu)造加權(quán)PPI網(wǎng)絡(luò),克服假陽性對實驗結(jié)果的影響;基于蛋白質(zhì)相互作用的邊權(quán)重,構(gòu)造相似度矩陣,設(shè)計特征值間的最大本征差值來自動確定劃分數(shù)目K,同時根據(jù)加權(quán)網(wǎng)絡(luò)中的蛋白質(zhì)節(jié)點度來選取K個初始聚類中心,進而利用譜聚類結(jié)合模糊C-means聚類算法實現(xiàn)復合物的挖掘,提高聚類的準確率,降低數(shù)據(jù)的維數(shù);其次基于蛋白質(zhì)節(jié)點的復合物參與度以及節(jié)點鄰域子圖密度,設(shè)計出關(guān)鍵節(jié)點的關(guān)鍵性得分。在DIP和Krogan 2個數(shù)據(jù)集上,將PEC與DC、BC、CC、SC、IC、PeC、WDC、LIDC、LBCC和UC 10種經(jīng)典算法相比,實驗結(jié)果表明,PEC算法能夠識別出更多的關(guān)鍵蛋白質(zhì),且聚類結(jié)果的準確率和特異性較高。
注:因版權(quán)方要求,不能公開全文,如需全文,請咨詢雜志社。
計算機工程與科學雜志, 月刊,本刊重視學術(shù)導向,堅持科學性、學術(shù)性、先進性、創(chuàng)新性,刊載內(nèi)容涉及的欄目:算法研究、圖形與圖象、計算機網(wǎng)絡(luò)、神經(jīng)網(wǎng)絡(luò)、仿真技術(shù)研究、人工智能、研究與實現(xiàn)、試題選載與博士論文摘要等。于1973年經(jīng)新聞總署批準的正規(guī)刊物。