av在线播放日韩亚洲欧,av网站免费线看,bt√天堂资源在线官网,а天堂www在线忘忧草,国产成人精品97

首頁 > 期刊 > 計算機科學(xué) > 基于密度約束的對比模式挖掘 【正文】

基于密度約束的對比模式挖掘

作者:柴欣; 高一寒; 武優(yōu)西; 劉靖宇 河北工業(yè)大學(xué)人工智能與數(shù)據(jù)科學(xué)學(xué)院; 天津300401; 河北省大數(shù)據(jù)重點實驗室; 天津300401

摘要:序列模式挖掘是從序列數(shù)據(jù)中發(fā)現(xiàn)用戶感興趣的模式。對比模式挖掘是其中的一類挖掘方法,其特點是在兩類或多類別的序列庫中找到特征信息,在實際的生活和生產(chǎn)中應(yīng)用十分廣泛。隨著數(shù)據(jù)規(guī)模的不斷增加,算法的挖掘效率顯得尤為重要,但是當(dāng)前對比模式挖掘仍存在挖掘速度太慢的問題。為了快速挖掘滿足密度約束和間隙約束的對比模式,文中提出了一種近似求解算法ADMD(Approximately Distinguishing Patterns Mining Based on Density Constraint),該算法在模式的挖掘過程中允許存在小部分的模式丟失,從而換取挖掘速度的大幅提升。該算法采用網(wǎng)樹的特殊結(jié)構(gòu)來計算模式的支持?jǐn)?shù);采用模式拼接的方式來生成候選模式;采用預(yù)判式剪枝策略對模式進行剪枝,以避免大量冗余模式的生成。但由于在剪枝過程中可能會剪掉一部分非冗余模式,造成挖掘結(jié)果并非完備,因此該算法是一種近似求解算法。在ADMD算法的基礎(chǔ)上,通過在剪枝策略中設(shè)定參數(shù)k的方式來得到ADMD-k算法,該算法可以通過設(shè)定k的取值來調(diào)整剪枝程度,從而在挖掘效率和準(zhǔn)確率方面取得平衡。最后在真實的蛋白質(zhì)數(shù)據(jù)集上將所提算法與其他算法從挖掘的對比模式數(shù)量和挖掘速度方面進行對比實驗。實驗結(jié)果表明,在k=1.5的情況下,所提算法僅用不到原來13%的時間,就可以挖掘到99%以上的模式,具有近似度高、速度快的特點。

注:因版權(quán)方要求,不能公開全文,如需全文,請咨詢雜志社。

計算機科學(xué)雜志

計算機科學(xué)雜志, 月刊,本刊重視學(xué)術(shù)導(dǎo)向,堅持科學(xué)性、學(xué)術(shù)性、先進性、創(chuàng)新性,刊載內(nèi)容涉及的欄目:網(wǎng)絡(luò)與通信、信息安全、軟件與數(shù)據(jù)庫技術(shù)、人工智能、圖形圖像與模式識別等。于1974年經(jīng)新聞總署批準(zhǔn)的正規(guī)刊物。

  • 北大期刊
  • CSCD期刊
  • 統(tǒng)計源期刊
  • 1-3個月審核

服務(wù)介紹LITERATURE

正規(guī)發(fā)表流程 全程指導(dǎo)

多年專注期刊服務(wù),熟悉發(fā)表政策,投稿全程指導(dǎo)。因為專注所以專業(yè)。

保障正刊 雙刊號

推薦期刊保障正刊,評職認(rèn)可,企業(yè)資質(zhì)合規(guī)可查。

用戶信息嚴(yán)格保密

誠信服務(wù),簽訂協(xié)議,嚴(yán)格保密用戶信息,提供正規(guī)票據(jù)。

不成功可退款

如果發(fā)表不成功可退款或轉(zhuǎn)刊。資金受第三方支付寶監(jiān)管,安全放心。