摘要:隨機(jī)森林算法是一類在機(jī)器學(xué)習(xí)中較為常見的算法,其在數(shù)據(jù)的分類以及非參數(shù)回歸中都有重要的作用。如何更好地處理數(shù)據(jù),進(jìn)行特征選擇是隨機(jī)森林的重點(diǎn)研究領(lǐng)域。自編碼神經(jīng)網(wǎng)絡(luò)在深度學(xué)習(xí)中有著不可替代的作用,其在數(shù)據(jù)壓縮、特征提取等方面有著優(yōu)異的性能。結(jié)合兩者優(yōu)點(diǎn),提出一種基于使用稀疏降噪自編碼器對(duì)原始數(shù)據(jù)進(jìn)行特征提取的隨機(jī)森林算法。采用多種常用數(shù)據(jù)集進(jìn)行實(shí)驗(yàn)分析,對(duì)原始數(shù)據(jù)分別采用不同的特征提取方法,并利用隨機(jī)森林將提取后的特征進(jìn)行分類。實(shí)驗(yàn)結(jié)果表明,利用稀疏降噪自編碼神經(jīng)網(wǎng)絡(luò)進(jìn)行特征提取所得到的特征,能夠使隨機(jī)森林的分類精度得到一定程度的提高。
注:因版權(quán)方要求,不能公開全文,如需全文,請(qǐng)咨詢雜志社。
統(tǒng)計(jì)與信息論壇雜志, 月刊,本刊重視學(xué)術(shù)導(dǎo)向,堅(jiān)持科學(xué)性、學(xué)術(shù)性、先進(jìn)性、創(chuàng)新性,刊載內(nèi)容涉及的欄目:統(tǒng)計(jì)理論與方法、經(jīng)濟(jì)統(tǒng)計(jì)、財(cái)政與金融統(tǒng)計(jì)、資源與環(huán)境統(tǒng)計(jì)、社會(huì)與管理統(tǒng)計(jì)等。于1986年經(jīng)新聞總署批準(zhǔn)的正規(guī)刊物。