摘要:決策樹是從一組數據中生成分類器的一個行之有效的方法。其中ID3算法是目前引用率較高的算法。ID3算法是以信息熵為核心的分類預測算法。然而ID3算法存在多值偏向問題,可能使得出的決策樹并不是最優(yōu)的。文章將信息增益與關聯函數生活經驗和相結合,改進ID3算法,克服ID3算法偏向于選擇取值多的屬性的缺點,提高ID3算法準確率。并將改進后的ID3算法與原算法比較,證明改進后的ID3算法準確有效。
注:因版權方要求,不能公開全文,如需全文,請咨詢雜志社。
信息通信雜志, 月刊,本刊重視學術導向,堅持科學性、學術性、先進性、創(chuàng)新性,刊載內容涉及的欄目:電子與信息科學、信息技術、通信工程、軟件理論與方法、信息系統(tǒng)及應用、通信運營、信息管理、網絡與資源建設、信息傳播、信息化教育、電子政務及商務、產業(yè)論壇等等。于1987年經新聞總署批準的正規(guī)刊物。