av在线播放日韩亚洲欧,av网站免费线看,bt√天堂资源在线官网,а天堂www在线忘忧草,国产成人精品97

首頁 > 期刊 > 計算機與現(xiàn)代化 > 結合主題模型詞向量的CNN文本分類 【正文】

結合主題模型詞向量的CNN文本分類

作者:牛雪瑩 太原科技大學計算機科學與技術學院; 山西太原030024

摘要:挖掘微博文本中的信息對自動問答、輿情分析等應用研究具有重要意義。文本數(shù)據(jù)的分類研究是文本數(shù)據(jù)挖掘的基礎。本文提出將Word2vec和LDA(Latent Dirichlet Allocation)的文本表示同時輸入卷積神經(jīng)網(wǎng)絡模型進行高層語義特征抽象和分類學習,使得輸入的詞向量既能表現(xiàn)詞語之間的語義信息又能體現(xiàn)文本的主題思想。首先用Word2vec和LDA模型分別在語料庫中學習產生詞向量,然后詞向量分別級聯(lián)得到各自的文本矩陣表示,最后將文本矩陣作為2個通道同時輸入到卷積神經(jīng)網(wǎng)絡做分類訓練,并通過微博數(shù)據(jù)實驗驗證了該方法的有效性。

注:因版權方要求,不能公開全文,如需全文,請咨詢雜志社。

計算機與現(xiàn)代化雜志

計算機與現(xiàn)代化雜志, 月刊,本刊重視學術導向,堅持科學性、學術性、先進性、創(chuàng)新性,刊載內容涉及的欄目:算法設計與分析、數(shù)據(jù)庫與數(shù)據(jù)挖掘、軟件工程、操作系統(tǒng)、人工智能、圖像處理、計算機仿真、計算機控制、網(wǎng)絡與通信、信息安全、電子商務、計算機輔助設計、計算機輔助教學、信息系統(tǒng)與ERP、中文信息技術、多媒體技術、農村信息化技術、應用與開發(fā)等等。于1985年經(jīng)新聞總署批準的正規(guī)刊物。

  • 統(tǒng)計源期刊
  • 1-3個月審核

服務介紹LITERATURE

正規(guī)發(fā)表流程 全程指導

多年專注期刊服務,熟悉發(fā)表政策,投稿全程指導。因為專注所以專業(yè)。

保障正刊 雙刊號

推薦期刊保障正刊,評職認可,企業(yè)資質合規(guī)可查。

用戶信息嚴格保密

誠信服務,簽訂協(xié)議,嚴格保密用戶信息,提供正規(guī)票據(jù)。

不成功可退款

如果發(fā)表不成功可退款或轉刊。資金受第三方支付寶監(jiān)管,安全放心。