摘要:針對藏文情感分析的要求,建立藏文情感語料庫。建庫主要分三大步驟,爬取原始語料、開發(fā)標注平臺、建立結(jié)構(gòu)化語料。在標注體系上,糅合并參考英文和中文中相對優(yōu)秀的情感語料庫的標注體系的優(yōu)點,結(jié)合藏文情感文本的特點,建立藏文情感語料標注規(guī)范。實驗表明,該語料庫具有擴展性和實用性,在該標注平臺上標注藏語詞句能減輕標注人員工作量,同時有效建立結(jié)構(gòu)化語料,滿足情感分析需求。
注:因版權(quán)方要求,不能公開全文,如需全文,請咨詢雜志社。
計算機時代雜志, 月刊,本刊重視學(xué)術(shù)導(dǎo)向,堅持科學(xué)性、學(xué)術(shù)性、先進性、創(chuàng)新性,刊載內(nèi)容涉及的欄目:技術(shù)廣角、網(wǎng)絡(luò)技術(shù)、應(yīng)用實踐、經(jīng)驗技巧、計算機教育、信息化建設(shè)等。于1983年經(jīng)新聞總署批準的正規(guī)刊物。