摘要:針對藏文情感分析的要求,建立藏文情感語料庫。建庫主要分三大步驟,爬取原始語料、開發(fā)標注平臺、建立結構化語料。在標注體系上,糅合并參考英文和中文中相對優(yōu)秀的情感語料庫的標注體系的優(yōu)點,結合藏文情感文本的特點,建立藏文情感語料標注規(guī)范。實驗表明,該語料庫具有擴展性和實用性,在該標注平臺上標注藏語詞句能減輕標注人員工作量,同時有效建立結構化語料,滿足情感分析需求。
注:因版權方要求,不能公開全文,如需全文,請咨詢雜志社。
計算機時代雜志, 月刊,本刊重視學術導向,堅持科學性、學術性、先進性、創(chuàng)新性,刊載內容涉及的欄目:技術廣角、網絡技術、應用實踐、經驗技巧、計算機教育、信息化建設等。于1983年經新聞總署批準的正規(guī)刊物。