基于ESVM的科技政策文本標簽分類研究 吳峰; 李銀生; 聶永川; 范通讓; 趙文彬; 張博 河北省科學技術情報研究院; 河北省科技信息處理實驗室; 河北石家莊050021; 石家莊鐵道大學信息科學與技術學院; 河北石家莊050043 摘要:文本標簽作為一種文本關鍵詞,能夠簡化科技政策中有效信息的挖掘。本文從科技政策類別角度,將標簽類別分為科技投入、知識產權、農村科技和稅收四類,針對傳統SVM算法的缺點和標簽數據不平衡的缺點,結合歐式距離思想,提出一種帶有懲罰因子的ESVM科技政策文本標簽分類方法。最后,對比SVM和ESVM兩種分類方法,驗證了本文方法在處理科技政策文本標簽數據上的有效性。 注: 保護知識產權,如需閱讀全文請聯系河北省科學院學報雜志社
相關推薦 更多 科技風 省級 1個月內錄用 科學咨詢 省級 1個月內錄用 科技創新與應用 省級 1個月內錄用 科學大眾 省級 1個月內錄用 黑龍江科技信息 省級 1個月內錄用 資源節約與環保 省級 1個月內錄用