一種基于集成學(xué)習(xí)的科研合作者潛力預(yù)測分類方法
摘要:科研合作是學(xué)術(shù)成果非常重要的實(shí)現(xiàn)形式,很多高水平的研究成果通過合作實(shí)現(xiàn).研究合作潛力可以為學(xué)者選擇合作者提供指導(dǎo),最大化科研效率.然而當(dāng)前大數(shù)據(jù)爆發(fā)阻礙了合作者的有效選擇.為了解決這個(gè)問題,基于學(xué)者文章大數(shù)據(jù),經(jīng)過特征分析和優(yōu)化,綜合考慮學(xué)者的文章、機(jī)構(gòu)、研究興趣等個(gè)人屬性和相關(guān)屬性,分別從文章標(biāo)題、文章等級(jí)、文章數(shù)量、時(shí)間及署名序多維度構(gòu)造樣本特征,以文章所發(fā)表的期刊會(huì)議等級(jí)作為合作者序列對(duì)的樣本標(biāo)簽,表示當(dāng)前合作者的潛力高低,利用集成方法的強(qiáng)學(xué)習(xí)特性,提出了基于集成學(xué)習(xí)分類方法的科研合作者潛力預(yù)測模型.分析并構(gòu)造對(duì)應(yīng)于科研合作者潛力預(yù)測問題的特征集后,采用分類方法解決這一問題.實(shí)驗(yàn)中準(zhǔn)確率、召回率、F1分?jǐn)?shù)都遠(yuǎn)高于傳統(tǒng)機(jī)器學(xué)習(xí)方法,并能以較少的樣本和時(shí)間收斂于較高值(80%以上),說明了模型的優(yōu)越性.
注: 保護(hù)知識(shí)產(chǎn)權(quán),如需閱讀全文請(qǐng)聯(lián)系計(jì)算機(jī)研究與發(fā)展雜志社