摘要:跨語(yǔ)言句子語(yǔ)義相似度計(jì)算旨在計(jì)算不同語(yǔ)言句子之間的語(yǔ)義相似程度。近年來(lái),前人提出了基于神經(jīng)網(wǎng)絡(luò)的跨語(yǔ)言句子語(yǔ)義相似度模型,這些模型多數(shù)使用卷積神經(jīng)網(wǎng)絡(luò)來(lái)捕獲文本的局部語(yǔ)義信息,缺少對(duì)句子中遠(yuǎn)距離單詞之間語(yǔ)義相關(guān)信息的獲取。該文提出一種融合門控卷積神經(jīng)網(wǎng)絡(luò)和自注意力機(jī)制的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),用于獲取跨語(yǔ)言文本句子中的局部和全局語(yǔ)義相關(guān)關(guān)系,從而得到文本的綜合語(yǔ)義表示。在SemEval-2017多個(gè)數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果表明,該文提出的模型能夠從多個(gè)方面捕捉句子間的語(yǔ)義相似性,結(jié)果優(yōu)于基準(zhǔn)方法中基于純神經(jīng)網(wǎng)絡(luò)的模型方法。
注:因版權(quán)方要求,不能公開全文,如需全文,請(qǐng)咨詢雜志社。
中文信息學(xué)報(bào)雜志, 月刊,本刊重視學(xué)術(shù)導(dǎo)向,堅(jiān)持科學(xué)性、學(xué)術(shù)性、先進(jìn)性、創(chuàng)新性,刊載內(nèi)容涉及的欄目:綜述、語(yǔ)言資源建設(shè)、機(jī)器翻譯、信息抽取與文本挖掘、情感分析與社會(huì)計(jì)算、自然語(yǔ)言理解與生成等。于1986年經(jīng)新聞總署批準(zhǔn)的正規(guī)刊物。