TextLeak:基于決策的單詞級(jí)黑盒文本對(duì)抗攻擊方法
武漢大學(xué)學(xué)報(bào)(理學(xué)版)
頁數(shù): 10 2023-06-27
摘要: 現(xiàn)有的基于決策的黑盒文本對(duì)抗攻擊方案無法兼顧攻擊效果和攻擊效率,因此,提出了一種簡(jiǎn)單而高效的基于決策的單詞級(jí)黑盒文本對(duì)抗攻擊方法 TextLeak。該方法的核心思想是通過多級(jí)搜索的方式尋找最小擾動(dòng)以生成對(duì)抗樣本,即先通過粗粒度搜索確定目標(biāo)區(qū)域,然后基于該目標(biāo)區(qū)域通過細(xì)粒度搜索找到最優(yōu)解作為對(duì)抗樣本。以攻擊成功率、擾動(dòng)率以及查詢次數(shù)為主要評(píng)估指標(biāo),在相同的數(shù)據(jù)集和模型下,選取了三... (共10頁)