10月8日,我校計算機科學學院碩士研究生麻斌豪以第一作者在人工智能頂刊Neural Networks發表論文Multi-domain Active Defense: Detecting Multi-domain backdoor poisoned samples via ALL to ALL Decoupling Training without clean datasets (2023, 168:350-362;https://www.sciencedirect.com/science/article/pii/S0893608023005324?via%3Dihub)。孟博教授為唯一通訊作者,我校為唯一署名單位。

多域主動防御方法框架。 計科學院供圖
深度學習容易受到后門攻擊,在這種攻擊中,攻擊者可以通過向訓練集中注入中毒樣本,輕松地將隱藏的后門嵌入到訓練好的模型中。許多用于檢測后門中毒攻擊的先進技術都是基于潛在可分性假設。然而,目前的自適應中毒策略會大大降低“可區分行為”,從而使大多數先前的先進技術有效性降低。此外,現有的檢測方法對于多域數據集來說并不實用,且可能會泄露用戶隱私,因其需要并收集干凈的樣本。
為解決上述問題,該篇論文提出了一種不使用干凈數據集的多域主動防御方法。此種方法可以生成不同域的干凈樣本,并利用干凈樣本逐輪解耦神經網絡,從而解除特征和標簽之間的關聯,使后門中毒樣本更容易被檢測。
據悉,Neural Networks 是專注于神經網絡和深度學習研究的學術期刊。該期刊發布關于神經網絡、深度學習、機器學習和相關領域的原創研究論文、綜述文章和技術報告,在人工智能領域具有較高的國際影響力,是中科院SCI一區TOP期刊。