(相關資料圖)
近日,中科院軟件所天基綜合信息系統重點實驗室研究團隊的論文“Meta Attention-Generation Network for Cross-Granularity Few-Shot Learning”被計算機視覺領域頂級學術期刊IJCV(International Journal of Computer Vision)接收,第一作者為助理研究員強文文、博士生李江夢。論文首次提出一個新的學習問題:跨粒度的小樣本學習(CG-FSL),并基于結構因果理論推導出適用于CG-FSL的因果學習模型,稱為元注意力生成網絡 (MAGN),有效突破細粒度小樣本學習的瓶頸。
細粒度分類旨在識別屬于粗粒度類別的細粒度子類的圖像,相比于粗粒度樣本,其收集和標注難度大、成本高?,F有的標準小樣本學習(FSL)側重于對已知和未知類進行泛化,所有的分類都處于相同的粒度級別。實踐中使用FSL方法來解決分類問題時,需要為某些細粒度類提供大量標記樣本。如何才能實現基于少量標記樣本的細粒度分類,是研究團隊希望解決的問題。由于粗粒度類樣本的易得性,研究團隊希望從粗粒度類別中學習知識,并通過少量樣本轉移到細粒度類別中。
基于上述探索和分析,研究團隊遵循認知神經學的規律,提出了基于大量粗粒度類標簽樣本進行訓練,在測試階段對細粒度子類標簽樣本進行劃分的方法。同時,通過結構因果模型(SCM)對CG-FSL進行分析,發現在粗粒度級別學習的標準小樣本學習模型實際上是一個混雜因素。研究團隊采用后門調整以解耦干擾,推導并提出了一個稱為元注意力生成網絡 (MAGN) 的因果CG-FSL模型。該模型以雙層優化方式進行訓練,可以自適應地生成多注意圖,以消除由粗粒度類別信息引起的混淆。
研究團隊基于5個不同的細粒度圖像數據集,通過構建多個基準和評估協議,來對比CG-FSL方法和幾種廣泛使用的FSL方法。經過大量實驗,結果表明CG-FSL更具有挑戰性,所構建的MAGN模型在細粒度分類任務精度上明顯優于標準小樣本學習模型,實現了在跨粒度小樣本學習上的突破。