Przejdź do treści

Global Counterfactual Directions

Pomimo rosnącego postępu w rozwoju metod generowania wizualnych kontrfaktycznych wyjaśnień, poprzednie prace traktują je jako technikę całkowicie lokalną. W tej pracy robimy pierwszy krok w kierunku ich globalizacji. W szczególności odkrywamy, że ukryta przestrzeń autoenkoderów dyfuzyjnych koduje proces wnioskowania danego klasyfikatora w postaci globalnych kierunków. Proponujemy nowatorskie podejście oparte na proxy, które odkrywa dwa rodzaje tych kierunków przy użyciu tylko jednego obrazu w całkowicie czarnej skrzynce. Dokładnie rzecz biorąc, kierunki g pozwalają na odwrócenie decyzji danego klasyfikatora na całym zbiorze danych obrazów, podczas gdy kierunki h dodatkowo zwiększają różnorodność wyjaśnień. Nazywamy je ogólnie Globalnymi Kierunkami Kontrfaktycznymi (GCD). Co więcej, pokazujemy, że GCD mogą być naturalnie łączone z ukrytymi zintegrowanymi gradientami, co skutkuje nową metodą atrybucji czarnej skrzynki, jednocześnie zwiększając zrozumienie kontrfaktycznych wyjaśnień. Weryfikujemy nasze podejście na istniejących benchmarkach i pokazujemy, że uogólnia się ono na rzeczywiste przypadki użycia.

Materiał konferencyjny:

Computer Vision – ECCV 2024, Lecture Notes In Computer Science, vol. LXIII

Autorzy z PW:

Przemysław Biecek

Rok wydania: