One Self-Configurable Model to Solve Many Abstract Visual Reasoning Problems
Abstrakcyjne wnioskowanie wizualne (AVR – Abstract Visual Reasoning) obejmuje szeroki zakres problemów, podobnych do tych stosowanych w testach IQ. W ostatnich latach nastąpił dynamiczny rozwój metod rozwiązywania poszczególnych rodzajów zadań AVR, jednak we współczesnej literaturze różne typy problemów AVR rozważane są odrębnie, co prowadzi do opracowywania bardzo wyspecjalizowanych metod ukierunkowanych na rozwiązywanie zadań konkretnego typu.
W celu zbudowania uniwersalnych systemów uczących się w dziedzinie AVR proponujemy ujednolicony model do rozwiązywania zadań pojedynczego wyboru (SCAR). Model ten potrafi rozwiązywać różnorodne zadania AVR bez przyjętych z góry założeń dotyczących ich struktury, w szczególności liczby i rozmieszczenia paneli. Proponowany model opiera się na nowatorskiej warstwie dynamicznej (SAL – Structure-Aware Layer), która dostosowuje swoje wagi do struktury rozważanego problemu.
Eksperymenty przeprowadzone na Progresywnych Matrycach Ravena, problemach analogii wizualnej oraz zadaniach wyboru niepasującego obrazu wykazały, że SCAR (oraz ogólniej, modele oparte na SAL) skutecznie rozwiązują różnorodne zadania AVR, osiągając wyniki porównywalne z najlepszymi metodami specjalistycznymi. Co więcej, SCAR wykazuje istotne zdolności w uczeniu wielozadaniowym i transferze wiedzy.
Według naszej wiedzy, jest to pierwsza udana próba zbudowania uniwersalnego modelu do rozwiązywania zadań AVR opartego na jednolitej architekturze. Niniejsza praca ma na celu stymulowanie dalszego rozwoju badań poświęconych systemom uniwersalnym w obszarze AVR.
Materiał konferencyjny:
Proceedings of the AAAI Conference on Artificial Intelligence
Autorzy z PW:
Mikołaj Małkiński, Jacek Mańdziuk
Dyscyplina:
Rok wydania: