Active Visual Exploration Based on Attention-Map Entropy
Aktywne eksplorowanie wzrokowe rozwiązuje problem ograniczonych możliwości sensorów w rzeczywistych scenariuszach, gdzie kolejne obserwacje są aktywnie wybierane na podstawie otoczenia. Aby poradzić sobie z tym problemem, wprowadzamy nową technikę o nazwie Entropia Mapy Uwagi (AME). Wykorzystuje ona wewnętrzną niepewność modelu opartego na transformatorach do określenia najbardziej informatywnych obserwacji. W przeciwieństwie do istniejących rozwiązań, nie wymaga dodatkowych składników funkcji straty, co upraszcza proces treningu. Poprzez eksperymenty, które naśladują sensory podobne do siatkówki oka, pokazujemy, że taki uproszczony trening znacząco poprawia wyniki rekonstrukcji, segmentacji i klasyfikacji na dostępnych publicznie zbiorach danych.
Materiał konferencyjny:
Elkind Edith (red.): Proceedings of the Thirty-Second International Joint Conference on Artificial Intelligence, Macao, SAR, 19-25 August 2023, 2023, International Joint Conferences on Artificial Intelligence
Autorzy z PW:
Tomasz Trzciński
Dyscyplina:
Rok wydania: