From Seeing to Recognising – an Extended Self-Organizing Map for Human Postures Identification
Artykuł przedstawia dedykowaną metodę rozpoznawania ludzkich postaw z wykorzystaniem opcji klasyfikacji i klastrowania. Ostatecznym celem badań jest rozpoznawanie działań człowieka na podstawie sekwencji postaw, co stawia określone wymagania wobec opracowanej metody.
W tym celu zaproponowano rzadki autoenkoder (Sparse Autoencoder) w połączeniu z samoorganizującą się mapą (SOM – Self-Organized Map). SOM została rozszerzona o dodatkową warstwę odpowiedzialną za post-etykietowanie lub klasteryzację, co tworzy strukturę określaną jako rozszerzona SOM (extended SOM).
Aby poprawić wydajność SOM, zastosowano dwie modyfikacje ukierunkowane na zadanie – dedykowaną miarę odległości kątowej oraz funkcję sąsiedztwa do aktualizacji wag SOM.
Główny wkład badawczy tej pracy to koncepcja rozszerzonej SOM, która jest trenowana na danych nieoznaczonych i może klasyfikować lub grupować postawy człowieka. Sparse Autoencoder pozwala na zachowanie cech charakterystycznych danych przy jednoczesnym zmniejszeniu ich wymiarowości.
Wykazano, że opracowana metoda osiąga wyższą efektywność klasyfikacji w porównaniu do innych reprezentatywnych metod. Badania ablacyjne pokazują, w jaki sposób wprowadzone modyfikacje poprawiają wyniki klasyfikacji. Opracowana metoda charakteryzuje się dobrą rozdzielczością w rozróżnianiu postaw. Na końcu artykułu przedstawiona jest dyskusja na temat użyteczności zaproponowanej koncepcji.
Artykuł:
IEEE Robotics and Automation Letters
Autorzy z PW:
Vibekananda Dutta, Teresa Zielińska, Robert Sitnik
Dyscyplina:
Rok wydania: