Robust two-dimensional PCANet with F-norm distance metric
Sieć PCANet jest uproszczoną wersją splotowej sieci neuronowej (CNN). Wykorzystuje ona model głębokiego uczenia w podprzestrzeniach. Typowe filtry PCA używają kwadratowej normy Frobeniusa jako miary odległości stosowanej w procesie uczenia. W związku z tym wykazują one dużą czułość na odstające wartości danych. Typowa sieć PCANet napotyka trudności w wyodrębnianiu informacji strukturalnych wzdłuż wierszy i kolumn cyfrowej reprezentacji obrazów, bowiem filtry muszą być uprzednio zwektoryzowane. Aby rozwiązać te problemy zaproponowano bardziej odporną, dwukierunkową, dwuwymiarową wersję PCANet (RBDPCANet), w której filtry wykorzystują zmodyfikowaną odległość łagodzącą negatywny wpływ wartości odstających na wynik analiz porównawczych obrazów. Dodatkowo, w funkcji celu uwzględnia się jednocześnie związek między błędami rekonstrukcji a odległościami projekcji. Po krótkim opisie koncepcji PCANet oraz przedstawienia związanych z poruszoną tematyką prac, opisano metodologię generowania trzech jąder splotowych w postaci algorytmów RBDPCANet-1, RBDPCANet-2 i RBDPCANet-3. Te jądra buduje się iteracyjnie, są one odpowiednie do implementacji numerycznych. Każdy z trzech algorytmów używa innej funkcji celu w procesie optymalizacji. Pokazano, że w zadaniach rozpoznawania obrazów, opracowane metody charakteryzują się lepszą odpornością na szumy w porównaniu z klasycznym podejściem PCANet. Wykazano poprawność formalną opracowanych metod oraz wykazano odporność algorytmów na obroty obrazów. Skuteczność zaproponowanej metodologii została zweryfikowana z wykorzystaniem obrazów pochodzących z publicznie dostępnych zbiorów danych. Obszerne wyniki eksperymentalne wykazały, że zaproponowane algorytmy RBDPCANet nie tylko znacząco poprawiają efektywność klasyfikacji obrazów, ale również charakteryzują się silną odpornością na przesłonięcia, zmiany oświetlenia, zmiany orientacji itp.
Artykuł:
Knowledge-Based Systems
Autorzy z PW:
Teresa Zielińska
Rok wydania: