Asymmetry index for data and its verification in dimensionality reduction and data visualization
W pracy zaproponowany został wskaźnik asymetrii danych, będący miarą stopnia asymetrii analizowanego zbioru danych. Zapewnia on dodatkowe informacje o zbiorze, co pozwala na lepsze ukierunkowanie i udoskonalenie dalszej analizy. Wskaźnik odzwierciedla poziom asymetrii relacji między danymi wynikającej z ich hierarchicznej struktury.
Dzięki informacjom uzyskanym za pomocą wskaźnika asymetrii, możliwe jest uzasadnienie i wytłumaczenie skuteczności asymetrycznych metod analizy danych, a także odpowiednie przygotowanie narzędzi do dalszej analizy, dostosowując je do asymetrycznych cech danych.
Wskaźnik asymetrii sformułowany jest w oparciu o graf k-najbliższych sąsiadów, który reprezentuje analizowane dane. Wykorzystuje on zatem informacje o ich wewnętrznej geometrii, umożliwiając wgląd w strukturę zbioru.
Przeprowadzone eksperymenty na rzeczywistych danych służą weryfikacji użyteczności wskaźnika asymetrii oraz poprawności jego teoretycznych podstaw. W empirycznej walidacji zastosowane zostały zarówno symetryczne, jak i asymetryczne algorytmy redukcji wymiarowości danych, a wyniki ich działania ocenione zostały na podstawie klasteryzacji w dwuwymiarowej przestrzeni wizualizacji. Ostatecznie stwierdzone zostało, czy zaproponowany wskaźnik rzeczywiście przewiduje przewagę metod asymetrycznych nad ich symetrycznymi odpowiednikami.
Artykuł:
Information Sciences
Autorzy z PW:
Dominik Olszewski
Dyscyplina:
Rok wydania: