Przejdź do treści

SeFNet: Linking tabular datasets with semantic feature nets

Tabelaryczne zbiory danych odgrywają znaczącą rolę w szerokim zakresie aplikacji uczenia maszynowego. Jednakże, mimo że często dotyczą one podobnych problemów, tabelaryczne zbiory danych są zwykle traktowane jako samodzielne zadania. Możliwości wykorzystania wcześniej rozwiązanych problemów są ograniczone ze względu na brak ustrukturyzowanych informacji kontekstowych o ich cechach oraz brak zrozumienia zależności między nimi. Aby przezwyciężyć to ograniczenie, proponujemy nową metodologię o nazwie Semantic Feature Net (SeFNet), przechwytującą semantyczne znaczenie analizowanych cech tabelarycznych. Wykorzystując istniejące ontologie i wiedzę dziedzinową, SeFNet otwiera nowe możliwości dzielenia się spostrzeżeniami między różnymi zadaniami predykcyjnymi. Jedną z takich możliwości jest miara podobieństwa semantycznego opartego na ontologii zbioru danych (DOSS), która określa ilościowo podobieństwo między zbiorami danych przy użyciu relacji między ich cechami. W tym artykule przedstawiamy przykład zastosowania sieci SeFNet przygotowanej dla zbioru zadań predykcyjnych w opiece zdrowotnej, z relacjami cech pochodzącymi z ontologii SNOMED-CT. Proponowana metodologia SeFNet i towarzysząca jej miara DOSS rozwiązują problem ograniczonych informacji kontekstowych w tabelarycznych zbiorach danych. Włączając wiedzę dziedzinową i ustanawiając relacje semantyczne między cechami, zwiększamy potencjał meta-uczenia się i umożliwiamy dzielenie się cennymi spostrzeżeniami w różnych zadaniach predykcyjnych.

Artykuł:

Information Fusion

Autorzy z PW:

Katarzyna Woźnica, Przemysław Biecek

Rok wydania: