Cloud-native distributed genomic pileup operations
To prezentacja skalowalnej, rozproszonej i wydajnej implementacji algorytmu gromadzenia danych, która nadaje się do wdrożenia w środowiskach obliczeniowych w chmurze. Autorzy zaimplementowali własny algorytm partycjonowania danych zoptymalizowany do pracy z sekwencjami, nowatorskie i unikalne podejście do przetwarzania zdarzeń sekwencjonowania z wykorzystaniem tagów MD, mikrooptymalizacje kodu źródłowego dla operacji cyklicznych oraz modularną strukturę algorytmu. Udowodnili, że nowatorskie podejście konsekwentnie i znacząco przewyższa inne zaawansowane rozproszone narzędzia pod względem czasu wykonania (do 6,5 raza szybciej) i użycia pamięci (do 2 razy mniej), co prowadzi do znaczącej redukcji kosztów w chmurze.
Artykuł:
Bioinformatics
Autorzy z PW:
Marek Wiewiórka, Agnieszka Szmurło, Paweł Stankiewicz, Tomasz Gambin
Dyscyplina:
Rok wydania: