Przejdź do treści

Cloud-native distributed genomic pileup operations

To prezentacja skalowalnej, rozproszonej i wydajnej implementacji algorytmu gromadzenia danych, która nadaje się do wdrożenia w środowiskach obliczeniowych w chmurze. Autorzy zaimplementowali własny algorytm partycjonowania danych zoptymalizowany do pracy z sekwencjami, nowatorskie i unikalne podejście do przetwarzania zdarzeń sekwencjonowania z wykorzystaniem tagów MD, mikrooptymalizacje kodu źródłowego dla operacji cyklicznych oraz modularną strukturę algorytmu. Udowodnili, że nowatorskie podejście konsekwentnie i znacząco przewyższa inne zaawansowane rozproszone narzędzia pod względem czasu wykonania (do 6,5 raza szybciej) i użycia pamięci (do 2 razy mniej), co prowadzi do znaczącej redukcji kosztów w chmurze. 

Autorzy z PW:

Marek Wiewiórka, Agnieszka Szmurło, Paweł Stankiewicz, Tomasz Gambin

Czasopismo:

Bioinformatics

Rok wydania: