BERTrand—peptide:TCR binding prediction using Bidirectional Encoder Representations from Transformers augmented with random TCR pairing
Pojawienie się eksperymentów sekwencjonowania receptora komórek T (TCR) umożliwiło znaczący wzrost dostępnych danych dotyczących wiązania peptydów z TCR, dzięki modelom uczenia maszynowego. Wysokiej jakości modele predykcyjne dla stałej sekwencji epitopu są możliwe, o ile dostępne są wystarczające ilości znanych sekwencji TCR wiążących się z peptydem. Jednak ich wydajność znacząco spada dla wcześniej niewidzianych peptydów. W ramach badania przygotowano zbiór danych znanych wiązań peptydów z TCR i zwiększono go o negatywne odchylenia utworzone z repertuarów limfocytów T dawców zdrowych. Wykorzystano metody głębokiego uczenia powszechnie stosowane w Przetwarzaniu Języka Naturalnego, aby wytrenować część modelu predykcyjnego wiązania peptydów z TCR z stopniem uogólnienia między-peptydowego (0,69 AUROC). Wyniki wskazują, że BERTrand przewyższa opublikowane metody podczas oceny sekwencji peptydów, które nie były używane podczas trenowania modelu.
Artykuł:
Bioinformatics
Autorzy z PW:
Dariusz Plewczyński, Oleksandr Myronov
Dyscyplina:
Rok wydania: