BERTrand—peptide:TCR binding prediction using Bidirectional Encoder Representations from Transformers augmented with random TCR pairing

Pojawienie się eksperymentów sekwencjonowania receptora komórek T (TCR) umożliwiło znaczący wzrost dostępnych danych dotyczących wiązania peptydów z TCR, dzięki modelom uczenia maszynowego. Wysokiej jakości modele predykcyjne dla stałej sekwencji epitopu są możliwe, o ile dostępne są wystarczające ilości znanych sekwencji TCR wiążących się z peptydem. Jednak ich wydajność znacząco spada dla wcześniej niewidzianych peptydów. W ramach badania przygotowano zbiór danych znanych wiązań peptydów z TCR i zwiększono go o negatywne odchylenia utworzone z repertuarów limfocytów T dawców zdrowych. Wykorzystano metody głębokiego uczenia powszechnie stosowane w Przetwarzaniu Języka Naturalnego, aby wytrenować część modelu predykcyjnego wiązania peptydów z TCR z stopniem uogólnienia między-peptydowego (0,69 AUROC). Wyniki wskazują, że BERTrand przewyższa opublikowane metody podczas oceny sekwencji peptydów, które nie były używane podczas trenowania modelu.

Artykuł:

Bioinformatics

Autorzy z PW:

Dariusz Plewczyński, Oleksandr Myronov

Dyscyplina:

informatyka techniczna i telekomunikacja

Rok wydania:

2023

Zobacz publikację

Zobacz więcej informacji o publikacji