Przejdź do treści

Opublikowano: 24.07.2024 09:33

Nowatorska identyfikacja cząstek w eksperymencie ALICE

Detektor ALICE, źródło: CERN (www.cern.ch)

Interdyscyplinarny zespół fizyków i informatyków z Politechniki Warszawskiej opublikował w czasopiśmie European Physical Journal C artykuł z wynikami prac usprawniających identyfikację cząstek, która jest jedną z najważniejszych zdolności eksperymentu ALICE zlokalizowanego na Wielkim Zderzaczu Hadronów (LHC) w ośrodku CERN.

W celu prowadzenia dokładnych pomiarów własności plazmy kwarkowo-gluonowej tworzącej się w wyniku wysokoenergetycznych zderzeń ciężkich jonów w LHC, potrzebny jest szereg informacji na temat cząstek, które są rejestrowane w detektorach eksperymentu. Oprócz takich charakterystyk jak ich trajektorie czy energie, niezbędna jest również możliwość określenia, czy dany sygnał (np. zarejestrowany ślad trajektorii) pochodzi od konkretnego typu cząstki — czy ślad ten zostawił np. pion, kaon, proton, czy może elektron albo mion.

W eksperymencie ALICE istnieje kilka systemów detekcji, które pozwalają na separację powstających w nich sygnałów w zależności od typu rejestrowanej cząstki. Detektor TPC (Time Projection Chamber), tj. komora projekcji czasowej, rejestruje straty energii na jednostkę długości, detektor TOF (Time-of-Flight) mierzy czas, jaki cząstka pokonała od momentu zderzenia do momentu rejestracji w nim, a detektor promieniowania przejścia TRD (Transition Radiation Detector) mierzy promieniowanie emitowane przez przejście cząstek przez granicę materiałów o różnej stałej dielektrycznej. W każdym z tych detektorów różne typy cząstek zachowują się inaczej, umożliwiając ich klasyfikację.

Na zdjęciu schemat eksperymentu ALICE
Schemat eksperymentu ALICE

Do tej pory klasyczne metody klasyfikacji cząstek opierały się na ręcznie opracowywanych kryteriach selekcji, przykładowo na podstawie tego, jak bardzo odpowiedź danego detektora odbiega od wartości oczekiwanej. W takim przypadku cząstki wypadające poza tak określony obszar selekcji są odrzucane. Najbardziej problematyczne są jednak sytuacje, gdy sygnały dla różnych typów cząstek w danym detektorze zaczynają się przekrywać dla pewnych zakresów pędu bądź energii rejestrowanych cząstek. Rozwiązaniem tego problemu jest łączenie informacji z różnych detektorów, gdzie te obszary przekrycia są inne (zachodzą np. dla innych przedziałów pędowych). Niestety, ręczne metody wyboru regionów selekcji metodą prób i błędów są mało skuteczne, co obniża zarówno czystość badanej wyselekcjonowanej próbki danego typu cząstek, jak i wydajność całej procedury selekcji. Innymi słowy, za pomocą dotychczas używanych metod można utrzymać wysoką czystość próbki mocno tracąc na wydajności, czyli odrzucając bardzo dużo cząstek, które powinny się znaleźć w danej próbce, ale nie przeszły ostrych kryteriów selekcji, i vice versa.

Aby poprawić wydajność metod identyfikacji, nowatorskie podejścia wykorzystują modele uczenia maszynowego, które uczą się prawidłowego przypisania typów cząstek w zadaniu klasyfikacyjnym. Jednakże ze względu na różnorodne techniki pomiaru cząstek stosowane przez różne detektory wchodzące w skład ALICE, a także fakt, że nie wszystkie wytworzone cząstki są zawsze możliwe do zarejestrowania (np. cząstka może „wpaść” do obszaru między sensorami danego detektora), wytworzone cząstki nie zawsze dają sygnały we wszystkich komponentach eksperymentu. W rezultacie powstają dane z brakującymi wartościami (gdy w którymś detektorze nie zaobserwowano sygnału odpowiadającego danej cząstce, pomimo, że sygnały zaobserwowano w innych detektorach).

Podobny problem braku danych ma miejsce w medycynie, gdy w przypadku analizy danych medycznych brakuje informacji o niektórych parametrach poszczególnych pacjentów. Analiza takich niekompletnych danych jest z tego powodu utrudniona. 

Gotowych rozwiązań uczenia maszynowego nie można trenować na takich przykładach bez modyfikacji zbioru danych szkoleniowych lub ponownego zaprojektowania architektury modelu. W tej pracy proponujemy nową metodę identyfikacji cząstek, która rozwiązuje te problemy i może być trenowana na wszystkich dostępnych przykładach danych, w tym niekompletnych. Nowe podejście poprawia czystość procedury identyfikacji i wydajność wybranej próbki dla wszystkich badanych typów cząstek.

Wyniki badań są elementem pracy inżynierskiej Miłosza Kasaka, studenta kierunku informatyka na Wydziale Elektroniki i Technik Informacyjnych PW, oraz pracy doktorskiej doktorantki Wydziału Fizyki oraz uczestniczki programu Doctoral Student w CERN Mai Karwowskiej. W skład zespołu autorów weszli również: Kamil Deja (Wydział Elektroniki i Technik Informacyjnch oraz IDEAS NCBR Sp. z o. o.), Monika Jakubowska (Wydział Elektryczny), Łukasz Graczykowski oraz Małgorzata Janik (Wydział Fizyki).

Publikacja Machine-learning-based particle identification with missing data znajduje się pod adresem https://doi.org/10.1140/epjc/s10052-024-1304

Opracował: dr hab. inż. Łukasz Graczykowski