Przejdź do treści

Publikacje

Wartość? 200 punktów

Publikacje to nieodłączna część pracy naukowców. To publikacje opisują i podsumowują dorobek badawczy, często wielomiesięczny albo nawet wieloletni wysiłek, budują pozycję naukowców i całych zespołów. Są także elementem ewaluacji – oceny konkretów osób, a co za tym udzie – całych dyscyplin.

Na poniższej liście prezentujemy najwyżej punktowane publikacje (czyli takie za 200 punktów), w które wkład mieli naukowcy z Politechniki Warszawskiej. Wykaz obejmuje dane od początku 2023 roku.

Don’t Predict Counterfactual Values, Predict Expected Values Instead

Algorytmy minimalizacji żalu kontrfaktycznego (Counterfactual Regret Minimization, CRM) są najpopularniejszym sposobem szacowania równowagi Nasha w grach o sumie zerowej z niepełną informacją. W szczególności, zaawansowany bot do pokera, DeepStack, wykorzystuje tzw. Deep Counterfactual Value Network (DCVN) do nauki wartości kontrfaktycznych (CFV) związanych z różnymi stanami gry. Każda wartość kontrfaktyczna to iloczyn dwóch czynników: (1) prawdopodobieństwa, że przeciwnik osiągnie dany stan w grze, które można obliczyć na podstawie danych wejściowych, oraz (2) oczekiwanej wartości (EV) wypłaty w tym stanie, która jest złożoną funkcją danych wejściowych, trudną do obliczenia. W niniejszym artykule proponujemy prostą, ale skuteczną modyfikację procesu szacowania CFV, polegającą na wykorzystaniu głębokiej sieci neuronowej do szacowania jedynie czynnika EV wartości kontrfaktycznej. Nowe podejście znacznie upraszcza problem nauki i prowadzi do dokładniejszego szacowania CFV. Bezpośrednie porównanie strat predykcji CFV wykazuje znaczną poprawę dokładności predykcji proponowanego podejścia (DEVN) w porównaniu z oryginalną formułą DCVN (relatywnie o 9,18-15,70%, w zależności od konkretnego ustawienia eksperymentu). Ponadto zastosowanie DEVN poprawia teoretyczną, dolną granicę błędu o 29,05-31,83% w porównaniu do treningu opartego na DCVN. Dodatkowo, DEVN osiąga cel wykorzystując do wnioskowania znacznie mniejsze i szybsze sieci. Chociaż proponowana modyfikacja może wydawać się raczej techniczna, w rzeczywistości przedstawia fundamentalnie inne podejście do procesu nauki i szacowania CFV, ponieważ rozkłady sygnałów treningowych różnią się znacząco między DCVN a DEVN. Pierwszy szacuje CFV, które są obciążone prawdopodobieństwem osiągnięcia danego stanu gry, podczas gdy trening drugiego opiera się na bezpośrednim szacowaniu EV, niezależnie od prawdopodobieństwa stanu. W efekcie sygnał nauki DEVN lepiej odzwierciedla rzeczywistą wartość danego stanu, co pozwala na dokładniejsze szacowanie CFV.

Materiał konferencyjny:

Proceedings of the 37th AAAI Conference on Artificial Intelligence

Rok wydania:

Autorzy z PW:

Jacek Mańdziuk

The Tunnel Effect: Building Data Representations in Deep Neural Networks

Głębokie sieci neuronowe są powszechnie znane ze swojej niezwykłej skuteczności w różnych zadaniach, a panuje przekonanie, że głębsze sieci w naturalny sposób uczą się bardziej złożonych reprezentacji danych. W niniejszej pracy pokazujemy, że wystarczająco głębokie sieci trenowane do nadzorowanej klasyfikacji obrazów dzielą się na dwie odrębne części, które w różny sposób przyczyniają się do powstawania reprezentacji danych. Początkowe warstwy tworzą reprezentacje liniowo separowalne, podczas gdy kolejne warstwy, które określamy jako tunel, kompresują te reprezentacje i mają minimalny wpływ na ogólną wydajność. Przeprowadzone przez nas badania empiryczne pokazują, że tunel pojawia się we wczesnych etapach procesu treningowego, a jego głębokość zależy od relacji między pojemnością sieci a złożonością zadania. Ponadto pokazujemy, że tunel pogarsza uogólnianie na dane spoza rozkładu i omawiamy jego konsekwencje dla uczenia ciągłego.

Materiał konferencyjny:

Advances in Neural Information Processing Systems 36. 37th Conference on Neural Information Processing Systems (NeurIPS 2023)

Rok wydania:

Autorzy z PW:

Wojciech Masarczyk, Mateusz Ostaszewski, Tomasz Trzciński 

Overestimation, Overfitting, and Plasticity in Actor-Critic: the Bitter Lesson of Reinforcement Learning

Ostatnie postępy w uczeniu ze wzmocnieniem (Reinforcement Learning RL) metodami off-policy znacznie poprawiły efektywność próbkowania, głównie dzięki zastosowaniu różnych form regularyzacji, które umożliwiają więcej kroków aktualizacji gradientu niż w tradycyjnych agentach. Jednak wiele z tych technik było testowanych w ograniczonych warunkach, często na zadaniach z pojedynczych symulacyjnych benchmarków i w porównaniu z dobrze znanymi algorytmami, zamiast z szerokim zakresem podejść regularyzacyjnych. Ogranicza to nasze zrozumienie konkretnych mechanizmów napędzających ulepszenia w RL. Aby to zbadać, zaimplementowaliśmy ponad 60 różnych agentów off-policy, z których każdy integrował uznane techniki regularyzacji z najnowszych algorytmów state-of-the-art. Przetestowaliśmy tych agentów w 14 zróżnicowanych zadaniach z 2 symulacyjnych benchmarków, mierząc metryki treningowe związane z przeszacowaniem, przeuczeniem i utratą plastyczności — problemami, które motywują analizowane techniki regularyzacyjne. Nasze wyniki pokazują, że skuteczność konkretnej konfiguracji regularyzacyjnej zależy od zadania, jednak pewne kombinacje konsekwentnie wykazują solidną i ponadprzeciętną wydajność. W szczególności prosty agent Soft Actor-Critic, odpowiednio zregularyzowany, konsekwentnie znajduje politykę o lepszej wydajności w trakcie treningu, co wcześniej było osiągane głównie za pomocą podejść modelowych.

Materiał konferencyjny:

Proceedings of the 41st International Conference on Machine Learning

Rok wydania:

Autorzy z PW:

Michał Bortkiewicz, Mateusz Ostaszewski, Tomasz Trzciński 

Controlled hydrolysis of AlMe₃ to tetramethylalumoxane and a new look at incipient adducts with water

Alumoksany to związki metaloorganiczne zawierające ugrupowanie Al–O–Al z organicznymi podstawnikami. Ich chemia ma długą historię, a pierwsze badania nad tymi związkami sięgają lat 50. XX wieku. Alumoksany wzbudzają szczególne zainteresowanie ze względu na ich wysoką aktywność katalityczną, a metylalumoksan (MAO) jest szeroko stosowany jako kokatalizator w procesach polimeryzacji.

W artykule przedstawiono metodę syntezy tetrametyloalumoksanu poprzez kontrolowaną hydrolizę trimetyloglinu (AlMe₃) w obecności silnej zasady Lewisa – pirydyny. Dzięki technikom spektroskopowym oraz zaawansowanym obliczeniom kwantowo-chemicznym wykazano, że kluczową rolę w pierwszych etapach reakcji odgrywają hiperwalencyjne pięciokoordynacyjne kompleksy glinowe, co pozwoliło lepiej zrozumieć sposób oddziaływania cząsteczek AlMe₃ z wodą. Otrzymane wyniki stanowią istotny wkład w zrozumienie mechanizmu hydrolizy związków glinoorganicznych, co może przyczynić się do dalszego rozwoju chemii alumoksanów i ich racjonalnego projektowania.

Artykuł został dedykowany pamięci Profesora Stanisława Pasynkiewicza, wybitnego chemika i Rektora Politechniki Warszawskiej w latach 1973–1981, który wniósł nieoceniony wkład w rozwój chemii związków glinoorganicznych, z którymi był związany od początku swojej kariery naukowej.

Artykuł:

Chemical Communications

Rok wydania:

Autorzy z PW:

Krzesimir Korona, Janusz Lewiński, Antoni Pietrzykowski, Marta Lemieszka 

Dyscyplina:

Metal cations recognition by bowl-shaped <i>N</i>-pyrrolic polycyclic aromatic hydrocarbons

Po raz pierwszy zbadano zastosowanie poliaromatycznych związków o kształcie misy i zawierających azot w roli receptorów molekularnych do wykrywania kationów metali. Przeprowadzono kompleksowe pomiary potencjometryczne i spektrofluorymetryczne, jak również obliczenia kwantowo-mechaniczne za zakresu teorii funkcjonału gęstości (DFT). Pokazano, że badane związki skutecznie rozpoznają kationy metali, ze szczególnym uwzględnieniem kationów cezu (Cs⁺).

Artykuł:

Chemical Communications

Rok wydania:

Autorzy z PW:

Jakub Cyniak, Joachim Ażgin, Wojciech Wróblewski, Artur Kasprzak 

Dyscyplina:

On the Fate of Lithium Ions in Sol-Gel Derived Zinc Oxide Nanocrystals

Najczęściej stosowaną metodą syntezy nanokryształów tlenku cynku (ZnO NCs) jest nieorganiczna metoda zol–żel, w której jako reagenty wykorzystuje się octan cynku oraz wodorotlenek litu. Nasze badania wykazały, że wbrew powszechnej opinii ZnO NCs otrzymane tą metodą zawierają inherentne domieszki w postaci jonów metali alkalicznych. Jony Li⁺ są kinetycznie uwięzione w strukturze nieorganicznego rdzenia ZnO, przenikają do płytkiej warstwy podpowierzchniowej, a także występują w obrębie organicznej warstwy stabilizującej.

Uzyskane wyniki pozwoliły po raz pierwszy zidentyfikować strukturalne niedoskonałości nanostruktur ZnO wytwarzanych metodą zol–żel, a także lepiej zrozumieć proces domieszkowania i pasywacji powierzchni tych materiałów, kluczowy dla ich przyszłych zastosowań w zaawansowanych technologiach.

Artykuł:

Small

Rok wydania:

Autorzy z PW:

Małgorzata Wolska-Pietkiewicz, Janusz Lewiński

Dyscyplina:

A control oriented strategy of disruption prediction to avoid the configuration collapse of tokamak reactors

Celem syntezy termojądrowej jest produkcja energii elektrycznej poprzez łączenie lekkich jąder w plazmie o wysokiej temperaturze. Najbardziej obiecująca droga do fuzji termojądrowej przewiduje zamknięcie takich plazm za pomocą pól magnetycznych, których najczęściej badaną konfiguracją jest tokamak.

Jednym z głównych wyzwań stojących na drodze do reaktora komercyjnego są gwałtowne zerwania sznura plazmowego (z ang. disruptions), które występują we wszystkich urządzeniach tokamakowych.

W niniejszej pracy przestawiono, w jaki sposób, wdrażając nowatorskie metody analizy tysięcy eksperymentów przeprowadzonych w reaktorze JET, zbadano charakter różnych form tych zjawisk. Badania obejmowały szeroki zakres izotopowych składów paliwa – od wodoru po tryt, w tym kluczową kampanię D-T.

Opracowano nowatorskie podejście do detekcji zagrożenia, które pozwala określić zarówno prawdopodobieństwo wystąpienia zakłócenia, jak i czas pozostały do jego nastąpienia. Wykorzystane metody są adaptacyjne i mogą być stosowane w czasie rzeczywistym.

Uzyskane wyniki wskazują, że możliwe jest opracowanie opartych na fizyce narzędzi do prognozowania i kontroli zakłóceń zachodzących w plazmie, co pozwoli wdrożyć realistyczne strategie ich unikania i zapobiegania nim, spełniające wymagania stawiane przyszłym generacjom urządzeń termojądrowych.

Artykuł:

Nature Communications

Rok wydania:

Autorzy z PW:

Elżbieta Fortuna-Zaleśna, Łukasz Ciupiński

Fine-tuning Reinforcement Learning Models is Secretly a Forgetting Mitigation Problem

Dostrajanie (fine-tuning) to powszechnie stosowana technika w uczeniu głębokim, umożliwiająca przenoszenie wcześniej wytrenowanych zdolności, często wykorzystywana w modelach bazowych (foundation models). Jednak dostrajanie modeli uczenia ze wzmocnieniem (RL) pozostaje wyzwaniem.

W niniejszej pracy analizujemy dwie przyczyny słabej transferowalności. Pierwsza jest związana z utratą skuteczność w podprzestrzeni stanów starego zadania, które nie zostały odwiedzone na początkowym etapie dostrajania, mimo że przed dostrojeniem agent radził sobie w nich dobrze. W efekcie tracimy oczekiwane korzyści z transferu. Druga przyczyna jest związana z nieoptymalnym agentem bazowym, który w trakcie dostrajana w nowym zadaniu ogranicza się jedynie do małej części zdolności wcześniej wytrenowanych, na skutek czego inne ulegają zapomnieniu.

W naszej pracy identyfikujemy warunki, w których to zjawisko występuje, pokazując, że jest ono częste i w wielu przypadkach katastrofalne.

Dzięki szczegółowej analizie empirycznej, przeprowadzonej w wymagających środowiskach NetHack i Montezuma’s Revenge, wykazujemy, że standardowe techniki zachowywania wiedzy pozwalają złagodzić ten problem i pełniej wykorzystać wcześniej wytrenowane zdolności.

W szczególności w NetHack osiągamy nowy najlepszy wynik dla modeli neuronowych, poprawiając poprzedni rekord z 5K do ponad 10K punktów w scenariuszu Human Monk.

Materiał konferencyjny:

Proceedings of the 41st International Conference on Machine Learning

Rok wydania:

Autorzy z PW:

Michał Bortkiewicz, Mateusz Ostaszewski

Atomistic analysis of the mechanisms underlying irradiation-hardening in Fe–Ni–Cr alloys

Stale austenityczne eksploatowane w warunkach intensywnego promieniowania, np. w reaktorach jądrowych, ulegają znaczącym zmianom mikrostrukturalnym, prowadzącym do umocnienia radiacyjnego i degradacji ich właściwości mechanicznych. W opublikowanej pracy: "Atomistic Analysis of the Mechanisms Underlying Irradiation-Hardening in Fe-Ni-Cr Alloys" – A. Ustrzycka, F. J. Dominguez-Gutierrez, W. Chromiński, International Journal of Plasticity, 2024, przy użyciu symulacji atomistycznych oraz eksperymentalnej analizy mikroskopowej, zbadano mechanizmy powstawania i ewolucji defektów radiacyjnych w stopach Fe-Ni-Cr. 

W pierwszej kolejności przeprowadzono symulacje nakładających się kaskad zderzeniowych (overlapping cascade), które odwzorowują efekty bombardowania materiału neutronami, umożliwiając analizę powstawania i ewolucji defektów radiacyjnych. Następnie zweryfikowano rodzaj i gęstość powstałych defektów metodami eksperymentalnymi. Próbki stopu FeNiCr poddano napromieniowaniu jonami Ni o wysokiej energii, wykorzystując akcelerator tandemowy. Powstałe w ten sposób defekty radiacyjne przeanalizowano za pomocą transmisyjnej mikroskopii elektronowej (TEM), co pozwoliło na ich identyfikację oraz ilościową charakterystykę. Analiza symulacji przeprowadzonych metodą Dynamiki Molekularnej wykazała, że defekty radiacyjne, zarówno pętle dyslokacyjne, jak i nanometryczne pustki, przyczyniają się do wzrostu umocnienia materiału, przy czym pustki stanowią znacznie silniejsze bariery dla ruchu dyslokacji. Zaobserwowano kluczowe mechanizmy, takie jak ścinanie pustek przez dyslokacje, ich zapadanie się do pętli dyslokacyjnych, a następnie zanikanie w wyniku interakcji z dyslokacjami. Procesy te prowadzą do złożonego sprzężenia między gęstością pustek i pętli dyslokacyjnych. W oparciu o te wyniki opracowano nowy model umocnienia radiacyjnego, uwzględniający efekty oddziaływań dyslokacji powstałych w wyniku deformacji plastycznej z defektami promieniowania.

Artykuł powstał we współpracy z IPPT i NCBJ.

Artykuł:

International Journal of Plasticity

Rok wydania:

Autorzy z PW:

Witold Chromiński

MXenes: Multifunctional Materials for the Smart Cities of Tomorrow

Obecnie ponad 60% światowej populacji mieszka w miastach. Życie w miastach niesie wiele korzyści, ale wiąże się również z wyzwaniami związanymi z koniecznością inteligentnej urbanizacji.

Nowa generacja projektowalnych dwuwymiarowych nanomateriałów, zwanych MXenami, stanowi kluczową technologię, która może wynieść współczesne podejście do urbanizacji na wyższy poziom, prowadząc do realizacji koncepcji inteligentnego miasta. Inteligentne miasto to nowatorski model oparty na samowystarczalnych technologiach, które są interaktywne i responsywne wobec potrzeb obywateli.

W niniejszym artykule omawiane są technologie oparte na MXenach, które mogą wspierać zrównoważony rozwój miast. Dzięki nim możliwe jest projektowanie samowystarczalnych, adaptacyjnych i inteligentnych budynków, które minimalizują zużycie zasobów i rozwiązują problemy związane z deficytem czystej energii, wody oraz powietrza.

MXeny mogą także rozwiązać problem obecnych ograniczeń technologicznych związanych z Internetem Rzeczy (IoT) i telemedycyną, ponieważ łączą różnorodne właściwości i umożliwiają wielofunkcyjność. Przewiduje się, że MXeny odegrają kluczową rolę w rozwoju inteligentnych miast. W związku z tym, przedstawiono ich potencjał i mapę drogową, która demonstruje praktyczne zastosowania MXenów w tym kontekście.

Podsumowując, badanie to promuje rolę MXenów w poprawie jakości życia mieszkańców miast, podnosząc standardy urbanizacji do nowego poziomu.

Artykuł:

Advanced Functional Materials

Rok wydania:

Autorzy z PW:

Agnieszka Jastrzębska, Muhammad Abiyyu Kenichi Purbayanto, Kacper Skarżyński, Marcin Słoma

Microfluidic system for generating a three-dimensional (3D) vascularized islet-on-a-chip model

Cukrzyca to choroba związana z niewydolnością endokrynnej części trzustki, składającej się głównie z wysp trzustkowych. Obecnie cukrzyca jest uważana za najszybciej rozwijającą się chorobę cywilizacyjną. Na całym świecie ponad 440 milionów ludzi cierpi na cukrzycę, a szacuje się, że do 2045 roku liczba ta wzrośnie do 700 milionów. Wyspy trzustkowe to złożone, silnie unaczynione mini-narządy, a jedynie opracowanie w pełni funkcjonalnego, unaczynionego modelu wyspy trzustkowej może przyczynić się do postępu w wiedzy na temat rozwoju cukrzycy, nowych strategii terapeutycznych oraz generowania wysp do zastosowań w medycynie regeneracyjnej.

Dlatego głównym celem naszego badania było opracowanie mikroprzepływowego systemu do jednoczesnej hodowli dwóch trójwymiarowych (3D) modeli badawczych. Urządzenie przedstawione w niniejszym artykule zostało wykorzystane do jednoczesnej hodowli modelu naczynia krwionośnego, składającego się z komórek śródbłonka (HUVEC), opracowanego przy użyciu techniki Viscous Finger Patterning (VFP), oraz modelu wyspy trzustkowej, który został opracowany w wyniku współhodowli komórek α i β.

Podczas badań zoptymalizowano metodę produkcji urządzenia, w tym celu porównano najprecyzyjniejszą technikę mikrofrezowania z metodą szybkiego prototypowania – drukiem 3D. Przestrzenne rozmieszczenie komórek w opracowanych modelach, ich morfologia i żywotność zostały zwizualizowane za pomocą barwienia fluorescencyjnego oraz analizy mikroskopii konfokalnej. Niniejszy artykuł przedstawia badania wstępne dotyczące opracowania długoterminowej hodowli złożonego modelu imitującego połączenie mikrokrążenia z wyspą trzustkową, który w przyszłości może posłużyć do opracowania nowych strategii terapeutycznych lub generowania w pełni funkcjonalnych wysp trzustkowych.

Artykuł:

Sensors and Actuators B - Chemical

Rok wydania:

Autorzy z PW:

Patrycja Baranowska, Zbigniew Brzózka, Elżbieta Jastrzębska, Dominik Kołodziejek

Ag-In-Zn-S alloyed nanocrystals as photocatalysts of controlled light-mediated radical polymerization

Przedstawiamy pierwsze zastosowanie niestechiometrycznych nanokryształów stopowych Ag–In–Zn–S jako fotoinicjatorów i fotokatalizatorów kontrolowanej polimeryzacji metakrylanu metylu (MMA).
 
Przetestowano dwa typy nanokryształów, różniące się składem i charakteryzujące się czerwoną oraz zieloną fotoluminescencją.
 
Wykorzystując ich właściwości redukcyjne oraz zdolność do generowania wolnych rodników, wykazaliśmy, że pod wpływem światła UV skutecznie inicjują rodnikową polimeryzację MMA, natomiast w świetle widzialnym (niebieskim lub zielonym) pełnią funkcję fotokatalizatorów kontrolowanej polimeryzacji rodnikowej.

Artykuł:

Chemical Communications

Rok wydania:

Autorzy z PW:

Piotr Bujak, Anna Iuliano, Adam Proń, Ireneusz Wielgus

Dyscyplina: