Opublikowano: 09.10.2024 08:30
Dlaczego fizyk dostał Nobla za sieci neuronowe? Czego uczy nas ta nagroda?
Dr hab. inż. Julian Sienkiewicz i dr inż. Tomasz Gradowski z Wydziału Fizyki oraz prof. Przemysław Biecek z Wydziału Matematyki i Nauk Informacyjnych komentują przyznanie Nagrody Nobla z fizyki.
Dlaczego fizyk dostał Nobla za sieci neuronowe?
Komentarz dr. hab. inż. Juliana Sienkiewicza i dr. inż. Tomasza Gradowskiego z Wydziału Fizyki
Wiele osób mogło z zaskoczeniem przyjąć werdykt Komitetu Noblowskiego, przyznający nagrodę z fizyki Johnowi Hopfieldowi oraz Geoffrey’owi Hintonowi za „fundamentalne odkrycia i wynalazki, które umożliwiają uczenie maszynowe za pomocą sztucznych sieci neuronowych”. O ile wybór Hintona – który uzyskał doktorat z informatyki i dzięki pracom na temat propagacji wstecznej w wielowarstwowych sieciach neuronowych jest powszechnie uważany za ojca chrzestnego AI – nie dziwi, o tyle nagroda dla Hopfielda, który jest fizykiem, może już wzbudzać zdumienie.
Jednak to właśnie John Hopfield, publikując w 1982 w prestiżowym czasopiśmie PNAS pracę Neural networks and physical systems with emergent collective computational abilities, pokazał, że opis jednowarstwowej sieci neuronowej jest identyczny z tym, który zaproponowano dla tzw. szkła spinowego. Szkło spinowe, opisane w 1975 roku przez Davida Sherringotna oraz Scotta Kirkpatricka, a następnie badane m.in. przez Giorgio Parisiego (noblistę z fizyki z 2021 roku), to układ, charakteryzujący się brakiem wypadkowego momentu magnetycznego, ale wykazujący lokalne uporządkowanie spinów. Jego korzenie sięgają słynnego modelu Isinga, a opis teoretyczny to klasyczny przykład zastosowania fizyki statystycznej.
Hopfield pokazał, że zaproponowana przez niego sieć neuronowa, symulująca pamięć asocjacyjną, mimo swojej prostej struktury, jest w stanie zapamiętywać i przechowywać wzorce, wykorzystując kolektywne oddziaływanie pomiędzy neuronami. Praca ta to jeden z kamieni milowych rozwoju koncepcji rekurencyjnych sieci neuronowych, których zastosowanie znajdziemy m.in. w rozpoznawaniu pisma czy mowy, a także w przetwarzaniu języka naturalnego.
Historia zatacza koło: dziś sieci neuronowe są jednym z wielu narzędzi uczenia maszynowego standardowo wykorzystywanych w fizyce, w tym również na Wydziale Fizyki PW – począwszy od identyfikacji cząstek elementarnych, poprzez projektowanie dyfrakcyjnych elementów optycznych, badanie przestrzeni międzyziarnowej w elektrolitach stałych, a na przewidywaniu możliwych połączeń w sieciach społecznościowych skończywszy.
Mimo ponad 40 lat, które minęły od momentu opublikowania pracy Hopfielda, sprzężenie zwrotne pomiędzy fizyką a informatyką trwa dalej. Okazuje się, że bezpośrednie zastosowanie sieci neuronowych do opisu problemów fizycznych może przynosić błędne wyniki w przypadku niewystarczających danych treningowych. Jednak ostatnie lata pokazują, że dzięki koncepcji PINN (Physics-Informed Neural Networks), opierającej się na uwzględnieniu podstawowych zasad fizycznych w funkcji kosztu sieci neuronowych, możliwe jest obecnie wykorzystanie tych algorytmów do otrzymania poprawnych rozwiązań problemów fizycznych.
Czego uczy nas tegoroczna Nagroda Nobla z fizyki?
Komentarz prof. Przemysława Biecka z Wydziału Matematyki i Nauk Informacyjnych
Sztuczna inteligencja coraz częściej pojawia się w rozmaitych sytuacjach, stając się integralną częścią naszego życia. Kwestią czasu było, kiedy jej wpływ zostanie dostrzeżony również w kontekście Nagrody Nobla. Ten moment nadszedł w październiku 2024 roku, gdy Nagrodę Nobla z fizyki otrzymali John Hopfield oraz Geoffrey Hinton.
Ten wybór wzbudził kontrowersje, szczególnie ze względu na postać Hintona. Dlaczego? Hinton nie jest „typowym fizykiem”. Na jednej z konferencji wprowadzono go słowami: „Nie zdał fizyki, porzucił psychologię, a następnie dołączył do dziedziny bez ustalonych standardów: sztucznej inteligencji”.
Nie dość, że nie jest fizykiem, to jego główne osiągnięcie – maszyny Boltzmanna – nie dotyczy odkryć w fizyce cząstek elementarnych ani ciała stałego. To raczej informatyczny algorytm inspirowany fizyką, który służy do rozpoznawania nowych wzorców w danych.
Dodatkowo, jego przełomowa praca nie została opublikowana w prestiżowym czasopiśmie fizycznym, ale w „Cognitive Science”, czasopiśmie wycenianym w Polsce na 100 punktów (co odpowiada „dostatecznej” ocenie w skali szkolnej), które przez MNiSW nie jest nawet przypisane do nauk fizycznych.
Co więc się wydarzyło? Czy Komitet Noblowski, zafascynowany szumem wokół sztucznej inteligencji, postanowił podążać za duchem czasu? A może podziały na dyscypliny naukowe i troska o „czystość” matematyki, fizyki i informatyki to już przeszłość? Może prawdziwe odkrycia, te, które naprawdę zmieniają nasz świat, kryją się na pograniczu dyscyplin, daleko od akademickich wież z kości słoniowej?
Nauka w Polsce przeżywa głęboki kryzys, zarówno tożsamościowy (po co istnieje), jak i finansowy (brak wystarczającego wsparcia na badania naukowe). Cieszymy się z polskich korzeni, naukowców, którzy zmieniają świat. Ale nie tworzymy środowiska, by takie odkrycia powstawały na polskich uczelniach.
Tegoroczna Nagroda Nobla z fizyki nauczyła mnie dwóch prostych prawd: inwestycja w badania podstawowe się opłaca i może w nieoczywisty sposób prowadzić do przełomowych technologii, takich jaką z pewnością jest sztuczna inteligencja. Praca w silosach dyscyplin naukowych i strach przed przekraczaniem ich granic to ograniczenia, z którymi musimy walczyć.
Niech żyje interdyscyplinarność. Niech żyje rozwój. Niech żyje fizyka!
Podobne tematy: