Badania naukowe mogą wkrótce ulec zasadniczym zmianom – sztuczna inteligencja okazała się niedoścignionym narzędziem człowieka do analizy niewyobrażalnych tomów literatury specjalistycznej. W eksperymencie sztuczna inteligencja była w stanie dokładniej ocenić fałszywe i prawdziwe odkrycia naukowe niż ludzcy eksperci. Ułatwi to ludziom badania naukowe, umożliwiając maszynom przesiewanie ton surowych informacji w poszukiwaniu obiecujących kierunków.
Od samego początku twórcy generatywnej sztucznej inteligencji (ChatGPT i inni) skupiali się na zdolności dużych modeli językowych (LLM) do odpowiadania na pytania poprzez podsumowanie ogromnych danych, na których się szkolili. Naukowcy z University College London (UCL) postawili sobie inny cel. Zastanawiali się, czy LLM mogą syntetyzować wiedzę – wydobywać wzorce z literatury naukowej i wykorzystywać je do analizy nowych artykułów naukowych? Doświadczenie pokazuje, że sztuczna inteligencja jest w stanie przewyższyć ludzi w dokładności oceniania recenzowanych artykułów.
„Postęp naukowy często opiera się na próbach i błędach, ale każdy dokładny eksperyment wymaga czasu i zasobów. Nawet najbardziej doświadczeni badacze mogą przeoczyć ważne wnioski z literatury. W naszej pracy badamy, czy LLM potrafią identyfikować wzorce w dużych tekstach naukowych i przewidywać wyniki eksperymentów” – wyjaśniają autorzy pracy. Nietrudno sobie wyobrazić, że poddanie sztucznej inteligencji procesowi recenzji wykracza daleko poza zwykłe odkrywanie wiedzy. Może to okazać się przełomem we wszystkich obszarach nauki, oszczędzając czas i pieniądze naukowców.
Eksperyment opierał się na analizie pakietu prac naukowych z zakresu neurobiologii, ale można go rozszerzyć na dowolną dziedzinę nauki. Badacze przygotowali wiele par abstraktów, składających się z jednej prawdziwej pracy naukowej i jednej fałszywej – zawierającej wiarygodne, ale błędne wyniki i wnioski. Pary dokumentów zostały sprawdzone przez 15 ogólnych specjalistów LLM i 117 specjalnie wybranych ekspertów w dziedzinie neurologii ludzkiej. Wszyscy musieli oddzielić dzieła prawdziwe od fałszywych.
Wszystkie LLM osiągnęły lepsze wyniki niż neurobiolodzy, przy dokładności sztucznej inteligencji wynoszącej średnio 81% i dokładności ludzkiej wynoszącej średnio 63%. Kiedy najlepsi eksperci-ludzie analizowali dokumenty, dokładność wzrosła do 66%, ale nie była bliska dokładności sztucznej inteligencji. A kiedy LMM został specjalnie przeszkolony w oparciu o dane z neuronauki, dokładność przewidywań wzrosła do 86%. Naukowcy twierdzą, że odkrycie toruje drogę w przyszłość, w której eksperci-ludzi będą mogli współpracować z dobrze skalibrowanymi modelami.
Wykonane prace pokazują również, że większość nowych odkryć nie jest wcale nowa. AI doskonale ujawnia tę cechę we współczesnej nauce. Dzięki nowemu narzędziu naukowcy będą przynajmniej wiedzieć, czy wybrany przez nich obszar badań jest warty kontynuowania i czy łatwiej jest szukać jego wyników w Internecie.