Co eksperci z innych dziedzin powinni wiedzieć o nauce o danych opartej na sztucznej inteligencji. Zachęcamy do zapoznania się z spostrzeżeniami prof. Michaela L. Brodie opartymi na dyskusjach ze światowymi liderami w wielu dziedzin podczas Kongresu Futurist of the Year SGMK. Artykuł został opublikowany na LinkedIn oraz Medium.
1. Naiwne pytania światowej klasy myślicieli
Podczas kongresu Futurist of the Year 2024, który odbył się w dniach 9-11 kwietnia 2024 r. w Polsce, odbyłem wiele stymulujących intelektualnie rozmów ze światowymi liderami różnych dziedzin, m.in. astrofizykiem uhonorowanym nagrodą Nobla, profesorami filozofii nauki z Wiednia i Oksfordu oraz etykami z dziedzin pragmatycznych, takich jak technologia i biznes. Przedstawiłem obecny stan nauki o danych opartej na sztucznej inteligencji, częściowo podsumowany w tym tekście. Ci błyskotliwi naukowcy i praktycy zadawali liczne pytania, które pokornie określali jako „naiwne”. Ich pytania były genialne z punktu widzenia paradygmatu matematyczno-naukowego – jak mieliby zapytać inaczej? „Czy to się opiera na indukcji?”, „Jaką to się rządzi logiką?” – choć naiwne z perspektywy data science opartej na sztucznej inteligencji, są to bardzo rozsądne pytania zadawane przez cały świat, który nie rozpoczął jeszcze zmiany paradygmatu – Rewolucji AI, która przerośnie rewolucję naukową i przemysłową i będzie trwać dekadę lub całe stulecie. To właśnie stanowiło inspirację do napisania poniższego tekstu, który jest przeznaczony dla osób niebędących ekspertami w dziedzinie sztucznej inteligencji.
Spróbujmy zatem głębiej zbadać ten temat, omawiając kilka kluczowych zagadnień i koncepcji, które intrygują mnie do dziś, nawet po całej dekadzie przeprowadzonych badań.
2. Kontekst – wizjonerski kongres
Ten wizjonerski kongres był zupełnie inny od wszystkich poprzednich w mojej karierze. Był to niezwykle stymulujący intelektualnie tydzień. Jego pomysłodawcą jest Piotr Turek, Rektor Szkoły Głównej Mikołaja Kopernika – nowego polskiego uniwersytetu, który Rektor Turek tworzy od podstaw. Kongres odzwierciedlał rodzącą się wizję nowoczesnej uczelni, która będzie się zajmować najbardziej znaczącymi dziedzinami i zagadnieniami naszych czasów, wykorzystując współpracę i multidyscyplinarność. Na szczęście dla mnie, Kongres był zdominowany przez moją pasję, sztuczną inteligencję (AI). Przebywanie w towarzystwie trzydziestu czołowych światowych myślicieli i futurologów, w tym Didiera Queloza, laureata Nagrody Nobla w dziedzinie fizyki, Johna Tasioulasa (Uniwersytet Oxfordzki) i Marka Coeckelbergha (Uniwersytet Wiedeński), profesorów odpowiednio filozofii etyki i prawa oraz technologii i sztucznej inteligencji; Dorothei Baur, etyczki biznesu i Marka Esposito (Uniwersytet Harvarda), zajmującego się tematem Czwartej Rewolucji Przemysłowej, było szalenie ekscytujące. Wszystkie prezentacje były inspirujące i prowokujące do myślenia, niektóre nawet szokujące. Chociaż byłem jedynym prelegentem z dziedziny sztucznej inteligencji, każdy mówca spekulował na temat wpływu AI na swoją dyscyplinę. Nasze prywatne dyskusje rodziły wiele nowych przemyśleń.
3. Moje wystąpienia
Wygłosiłem dwa wystąpienia: „Rewolucja AI zmienia świat: filozofia, siła i ograniczenia nauki o danych opartej na sztucznej inteligencji” (prelekcja),wyjaśniający naturę sztucznej inteligencji, która przykuwa uwagę świata [4] i jej wartość [3] oraz „Rewolucja AI skoncentrowana na danych: Struktura rozwiązywania problemów w nauce o danych opartej na sztucznej inteligencji” (prelekcja, artykuł[2]), który wykorzystuje trochę technicznego żargonu, aby wyjaśnić rozwiązywanie problemów oparte na sztucznej inteligencji i jej zagadkowość. Moje przesłanie było następujące: nauka o danych oparta na AI jest znacznie potężniejsza niż nauka, nasz najsilniejszy paradygmat pozyskiwania wiedzy, który funkcjonuje od ponad czterystu lat. Data science oparta na sztucznej inteligencji zmieni każdą dyscyplinę i przedsięwzięcie bogate w dane, a tym samym – nasz świat. Może ona być wykorzystywana w zgodzie z pozytywnymi wartościami ludzkimi, ale także w celu zniszczenia – tak, nawet społeczeństwa i naszej planety.
Kongres był dla mnie okazją, by spróbować wyjaśnić ekspertom spoza dziedziny sztucznej inteligencji ową technologię, która przykuwa uwagę całego świata. Nie udało mi się. Po dziesięcioleciach badań nad tym nowym paradygmatem zdobywania wiedzy, jego istota nadal pozostaje nieprzenikniona zarówno dla mnie jak i moich kolegów dziedziny z AI. Świat znajduje się na początku Rewolucji AI, która będzie wynikiem zmiany paradygmatu matematyczno-naukowego na paradygmat nauki o danych. Eksperci AI właśnie rozpoczęli ten proces, który może potrwać dziesięciolecia lub nawet całe stulecie, przy czym nauka o danych może nadal pozostać enigmatyczna. Podczas kongresu czołowi światowi intelektualiści zadawali pytania, które nazywali „naiwnymi”. Nie były one naiwne. Dla tych genialnych ludzi, podobnie jak dla większości świata, paradygmat matematyczno-naukowy jest podstawą zrozumienia; a zatem pytanie „Czy to indukcja?” jest bardzo sensowne. Tylko, że eksperci od nauki o danych nie znają na nie odpowiedzi. Mogę więc jedynie mieć nadzieję, że moje wystąpienie sprowokowało słuchaczy do rozpoczęcia tej zmiany paradygmatu, która zdominuje przyszłość ludzkiego rozumowania.
4. Czego się nauczyłem
Po blisko dekadzie badań i publikacji w dziedzinie nauki o danych opartej na sztucznej inteligencji, nadal mam przed sobą długą drogę, aby ją zrozumieć, nie tylko jej nieuchwytność, ale też cały paradygmat pozyskiwania wiedzy. Z przyjemnością mogę powiedzieć, że rozmowy ze światowej klasy ekspertami z wielu dziedzin podczas tego kongresu pomogły mi uświadomić sobie, jak mało wiem. Spróbuję tu opowiedzieć o tym, czego się nauczyłem.
4.1 Narodziny zmiany paradygmatu z matematyczno-naukowego na paradygmat nauki o danych.
Większość wykształconych osób posiada zestaw pojęć (tj. ontologię), leżących u podstaw ich wiedzy i przekonań, częściowo opartych na metodach ich poznania (tj. epistemologii), który pozwala im rozumieć świat i rozważać na jego temat. Zapewnia to wspólną społeczną podstawę dla wzajemnego zrozumienia, komunikacji i dialogu. Ze względu na znaczenie matematyki i nauk ścisłych w edukacji, ten paradygmat matematyczno-naukowy jest podzielany przez większość osób, w tym nie-naukowców i nie-matematyków. Stanowi on podstawę naszego sposobu myślenia. Nauka o danych oparta na sztucznej inteligencji to nowy paradygmat, który przyciągnął uwagę świata w 2022 roku wraz z uruchomieniem ChatGPT OpenAI. Dla większości ludzi ChatGPT wydaje się „inteligentny”, przechodząc w ten sposób test Alana Turinga, który od 1950 roku określał, kiedy inteligencja maszynowa (obliczeniowa) staje się równa inteligencji ludzkiej. Genialny Alan Turing przewidział świat komputerów, którego wyobrażenie sobie zajęło reszcie świata dziesięciolecia, nie mówiąc już o jego zrozumieniu. Jak więc ludzie żyjący w paradygmacie matematyczno-naukowym rozumieją ChatGPT – czym jest i do czego jest zdolny? Tylko niektórzy eksperci od sztucznej inteligencji i inne nieliczne osoby rozumieją, że ChatGPT jest zastosowaniem nowej technologii data science opartej na sztucznej inteligencji, która jest nowatorskim paradygmatem, zasadniczo różniącym się od paradygmatu matematyczno-naukowego. Eksperci ci wiedzą, że nauka o danych oparta na sztucznej inteligencji jest enigmatyczna tj. nikt nie wie, jak działa, nie mówiąc już o naturze wyników, które generuje. Dlatego też większość ludzi na świecie nie rozpoczęła jeszcze tej trudnej zmiany paradygmatu.
4.2 Czym jest paradygmat danych oparty na sztucznej inteligencji?
Filozofią paradygmatu data science opartej na sztucznej inteligencji1 jest uczenie się na podstawie danych. Dokładniej mówiąc, pozyskuje ona wiedzę z dużych zbiorów danych za pomocą metod obliczeniowych opartych na sztucznej inteligencji. Takie duże zbiory danych reprezentują tylko niektóre cechy subpopulacji zjawiska fizycznego lub abstrakcyjnego. Analiza ta jest możliwa, pod warunkiem, że: 1) istnieją odpowiednie dane treningowe reprezentujące właściwości kluczowe dla zamierzonej analizy; 2) metoda treningowa oparta na sztucznej inteligencji jest w stanie umożliwić modelowi nauczenie się tego, co jest potrzebne do zamierzonej analizy, 3) zbiór danych do analizy – „nie widziany” wcześniej, nowy zbiór danych wejściowych – zawiera dane adekwatne (cechy i subpopulacja) do zamierzonej analizy oraz 4) wyszkolony model – wynik szkolenia – przeprowadza zamierzoną analizę, pozyskując wiedzę. Dla takich zbiorów danych treningowych i danych wejściowych istnieją setki metod analitycznych, z których każda używa innej perspektywy do przeprowadzania procesu wnioskowania. Która z nich jest prawdziwa? A co ważniejsze, czym jest prawda w takim paradygmacie? Może się to wydawać złożoną definicją paradygmatu nauki o danych, ale zaledwie dotknęliśmy tutaj tego tematu. ChatGPT jest wczesnym przykładem jednego typu zastosowań data science opartej na sztucznej inteligencji; obecnie istnieją tysiące innych, a miliony nie zostały nawet jeszcze odkryte.
4.3 Paradygmat matematyczno – naukowy i paradygmat nauki o danych różnią się zasadniczo
W przeciwieństwie do nauki, która stosuje ilościową, obiektywną analizę fizycznie mierzalnych zjawisk w celu uzyskania ostatecznych wyników, które są nie tylko pewne, ale także uniwersalne, pomimo przeciwnego stwierdzenia Davida Hume’a z XVIII wieku. Data science oparta na sztucznej inteligencji daje wyniki, które są niepewne, prawdopodobnie probabilistyczne2 i potencjalnie błędne. Paradygmat nauki o danych opartej na AI znacznie przewyższa naukę pod względem zakresu, skali, złożoności, realizmu, elastyczności i mocy[4][3][2]. W rezultacie nauka o danych oparta na sztucznej inteligencji zaowocuje pozyskaniem znacznie większej ilości wiedzy niż ta, którą pozyskano w 2500-letniej historii nauki od czasów Talesa (626-548 p.n.e.). Dlatego też, data science oparta na AI wyznacza niezwykły czas w historii ludzkiego rozumowania i zdobywania wiedzy, o czym opowiem w kolejnych podpunktach.
Podczas gdy paradygmat nauki o danych oparty na sztucznej inteligencji jest nieuchwytny, ma on wiele aspektów, które w pełni rozumiemy i w których jest podobny od paradygmatu matematyczno-naukowego, w większości jednak, jest od niego znacząco odmienny. Podobieństwa, które powodują, że ludzie mylą te dwa paradygmaty, polegają na tym, że oba są paradygmatami pozyskiwania wiedzy wykorzystywanymi do zdobywania wiedzy, rozwiązywania problemów i tworzenia prognoz. Fundamentalne różnice są jednak bardziej zasadnicze i złożone.
4.4 Nauka o danych oparta na sztucznej inteligencji znacznie przewyższa matematykę
Ze względu na radykalne różnice między matematyką a nauką o danych opartą na sztucznej inteligencji i jej potencjałem, zmiana paradygmatu będzie bardzo głęboka tj. przekształci sposób ludzkiego rozumowania i wiedzę, osiągając w tym samym rangę rewolucji – Rewolucji AI. Rewolucja AI przewyższy rewolucje naukowe i przemysłowe pod względem wielkości wpływu, jaki wywrze na świat. Poprzednie rewolucje fundamentalnie zmieniły świat, definiując współczesność. Trwały od 200 do 400 lat. Rewolucja AI jest jeszcze w powijakach a już ma za sobą 40 lat niesamowitych osiągnięć, które zmieniły świat, np. rozwiązania dotyczące problemu fałdowania białek (AlphaFold[7]), czy wczesnego wykrywania raka[9]. Takie rozwiązania, znalezione w ciągu godzin lub dni obliczeń w porównaniu z dziesięcioleciami, które zajmowało to nauce, są osiągalne tylko dzięki data science opartej na sztucznej inteligencji. Ponieważ znajdujemy się dopiero u progu Rewolucji AI, niemożliwe jest dokładne oszacowanie jej wpływu, wiemy jedynie, że znacznie przewyższy on wpływ nauki.
4.5 Zakres nauki o danych opartej na sztucznej inteligencji
Nauka o danych oparta na sztucznej inteligencji ma zastosowanie w każdej dziedzinie, która posiada dane odpowiednie do analizy związanych z nią problemów. Dotyczy to nie tylko samych działań generujących takie dane, ale także ich planowania, zarządzania nimi i ich całościowej ewaluacji. Ze względu na właściwości data science opartej na AI, znajduje ona zastosowanie w każdej działalności, w każdym biznesie, w każdym obszarze wyzwań. Podobnie jak ponad dekadę temu w biologii, kiedy ta przekształciła się w bioinformatykę, zagadnienia się nie zmieniły, zmieniły się metody badawczo-poznawcze. Medycyna i farmaceutyka również rozwijają się w kierunku medycyny obliczeniowej oraz obliczeniowego odkrywania i opracowywania leków.
5. Zmiany paradygmatów i rewolucje
Aby zrozumieć paradygmat nauki o danych opartej na sztucznej inteligencji – jego charakter i siłę – należy odłożyć na bok paradygmat matematyczno-naukowy i podążać za zmianą. To ogromne wyzwanie dla wszystkich, w tym także dla wielu czołowych myślicieli, którzy zainspirowali powstanie tego tekstu.
Paradygmat to koncepcja na tyle potężna, że stanowi podstawę całego sposobu rozumowania, np. produkcja oparta na pracy fizycznej na skalę lokalną zdeterminowała większą część historii ludzkości. Zmiana paradygmatu pojawia się, gdy wyłania się nowy paradygmat umożliwiający znacznej części populacji zupełnie nowy sposób rozumowania, np. produkcja na skalę przemysłową, oparta na pracy zautomatyzowanej. Kiedy zmiana paradygmatu jest znacząca, tak jak w przypadku rewolucji przemysłowej i naszego przykładu ze sztuczną inteligencją, nazywa się ją rewolucją. Takie rewolucje zaczynają się niepozornie, od koncepcji innowatora, np. od silnika parowego Whitneya. Jednakże rewolucja wymaga zrozumienia zmiany paradygmatu, znalezienia możliwości jego zastosowań itp. Rewolucja przemysłowa i naukowa trwały od 200 do 400 lat. Drugą charakterystyczną cechą rewolucji jest jej wpływ, np. rewolucja przemysłowa nie tylko umożliwiła zautomatyzowaną produkcję towarów, ale także przekształciła społeczeństwo. Rewolucje naukowe spowodowały, że ludzkie odkrycia i płynąca z nich wiedza stała się podstawą nowoczesnego społeczeństwa.
5.1 Rewolucja AI dopiero się rodzi.
Pomimo fenomenalnych osiągnięć nauki o danych opartej na sztucznej inteligencji, rewolucja AI dopiero się rozpoczęła. Nikt nie dokonał jeszcze zmiany paradygmatu, ponieważ nauka o danych oparta na sztucznej inteligencji jest zarówno nowatorska, jak i enigmatyczna. Nawet eksperci w dziedzinie sztucznej inteligencji będą potrzebować dziesięcioleci, aby odpowiednio ją zrozumieć i zastosować w sposób solidny i bezpieczny. Jak dotąd, tylko kilka milionów ludzi3, głównie badaczy zajmujących się nauką o danych opartą na sztucznej inteligencji, weszło w proces tej zmiany. W związku z tym większość świata, np. entuzjaści ChatGPT, nieuchronnie pojmują ChatGPT z perspektywy paradygmatu matematyczno-naukowego, co jest podejściem błędnym, ponieważ są one diametralnie różne.
5.2 Miną dziesięciolecia lub nawet całe stulecie, zanim nauka o danych oparta na sztucznej inteligencji dojrzeje i zostanie prawidłowo wdrożona.
Podobnie jak w przypadku poprzednich znaczących zmian paradygmatu, przejście od myślenia naukowego do myślenia opartego na data science zajmie dużo czasu, może jakieś niecałe 200 lat. Po pierwsze, data scence oparta na sztucznej inteligencji jest dziś i być może na zawsze pozostanie nieodgadniona. Nikt nie wie, jak i czego uczy się ona podczas treningu, jak i co wnioskuje podczas (tak zwanego) wnioskowania, jak przebiega jej proces wnioskowania ani jak interpretować jego wyniki w kontekście wyjściowego problemu dziedzinowego. Po drugie, w rezultacie nie możemy udowodnić ani żadnych właściwości rozwiązania użytego przez data science do wygenerowania wyniku, ani tegoż wyniku. Wiemy, że wyniki te mogą być fałszywe (tak zwane „halucynacje). Ale w tym tkwi jednocześnie niezgłębiona potęga nauki o danych – w jej zdolności do uogólniania na podstawie danych treningowych i przypadków zjawisk reprezentowanych w danych wyjściowych.
Zmiana paradygmatu wymaga, by cały świat, a nie tylko eksperci od sztucznej inteligencji, zaakceptował nowy paradygmat, zrozumiał go, rozumował za jego pomocą i stosował go do rozwiązywania problemów, a także by stał się on naszą drugą naturą, tak jak dziś jest nią matematyka. Przejście od matematyki do rozumowania opartego na nauce o danych wiąże się z wieloma wyzwaniami, jak ma to miejsce w przypadku większości zmian paradygmatu, ale także ze szczególnym wyzwaniem związanym z nieuchwytnością. Rozumowanie oparte na sztucznej inteligencji wymaga porzucenia rozumowania matematycznego, które na ile nam wiadomo, nie znajduje tu zastosowania, w celu przyjęcia i zastosowania rozumowania opartego na sztucznej inteligencji. Musi być ono jednak połączone z rozumowaniem matematyczno-naukowym, aby możliwe było określenie wyjściowego problemu dziedzinowego, interpretacja wyników w kontekście tego problemu oraz udowodnienie wszelkich właściwości tych wyników poza obszarem data science.
Większość nieporozumień związanych z nauką o danych opartej na sztucznej inteligencji wynika z prób niewłaściwego zastosowania nauk matematycznych, dla których zwyczajnie nie ma miejsca w data science opartej na AI. Wyobraźmy sobie czołowych światowych naukowców, matematyków, nie mówiąc już o wszystkich wykształconych ludziach, którzy przez całe życie polegali na paradygmacie matematyczno-naukowym, odkładających go na bok, aby zrozumieć i zastosować naukę o danych opartą na AI. Kończy się to najczęściej próbą zastosowania logiki typowej dla zachodnich myślicieli, która uniemożliwia jednak rozumowanie oparte na data science. Było to dla mnie nieznane i niewygodne doświadczenie. Po wielu latach praktyki stwierdzam, że mam jeszcze wiele do zrobienia. Nauka o danych wzbogaca ludzkie rozumowanie o niezwykły, nowy paradygmat zdobywania wiedzy, równolegle funkcjonujący bratni paradygmat, który nie zastępuje nauki, tylko ją uzupełnia.
6. Konsekwencje nauki o danych opartej na sztucznej inteligencji
6.1 Nauka jest sztuczna i dotyczy tylko niewielkiej części wszechświata.
To stwierdzenie w ustach naukowca, może się wydawać pogwałceniem jego pierwotnych przekonań. Spostrzeżenia te poczyniłem, gdy zacząłem zmieniać paradygmat, co sprawiło, że spojrzałem na naukę z nowego punktu widzenia. Ciekaw jestem, czy ta nowa perspektywa wyda się Wam prawdziwa.
Moje rozumienie nauki o danych opartej na sztucznej inteligencji opiera się na twierdzeniu, że jest ona znacznie potężniejsza od nauki ze względu na swój niezmierzony zakres, skalę, złożoność, realizm, elastyczność i moc[2][3][4]. Co więcej, wszystkie rozwiązania i wyniki są niepewne, prawdopodobnie probabilistyczne, niemożliwe do udowodnienia i prawdopodobnie błędne, tzn. są halucynacją. Stoi to w ostrym kontraście z nauką, która jest ostateczna, pewna i nie tylko możliwa do udowodnienia, ale także uniwersalna. Wyjątkiem od tej reguły są eksperymenty naturalne, w których akurat niekontrolowany kontekst empiryczny jest zgodny z założeniami metody naukowej. Z moich osobistych doświadczeń wynika, że podczas gdy niektóre aspekty świata są podobne do nauki, większość świata jest podobna do danych naukowych – niepewna, probabilistyczna, nie do udowodnienia i niepoprawna – prawdopodobnie błędnie postrzegana lub wymagająca ponownego zdefiniowania. W związku z tym, nasunęło mi się następujące spostrzeżenie: nauka to trwający od dwóch i pół tysiąca lat wysiłek człowieka, by zdefiniować świat jako pewny i możliwy do udowodnienia, tj. możliwy do kontrolowania. Ja jednak wierzę, że rzeczywistość – wszechświat – jest niepewna, rzadko możliwa do udowodnienia, a zatem w dużej mierze niekontrolowana. Istotne przesłanki lub pytania naukowe to tylko te, które można ocenić w odniesieniu do fizycznie mierzalnych zjawisk, które można poddać ścisłej metodzie naukowej. Nie wątpię w prawdziwość wiedzy naukowej, ale zauważam, że jest to niewielki wycinek naszego wszechświata ustanowiony z powodów psychologicznych4. Choć może się to wydawać szokujące. Pomyśl tylko, co to zapowiada – że istnieje zupełnie nowy sposób rozumowania, który otworzy przed nami nową rozległą dziedzinę prawdziwej, ale niepewnej wiedzy5. Będzie to przeciwwaga do sztucznych ograniczeń nakładanych na wiedzę przez naukę – nieskończenie większa i być może lepsza dziedzina lub prawdziwa wiedza. Każda ludzka koncepcja jest sztuczna, tj. wymyślona przez człowieka, ewentualnie inspirowana naturą. Nauka jest wykorzystywana do udowadniania, czy te sztuczne (ludzkie) koncepcje są prawdziwe (rzeczywiste) czy fałszywe. Po udowodnieniu naukowym, koncepcja jest uważana za zjawisko naturalne lub nawet prawo naturalne, mimo że została stworzona sztucznie w ludzkim mózgu.
6.2 Ponowne zrozumienie podstawowych ludzkich pojęć i przekonań
Rozważmy test Alana Turinga z 1950 roku, który zdefiniował inteligencję maszyn w kategoriach ludzkiej inteligencji. W listopadzie 2022 r. ChatGPT OpenAI przeszedł test Turinga, tj. inteligencja maszyny osiągnęła poziom inteligencji człowieka. Neurolodzy, naukowcy zajmujący się pracą mózgu i eksperci od sztucznej inteligencji są powszechnie zgodni co do tego, że duże modele językowe (LLM), które leżą u podstaw chatbotów, nie są inteligentne w żadnym sensie tego słowa[8]. Pokazuje to, że definicja inteligencji Turinga – ludzkiej lub maszynowej – jest nieadekwatna. Eksperci nie są zgodni co do definicji ludzkiej inteligencji, ale zgadzają się, że czymkolwiek by nie była, nie objawia się ona w LLM.
6.3 Czym są wiedza, uczenie się, rozumowanie?
Pojawienie się „inteligencji” LLM – czymkolwiek ona jest – skłoniło odpowiednich ekspertów do ponownego rozważenia podstawowych pojęć, takich jak wiedza, uczenie się, rozumowanie, pamięć, zapamiętywanie i wielu innych, które LLM wydają się naśladować i które są swobodnie używane do opisywania LLM. Mówi się, że sztuczne sieci neuronowe (ANN) są inspirowane pracą ludzkiego mózgu6. Zostały one wdrożone w oparciu o nasze rozumienie struktury i procesów ludzkiego rozumowania. ANN zostały wymyślone w 1943 roku, ale nie osiągnęły prawdziwej mocy aż do Alex Net w 2012 roku[1] kiedy wprowadzono rozszerzenie ANN o wiele poziomów, wsteczną propagację w celu trenowania tych poziomów, zwiększenie mocy obliczeniowej i danych na dużą skalę. Właściwości nauki o danych opartej na sztucznej inteligencji powodują, że odpowiedni eksperci – naukowcy zajmujący się mózgiem, neurolodzy, eksperci od sztucznej inteligencji – zmieniają obecne definicje powyższych terminów, ponieważ nie rozumieją w pełni biologicznych lub mechanicznych procesów ludzkiego rozumowania. Rozumieją podstawowe procesy mechaniczne, np. to że połączenia pomiędzy miliardami neuronów w mózgu tworzą sieć szlaków, po których poruszają się impulsy nerwowe, wiedzą także, że określone obszary mózgu są odpowiedzialne za określone funkcje, ale nie wiedzą jak dokładnie te struktury współpracują ze sobą. Czym zatem jest rozumowanie, odkrywanie wiedzy, innowacja, itp.? Nauka o danych w oczywisty sposób prowokuje nas do przemyślenia na nowo tych zagadnień.
6.4 Quo tendimus? Teo-, antropo- i dano-centryzm
Nauka o danych oparta na sztucznej inteligencji powoduje, że podstawowe koncepcje w wielu dziedzinach muszą zostać ponownie przemyślane. Proces ten może mieć ogromne znaczenie. Powstanie całkowicie nowych, znaczących koncepcji doprowadzało zazwyczaj do zmian paradygmatów, które przekształcały ludzkie rozumowanie, a tym samym nasze postrzeganie świata.W XVIII wieku, ludzkość dokonała zmiany paradygmatu z teocentrycznego na antropocentryczny. W XIX wieku, naukowcy porzucili antropocentryzm na rzecz nauki. Podczas gdy ja i wielu moich kolegów zajmujących się sztuczną inteligencją inspirujemy się nauką o danych opartą na sztucznej inteligencji, ona nadal pozostaje nieprzenikniona – jest enigmą, zmianą paradygmatu na dano-centryzm. Prowadzi to do niezwykłych filozoficznych przemyśleń na temat sposobu ludzkiego rozumowania i wiedzy, np. że ogromna ilość wiedzy naukowej nie jest uniwersalna, jak deklarowano w świecie teocentrycznym i potem częściowo w świecie antropocentrycznym, a już w świecie zorientowanym na dane staje się ona prawie całkowicie relatywistyczna. Jest pozbawiona ludzkich wartości, co rodzi fundamentalne pytania moralne, etyczne i filozoficzne postawione przez Yuvala Harariego w Homo Deus [5], który pyta, czy ludzkość porzuciła bogów (Deus), postrzega siebie jako bogów (Homo Deus), czy też, co bardziej ekstremalne, nieświadomie tworzy religię danych (tu, Harari zdaje się sprzeciwiać deifikacji danych i automatyzacji jako źródła wiedzy).
6.5 Korzyści i zagrożenia związane z nauka o danych opartą na sztucznej inteligencji
Niezmierzony zakres, skala, złożoność, realizm, elastyczność i potęga nauki o danych opartej na sztucznej inteligencji nie tylko stwarza znaczące wyzwania koncepcyjne i poznawcze, ale wymaga także ponownego przemyślenia wielu innych podstawowych pojęć i paradygmatów w ramach naszego zachodniego paradygmatu.
Ze względu na umiejętność pozyskiwania przez data science opartą na AI znacznie większej wiedzy niż było to możliwe w nauce, musimy ponownie przyjrzeć się zagadnieniom związanym z etyką, moralnością, prawami człowieka, rolą ludzi w społeczeństwie oraz rolą danych i obliczeń. Takie przemyślenia będą się pojawiać stopniowo, wraz z postępem procesu zmiany paradygmatu.
Strach przed przejęciem kontroli przez maszyny w świecie skoncentrowanym na danych, np. przed zastąpieniem całej ludzkiej pracy, jest realny, ale niewielki i ograniczony[5], podobnie jak w przypadku energii jądrowej. Czy damy sobie radę? Czy jesteśmy w stanie przeprowadzić ludzkość przez czasy autokracji i coraz bardziej wyniszczających, globalnych wojen – reliktów XIV i XV wieku? Sztuczna inteligencja jest doskonalona zarówno z myślą o działaniach destrukcyjnych jak i twórczych. Wojna w strefie Gazy oraz wojna ukraińsko-rosyjska stały się poligonami doświadczalnymi dla produktów i usług AI, podobnie jak hiszpańska wojna domowa przed II wojną światową. Z drugiej jednak strony, może nauka o danych oparta na sztucznej inteligencji może być stosowana zgodnie z pozytywnymi wartościami ludzkimi, aby stawić czoła zagrożeniom egzystencjalnym, takim jak zmiany klimatu? Jeśli sztuczna inteligencja może pozyskiwać wiedzę z ogromnych zbiorów danych, czy należy ponownie rozważyć kwestię prywatności i praw człowieka? Powszechna Deklaracja Praw Człowieka ONZ z 1948 r. jest ponownie analizowana z pomocą Rady Doradczej ONZ do spraw AI.
Jako wieloletni ekspert w dziedzinie sztucznej inteligencji nie miałem pojęcia, dokąd może doprowadzić ludzkość obecna zmiana paradygmatu. Martwię się o siebie, a jeszcze bardziej o moje dzieci i wnuki.
7 Futurist of the Year 2024
7.1 Szaleństwo popłaca
Kiedy po raz pierwszy zostałem zaproszony przez Piotra Turka, rektora Uniwersytetu Mikołaja Kopernika (SGMK) do udziału w tym kongresie, byłem jednocześnie zaintrygowany i pełen wątpliwości. Przez ponad 50 lat swojej kariery uczestniczyłem w różnych konferencjach naukowych i uważałem futuryzm za działalność prowokacyjną, być może rozrywkową, ale nie merytoryczną, z wyjątkiem działań kilku wybitnych osób – Marshalla McLuhana, z którym ukończyłem dwa kursy na Uniwersytecie w Toronto w 1972 roku, Alvina Tofflera, Nicoli Tesli i Raya Kurzweila. Kongres był pomysłem rektora. Skontaktował się ze mną osobiście, przedstawiając kuszącą perspektywę poznania światowych liderów wielu dziedzin, w tym sztucznej inteligencji, fizyki, filozofii, etyki oraz ich wpływu na świat. Propozycja była bardzo nęcąca. Miałem jednak także dodatkową motywację. Właśnie zakończyłem okres badań, opublikowanych w trzech artykułach[2][3][4]. Była to okazja do zaprezentowania wyników tych badań przed publicznością złożoną z rówieśników reprezentujących dziedziny niezwiązane ze sztuczną inteligencją. Była to okazja do podzielenia się wynikami mojej pracy z osobami spoza środowiska AI które, jak to opisałem powyżej, szukały odpowiedzi. Mam nadzieję, że w porównaniu do artykułów prasy codziennej, czy też treści zamieszczanych przez samozwańczych ekspertów AI, moje wypowiedzi były ściślej oparte na konkretnej wiedzy technologicznej. Biorąc pod uwagę, że prelegentami były osoby spoza branży AI, założyłem, że to raczej ja będę się dzielił swoją wiedzą z nimi. Jakże się myliłem. Nauczyłem się od nich więcej, niż oni ode mnie.
Futurist of the Year 2024 jest innowacyjną inicjatywą Rektora – zaprosić błyskotliwych ludzi, biorąc pod uwagę jedynie ich ogromną wiedzę specjalistyczną, a nie granice państwowe, czy też obecne stanowiska, na wydarzenie, które ma podkreślać, co będzie budować przyszłość tego uniwersytetu. Kongres skupiał się na zagadnieniach nowych technologii, z naciskiem na sztuczną inteligencję, edukację i finanse. Rektor zapewnił międzynarodowym ekspertom możliwość kontynuowania współpracy z uczelnią w charakterze rady doradczej. W przeszłości byłem zaangażowany w pięć podobnych rad. Przedstawiona przez Rektora wizja przyszłości uniwersytetu sprawiła, że udział w tej był dla mnie bardzo atrakcyjny.
7.2 Odniosłem znaczące korzyści.
Największa korzyścią z udziału w kongresie, było to, że zainspirował mnie do ponownego przemyślenia przyszłości i zdefiniowania moich koncepcji, wartości i kierunków, do czego sam zachęcałem innych w kontekście nauki o danych opartej na sztucznej inteligencji. Prawdziwie ekscytującym doświadczeniem były swobodne, ale gorące polemiki z prelegentami z innych dziedzin, przede wszystkim filozofii, nauki i etyki. Każdemu z nich bardzo bliskie były zagadnienia związane z data science opartej na AI, czym ona jest i jak można ją ponownie zrozumieć i zastosować. Jak już wspomniałem powyżej, wydaje się, że podstawowe koncepcje ze wszystkich tych dziedzin nie tylko bezpośrednio dotyczą nauki o danych opartej na AI, ale muszą zostać ponownie przemyślane właśnie ze względu na nią. Podsumowując, dawno już nie przeżyłem tak stymulującego intelektualnie tygodnia.
7.3 Jak rozwijać nowy, nowoczesny polski uniwersytet?
Rektor Szkoły Głównej Mikołaja Kopernika wraz ze swoimi współpracownikami i polskim rządem rozpoczynają ambitne i niezwykłe przedsięwzięcie – stworzenie nowego, nowoczesnego uniwersytetu, który zaspokoi współczesne potrzeby edukacyjne i badawcze, nie posiadając przy tym setek lat tradycji akademickiej. To bardzo imponujące założenia, jak na pierwszy rok działalności.
Działaj jak startup: Jak przy takich założeniach rozwijać nowe kursy, programy, wydziały, metody nauczania itp.? Z mojego doświadczenia wynika, że w tych podstawowych obszarach, większość uniwersytetów ma już swoją długą i cenną spuściznę. Ale jak powinny się one rozwijać, by pozostawać tętniącą życiem uczelnią, która umie dostosować swoje programy oraz metody nauczania do wymagań studentów i rynku, przy jednoczesnym uwzględnieniu najcenniejszej, najnowszej wiedzy? Jako przykład, mogę tu podać sztuczną inteligencję. Rozpoznawanie i generowanie obrazów i języków było jednymi z najbardziej rozwiniętych dziedzin sztucznej inteligencji, których metody rozwijane były przez pięćdziesiąt lub więcej lat. Do 2015 r. dziedzictwo to zostało całkowicie zastąpione metodami data science opartej na AI. W związku z tym, powiązane programy nauczania powinny zostać zmodyfikowane tak, by odzwierciedlały te postępy, nie tylko w zakresie jednego przedmiotu, ale wszystkich kierunków, np. w zakresie wymagań dotyczących teorii i praktyki oraz ich odpowiednich zastosowań zarówno na kursie AI, jak i na całej uczelni. To oczywiste, ale trudne. Jak uniwersytet ma poradzić sobie z tak szybkimi zmianami? Z myślą o tym, zapożyczyłem od Michaela Stonebrakera (MIT) pomysł, by prowadzić nowy kierunek tak jak startup. Zmniejszyć koszty jego uruchamiania i pozwolić mu działać przez trzy lata, do czasu, gdy zakończy się niepowodzeniem bądź sukcesem, albo będzie wymagał nowego „biznesplanu”. Takie kierunki powinny ubiegać się o „finansowanie” z ograniczonych zasobów uniwersyteckich. Chociaż MIT nie przyjął propozycji Mike’a, powinna ona zostać zastosowana we wszystkich obszarach nowoczesnego uniwersytetu.
Zastosujmy koncepcję startupu do wszystkich kierunków uniwersyteckich i studentów każdego stopnia. Czy powinniśmy wymagać od nich, by byli od razu gotowi do pracy, zdolni do produktywności tuż po zatrudnieniu? W związku z szybkim rozwojem technologii, biznesu i rządów, pracodawca powinien traktować nowo zatrudnionego pracownika tak jak startup – wdrożyć go do pracy przy minimalnych kosztach ogólnych, pilnować by zakres obowiązków i wymagań był dopasowany do jego umiejętności, dostosowując je w razie potrzeby i odroczyć jego ewaluację o biznesowy odpowiednik czasowy 3-letniego kursu uniwersyteckiego.
Referencje :
[1] Alex Krizhevsky, Ilya Sutskever, and Geoffrey E. Hinton. 2012. ImageNet classification with deep convolutional neural network. In Proceedings of the 25th International Conference on Neural Information Processing Systems – Volume 1 (NIPS’12). Curran Associates Inc., Red Hook, NY, USA, 1097–1105.
[2] Brodie, M.L., A framework for understanding data science, arXiv preprint https://arxiv.org/abs/2403.00776 https://doi.org/10.48550/arXiv.2403.00776 Harvard University, March 2024.
[3] Brodie, M.L., Data science reference framework Part I: A data science axiology: the nature, value, and risks of data science, arXiv preprint http://arxiv.org/abs/2307.10460 https://doi.org/10.48550/arXiv.2307.10460 Harvard University, July 2023.
[4] Brodie, M.L., Defining data science: a new field of inquiry, arXiv preprint https://arxiv.org/abs/2306.16177 https://doi.org/10.48550/arXiv.2306.16177 Harvard University, July 2023.
[5] Grace, et. al. Thousands of AI Authors on the Future of AI. https://doi.org/10.48550/arXiv.2401.02843 January 2024
[6] Harari, Yuval Noah. 2016. Homo Deus. London, England: Harvill Secker.
[7] Jumper, J., Evans, R., Pritzel, A. et al. Highly accurate protein structure prediction with AlphaFold. Nature 596, 583–589 (2021). https://doi.org/10.1038/s41586-021-03819-2
[8] Mitchell, Melanie and David C. Krakauer. “The debate over understanding in AI’s large language models.” Proceedings of the National Academy of Sciences of the United States of America 120 (2022)å https://doi.org/10.1073/pnas.2215907120
[9] Yala A, Mikhael PG, Strand F, Lin G, Satuluru S, Kim T, Banerjee I, Gichoya J, Trivedi H, Lehman CD, Hughes K, Sheedy DJ, Matthis LM, Karunakaran B, Hegarty KE, Sabino S, Silva TB, Evangelista MC, Caron RF, Souza B, Mauad EC, Patalon T, Handelman-Gotlib S, Guindy M, Barzilay R. Multi-Institutional Validation of a Mammography-Based Breast Cancer Risk Model. J Clin Oncol. 2022 Jun 1;40(16):1732-1740. doi: 10.1200/JCO.21.01337. Epub 2021 Nov 12. PMID: 34767469; PMCID: PMC9148689.