„Vůbec jsem to nečekal. Jsem naprosto vyvedený z míry,“ řekl Geoffrey Hinton pár minut poté, co se dozvěděl, že získal Nobelovu cenu za fyziku pro rok 2024. Výjimečně je mu to asi možné věřit. Hinton i jeho spolunositel John Hopfield se totiž pohybují na poli, které za součást fyziky skutečně nikdo neoznačuje.
Geoffrey Hinton a John Hopfield jsou uznávanými informatiky a věnovali se vývoji postupů, na kterých stojí základy dnešních forem „umělé inteligence“ (AI). A přestože jejich práce byla částečně inspirována fyzikálními modely, pevně zůstává právě v oboru informačních technologií. Udělení Nobelovy ceny za fyziku pro rok 2024 je tak nejen pro oba laureáty poměrně velkým překvapením. O den později pak Nobelovu cenu za chemii získali další dva informatici a, pravda, jeden biochemik, který se však hojně věnoval i vývoji specifického softwaru. Všichni se zasloužili o to, že „AI“ rozlouskla problém, se kterým lidé a jejich dosavadní nástroje marně potýkali celé desetiletí. Letošní Nobelovy ceny tak nabyly trochu jiného významu, než si s nimi většinou spojujeme. Nejsou připomenutím úspěchů a výsledků, které změnily svět, ale předznamenávají změny, které ho čekají.
Fyzika: Velmi staré neuronky
Výzkum umělé inteligence je opravdu starý. Sahá minimálně do 50. let minulého století. A pokud zahrneme i ryze teoretické začátky, dostaneme se až na přelom 18. a 19. století, kdy se poprvé objevily matematické koncepty učení. Tehdy se jim ještě neříkalo „neurony“, ale principy byly podobné. Ve 40. a v 50. letech 20. století se pak začalo o neuronech a perceptronech mluvit více a začal se rodit obor umělé inteligence. Objevy Johna Hopfielda a Geoffreyho Hintona na tyto začátky prakticky navazují. Hopfield vyvinul (respektive zdokonalil a zpopularizoval) Hopfieldovy sítě. Je to v podstatě statistický nástroj, síť výpočtů, která se dokáže „naučit“ a replikovat vzory podle zadaných dat. Namísto toho, aby programátor musel do počítače tyto vzory přímo programovat, se je počítač může naučit sám, na základě dat (třeba obrázků), na kterých se trénuje. Geoffrey Hinton, známější z obou vědců, přišel s objevem, který kupodivu není pojmenovaný po něm. Jde o Boltzmannův stroj, důležitého předchůdce dnešních neuronových sítí. Velmi zjednodušeně řečeno, oba systémy v rámci svého „trénování“ hledají, jak si data uspořádat cestou nejmenšího odporu. Oba tyto koncepty jsou tedy — byť poměrně abstraktně — provázané se světem fyziky. Hopfield i Hinton pracovali s konceptem statistické mechaniky. Lze si to představit jako matematický trik, který fyzikové vyvinuli, aby popsali chování složitého systému plného vzájemně se ovlivňujících částeček. Nemusíte znát polohu každé jednotlivé z nich, abyste dokázali předpovědět pravděpodobné chování celku. Ne všichni s takovým zdůvodněním souhlasí. „Informatici už mají svou verzi nobelovek, Turingovu cenu, kterou ostatně už Hinton dostal,“ vyjádřil překvapení mnohých vědců Andrew Lensen, jenž vyučuje AI na Victoria University na Novém Zélandu. A dokonce samotný Hinton nenápadně podotkl: „Kdyby to byla Nobelova cena za informatiku, bylo by to samozřejmě vhodnější.“ Nobelův výbor pro fyziku si byl určitě velmi dobře vědom toho, že jeho volba bude poněkud kontroverzní. Slovo „fyzika“ v oficiálním vysvětlení skloňuje hned 17× a autoři se tak pokoušeli zdůraznit právě fyzikální inspiraci pro práci obou oceněných. Ale je to snaha trochu násilná: stejně tak by se dalo zdůraznit, že si informatici půjčili některé koncepty z biologie, konkrétně modelu mozkových neuronů. Ovšem autoři cen mají do jisté mí-ry svázané ruce. Obory, za které se „nobelovky“ udělují, jsou pevně dané. Neudělit cenu významnému objevu, na kterém dnes stojí celá řada dalších technologií, by se naopak dalo považovat za zpátečnické. A Nobelův výbor bývá opatrný; obvykle uděluje ceny s odstupem času za objevy, které prokázaly svůj význam — ale nechce uváznout v minulosti.
Chemie: Jak už AI předběhla lidi
Cenu za chemii rozdělila komise na polovinu mezi tři vědce. Jednu polovinu získal Američan David Baker, který je ve svém oboru doslova „superstar“. Byl oceněn za přínos k vytváření nových, v přírodě se nevyskytujících bílkovin. Tedy za to, že rozšířil možnou paletu stavebních kamenů živých organismů o úplně nové „barvy“, se kterými by mělo být možné produkovat věci v přírodě nevídané. Bakerův přínos k oboru je ovšem širší a dotýká se i oblasti, za kterou byla udělena druhá polovina ceny: totiž za využití „umělé inteligence“ k vyřešení otázky tvaru bílkovin. Tu dostali Demis Hassabis a John Jumper z laboratoří DeepMind (dnes Google DeepMind). Práce těchto dvou odborníků a jejich kolegů z firmy mezi lety 2018 a 2020 spustila doslova revoluci v jednom vědeckém oboru. Jasně ukázali, že software založený na přístupech hlubokého učení může efektivně řešit jeden z největších problémů vědeckého výzkumu: předpověď trojrozměrné struktury proteinů. Objev zásadně změnil způsob, jakým dnes na světě pracují tisíce vědců. Mohla by to být předzvěst budoucnosti i v dalších vědeckých oborech — a nejen v nich. A také ukazuje, jak „plíživě“ umělá inteligence změnila náš svět, mění ho a měnit bude.
Životně důležité pro život
Pozemský život je kompletně postaven na zmíněné skupině látek — a z nich. To, co která bílkovina v buňce (a tedy i v těle) dělá, neurčuje jenom jejich chemické složení, ale také tvar. Bez znalosti tvaru je těžké zjistit, jak to dělá, a tento účinek napodobit (například pro léčebné účely). Základní mechanismus pro určení tvaru bílkovin popsal už v roce 1961 Christian Anfinsen. Ukázal, že se protein složí sám od sebe na základě pořadí jednotlivých „dílů“ (aminokyselin) v řetězci. Je předvídatelný, měl by se tedy „dát spočítat“. Ale jak? Postup „skládání“ bílkoviny trochu připomíná to, jakým způsobem se do sebe zašmodrchá natažená řada různě zatočených gumiček a pružinek. Výsledek dokážeme nějak popsat, ale dopředu ho odhadnout? Američan Cyrus Levinthal v 70. letech spočítal, že i relativně krátký protein se 100 aminokyselinami má teoreticky více než 1 047 možných podob. Hledat správný tvar metodou pokus–omyl by trvalo déle, než existuje vesmír. Silnější počítače v tomto případě nepomohou, problém vyžadoval úplně nový přístup. Odměna pro úspěšné řešitele této otázky by byla doslova „jackpotem“. Kdybychom dokázali předpovědět tvar bílkovin jen z jejich složení, získali bychom tím přístup k jejich „programovacímu jazyku“. Najednou by se před námi otevřela celá řada vzrušujících možností, jak ovlivňovat, co (nejen) naše buňky dělají, včetně třeba příčin nemocí, vývoje možných léků nebo třeba nových látek pro využití v našich chemických reakcích. Protože ale výpočty nikam nevedly, věda se celá desetiletí musela spoléhat na ruční práci odborníků po celém světě, kteří bílkoviny v laboratořích „mapovali“ pod mikroskopy. Ovšem získat tvar jednoho proteinu trvalo často měsíce nebo roky. A u některých (například bílkovin v buněčných membránách) bylo získání struktur prakticky nemožné. Náročnost takové práce zdržovala pokrok v biologii obecně. „Je to úzké hrdlo, které zpomaluje a omezuje poznání života vůbec,“ popsal situaci před časem biolog Jan Černý z Přírodovědecké fakulty v Praze.
Annus AI mirabilis
Počítání struktury bílkovin patřilo dlouho k nejtěžším úlohám současné vědy. V polovině 90. let dokonce vznikla soutěž nazvaná CASP, kde týmy závodily v „simulovaném skládání proteinů“. Pokrok byl v následujících 20 letech tak pomalý, že organizátoři uvažovali o jejím zrušení. Přelomový okamžik nastal v roce 2018, kdy se do soutěže CASP poprvé zapojila společnost DeepMind s modelem AlphaFold. Jejich přístup, založený na hlubokém učení neuronových sítí, umožnil poprvé předpovědět strukturu proteinů s přesností, která se blížila experimentálním metodám. V roce 2020 pak vylepšený AlphaFold 2 dosáhl přesnosti 92 %, což bylo obrovské zlepšení oproti předchozím pokusům. Období stagnace skončilo. Díky AlphaFold (a nástrojům, které se jím inspirovaly) se vědcům rychle podařilo udělat „více práce“ než za předchozího půl století. „Nikdo nepochybuje, že ocenění jsou ti praví a že jde o průlom, který už změnil výzkum v oboru a bude mít řadu dalších druhotných dopadů,“ řekl pro novináře Marián Novotný z Přírodovědecké fakulty v Praze a dodává: „Překvapivé je snad jedině to, že cena přišla tak brzy.“ I když s výsledky této „proteinové revoluce“ se setkávají v tuto chvíli jen odborníci v oboru, mezi experty převládá názor, že jeho vliv se brzy rozšíří. Jedním z nejvýznamnějších přínosů umělé inteligence by mělo být výrazné urychlení vývoje nových léků. Aplikace však sahají daleko za rámec farmaceutického průmyslu. Predikce proteinů otevírá dveře k řešení mnoha dalších biologických problémů. Vědci mohou navrhnout nové enzymy, které budou schopné rozkládat plastové odpady nebo efektivněji využívat přírodní zdroje. Přesnější znalost bílkovin nám umožní lépe pochopit, jak funguje evoluce, vyvíjet nové metody pro manipulace a úpravu buněk nebo přesněji zasahovat do dnešních ekosystémů. Tyto druhotné dopady se projeví až za delší dobu, nejspíše desetiletí, ale jejich vliv na biologii a související obory může být zcela zásadní.
O důležitosti otevřenosti
Skutečnost, že AI uspěla právě v této oblasti, není náhodná. Existují dobré důvody, proč se právě tento obor stal místem, kde umělá inteligence zaznamenala jeden ze svých největších dosavadních úspěchů. Jeden už jsme zmínili: „hrubá síla“, kdy počítače zkoušejí všechny možné podoby bílkovin, se tady z praktických důvodů použít nedala. Ani vesmír by v takovém případě nevydržel počkat na výsledek. Pak ale desetiletí trvající vývoj ve výpočetní technice a také v softwaru v druhé dekádě 21. století dospěl do fáze, ve které se počítače mohly „naučit intuici“. Další důvod je méně zjevný a zajímavější: je jím dostupnost velkého množství otevřených dat právě v oboru předpovědi podoby bílkovin. Vědci po celém světě v laboratořích pracně sbírali údaje o podobě bílkovin — a jen proto, aby je pak mezi sebou otevřeně sdíleli v plně přístupných databázích. To poskytlo umělé inteligenci dostatečný tréninkový materiál, na kterém se mohla učit. AlphaFold tedy nemusel začínat od nuly. Autoři modelu měli zadarmo po ruce obrovské množství spolehlivých a ověřených údajů, na kterých se mohli naučit, jak se bílkoviny skládají. Důležitost otevřených dat pro úspěch modelu společnosti DeepMind je vidět i na tom, co mu dnes stále nejde: „Problémy, na které dnes Alpha- Fold stále nedosáhne, jsou do značné míry ty, o nichž nemáme k dispozici dobré výsledky z laboratorních pokusů,“ vysvětlil Marián Novotný. Jde o důležité připomenutí skutečnosti, že současná podoba umělé inteligence není rozhodně všemocná. V oborech, kde není k dispozici množství otevřených dat, bude její přínos ve stávající podobě mnohem omezenější. V některých případech může zase dojít k „monopolizaci pokroku“, pokud budou důležitá data vlastněna pouze jedním nebo několika komerčními subjekty. I to může být za určitých okolností z hlediska společnosti jako celku nevýhodné.
Revoluce za kopcem
Když v roce 2020 AlphaFold prolomil výkon všech předchozích modelů, biolog Jan Černý z Univerzity Karlovy k tomu řekl: „Pro nás v oboru to bude jako přistání na Měsíci. Každý si bude pamatovat, kde byl, když to oznámili.“ Takový význam měla událost pro „zasvěcence“. Většina světa si přitom nevšimla. Samozřejmě, ve vědě nejde o úplně výjimečnou situaci. Odborníci vidí zásadní změnu, veřejnost má své starosti a zájmy. Úspěch AlphaFold ale je v něčem jiný: je to důkaz, že revoluce vyvolaná současnou generací AI už skutečně probíhá. Neskrývá se někde v budoucnosti. Není to patrné i proto, že se nešíří rovnoměrně napříč všemi obory lidské činnosti. Některé změnila, některé mění, některé teprve měnit bude. Každý vědec — a nejenom vědec, doslova kdokoli — bude nyní mít k dispozici „celý tým asistentů“. Jak je využije, bude záležet na tom, do čeho se pustí. Ale už nyní je zřejmé, že to bude silný nástroj. Katalyzátor změn. Podobně jako kdysi dynamit — vynález, který Alfredu Nobelovi vydělal pohádkové jmění a umožnil mu posmrtně financovat „nobelovky“. Umělá inteligence neuspěje všude (viz výše zmíněný problém dostupných dat), můžeme však očekávat, že tam, kde uspěje, přinese podobně zásadní změny. Až se tak stane, promění daný obor stejně radikálně, jako tomu bylo u biologie s nástupem AlphaFold. Běžná veřejnost si však těchto revolucí možná všimne až později, kdy jejich důsledky začnou ovlivňovat každodenní život. Pokrok ve vědě podpořený umělou inteligencí tak může probíhat izolovaně v jednotlivých oborech, ale z dlouhodobého hlediska mít dalekosáhlý dopad na celou společnost.
Připomenutí ze Stockholmu
Letošní ročník nejslavnějších vědeckých cen má až nezvykle aktuální význam a připomíná, že AI už náš svět mění. Takže až váš obor nebo profese zažije svůj „AlphaFold moment“, nestěžujte si, že vás nikdo neupozornil. Zapojení umělé inteligence do všech oblastí má i své stinné stránky. Jedním z těch, kteří nešetří kritickými slovy na adresu umělé inteligence, je ostatně právě Geoffrey Hinton. Čerstvý nobelista a jeden z „otců umělé inteligence“ loni opustil firmu Google, prý aby se mohl naplno věnovat právě osvětě týkající se nebezpečí AI. „Odešel jsem, abych mohl mluvit o nebezpečí umělé inteligence, aniž bych bral v úvahu, jaký to má dopad na Google,“ uvedl tehdy Hinton. Výtek k zapojení AI je celá řada. Nejčastěji lidé upozorňují na to, jak lze nové nástroje generativní umělé inteligence využít ke generování falešného obsahu, podvodům, manipulacím nebo šmírování. Hintonova varovná slova jsou ale obecnějšího charakteru: „Uvědomil jsem si náhle, že tyhle věci [myšleno AI systémy — pozn. red.] budou v budoucnu mnohem chytřejší než my,“ vysvětlil v loňském rozhovoru Hinton. „Jak to přežijeme?“
Medicína: Od červa k člověku
Ocenění za „fyziologii a lékařství“, jak zní oficiální popis, bylo letos tedy jediným z vědeckých Nobelových cen, ve kterém umělá inteligence nehrála velkou roli. Dělí se o ni rovným dílem dva amer ičtí vědci, vývojový biolog Victor Ambros a molekulární biolog Gary Ruvkun. A získali ji za popis části lidského genetického materiálu, který byl dlouho považován za „zbytečný“, tzv. mikroRNA. Až jejich práce (a práce jejich následovníků) ale ukázala, že hraje klíčovou roli v řadě procesů, a to včetně vzniku některých nemocí. Základem pro udělení letošní ceny byla publikace obou nynějších laureátů z roku 1993. V ní popsali naprosto neočekávaný nález nového způsobu, jakým naše tělo řídí činnost genů (tzv. genové regulace). Navíc jde o způsob, který je zásadní pro všechny mnohobuněčné organismy, člověka nevyjímaje. Šlo o jeden z mnoha kroků v hledání odpovědi na otázku: jak podle jednoho návodu může vzniknout tolik různých „součástek“ našeho těla?
Ty se zapni, ty vypni!
Informace uložené v lidských chromozomech jsou vlastně jakýmsi návodem k použití pro všechny buňky v těle. Když vědci do tohoto mikroskopického světa poprvé nahlédli, narazili na záhadu: každá buňka totiž obsahuje ty samé chromozomy, takže každá buňka obsahuje přesně stejnou sadu genů a přesně stejný soubor instrukcí. Ale přesto mají různé typy buněk, například svalové a nervové, velmi odlišné vlastnosti. Jak tyto rozdíly vznikají? Odpověď spočívá v genové regulaci, která umožňuje každé buňce vybrat si jen příslušné instrukce. V každém typu buňky je aktivní pouze vybraná sada genů a díky tomu se buňky umějí specializovat. MikroRNA a způsob její regulace genů byl do roku 1993 neznámým fenoménem. Dnes už se ví, že lidský genom kóduje více než tisíc různých látek, které spadají do této kategorie. Studium těchto a dalších příbuzných tříd malých RNA vedlo k vytvoření zcela unikátní oblasti výzkumu. Mají schopnost regulovat to, jak je gen aktivní. Díky tomu mají dalekosáhlý dopad na většinu biologických procesů, ovlivňujících zdraví a nemoci, včetně vývoje, stárnutí, rakoviny, cukrovky, srdečních chorob, Alzheimerovy choroby, leukémie, schizofrenie a mnoha dalších.
Průhledný červík
Ambros s Ruvkunem se poprvé setkali v osmdesátých letech, kdy oba pracovali jako postdoktorandi v laboratoři Roberta Horvitze. Tento přírodovědec v Bostonu zkoumal nenápadného tvorečka — asi milimetr dlouhého půdního červa, hlístici jménem háďátko obecné. Skládá z přibližně 1000 buněk, pomáhá odkrývat základní tajemství o tom, jak funguje lidské tělo. Pro srovnání — lidské tělo obsahuje zhruba 30 bilionů buněk (nepočítaje v to bakterie, které v našem těle žijí). Mnohé mechanismy, které jsou obtížně sledovatelné u člověka, jsou však zachovány mezi člověkem a hlísticemi a jejich odhalení může posouvat hranice poznání v biologii člověka. Háďátko obecné (Caenorhabditis elegans) má navíc krátký životní cyklus, je průhledné a vývojové schéma všech somatických buněk je díky předcházejícím pracím detailně známé. Patří sem práce oceněná Nobelovou cenou za fyziologii a lékařství z roku 2002, již sdíleli Sydney Brenner, John Sulston a Bob Horvitz. Předvedli, jak je geneticky regulován vývoj orgánů a programována „buněčná smrt“ (tedy zánik jednotlivých buněk). Ambros a Ruvkun se zajímali o geny, které řídí načasování aktivace různých genetických programů a zajišťují, že se různé typy buněk vyvíjejí ve správný čas. Využívali proto zmutované červy, u nichž narazili rovnou na několik podivností, které souvisely s neobvykle krátkými molekulami RNA. Oba mladí vědci zkoumali jinak zmutovaná háďátka, ale oba naráželi na stejné podivnosti ohledně této malé RNA.
Ale je to pravda, kolegové?
Když své poznatky sladili, zjistili, že objevili úplně nový způsob genové regulace — a také nový neznámý typ RNA, který pro jeho velikost pojmenovali mikroRNA. Popsali to v odborném časopise Cell roku 1993. Čekali nadšenou reakci vědecké komunity — a byli velmi zklamáni. Kolegové se k objevu stavěli skepticky. Mechanismus nebyl pozorován u žádného jiného tvora, a tak ho skeptici zpočátku považovali za zvláštnost spojenou jen s háďátkem. Že by stejný způsob regulace buněk mohl fungovat také u jiných tvorů, či dokonce člověka, to bylo vnímáno jako velmi bizarní úvaha. Na ocenění čekali Ruvkun s Ambrosem dlouhých sedm let. To se jim totiž povedlo popsat další typ mikroRNA, ale tentokrát ne u hlístic. Tento typ se nacházel v celé živočišné říši. To přivedlo další vědce k zájmu o podobné maličkaté kousky RNA. Díky tomu se během dalších let povedlo popsat stovky dalších mikroRNA. V současné době jich u člověka vědci identifikovali více než tisíc a hlavně zjistili, že regulace genů pomocí mikroRNA je mezi mnohobuněčnými organismy univerzální. Pak se stavidla zájmu protrhla a oblast se stala předmětem širokého zájmu. Například u člověka se našly mutace v genech kódujících mikroRNA, které způsobují stavy, jako je vrozená ztráta sluchu či oční a kosterní poruchy. A mutace v jednom z proteinů potřebných pro produkci mikroRNA dokonce vedou k syndromu DICER1, vzácnému, ale závažnému syndromu spojenému s rakovinou různých orgánů a tkání. A to už vedlo k významnému pokroku, který pomáhá spoustě nemocných. Pokroku už lékaři dosáhli ve vývoji diagnostiky a terapie na bázi mikroRNA u onemocnění, jako jsou metabolické poruchy, kardiovaskulární onemocnění, neurodegenerativní stavy a rakovina. /jj/