OpenAI začala naplno sázet na nový trend, na agenty zaměřené na „hloubkový výzkum“. Nejde přitom o laciný experiment — naopak.
Podle informací magazínu The Information plánuje OpenAI, známá firma stojící za populárním chatbotem ChatGPT, účtovat až 20 000 USD měsíčně za specializovaného agenta, který zvládne samostatně řešit úlohy odpovídající doktorandskému výzkumu. O něco levnější budou agenti zaměření na programování (10 000 USD měsíčně) nebo podporu práce vysoce kvalifikovaných „znalostních pracovníků“ (2 000 USD měsíčně). První firmy, jako Stripe či Box, už tyto technologie začínají využívat v praxi.
AI agenti mají minimálně podle firem z oboru ambici zásadně změnit každodenní fungování firem i jednotlivců tím, že převezmou úkoly, které dosud vyžadovaly značné lidské úsilí. Společnosti, které budou schopné správně nasadit AI agenty, tak mohou získat výraznou konkurenční výhodu díky úsporám času, zvýšení produktivity a lepší správě informací. První firmy, jako Stripe či Box, už hlásí pozitivní zkušenosti — agenty využívají například pro správu faktur, automatizaci zákaznické podpory nebo důkladné prohledávání podnikových dokumentů.
Samostatný pracovník
Co vlastně AI agent je? Výstižně (i proto, že trochu neurčitě) obsah pojmu shrnuje Ethan Mollick z University of Pennsylvania: „AI agent je program, který dostane od uživatele cíl a pak samostatně pracuje na jeho splnění.“
Díky takto širokému pojetí lze za agenty považovat cokoli od robotického vysavače, který samostatně projíždí pokojem, přes automatické call centrum až po sofistikovaný software schopný vytvořit podrobnou rešerši složitého tématu bez dalšího zásahu člověka.
Zásadní odlišnost oproti běžným chatbotům spočívá v tom, že agent se nezdržuje neustálým dialogem s člověkem, což šetří čas a umožňuje větší autonomii. Agent si sám nastaví strategii, jak nejlépe úkol splnit, vybírá nástroje, které má k dispozici, a člověka kontaktuje jen tehdy, potřebuje- li zpřesnit zadání nebo potvrdit další postup.
Pro uživatele taková interakce připomíná delegování práce — zadáte cíl, odejdete a agent mezitím pracuje sám. To ovšem znamená, že agentům musíte věřit, což může být problém, pokud výsledky nebudou 100%.
Ať už ale bude budoucnost vypadat jakkoli, jedno je jisté: AI agenti představují další krok v evoluci umělé inteligence a jejich vliv na pracovní i náš osobní život je nepředvídatelný — možná však opravdu zásadní.
Co je na trhu
Ačkoli může článek o AI agentech působit trochu jako sci-fi, jejich první generace už dnes existuje. Nabídka je pestrá: od poměrně jednoduchých nástrojů po ambiciózní projekty slibující komplexní řešení úkolů, se kterými si běžné vyhledávače nebo chatboty poradí jen těžko.
Velké firmy si od agentů slibují především výrazné usnadnění práce a lepší přístup k informacím. Google například již na konci roku 2024 zpřístupnil vlastní verzi Deep Research. Typickým příkladem současné generace agentů je právě Deep Research („hloubkový výzkum“), integrovaný do chatbotu Gemini. Podobnou funkci, navíc se stejným názvem, nabízí v úvodu článku i zmíněná firma OpenAI.
Funguje na jednoduchém principu: zadáte úkol či otázku a AI agent sestaví plán rešerše. Ten s vámi zkonzultuje a, pokud jej schválíte, pustí se do samostatné práce. Prohledává web, shromažďuje informace, analyzuje je, a nakonec zpracuje podrobnou zprávu, často doplněnou o přehledné tabulky a odkazy na zdroje.
Schopnosti těchto agentů jdou výrazně nad rámec jednoduchého vyhledávání na webu. Neomezují se jen na první výsledky vyhledávačů, ale mohou cíleně projít desítky či stovky stránek a zdrojů, vzájemně porovnat informace, ověřovat jejich konzistenci nebo je analyzovat z různých pohledů. Při správném zadání výstupy mohou připomínat práci zkušeného rešeršisty. Během několika minut však můžete získat dokument, jehož vytvoření by člověku trvalo minimálně hodiny intenzivní práce.
Jejich výsledky ovšem nejsou bezchybné. Zmíněné nástroje se zatím poměrně často pletou v detailech, někdy zamění osoby se stejným jménem, čerpají z méně důvěryhodných zdrojů nebo si dokonce domyslí fakta, která v použitých materiálech nejsou. Výsledky sice vypadají důvěryhodně, ale právě takové malé chyby mohou být zásadní, pokud rešerši důkladně neprověříte.
Není to překvapivé; aktuální generace AI agentů má podle zkušeností uživatelů řadu slabin. Jednou z nich je jejich „křehkost“: mohou se snadno „zacyklit“ a opakovat zbytečné činnosti, které nikam nevedou. Stačí drobná chyba na začátku — například špatně pochopený parametr úkolu, chyba v interpretaci instrukcí nebo v datech — a agent se vydá nesprávnou cestou, což vede ke ztrátě času i zdrojů. A protože provoz takových systémů není levný ani zvlášť rychlý, mohou tyto zbytečné slepé uličky představovat i výrazný problém.
Druhou oblastí, v níž mají AI agenti prostor pro zlepšení, je hloubka jejich analýzy. Již zmíněný Ethen Mollick to ilustroval na příkladu, kdy nechal agenta provést nákupní rešerši na Amazonu. Výsledek byl sice technicky správný, ale povrchní. Agent provedl jednoduchý průzkum produktů a poskytl jen velmi obecná doporučení, která neodpovídala Mollickovým osobním preferencím. Podobnou povrchnost zaznamenal při analýze akciových titulů, kde agent připravil tabulku se základními ukazateli, jako jsou třeba P/E poměry. Taková analýza sice formálně odpovídá zadání, ale postrádá hlubší vhled, jaký by poskytl zkušený lidský analytik.
Praktické důsledky těchto omezení jsou jasné. Současní AI agenti zvládají relativně dobře strukturované úkoly, například sestavení pravidelných reportů, procházení většího množství webových stránek nebo práce se specializovanými programy. V momentech, kdy je potřeba hlubší kontext, individuální úsudek nebo detailní pochopení složitějšího problému, zatím zaostávají.
To může být problém — jako ostatně u AI i obecně. Záplavu informací, pro člověka mnohdy nezvládnutelnou, zpracuje AI za 10 minut. Dokáže vytvořit analýzu, za jakou byste jinde zaplatili tisíce korun a mnohdy na ni čekali i dosti dlouho. Jenže různé chybky, které do výsledku proniknou, nejsou na první pohled vidět (což se ale může stát i při lidském zpracování). Pokud jde o téma, kterému nerozumíte, je dosti pravděpodobné, že vám uniknou i při letmé kontrole. Výsledkem je tedy úctyhodně podrobná zpráva plná odkazů, za kterou ale nikdo nenese odpovědnost, protože podrobná kontrola by trvala minimálně mnoho hodin.
Podle prvních zkušeností firem i jednotlivců je agent schopen překvapivě samostatně vytvářet kvalitní rešerše, například pro plánování nových projektů či detailní průzkum konkurence. Na druhou stranu však platí, že plně spoléhat na výstupy bez důkladného ověření zatím nelze.
Zkrátka, AI agenti zaměření na „hloubkový výzkum“ ukazují pozoruhodné schopnosti, ale zároveň připomínají, že jejich spolehlivost zatím není 100%. Jsou nástrojem, který může zásadně pomoci — pokud víte, jak s ním pracovat, a dokážete rozpoznat jeho limity.
Budou se zlepšovat
Je jasné, že AI agenti jsou zatím na samém počátku své existence. Chyby, kterých se dnes dopouštějí — jako je nepřesné pochopení zadání, povrchní rešerše nebo uvíznutí v nekonečných cyklech — mohou být jen dočasnými problémy, které budou s každou další generací postupně redukovány na míru, kdy nebudou představovat zásadní problém při jejich praktickém nasazení. Tedy alespoň v úlohách, na které bude upínána nejčastější pozornost.
Stačí si připomenout rychlost, s níž se generativní AI posunula od relativně neohrabaného ChatGPT na konci roku 2022 k dnešním modelům, které dokážou vyhrávat medaile na programátorských nebo matematických olympiádách. Vývoj posledních dvou let jasně ukazuje, že schopnosti umělé inteligence rostou téměř exponenciálně. Modely, které byly před dvěma roky sotva schopny sestavit jednoduchý text nebo doplnit pár řádků kódu, dnes samostatně programují komplexní aplikace, skládají originální hudbu nebo řeší matematické úlohy na úrovni elitních studentů. I když rozhodně není jisté, že „obecná umělá inteligence“ je na dosah, nic také zatím nenasvědčuje tomu, že by měl tento trend brzy skončit.
Přesto je důležité připomenout, že překážkou v masovém využití AI agentů nemusí být nutně jen technologický vývoj, ale také schopnost firem a lidí tyto nástroje správně využít a řídit. I kdyby technické schopnosti AI agentů výrazně vzrostly, bez dobře promyšlených scénářů použití a jasně stanovených pravidel jejich zapojení může být potenciál této technologie omezený.
Dnešní stav věcí napovídá, že AI agenti zatím nejsnáze najdou uplatnění tam, kde jsou jasně definované procesy a strukturovaná data. To odpovídá především potřebám větších firem, které mají podrobně rozpracované pracovní postupy a jsou schopny snadno určit, jak by agentům měly zadávat úkoly.
Typické scénáře využití ve firemním prostředí už se začínají rýsovat — a patří mezi ně především rešerše trhu, analýza dat, automatická klasifikace a třídění dokumentů, správa faktur nebo rutinní reporting. Díky své schopnosti autonomně vykonávat opakované úkoly mohou agenti výrazně šetřit čas zaměstnanců, kteří se pak mohou soustředit na práci vyžadující lidský úsudek či kreativní rozhodování.
Malé firmy nebo jednotlivci mohou agenty sice používat také, ale zavádění je pro ně zatím náročnější. Samotné vytvoření agenta často zabere více času než přínos, který přinese jeho nasazení. U těchto menších subjektů proto dává smysl začít spíše s jednoduššími úkoly a postupně si ověřovat, zda jim agenti skutečně šetří čas a úsilí.
I když dnes ještě nelze říct s jistotou, kam přesně se AI agenti posunou za rok či dva, je jasné, že firmy se touto novinkou zabývat musí. Minimálně proto, že jejich konkurenti se už nyní snaží ověřit, zda jim agenti mohou přinést konkurenční výhodu. V příštích měsících tak budeme pravděpodobně svědky celé řady experimentů a pokusů, které ukážou, jak to s reálným potenciálem AI agentů skutečně vypadá.