Nedávno představený model umělé inteligence ChatGPT-4o podle expertů poráží nový konkurenční model Claude 3 Opus o několik procentních bodů v celé řadě testů. Mimo jiné vede v masivním multidisciplinárním multimodálním porozumění a uvažování nebo hodnocení matematického uvažování ve vizuálních kontextech (MathVista).
Zásadním vylepšením ChatGPT-4o je podle expertů rychlost. Průměrná délka odpovědi při audio komunikaci se pohybuje kolem 320 milisekund, což je srovnatelné s konverzací lidí.
Model navíc dokáže velmi dobře rozeznávat tón hlasu, zvuky, smích či dokonce sarkasmus a další emoce. GPT-4o reprezentuje významný krok vpřed směrem k přirozenější interakci člověka a technologie.
„Měřeno tradičními benchmarky se jedná o jeden z vůbec nejschopnějších modelů dneška," uvedl ředitel České asociace umělé inteligence Lukáš Benzl.
GPT-4o podle datového šéfa Creative Docku Adama Hanky ukazuje velké zlepšení v rozpoznávání hlasu a lidských emocí a má také výrazně vylepšený hlasový syntezátor.
První testy zatím ukazují, že model si dokáže velmi dobře poradit i se simultánním překladem, což je velké zlepšení oproti předchozím verzím, které vykazovaly nepříjemné zpoždění. Model také vykazuje zlepšené vlastnosti v oblasti rozpoznávání lidských emocí, což mu umožňuje efektivněji reagovat.
Výhodou je, že je zdarma
„Doposud měly modely GPT4 a Claude - Opus podobnou výkonnost s tím, že model GPT4 lehce převyšoval výkonnost Claude v některých úlohách. Se zlepšením OPenAI modelu GPTo lze snadno předpokládat, že tento model bude dominantní. Zároveň bude jeho velká výhoda to, že je přístupný uživatelům zdarma, což zajistí jeho rychlejší adopci mezi běžnými uživateli, kteří za chatGPT doposud neplatili," podotkl Hanka.
„Věřím, že tato verze dokáže ještě více zpříjemnit používání umělé komunikace široké veřejnosti, protože komunikace se stává přirozenější, svižnější a v neposlední řadě hodnotnější díky novým schopnostem modelu. Pro firmy může být zajímavé výrazné vylepšení textových odpovědí v neanglických jazycích, avizovaná rychlost, a až o 50 procent levnější API. Zásadně byla vylepšena také bezpečnost," dodal Benzl.
Zlepšené vlastnosti modelu zároveň podle Hanky vzbuzují řadu otázek ohledně soukromí a bezpečí uživatelů a bude třeba ještě ověřit, zda byl model dostatečně kvalitně dotrénován tak, aby vyhovoval nejvyšším standardům uživatelské ochrany.