Za hranicemi GPT-5: Nový horizont základních modelů

Základní modely jako GPT-4 od OpenAI již zásadně proměnily způsob, jakým píšeme, programujeme i komunikujeme. Jak komunita AI očekává GPT-5, očekávání sahají daleko za pouhý skromný upgrade – předpokládá se zásadní změna paradigmatu v tom, jak spolupracujeme s inteligentními stroji seniorexecutive.com. V této zprávě zkoumáme, co leží za GPT-5, mapujeme nastupující pokroky ve schopnostech AI modelů, trénovacích strategiích, směrech výzkumu i v širší společenské krajině. Každá sekce osvětluje další hranici základních modelů: od technických průlomů (usuzování, multi-modalita, paměť atd.) po nové trénovací přístupy, demokratizaci open-source, etické/regulační výzvy a dokonce i spektrulativní vize AGI (umělé obecné inteligence). Cílem je poskytnout srozumitelný a zároveň informativní přehled každému, koho zajímá, kam AI směřuje.

Očekávané technologické pokroky za hranicemi GPT-5

CEO OpenAI Sam Altman naznačil, že GPT-5 přinese výrazná vylepšení – včetně multimodálního porozumění, perzistentní paměti, větší “agenticity” a posíleného usuzování seniorexecutive.com. Při pohledu ještě dále můžeme očekávat, že se základní modely posunou kupředu v několika směrech:

Silnější usuzování a řešení problémů: Budoucí modely budou lépe zvládat logické uvažování, komplexní plánování i sledování vícekrokových instrukcí bez ztráty kontextu. Výsledkem bude méně nesmyslných odpovědí a více spolehlivých, faktických reakcí. Vylepšování usuzování je hlavní oblastí zájmu; např. výzkumníci z Microsoftu použili nové techniky (jako Monte Carlo tree search a reinforcement learning pro logiku), aby dramaticky zlepšili řešení matematických úloh u menších modelů microsoft.com. Celkově by příští generace modelů měla méně halucinovat a dokázat řešit složitější úlohy strukturovaným, krok za krokem vedeným myšlením yourgpt.ai.
Přirozená multi-modalita: Zatímco GPT-4 umožnila vstup obrázků, dalším cílem je skutečně multimodální AI, která plynule pracuje s textem, obrázky, audiem, videem i dalšími formáty. Od GPT-5 se čeká nativní podpora audia (hlasu) navíc oproti textu a obrázkům yourgpt.ai. Modely však půjdou ještě dál – budou modality skutečně propojovat: např. analyzovat graf, bavit se o něm a zároveň vygenerovat namluvené shrnutí v jediném kroku. Google Gemini AI je předzvěstí: poslední verze přijímá jako vstup obrázky, video i audio a dokáže generovat obrázky nebo mluvené odpovědi blog.google. Stručně řečeno, AI zítřka bude vidět, slyšet a mluvit, což umožní podstatně přirozenější interakci (představte si hlasového asistenta, který opravdu chápe, co vidí, nebo AI, která edituje video porozuměním obsahu).
Rozšířená paměť a kontext: Dnešní modely si pamatují jen omezenou část konverzace či dokumentu, budoucí modely si ale zapamatují mnohem víc. O GPT-5 kolují zvěsti, že zvládne více než 1 milion tokenů kontextu yourgpt.ai yourgpt.ai – prakticky si tedy bude pamatovat celé knihy či vícedenní konverzace najednou. I současné systémy posouvají hranice: model Claude od Anthropicu nabídl 100 000tokenové okno (asi 75 000 slov), takže zvládne zpracovat stovky stránek a pamatovat si detaily i po hodinách anthropic.com anthropic.com. Takto rozšířený kontext společně se skutečnou trvalou pamětí mezi sezeními otevírá možnost AI, která si “pamatuje” své uživatele. Představte si asistenta, který si vybaví vaše preference, minulé rozhovory či osobní poznámky aniž byste je museli znovu zadávat – to je schopnost, na kterou tvůrci GPT-5 cílí seniorexecutive.com. Taková dlouhodobá paměť povede k srozumitelnější a personalizovanější interakci.
Učení a adaptace v reálném čase: Budoucí základní modely nemusí být po natrénování “zmrazeny”; mohou se učit v reálném čase. Dnešní modely jsou po vydání neměnné, ale výzkum probíhá v oblasti kontinuálního učení, aby AI mohla přijímat nové informace či zpětnou vazbu okamžitě. Vizí je AI, která se učí z každé interakce a průběžně se vylepšuje (v bezpečných mezích), místo čekání na velký retraining. To by znamenalo přechod „od pevných, předem daných schémat k dynamičtějším, automatizovaným a flexibilnějším implementacím“ – modely by tak mohly přímo zohlednit aktuální data a kontext během svého běhu dataversity.net. Prakticky to znamená, že AI po éře GPT-5 by mohla okamžitě chápat nová slangová slova, aktualizovat znalosti při vydání nových vědeckých článků či zpráv a přizpůsobovat styl konkrétním uživatelům bez nutnosti zásadního přeprogramování. Vyřešit to bez “katastrofálního zapomínání” (ztráty původních znalostí) je výzkumná výzva arxiv.org, ale v této oblasti dochází k postupnému posunu vpřed.
Personalizace a agentní chování: S lepší pamětí a učením za chodu přichází personalizace. Lze očekávat, že základní modely se budou umět přizpůsobit potřebám a preferencím každého uživatele. Cestovní mapa OpenAI k GPT-5 zahrnuje schopnost “pamatovat si uživatele a sezení — což otevírá skutečnou personalizaci pracovních toků” yourgpt.ai. Váš AI psací asistent může napodobit váš tón, kodérský copilot se přizpůsobí stylu vašeho projektu, zákaznický chatbot rychle zareaguje na historii klienta. Současně se modely stávají více agentními – nejen odpovídají na dotazy, ale provádějí autonomní kroky dle zadání. O GPT-5 se mluví jako o pokroku směrem k “autonomnímu agentovi, který plánuje a vykonává” úlohy seniorexecutive.com. To znamená, že AI může sama zadávat podúkoly specializovaným nástrojům nebo API. Například pokročilý model by mohl nejen naplánovat itinerář cesty, ale zároveň rezervovat letenky a hotely prostřednictvím online nástrojů, to vše na základě obecného pokynu uživatele seniorexecutive.com seniorexecutive.com. Takto proaktivní, nástroje využívající AI znamená zásadní posun oproti reaktivním chatbotům minulosti — fakticky vzniká kolaborativní digitální asistent či kopilot pro reálné úlohy.

Trendy v trénovacích přístupech

Pro dosažení těchto pokroků je třeba nejen více dat či parametrů, ale nové strategie tréninku a architektury. Výzkumníci a inženýři zkoumají několik slibných metod, které jdou za rámec standardního “naučit obří Transformer na obrovském korpusu textu”:

Architektury mixture-of-experts (MoE): Jednou z cest, jak modely efektivně škálovat, je použití mixture-of-experts, kde různé podsítě (“experti”) se specializují na různé typy vstupů. Namísto jednoho monolitického sítě MoE model směruje každý dotaz jen na několik relevantních expertů. Tato technika umožňuje obrovskou kapacitu modelu bez úměrného růstu výpočetních nákladů – je totiž více “řídká”. MoE vrstvy byly údajně použity v GPT-4 a dalších špičkových systémech developer.nvidia.com. Také open-source komunita MoE ráda využívá – například model Mistral Mix-8B obsahuje osm expertních komponent v 7B-parametrovém základu developer.nvidia.com. Výhoda je jasná: MoE modely mohou výrazně navýšit počet parametrů a kapacitu modelu, aniž by každé zpracování dotazu bylo extrémně drahé. Jeden rozbor od NVIDIA například ukázal, že MoE model s 46 miliardami parametrů aktivuje na každý token jen asi 12 miliard, což šetří výpočet proti hustému modelu stejné velikosti developer.nvidia.com. Tato flop-efektivita znamená, že při stejném rozpočtu lze MoE model trénovat na více datech či dosáhnout vyššího výkonu developer.nvidia.com. Jak roste cena tréninku obřích modelů (například LLaMA 2 od Meta se 70 miliardami parametrů vyžadoval odhadem 3,3 milionu GPU-hodin pro předtrénování developer.nvidia.com), MoE architektury budou zřejmě stále populárnější pro GPT-5++ a novější modely. Slíbené jsou chytřejší modely za méně peněz.
Posilované učení a trénink na základě zpětné vazby: Dalším trendem je zapojení posilovaného učení (reinforcement learning, RL) ke zjemnění modelů, zejména k jejich sladění s preferencemi lidí nebo logickými cíli. OpenAI tento styl proslavila díky RLHF (Reinforcement Learning from Human Feedback) u instruovaných modelů jako ChatGPT. V budoucnu se RL využije ještě kreativněji. Příkladem je trénink modelu na řešení úloh pokusem a omylem: Microsoftí projekt Logic-RL odměňoval model pouze tehdy, pokud byly správné jak postup uvažování, tak finální odpověď při logických hádankách, takže model nemohl používat zkratky a musel být důsledný microsoft.com. Tento přístup více než zdvojnásobil přesnost u některých matematických úloh pro 7B model microsoft.com. Posilované učení také může pomoci s využíváním nástrojů – např. AI agent se učí, která sekvence akcí (volání API, spouštění kódu) vede k nejlepšímu výsledku pro daný úkol. Lze očekávat, že příští generace základních modelů bude trénována kombinací učení s učitelem, zpětnou vazbou od lidí a RL ve virtuálních prostředích pro lepší rozhodování. Stručně: modely po GPT-5 nebudou jenom předvídat jazyk, ale začnou se učit pokusem a zpětnou vazbou, podobně jako člověk.
Kontinuální a celoživotní učení: Klasické trénování je typu “naučit a zamrazit”: po natrénování na velkém statickém datasetu jsou váhy modelu zafixovány. Reálný svět se však neustále mění, proto je velkou výzvou naučit modely učit se průběžně bez zapomenutí starých znalostí. Výzkum se věnuje tématu “CL pro LLMs” (Continual Learning pro velké jazykové modely) arxiv.org. Výzvou je zabránění katastrofálnímu zapomínání, kdy učení nových úloh a dat narušuje předchozí dovednosti arxiv.org. Navrhovaná řešení zahrnují: doménově specifický inkrementální trénink (model se periodicky aktualizuje o nové informace), adapter moduly pro přepínání do nových oblastí a metody paměťového přehrávání pro uchování klíčové báze znalostí. Výzkum navrhuje rozdělit kontinuální učení na vertikální (od obecného ke specializovanému) a horizontální (průběh v čase s novými daty) arxiv.org. V praxi už je patrný postup – například služby umožňující doladit GPT modely na datech firmy či uživatele až po spuštění. Do budoucna se tedy dá očekávat model, který rutinně sám integruje nové vědecké publikace, nebo AI asistent, který se měsíce učí jemnosti konkrétního uživatele, bez nutnosti kompletního retréninku. Skutečné celoživotní učení zatím zůstává nevyřešenou výzkumnou otázkou, ale široce se považuje za klíč k dosažení větší lidské inteligence.
Neural-symbollcké a hybridní metody: Zajímavou oblastí je kombinace neuronových sítí se symbolickým usuzováním či explicitními znalostmi. Čisté deep learning modely mají někdy potíže s přesnou logikou, aritmetikou či faktickou konzistencí. Neural-symbollcké přístupy mají nabídnout to nejlepší z obou světů: kreativitu neuronových sítí i spolehlivost formálních metod. Například systém LIPS (LLM-based Inequality Prover) kombinuje rozpoznání vzorů jazykovým modelem se symbolickým řešitelem pro důkaz matematických nerovností microsoft.com. LLM zvládá flexibilní části (jak přistupovat k důkazu), přičemž striktní algebru přenechává symbolickému enginu – a tím dosahuje špičkových výsledků v řešení náročných matematických úloh bez potřeby extra trénovacích dat microsoft.com. Obecněji vidíme nárůst chain-of-thought prompting, kdy model během odpovědi vyvolává externí nástroje (např. spouštění Python kódu či dotazy do znalostní báze). Budoucí trénink může model explicitně učit kdy a jak tyto symbolické nástroje volat. Navíc je využívána syntetická generace dat pomocí formální logiky – například v MS vyvinuli “neuro-symbolic data generation”, kdy systém automaticky vyrábí nové matematické úlohy mutací symbolických vzorců a LLM je přeformuluje do přirozeného jazyka microsoft.com. Všechny tyto snahy směřují k základním modelům, které propojují usuzovací paradigmata: vnitřně mohou simulovat kód, manipulovat s grafy znalostí či vynucovat logická omezení během generování odpovědí. To by mohlo zásadně vylepšit konzistenci a faktickou správnost v oborech jako právo, věda či programování. Jinými slovy, budoucí modely by mohly učit se algoritmy a pravidla, nejen statistické souvislosti – tedy krok k robustnějšímu AI usuzování.

Nové směry výzkumu a změny paradigmat

Za rámec jednotlivých technik nebo vlastností se samotná krajina AI vyvíjí způsoby, které ovlivní modely po GPT-5. Několik klíčových trendů vystupuje:

Open-source modely a demokratizace AI: V minulosti pocházely nejpokročilejší jazykové modely jen od několika technologických gigantů a byly drženy v utajení. To se změnilo, když Meta (Facebook) v roce 2023 uvolnila LLaMA, a nyní je to ještě markantnější. Komunita open-source AI rychle dohání náskok uzavřených modelů about.fb.com. Podle generálního ředitele Metay Marka Zuckerberga byl jejich model LLaMA 3 (2024) už „konkurenceschopný s nejpokročilejšími modely“ a očekávají, že budoucí open-source modely budou v schopnostech vést about.fb.com. Meta nedávno odvážně uvolnila Llama 3.1 s 405 miliardami parametrů – první skutečně frontier-scale otevřený model about.fb.com. Důsledky jsou obrovské: vědci, startupy, ale i nadšenci mohou experimentovat na špičce technologického vývoje i bez miliardových rozpočtů na výpočetní techniku. Sledujeme explozi inovací řízených komunitou – od chatbotů vyladěných pro instrukce jako Vicuna (který byl postaven na otevřených vahách LLaMA) až po experty z oblasti medicíny, práva a dalších, kteří modely jemně dolaďují pro konkrétní obory. Do tohoto ekosystému se zapojují i velké společnosti: Amazon, Databricks a další nabízejí služby, které lidem umožňují modely na bázi LLaMA či podobné dále ladit a nasazovat about.fb.com. Dokonce i OpenAI, navzdory svému názvu, byla zatím uzavřeným projektem; ale je pozoruhodné, že spolu s očekávaným uvedením GPT-5 plánuje OpenAI vydat samostatný open-source model na podporu transparentnosti a výzkumu yourgpt.ai yourgpt.ai. Všechny tyto události směřují k budoucnosti, kde bude AI mnohem dostupnější. Místo aby nejsilnější modely ovládalo pár firem, budeme mít bohatý otevřený ekosystém AI – podobně jako open-source Linux nakonec překonal proprietární Unix about.fb.com about.fb.com. Tato demokratizace zajišťuje, že se na vývoji AI podílí širší okruh hlasů a nápadů, a umožňuje organizacím přizpůsobit si modely bez toho, aby musely poskytovat svá data třetí straně about.fb.com about.fb.com. Stručně řečeno: další technologický milník nebude jen o větších modelech – bude o široce sdílených modelech, pokroku řízeném komunitou a AI, kterou si kdokoli může přizpůsobit svým potřebám.
Menší a specializované modely (Ne vždy větší znamená lepší): Zajímavé je, že závod o stále větší obecné modely doplňuje trend ke specializaci. Základní modely určené pro konkrétní domény mohou v daném oboru překonat obecné modely – a to často s mnohem menším počtem parametrů. Skvělým příkladem je BloombergGPT, model s 50 miliardami parametrů, navržený speciálně pro finance. Trénovaný na obrovském množství finančních dat (a části obecných textů), BloombergGPT v oblasti finančních úloh „významně“ předčil běžné LLM modely, přičemž si udržel i vysokou úroveň na obecných jazykových úlohách arxiv.org arxiv.org. Ukazuje se, že cílené učení umožňuje dosáhnout expertní úrovně v určitém oboru i bez 500miliardového obra. Pravděpodobně uvidíme více vertikálních modelů: například model pro onkologii pro medicínský výzkum nebo právní model ovládající všechny judikáty zpaměti. Tyto modely mohou být menší a efektivnější, což usnadňuje jejich nasazení (např. lékařský model s 7 miliardami parametrů může běžet lokálně v nemocnici kvůli ochraně soukromí). Roste i hnutí za kompresi a optimalizaci modelů tak, aby běžely na okraji – na noteboocích či telefonech, místo jen v cloudu. Techniky jako kvantizace na 4 bity umožnily spouštět některé modely třídy GPT-3 na spotřební elektronice. Tento přístup „malé je krásné“ podporuje i demokratizaci: ne každý si může dovolit provozovat 175miliardový model, ale dobře zpracovaný 6miliardový model vyladěný pro konkrétní úlohu může být široce rozšířený. Do budoucna pravděpodobně využijeme souhvězdí specializovaných modelů na pozadí, místo jednoho modelu, který by měl zvládat vše. Strategie OpenAI na to dokonce naznačuje, když mluví o ekosystému GPT-5, který by mohl obsahovat menší otevřený model i různé doladěné varianty yourgpt.ai yourgpt.ai. Stručně řečeno: očekávejme bohatší rozmanitost základních modelů – velkých obecných i menších odborníků – které budou v aplikacích spolupracovat, každý v tom, co umí nejlépe.
Noví hráči a spolupráce ve výzkumu AI: Hranice AI už není exkluzivní doménou několika laboratoří ze Silicon Valley. Akadémie, neziskové kolektivy i nové startupy posouvají laťku. Projekty jako EleutherAI a konsorcium BigScience vytvořily velké modely (např. BLOOM s 176 miliardami parametrů) díky mezinárodní spolupráci. Společnost Anthropic (založená bývalými členy OpenAI) přinesla nový přístup Constitutional AI zaměřený na sladění modelů s etickými principy. Dochází i ke křížení mezi obory: kupříkladu DeepMind (nyní součást Google DeepMind) přenesl zkušenosti s reinforcement learningem (AlphaGo aj.) i do jazykových modelů, což údajně ovlivnilo vývoj Google Gemini. Navíc dochází ke sbližování výzkumu v oblasti jazyka, vize a robotiky. Laboratoř zabývající se embodied AI (roboty nebo agenty, kteří interagují s fyzickým světem) může přispět technikami pro paměť či učení v reálném čase, které využijí čistě jazykové modely. Jsme svědky plodné doby výměny zkušeností, konference i odborné časopisy se hemží snahami, jak modely učinit efektivnější, transparentnější a více lidské. Výsledkem bude, že post-GPT-5 éra bude formována širší komunitou – nejen povýšením verze od OpenAI, ale mnohasměrným skokem vpřed díky různorodým snahám po celém světě.

Společenské, etické a regulační dopady

Jak základní modely sílí a stávají se všudypřítomnými, jejich vliv na společnost se prohlubuje – přinášejí obrovské příležitosti, ale i závažné obavy. Při výhledu za GPT-5 je klíčové zvážit, jak budeme tyto modely odpovědně integrovat. Mezi hlavní dopady a otázky patří:

Transformace práce a každodenního života: Pokročilí AI asistenti mohou navýšit produktivitu i kreativitu v nesčetných oblastech – od psaní kódu, přes tvorbu dokumentů, analýzu dat, automatizaci zákaznického servisu až po doučování studentů. To vyvolává optimismus ohledně hospodářského růstu či řešení složitých problémů, ale i obavy z úbytku pracovních míst. Mnohé rutinní i kvalifikované činnosti by mohly být post-GPT-5 systémy automatizovány nebo alespoň podporovány. Společnost se bude muset přizpůsobit: zaměstnanci se budou muset rekvalifikovat a zaměřit se na úlohy, kde je lidský úsudek a „lidský dotek“ nepostradatelný. Někteří dokonce navrhují pilotní projekty nepodmíněného příjmu pro podporu těch, které by přechod na AI-automatizaci nejvíce zasáhl ncsl.org. Na druhé straně mohou modely působit jako „zesilovač lidské vynalézavosti“, jak říká OpenAI – nabízí jednotlivcům schopnosti, které byly dříve nedostupné openai.com. Jedinec s chytrým AI asistentem může zvládnout práci několika lidí, nebo dokonce vykonávat zcela nové činnosti (např. lékař využívající AI k procházení tisíců vědeckých studií během sekund, aby nalezl nový léčebný postřeh). Čistý dopad na společnost bude záležet na tom, jak zvládneme tento přechod, aby přínosy byly široce sdíleny a nevýhody zmírněny openai.com.
Dezinformace, zkreslení a etická rizika: Výkonnější generativní modely usnadní masovou produkci hyperrealistického falešného obsahu (text, obrázky, video, dokonce i hlasy). Zvyšuje se tím riziko šíření dezinformací a podvodů. Například budoucí multimodální GPT by mohl vygenerovat přesvědčivé video světového politika, jak říká něco, co ve skutečnosti nikdy neřekl – což je děsivé pro důvěryhodnost informací. Řešení bude vyžadovat kombinaci technických i politických opatření: vědci pracují na vodoznacích pro AI obsah nebo detekčních nástrojích (některé jurisdikce dokonce budou vyžadovat označení či detekci AI obsahu přímo ze zákona ncsl.org ). Významné je také zkreslení dat – pokud se modely učí z internetových dat, mohou převzít společenské předsudky či stereotypy, které v těchto datech jsou. Jakmile budou modely součástí rozhodování (přijímání do práce, úvěry, policejní praxe aj.), etické důsledky zaujatých výstupů jsou zásadní. Další výzkum v oblasti férovosti AI a snižování biasu bude klíčový, aby tyto modely nechtěně dále nešířily diskriminaci. Používají se techniky jako pečlivější výběr trénovacích dat, bias testy či dolaďování instrukcemi, které modelu explicitně vysvětlují, jak se vyvarovat nenávistných nebo předsudečných výstupů. Firmy také zkoumají transparentní metody, aby rozhodnutí modelů byla lépe vysvětlitelná. Do doby, než přijde GPT-6 či -7, se zřejmě objeví průmyslové standardy pro audity biasu a veřejná sdělení o omezeních modelů. Důležité je, že modely nové generace budou sladěné nejen proto, aby byly užitečné, ale i aby odpovídaly lidským hodnotám a bezpečnostním normám. Přístupy jako „Constitutional AI“ od Anthropicu (kde je AI trénováno k dodržování sady etických principů i bez lidského příkladu v každé situaci) se pravděpodobně stanou standardem, což povede k AI, která je neškodná a upřímná už z principu anthropic.com.
Regulační reakce a governance: Rychlý pokrok v oblasti základních modelů přinesl mezi tvůrci politik významné debaty. Vlády teď řeší, jak zajistit bezpečnost a odpovědnost AI bez zbrzdění inovací. Evropská unie je průkopníkem s AI Act, který v roce 2024 zavedl nová pravidla právě pro základní modely. Zákon klasifikuje velké modely pro obecné účely (nyní označované „GPAI modely“) a stanovuje povinnosti jako transparentnost ohledně trénovacích dat, posuzování rizik či požadavky na tlumení škodlivých výstupů ibanet.org ibanet.org. Rozlišuje dokonce „systemické“ základní modely – tedy ty největší s nejširším dopadem –, na které se vztahuje přísnější dohled (podobně jako jsou speciálně regulovány velké banky nebo infrastruktura) ibanet.org. V USA i jinde se diskutuje o auditech AI modelů, režimech licencí pro trénink extrémně silných modelů i o odpovědnosti za škody způsobené AI. Významným momentem byl v roce 2023 otevřený dopis podepsaný mnoha špičkami v oboru, který vyzýval k moratoriu na vývoj AI výkonnější než GPT-4 na šest měsíců, aby byla šance připravit regulační rámec ncsl.org. Dobrovolná pauza sice neproběhla, ale upozornila i uvnitř oboru na velké obavy z nekontrolovaného vývoje AI. Od té doby sledujeme vznik iniciativ jako Frontier Model Forum (koalice předních AI firem na podporu bezpečnosti AI) i vládní poradní orgány pro AI. Regulační opatření jsou stále konkrétnější: v Kalifornii navrhovaný zákon (Safe and Secure Innovation for Frontier AI Models Act) by vývojářům velmi pokročilých modelů ukládal povinnost implementovat „kill-switch“ – možnost okamžitého vypnutí modelu v případě nebezpečného chování – a vybavení bezpečnostním plánem ještě před začátkem tréninku ncsl.org. Probíhají také celosvětová jednání o sladění AI standardů v rámci OSN a G7. Až přijdou modely po GPT-5, pravděpodobně už budeme mít mnohem rozvinutější politický režim pro AI: očekávejme požadavky na dokumentaci vývoje modelů, posuzování bezpečnosti (např. na extremismus či bias) i možné certifikace modelů splňujících vybraná bezpečnostní kritéria. Hlavní výzvou je vyvážit inovaci a ochranu. Při uvážené regulaci může společnost získat maximum z výkonné AI a zároveň omezit rizika jako dezinformace, narušení soukromí či selhání autonomních systémů.
Bezpečnostní hrozby a zneužití: Jak se AI zlepšuje, roste i riziko zneužití – například k kyberútokům (psaní sofistikovaného malwaru nebo phishingových kampaní) či k podpoře zbraní (spekuluje se o využití AI v biotechnologiích nebo vojenském kontextu). To vyvolává otázky národní bezpečnosti. Vlády začínají považovat pokročilou AI za technologii dvojího užití. Exportní kontroly špičkových čipů (potřebných ke trénování velkých modelů) jsou jedním z nástrojů, jak zabránit některým státům získat výhodu v oblasti frontier AI. Můžeme také očekávat dohody podobné odzbrojovacím: bezpečnostní výzkum se bude sdílet otevřeně, zatímco vývoj skutečně nebezpečných schopností bude omezen. Dalším tématem je soukromí – modely trénované na veřejně dostupných datech mohou nevědomky uložit osobní údaje, schopnost generování lidsky působícího textu může obalamutit uživatele, aby sdíleli citlivé informace. Bude zapotřebí silnější ochrana dat a možná i nové přístupy (například trénink na syntetických datech nebo privacy-preserving learning). Stručně: společnost bude muset proaktivně předvídat zneužití a zvyšovat bezpečnostní opatření (od digitálních vodoznaků pro AI obsah až po směrnice pro AI v kritické infrastruktuře).

Celkově jsou společenské dopady základních modelů za hranicí GPT-5 obrovské. Abychom maximálně využili jejich pozitivní potenciál, musíme se vypořádat s otázkami důvěry, transparentnosti a bezpečnosti. Dobrou zprávou je, že tyto rozhovory – mezi etiky, technologickými lídry a tvůrci pravidel – už probíhají a paralelně kráčí s technickým vývojem.

Spekulativní vize: Směrem k AGI a dál

V neposlední řadě, při pohledu dále do budoucnosti, se mnoho lidí ptá, jak by mohly tyto trendy nakonec vyústit v AGI – Umělou obecnou inteligenci, která je často definována jako AI, jež se vyrovná nebo překoná lidské kognitivní schopnosti napříč širokým spektrem úkolů. Přestože AGI zůstává spekulativním pojmem, neustálý pokrok v možnostech fundamentálních modelů tuto diskuzi učinil konkrétnější. Zde zvažujeme několik vizionářských představ, jak by mohl vypadat svět s AGI po éře GPT-5, na základě současných trajektorií:

AGI jako kolektivní inteligence: Jednou z nastupujících vizí je, že AGI nemusí být jediný monolitický supermozek, ale spíše kolektiv specializovaných modelů a nástrojů, které spolupracují. První náznaky toho už vidíme: modely z éry GPT-5 by mohly vytvořit “super-agentní” ekosystémy – jedna AI rozdělí složitý problém na části a deleguje je expertním sub-agentům (jeden na programování, další na výzkum atd.) seniorexecutive.com. Pokud tento trend rozšíříme, mohla by AGI fungovat jako vysoce organizovaná komise AI, z nichž každá má lidskou úroveň schopností ve svém oboru a je koordinována meta-modelem. Takový systém by mohl dosáhnout obecné inteligence prostřednictvím agregace – celek je víc než součet částí. Tato myšlenka se pojí s architekturou mixture-of-experts v širším měřítku a odráží způsob, jakým lidé řeší problémy týmovou spoluprací. Souvisí to i s představou AI služeb přístupných přes API: budoucí AGI může vypadat méně jako jeden program a více jako síť mnoha modelů a databází po vzoru internetu, které dynamicky spolupracují na jakékoli zadané otázce či úkolu. Tento koncept „společnosti mysli“ (původně jej představil AI průkopník Marvin Minsky) by mohl být realizován fundamentálními modely, které vynikají v kooperaci a používání nástrojů.
Smyčky kontinuálního sebezdokonalování: Skutečně obecná AI by pravděpodobně byla schopna učit se autonomně a sama se zlepšovat. Vidíme první náznaky v projektech, kde AI optimalizuje jinou AI – například používá jeden model ke generování trénovacích dat nebo zpětné vazby pro druhý. Inženýři OpenAI uvažovali o „rekurzivním sebezdokonalování“, jakmile AI dosáhne dostatečné úrovně. Spekulativní scénář je AI, která si umí sama přepsat svůj kód nebo navrhnout efektivnější neuronové sítě, což povede k pozitivní zpětné vazbě amplifikace inteligence. Současné modely sice ještě nejsou schopny přepisovat svůj zdrojový kód, ale již dokážou psát nové programy. AGI by toho mohla využít k simulaci tisíců experimentů na vlastních variantách a následně vybrat nejlepší, což je proces mnohem rychlejší, než dokáže tým lidských inženýrů. To otevírá hluboké otázky (včetně klasické debaty o „AI takeoff“), a proto i společnosti, které na vývoji silné AI pracují nejrychleji, mluví o potřebě opatrnosti při přibližování se AGI openai.com openai.com. Přesto je myšlenka AI, která se učí lépe učit, logickým prodloužením dnešních trendů v meta-učení a automatizovaném strojovém učení. Do doby „za hranicí GPT-5“ je myslitelné, že už budou existovat rané formy AI s vlastním laděním – třeba omezené na bezpečné domény – což ukáže cestu k systémům, které se zlepšují s minimálním lidským zásahem.
Integrace AI s fyzickým světem: Doposud fundamentální modely žijí převážně v digitálním světě textu a obrázků. Vize AGI zahrnuje ukotvení těchto modelů v reálném prostředí skrze robotiku nebo IoT (Internet věcí). AI, která vidí skrze kamery, hýbe aktuátory a experimentuje v reálných podmínkách, by mohla získat druh zakotveného chápání světa, který mají lidé. Někteří experti se domnívají, že vtělení je klíčem k obecné inteligenci – učení se skrze čin a každodenní kontakt s reálným světem. Už máme první multimodální agenty (například DeepMindův Gato, který byl v roce 2022 vytrénován na úkolech od hraní videoher po ovládání robotické ruky). Hranice možností se bude posouvat dál: představte si AI, která čte o vaření, sleduje kuchařská videa (vize), vede konverzaci s kuchaři (jazyk) a sama je schopná ovládat robotické kuchyňské ruce k přípravě jídla (akce) – přičemž své schopnosti zlepšuje pokusem a omylem. Takový agent by integroval vize, jazyk, zvuk (prskot při vaření…), i motoriku – to už je velmi vzdálené chatbotům a mnohem blíže obecné inteligenci. Přestože to v dohledné době přesahuje možnosti GPT-5, výzkum tímto směrem směřuje. Firmy jako Tesla pracují na humanoidních robotech a OpenAI má svou vlastní robotickou divizi. Je představitelné, že AGI budoucnosti bude stejně robotem i chatbotem – nebo alespoň bude mít aktuátory, které umožní ovlivňovat fyzický svět přímo. To vytvoří nové příležitosti v průmyslu, zdravotnictví (robotické asistenty) i každodenním životě (opravdu chytré domácnosti) a současně přinese nové otázky ohledně bezpečnosti.
Lidsko-AI spolupráce a kognitivní posílení: Namísto vývoje AI v izolaci je přesvědčivější vizí, jak může AI zesilovat lidskou inteligenci. Ve světě po GPT-5 bychom každý mohli mít vysoce personalizovaného AI asistenta, který zná naše cíle, silné i slabé stránky do detailu. Tito asistenti by nám mohli pomáhat učit se nové dovednosti (v roli tutora/kouče), podílet se na brainstormingu, přebírat rutinní úkoly a fungovat jako kreativní partner. Někteří technologové hovoří o „IA“ (Intelligence Augmentation – rozšíření inteligence) jako o dvojčeti cíle AI. Například AGI-medicínský asistent by mohl umožnit lékařům diagnostikovat a léčit pacienty s nadlidskou přesností, díky kombinaci lékařských zkušeností lékaře a okamžité analýzy všech dostupných odborných článků i zdravotních záznamů. Ve vzdělání by mohl AI-tutor s obecnou inteligencí adaptovat výuku dle stylu každého žáka a poskytovat personalizované osnovy ve velkém měřítku, čímž by demokratizoval špičkové vzdělání globálně. Spekuluje se také o přímější integraci – například o rozhraních mozek-počítač, jež by umožňovala propojení AI se samotnými lidskými neurony (i když je to zatím spekulativní a provázené etickými otázkami). V každém případě je optimistickou vizí AGI, která naše možnosti rozšiřuje a spolupracuje s námi, nikoliv nějaká cizorodá superinteligence působící proti či odděleně od lidstva. K tomu bude nutná důkladná shoda AI cílů s lidskými hodnotami, což je předmětem intenzivního výzkumu i debat.
Superinteligence a neznámo: Někteří futuristé považují AGI za předstupeň ASI (Artificial Superintelligence) – AI, která nejenže se vyrovná lidské inteligenci, ale daleko ji překoná. Odhady kdy (a zda vůbec) k tomu dojde, se liší od dekád po pouhé roky, a toto téma je na pomezí spekulací. Pokud by AI urychlila vědecké objevy (jak už GPT-modely začínají například v oblasti proteinového skládání nebo matematiky), mohli bychom vstoupit do období extrémně rychlého pokroku. Takzvaný „výbuch inteligence“ je důvodem, proč postavy jako Elon Musk nebo zesnulý Stephen Hawking varovaly před nekontrolovaným AI. OpenAI tento postoj potvrzuje, jak říká Altman: superinteligence je na obzoru a společnost by měla být připravena a nastolit vhodná pravidla techcrunch.com openai.com. Další hranice se tak netýkají jen technologií, ale i filozofických otázek: jak zajistit, aby cíle ASI, pokud vznikne, byly sladěny s lidským blahobytem a existovaly robustní mechanismy řízení. Koncepty jako mezinárodní správa AGI či dokonce závazné dohody mohou přejít ze sci-fi do reality. Je třeba poznamenat, že mnoho AI expertů zůstává obezřetných – pokrok, ač rychlý, může narazit na základní limity nebo vyžadovat nové objevené paradigmy. Někteří přirovnávají naše současné modely k prvním pokusům o létání: GPT-4/5 jsou jako bratři Wrightové – pozoruhodný začátek, ale ještě daleko do éry jumbo jetů, které vyžadovaly desítky let inženýrského vývoje. Pravá AGI tak možná bude potřebovat teoretický průlom (třeba novou algoritmiku nebo dokonce nové výpočetní hardwary, jako jsou kvantové počítače nebo mozkově inspirované neuromorfní čipy). Není jisté, že současné navyšování velikosti Transformerů je přímou cestou k AGI. Každý průlomový model nás ale posouvá blíže pochopení inteligence – a snad i k jejímu vytvoření ve stroji.

Závěr
Obzor za hranicí GPT-5 je vzrušující i znepokojující. Technologicky očekáváme AI modely s hlubším porozuměním, více modalitami, větší (a delší) pamětí a větší autonomií při učení i jednání. Nové trénovací metody a prosperující otevřená vědecká komunita tento pokrok dramaticky urychlují. Současně však rostoucí síla fundamentálních modelů vyžaduje, abychom si kladli těžké otázky o jejich roli ve společnosti – jak využít jejich přínos a zároveň omezit zneužití, jak je eticky a spravedlivě začlenit do života a jak koexistovat s inteligencemi, které nám možná jednou budou rovny či nás předstihnou.

Při navigaci touto budoucností se stále znovu objevuje motiv spolupráce: spolupráce mezi člověkem a AI (abychom využili to nejlepší z obou), mezi různými AI systémy (specialisté pracující dohromady jako mixture-of-experts či AI agenty s nástroji) a především mezi aktéry ve společnosti. Vlády, technologické firmy, vědci i občané musí spolupracovat. AI není jen technickou, ale i společenskou hranicí – společně učíme modely tomu, co považujeme za důležité, skrze naši zpětnou vazbu i pravidla. Pokud se to podaří, mohou příští generace fundamentálních modelů být mocnými nástroji pokroku – pomáhat najít nové léky, demokratizovat poznání, řešit klimatické výzvy i podpořit lidskou kreativitu způsoby, které si dnes jen těžko dokážeme představit.

Když dnes stojíme na prahu GPT-5, je jasné, že se pomalu přibližujeme dlouhodobému snu (nebo obavě) o AGI. Ať už AGI přijde za deset let, nebo zůstane nedosažitelná, už samotná cesta k ní mění náš svět. Další hranice prověří naši vynalézavost nejen v konstrukci chytřejších strojů, ale i v používání moudrosti a prozíravosti, abychom zajistili, že tyto stroje skutečně poslouží lidstvu. Když překročíme GPT-5, otázkou nebude jen co budou fundamentální modely umět, ale kým chceme být my spolu s nimi. Příběh další kapitoly AI bude psát nás všech – a slibuje být jedním z nejdůležitějších a nejzajímavějších naší doby.

Zdroje:

Altman, S. (2025). Odborníci na AI předpovídají, jak GPT-5 změní způsob, jakým pracujeme. SeniorExecutive Media – Zmiňuje očekávanou multimodalitu, vylepšenou paměť a agentní schopnosti GPT-5 seniorexecutive.com seniorexecutive.com.
Kranen, K. & Nguyen, V. (2024). Využití systému Mixture of Experts v architekturách LLM. NVIDIA Technical Blog – Diskuse o MoE v GPT-4 a přínosu efektivity při škálování modelů developer.nvidia.com developer.nvidia.com.
Microsoft Research (2024). Nové metody zlepšují úsudek v malých a velkých jazykových modelech – Popisuje Logic-RL a neuronově-symbolické techniky, které zlepšují výkon v oblasti uvažování microsoft.com microsoft.com.
Anthropic (2023). Představujeme 100tisícové kontextové okno – Demonstruje 100 000-tokenovou paměť (75tisíc slov) v modelu Claude a její výhody pro dlouhé dokumenty anthropic.com anthropic.com.
YourGPT.ai (2025). GPT-5: Vše, co byste měli vědět – Shrnutí očekávaných funkcí GPT-5, jako je kontext pro více než milion tokenů, zvuková modalita, trvalá paměť pro personalizaci yourgpt.ai yourgpt.ai.
Zuckerberg, M. (2024). Otevřený AI zdroj je ta správná cesta. Meta Newsroom – Oznámení Llama 3.1 (405B) a konstatování, že otevřené modely rychle dohánějí a brzy možná překonají špičkový stav poznání about.fb.com about.fb.com.
Wu, S. et al. (2023). BloombergGPT: Velký jazykový model pro finance. arXiv preprint – 50miliardový model překonávající obecné LLM ve finančních úlohách bez ztráty obecné schopnosti arxiv.org.
Genna, I. (2024). Regulace základních modelů v EU AI Act. International Bar Association – Vysvětlení, jak evropský AI Act zachází s „AI pro všeobecné použití“ a ukládá povinnosti v oblasti transparentnosti a řízení rizik ibanet.org ibanet.org.
NCSL (2024). AI Legislativa 2024 – Poznamenává rezoluci vyzývající k moratoriu na trénink AI výkonnější než GPT-4 na 6 měsíců kvůli vývoji mechanismů správy ncsl.org, a kalifornský návrh zákona požadující, aby vývojáři pokročilých modelů implementovali bezpečnostní vypínací mechanismus ncsl.org.
OpenAI (2023). Plánování cesty k AGI a dál – Náčrt vize OpenAI pro bezpečné směřování k AGI a důležitost širokého sdílení přínosů i opatrného nasazení stále pokročilejších AI openai.com openai.com.