Mezi starším modelem GPT-3.5 a zbrusu novým modelem GPT-4 jsou některé klíčové rozdíly.
Po všech spekulacích a tvrzeních týkajících se schopností GPT-4 byla 14. března 2023 spuštěna tolik očekávaná čtvrtá iterace rodiny jazykových modelů GPT.
GPT-4 nepřišel s některými tolik propagovanými funkcemi, o kterých se říkalo, že má. Nejnovější model však výrazně vylepšuje GPT-3.5 a jeho předchůdce. Jak se ale GPT-4 liší od GPT-3.5? Provedeme vás některými klíčovými rozdíly mezi GPT-4 a GPT-3.5.
1. GPT-4 vs. GPT-3.5: Kreativita
Jednou z nejvýraznějších výhod modelu GPT-4 oproti GPT-3.5 je jeho schopnost poskytovat kreativnější odpovědi na výzvy. Nechápejte mě špatně; GPT-3.5 je velmi kreativní. Existuje dlouhý seznam kreativní věci, které můžete dělat s ChatGPT, který používá model. Kreativitou však již předčí mnohé velké jazykové modely.
GPT-4 však laťku ještě zvyšuje. I když kreativní výhoda GPT-4 nemusí být zřejmá při snaze vyřešit základní problémy, rozdíl v kreativita mezi oběma modely se projeví tím, jak se úkol stává těžším a vyžaduje vyšší úroveň tvořivost.
Pokud například požádáte oba modely, aby dokončily kreativní úkol, jako je psaní básně s použitím angličtiny i francouzštiny na každém řádku básně, ChatGPT poháněný nejnovějším modelem GPT-4 přinese lepší výsledky. Zatímco odpověď GPT-4 by používala oba jazyky na každém řádku, GPT-3.5 by místo toho střídala oba jazyky, přičemž každý řádek by používal jeden jazyk a další používal druhý.
2. GPT-4 vs. GPT-3.5: Obrazové nebo vizuální vstupy
Zatímco GPT-3.5 může přijímat pouze textové výzvy, GPT-4 je multimodální a může přijímat textové i vizuální vstupy. Aby bylo jasno, když říkáme vizuální vstupy, obrázek nemusí být obrazem napsané výzvy – může to být obraz čehokoli. Takže od obrázku ručně psaného matematického problému až po memy Reddit, GPT-4 dokáže pochopit a popsat téměř jakýkoli obrázek.
Na rozdíl od GPT-3 je GPT-4 jazykový i vizuální model.
Během živého přenosu oznámení GPT-4 nakrmil inženýr OpenAI model snímkem obrazovky serveru Discord. GPT-4 by na něm mohl popsat každý detail, včetně jmen uživatelů online v té době. Modelovi byl také předán obrázek ručně kreslené makety vtipného webu s pokyny přeměňte jej na webovou stránku a překvapivě GPT-4 poskytl funkční kód pro webovou stránku, která odpovídala obraz.
3. GPT-4 vs. GPT-3.5: Bezpečnější reakce
I když GPT-4 není dokonalý, opatření, která přijímá k zajištění bezpečnějších reakcí, jsou vítaným vylepšením oproti modelu GPT-3.5. S GPT-3.5 OpenAI zaujala více umírněný přístup k bezpečnosti. Jinými slovy, některá bezpečnostní opatření byla spíše dodatečná. OpenAI monitorovalo, co uživatelé dělali a jaké otázky kladli, identifikovalo nedostatky a snažilo se je na cestách opravit.
U GPT-4 je většina bezpečnostních opatření již zapečena v systému na úrovni modelu. Abychom porozuměli rozdílu, je to jako postavit dům z robustních materiálů hned od začátku oproti použití čehokoli, co jde, a pak se snažit věci opravit, když se objeví chyby. Podle Technická zpráva GPT-4 společnosti OpenAI [PDF], GPT-4 vyvolává toxické reakce pouze 0,73 % času ve srovnání s GPT-3.5 6,48 % toxických odpovědí.
4. GPT-4 vs. GPT-3.5: Skutečnost odezvy
Jednou z nedostatků GPT-3.5 je jeho tendence vytvářet nesmyslné a nepravdivé informace sebevědomě. V žargonu AI se tomu říká „halucinace AI“ a může způsobit nedůvěru k informacím generovaným AI.
V GPT-4 jsou halucinace stále problémem. Podle technické zprávy GPT-4 je však u nového modelu o 19 % až 29 % nižší pravděpodobnost halucinací ve srovnání s modelem GPT-3.5. Ale to není jen o technické zprávě. Odpovědi od modelu GPT-4 na ChatGPT jsou znatelně faktičtější.
5. GPT-4 vs. GPT-3.5: Kontextové okno
Méně diskutovaným rozdílem mezi GPT-4 a GPT-3.5 je kontextové okno a velikost kontextu. Kontextové okno udává, kolik dat může model uchovat ve své "paměti" během chatu a jak dlouho. GPT-4 má výrazně lepší velikost kontextu a okna než jeho předchůdce.
V praxi to znamená, že GPT-4 si může déle lépe pamatovat kontext konverzace a také pokyny během konverzace.
Problémem s GPT-3.5 je sklon modelu odcházet od tématu nebo nedodržovat pokyny, jak postupujete v průběhu konverzace. Mohli byste například říct modelce, aby vás oslovovala vaším jménem, a ono to na chvíli udělá, ale pak se nebude řídit pokyny. Ačkoli tento problém stále existuje u modelu GPT-4, je méně problém kvůli lepšímu kontextovému oknu.
Dalším problémem je omezení objemu textu, který můžete použít ve výzvě najednou. Shrnutí dlouhého textu pomocí GPT-3 obvykle znamená rozdělení textu na více částí a jejich shrnutí kousek po kousku. Zlepšení délky kontextu v modelu GPT-4 znamená, že můžete najednou vložit celé soubory PDF a nechat model shrnout, aniž byste jej rozdělovali na části.
GPT-4: Krok nahoru oproti GPT-3.5
GPT-4 je nepochybně významným krokem vpřed oproti svým předchůdcům. I když je stále sužován některými omezeními GPT-3.5, došlo k významným vylepšením v několika oblastech a přidání nových schopností činí z modelu vzrušující nový krok ve snaze o skutečně inteligentní jazyk AI modely.