GPT-4 je tady a toto jsou nové funkce, které byste si měli vyzkoušet.

OpenAI konečně spustila svou velmi očekávanou aktualizaci GPT, GPT-4. Velký jazykový model (LLM) přichází s některými výkonnými novými funkcemi a schopnostmi, které již šokovaly uživatele po celém světě.

Kromě toho, že je výrazně lepší než GPT-3.5, stávající LLM, který pohání virálního chatbota ChatGPT OpenAI, může GPT-4 porozumět složitějším vstupům, má mnohem větší limit vstupu znaků, má multimodální schopnosti a je údajně bezpečnější použití.

1. GPT-4 dokáže porozumět složitějším vstupům

Jednou z největších novinek GPT-4 je jeho schopnost porozumět složitějším a podrobnějším výzvám. Podle OpenAI, GPT-4 "ukazuje výkon na lidské úrovni v různých profesionálních a akademických měřítcích."

To bylo prokázáno tím, že GPT-4 prošel několika zkouškami na lidské úrovni a standardizovanými testy, jako je SAT, BAR a GRE, bez zvláštního školení. Nejen, že GTP-4 porozuměl a vyřešil tyto testy s relativně vysokým skóre ve všech oblastech, ale také pokaždé porazil svého předchůdce GPT-3.5.

instagram viewer
Kredit obrázku: OpenAI

Schopnosti porozumět podrobnějším vstupním výzvám napomáhá také skutečnost, že GPT-4 má mnohem větší limit slov. Nový model zvládne vstupní výzvy o délce až 25 000 slov (pro kontext byl GPT-3.5 omezen na 8 000 slov). To přímo ovlivní detaily, které mohou uživatelé vtěsnat do svých výzev, a poskytne tak modelu mnohem více informací, se kterými bude pracovat, a vytvoří delší výstupy.

GPT-4 také podporuje více než 26 jazyků, včetně jazyků s nízkými zdroji, jako je lotyština, velština a svahilština. Při srovnávání s přesností na tři snímky v benchmarku MMLU porazil GPT-4 GPT-3.5 stejně jako další přední LLM, jako je PaLM a Chinchilla, pokud jde o výkon v anglickém jazyce ve 24 jazycích.

2. Multimodální schopnosti

Předchozí verze ChatGPT byl omezen pouze na textové výzvy. Naproti tomu jednou z nejnovějších funkcí GPT-4 jsou jeho multimodální schopnosti. Model může přijímat textové i obrázkové výzvy.

To znamená, že AI může přijmout obrázek jako vstup a interpretovat jej a porozumět mu stejně jako textovou výzvu. Tato schopnost pokrývá všechny velikosti a typy obrázků a textu, včetně dokumentů kombinující obojí, ručně kreslených náčrtů a dokonce i snímků obrazovky.

Schopnosti čtení obrázků GPT-4 však přesahují pouze jejich interpretaci. OpenAI to předvedla ve svém vývojářském streamu (výše), kde poskytla GPT-4 ručně kreslenou maketu vtipného webu. Model měl za úkol napsat kód HTML a JavaScript, aby z makety udělal webovou stránku a zároveň nahradil vtipy skutečnými.

GPT-4 napsal kód při použití rozložení určeného v maketě. Po testování kód vytvořil funkční stránku se skutečnými vtipy, jak můžete hádat. Znamená to Pokroky v AI budou znamenat konec programování? Ne tak docela, ale stále je to funkce, která se bude hodit při pomoci programátorům.

Jakkoli se tato funkce zdá slibná, je stále ve zkušební verzi a není veřejně dostupná. Model navíc zabere spoustu času zpracování vizuálních vstupů, přičemž samotné OpenAI uvádí, že zrychlení může vyžadovat práci a čas.

3. Větší ovladatelnost

OpenAI také tvrdí, že GPT-4 má vysoký stupeň řiditelnosti. Umělá inteligence také ztížila rozbití postavy, což znamená, že je méně pravděpodobné, že selže, když je implementována do aplikace pro hraní určité postavy.

Vývojáři mohou předepsat styl a úkol své AI popisem směru v „systémové“ zprávě. Tyto zprávy umožňují uživatelům rozhraní API výrazně přizpůsobit uživatelské prostředí v určitých mezích. Vzhledem k tomu, že tyto zprávy jsou také nejjednodušším způsobem, jak model „útěk z vězení“, pracují také na tom, aby byly bezpečnější. Demo pro GPT-4 tento bod potvrdilo tím, že přimělo uživatele, aby se pokusil zabránit tomu, aby GPT-4 byl učitelem Socratic a odpověděl na jejich dotaz. Modelka však odmítla zlomit charakter.

4. Bezpečnost

OpenAI strávil šest měsíců tvorbou GPT-4 bezpečnější a vyrovnanější. Společnost tvrdí, že je o 82 % nižší pravděpodobnost, že bude reagovat na žádosti o nevhodný nebo jinak nepovolený obsah, o 29 % vyšší pravděpodobnost, že reagovat v souladu se zásadami OpenAI na citlivé požadavky a o 40 % vyšší pravděpodobnost, že produkují věcné odpovědi ve srovnání s GPT-3.5.

Není to dokonalé a stále můžete očekávat, že čas od času „halucinuje“ a může se ve svých předpovědích mýlit. Jistě, GPT-4 má lepší vnímání a předpovědní sílu, ale přesto byste neměli slepě věřit AI.

5. Zlepšení výkonu

Kromě hodnocení výkonu modelu při lidských zkouškách OpenAI také hodnotila robota na tradičních benchmarkech navržených pro modely strojového učení.

Tvrdí, že GPT-4 „výrazně překonává“ stávající LLM a „většinu nejmodernějších modelů“. Tyto benchmarky zahrnují výše zmíněné MMLU, AI2 Reasoning Challenge (ARC), WinoGrande, HumanEval a Drop, které všechny testují jednotlivé schopnosti.

Podobné výsledky najdete při porovnávání výkonu na srovnávacích testech akademické vize. Spuštěné testy zahrnují VQAv2, TextVQA, ChartQA, AI2 Diagram (AI2D), DocVQA, Infographic VQA, TVQA a LSMDC, z nichž všechny jsou GPT-4 na vrcholu. OpenAI však uvedla, že výsledky GPT-4 v těchto testech „nereprezentují plně rozsah jeho schopností“, protože výzkumníci stále nacházejí nové a náročnější věci, s nimiž se model může vypořádat.

Small Step pro GPT-4, Giant Leap pro AI

S větší přesností, bezpečností používání a pokročilými schopnostmi byl GPT-4 uvolněn pro veřejnost prostřednictvím měsíčního předplatného ChatGPT+, které stojí 20 měsíčně. OpenAI se navíc spojila s různými organizacemi, aby začala vytvářet produkty pro spotřebitele pomocí GPT-4. Microsoft Bing, Duolingo, Stripe, Be My Eyes a Khan Academy již implementovaly GPT-4 do svých produktů.

GPT-4 může být přírůstkovou aktualizací oproti GPT-3.5, ale pro AI je to celkově obrovská výhra. Jak se model stává přístupnějším, jak pro průměrného uživatele, tak pro vývojáře prostřednictvím jeho API, zdá se, že bude dobrým důvodem pro implementace LLM napříč obory.