Modely GPT OpenAI způsobily revoluci ve zpracování přirozeného jazyka (NLP), ale pokud neplatíte za prémii přístup ke službám OpenAI, nebudete moci doladit a integrovat jejich modely GPT do vašich aplikací. Kromě toho bude mít OpenAI přístup ke všem vašim konverzacím, což může být bezpečnostní problém, pokud používáte ChatGPT pro podnikání a další citlivější oblasti vašeho života. Pokud vás to nezajímá, možná budete chtít vyzkoušet GPT4All.

Co to tedy GPT4All vlastně je? Jak to funguje a proč to používat přes ChatGPT?

Co je GPT4All?

GPT4All je open-source ekosystém používaný k integraci LLM do aplikací bez placení za platformu nebo předplatné hardwaru. Vytvořila ji společnost Nomic AI, společnost zabývající se informační kartografií, jejímž cílem je zlepšit přístup ke zdrojům umělé inteligence.

GPT4All je navržen tak, aby běžel na moderních až relativně moderních počítačích bez nutnosti připojení k internetu nebo dokonce GPU! To je možné, protože většina modelů poskytovaných GPT4All byla kvantizována tak, aby byla malá jako několik gigabajtů a ke svému běhu vyžadovala pouze 4–16 GB RAM.

To umožňuje menším podnikům, organizacím a nezávislým výzkumníkům používat a integrovat LLM pro konkrétní aplikace. A protože GPT4All lze snadno nainstalovat pomocí instalačního programu na jedno kliknutí, mohou nyní lidé používat GPT4All a mnoho z jejích LLM pro tvorbu obsahu, psaní kódu, porozumění dokumentům a informacím shromáždění.

Proč používat GPT4ALL přes ChatGPT?

Obrazový kredit: bruce mars/Unsplash

Existuje několik důvodů, proč byste mohli chtít používat GPT4All přes ChatGPT.

  • Přenosnost: Modely poskytované GPT4All vyžadují pouze čtyři až osm gigabajtů paměti, ke spuštění nevyžadují GPU a lze je snadno uložit na USB flash disk pomocí instalačního programu GPT4All na jedno kliknutí. Díky tomu je GPT4All a jeho modely skutečně přenosné a použitelné na téměř jakémkoli moderním počítači.
  • Ochrana osobních údajů a zabezpečení: Jak bylo vysvětleno dříve, pokud nemáte přístup k ChatGPT Plus, všechny vaše konverze ChatGPT jsou přístupné pomocí OpenAI. GPT4All se zaměřuje na transparentnost dat a soukromí; vaše data budou uložena pouze na vašem místním hardwaru, pokud je záměrně nesdílíte s GPT4All, abyste pomohli rozvíjet jejich modely.
  • Offline mód: GPT je proprietární model, který vyžaduje přístup k API a neustálé připojení k internetu pro dotazování nebo přístup k modelu. Pokud ztratíte připojení k internetu nebo máte problém se serverem, nebudete mít přístup k ChatGPT. To není případ GPT4All. Vzhledem k tomu, že všechna data jsou již uložena ve čtyř až osmigigabajtovém balíčku a odvození se provádí lokálně, nepotřebujete k přístupu k žádnému modelu v GPT4All připojení k internetu. Můžete pokračovat v chatování a dolaďování svého modelu i bez připojení k internetu.
  • Volný a otevřený zdroj: Několik LLM poskytovaných GPT4All je licencováno pod GPL-2. To umožňuje komukoli doladit a integrovat své vlastní modely pro komerční použití, aniž by musel platit za licence.

Jak GPT4All funguje

Jak již bylo zmíněno dříve, GPT4All je ekosystém používaný k výcviku a nasazení LLM lokálně na vašem počítači, což je neuvěřitelný výkon! Načtení standardního 25–30GB LLM by obvykle vyžadovalo 32 GB RAM a GPU podnikové třídy.

Pro srovnání, LLM, které můžete použít s GPT4All, vyžadují pouze 3GB-8GB úložiště a mohou běžet na 4GB-16GB RAM. Díky tomu je možné provozovat celý LLM na okrajovém zařízení bez potřeby GPU nebo externí cloudové podpory.

Hardwarové požadavky na provoz LLM na GPT4All byly výrazně sníženy díky kvantizaci neuronové sítě. Snížením přesnosti hmotnosti a aktivací v neuronové síti lze mnoho modelů poskytovaných GPT4All provozovat na většině relativně moderních počítačů.

Tréninková data použitá v některých dostupných modelech byla shromážděna prostřednictvím „hromady“, což jsou pouze seškrábaná data z veřejně zveřejněného obsahu na internetu. Data jsou poté odeslána do databáze Atlas AI společnosti Nomic AI, kterou lze vidět na základě korelací na snadno viditelné 2D vektorové mapě (také známé jako vektorovou databázi AI).

Díky tomu, že Nomic AI trénoval model Groovy a používal veřejně dostupná data, dokázala Nomic AI vydat model na otevřenou licenci GPL, která umožňuje komukoli jej používat, a to i pro komerční aplikace.

Jak nainstalovat GPT4All

Instalace GPT4All je jednoduchá a nyní, když byla vydána verze 2 GPT4All, je ještě jednodušší! Nejlepší způsob, jak nainstalovat GPT4All 2, je stáhnout si instalační program jedním kliknutím:

Stažení:GPT4All pro Windows, macOS nebo Linux (zdarma)

Následující pokyny jsou pro Windows, ale GPT4All můžete nainstalovat na každý hlavní operační systém.

Po stažení dvakrát klikněte na instalační program a vyberte Nainstalujte. Program Windows Defender může instalaci považovat za škodlivou, protože proces udělování platných podpisů pro aplikace třetích stran může trvat dlouho. To by však mělo být brzy opraveno. V době psaní, pokud jste si stáhli aplikaci GPT4All z oficiálních stránek, měli byste být v bezpečí. Klikněte na Přesto nainstalovat k instalaci GPT4All.

Jakmile aplikaci otevřete, budete muset vybrat model, který chcete použít. GPT4ALL vám poskytuje několik modelů, z nichž všechny budou mít své silné a slabé stránky. Abyste věděli, který model stáhnout, zde je tabulka ukazující jejich silné a slabé stránky.

Modelka

Velikost

Poznámka

Parametry

Typ

Kvantování

Hermes

7,58 GB

  • Na základě pokynů
  • Dává dlouhé odpovědi
  • Kurátor s 300 000 necenzurovanými instrukcemi
  • Nelze použít komerčně

13 miliard

Lama

q4_0

GPT4All Falcon

3,78 GB

  • Rychlé reakce
  • Na základě pokynů
  • Licencováno pro komerční použití

7 miliard

Sokol

q4_0

Báječný

8 GB

  • Rychlé reakce
  • - Kreativní reakce
  • Na základě pokynů
  • Licencováno pro komerční použití

7 miliard

GPT-J

q4_0

ChatGPT-3.5 Turbo

Minimální

  • Vyžaduje osobní API
  • Odešle vaše chaty do OpenAI
  • GPT4All se používá pouze ke komunikaci s OpenAI

?

GPT

NA

ChatGPT-4

Minimální

  • Vyžaduje osobní API
  • Odešle vaše chaty do OpenAI
  • GPT4All se používá pouze ke komunikaci s OpenAI

?

GPT

NA

Snoozy

7,58 GB

  • Na základě pokynů
  • Pomalejší než Groovy, ale s vyšší kvalitou odpovědí
  • Nelze použít komerčně

13 miliard

Lama

q4_0

Chat MPT

4,52 GB

  • Rychlé reakce
  • Chat založený
  • Nelze použít komerčně

7 miliard

MPT

q4_0

Orca

3,53 GB

  • Na základě pokynů
  • Vysvětluje vyladěné datové sady
  • Přístupy ke konstrukci datové sady Orca Research Paper
  • Licencováno pro komerční použití

7 miliard

OpenLLaMA

q4_0

Vicuna

3,92 GB

  • Na základě pokynů
  • Nelze použít komerčně

7 miliard

Lama

q4_2

kouzelník

3,92 GB

  • Na základě pokynů
  • Nelze použít komerčně

7 miliard

Lama

q4_2

Čaroděj bez cenzury

7,58 GB

  • Na základě pokynů
  • Nelze použít komerčně

13 miliard

Lama

q4_0

Mějte na paměti, že poskytnuté modely mají různé úrovně omezení. Ne všechny modely lze komerčně používat zdarma; některé budou potřebovat více hardwarových prostředků, zatímco jiné budou potřebovat klíč API. Nejméně omezující modely dostupné v GPT4All jsou Groovy, GPT4All Falcon a Orca.

Můžete trénovat GPT4All Models?

Ano, ale ne kvantované verze. Chcete-li efektivně vyladit modely GPT4All, musíte si stáhnout nezpracované modely a použít GPU podnikové třídy, jako je např. Instinct Accelerators od AMD nebo GPU NVIDIA Ampere nebo Hopper. Kromě toho budete muset model trénovat prostřednictvím tréninkového rámce AI, jako je LangChain, což bude vyžadovat určité technické znalosti.

Jemné doladění modelu GPT4All bude vyžadovat určité finanční prostředky a také určité technické know-how, ale pokud chcete pouze napájet vlastní data modelu GPT4All, můžete pokračujte v trénování modelu prostřednictvím rozšířeného generování vyhledávání (které pomáhá jazykovému modelu získat přístup k informacím mimo jeho základní školení a porozumět jim úkoly). Můžete tak učinit tak, že před položením otázky požádáte GPT4All o modelování vašich vlastních dat. Vlastní data by měla být uložena lokálně a po zobrazení výzvy by vám model měl být schopen poskytnout informace, které jste kdysi poskytli.

Měli byste používat GTP4All?

Myšlenkou GPT4All je poskytnout volně použitelnou platformu s otevřeným zdrojovým kódem, kde lidé mohou na svých počítačích provozovat velké jazykové modely. V současné době je GPT4All a jeho kvantované modely skvělé pro experimentování, učení a zkoušení různých LLM v bezpečném prostředí. Pro profesionální vytížení stále doporučujeme používat ChatGPT, protože model je výrazně schopnější.

Celkově neexistuje žádný důvod, proč byste se měli omezovat na jeden. Protože se jejich případ použití nepřekrývá, měli byste zkusit použít oba.