ChatGPT je chatbot s umělou inteligencí OpenAI, který mění hru, a který udržuje internet v úžasu. Navzdory všem zavedeným technologickým trendům netrvalo dlouho a ChatGPT si našel cestu téměř do všech oblastí našeho digitálního života.
Jen velmi málo technologických inovací vyvolalo takový zájem, jako ChatGPT za tak krátkou dobu. Zdá se, že nikdy nedojdou skvělé triky – každý den se dozvídáme o vzrušujících nových věcech, o kterých jsme nevěděli, že to dokáže.
Ale jak je ChatGPT schopen dělat věci, které umí? Jak ChatGPT funguje?
Jak byl ChatGPT postaven?
Chcete-li pochopit, jak ChatGPT funguje, stojí za to podívat se na jeho původ a mozek za špičkovým chatbotem AI.
Za prvé, jakkoli se ChatGPT může zdát magické, byl postaven lidským géniem, stejně jako každá cenná softwarová technologie. OpenAI vytvořil ChatGPT, revoluční společnost pro výzkum a vývoj AI, která stojí za dalšími výkonnými nástroji AI, jako jsou DALL-E, InstructGPT a Codex. Dříve jsme odpověděli
nějaké otázky, které byste mohli mít ohledně ChatGPT, tak se podívejte.Zatímco se ChatGPT stal virálním ke konci roku 2022, většina základní technologie, která pohání ChatGPT, existuje mnohem déle, i když s mnohem menší publicitou. Model ChatGPT je postaven na GPT-3 (nebo konkrétněji GPT-3.5). GPT je zkratka pro „Generative Pre-trained Transformer 3“.
GPT-3 je třetí iterací řady GPT modelů AI a předcházely mu GPT-2 a GPT. Dřívější iterace modelů GPT jsou stejně užitečné, ale GPT-3 a jemně vyladěná iterace GPT-3.5 jsou mnohem výkonnější. Většina toho, co ChatGPT umí je způsobena základní technologií GPT-3.
Co je GPT?
Takže jsme zjistili, že ChatGPT je postaven na třetí generaci modelu GPT. Ale co je vlastně GPT?
Začněme rozbalením zkratek snadno stravitelným a netechnickým způsobem.
- „Generativní“ v GPT představuje její schopnost generovat text přirozeného lidského jazyka.
- "Předtrénováno" představuje skutečnost, že model již byl natrénován na nějakém konečném souboru dat. Podobně jako byste četli knihu nebo možná několik knih, než budete požádáni o zodpovězení otázek týkajících se toho.
- „Transformátor“ představuje základní architekturu strojového učení, která pohání GPT.
Když to všechno dáme dohromady, Generative Pre-trained Transformer (GPT) je jazykový model, který byl trénovaný pomocí dat z internetu s cílem generovat text v lidském jazyce, když je prezentován s a výzva. Takže jsme opakovaně říkali, že GPT byla trénována, ale jak byla trénována?
Jak byl ChatGPT vyškolen?
Samotný ChatGPT nebyl trénován od základů. Místo toho se jedná o vyladěnou verzi GPT-3.5, která je sama o sobě vyladěnou verzí GPT-3. Model GPT-3 byl trénován s velkým množstvím dat shromážděných z internetu. Vzpomeňte si na Wikipedii, Twitter a Reddit – to byla data a lidský text seškrábaný ze všech koutů internetu.
Pokud vás zajímá, jak trénink GPT funguje, GPT-3 byl trénován pomocí kombinace učení pod dohledem a učení pomocí posilování pomocí lidské zpětné vazby (RLHF). Učení pod dohledem je fáze, kdy je model trénován na velké datové sadě textu staženého z internetu. Fáze posílení učení je místo, kde se trénuje, aby produkovalo lepší reakce, které jsou v souladu s tím, co by lidé přijali jako lidské a správné.
Školení s řízeným učením
Abyste lépe porozuměli tomu, jak se učení pod dohledem a posilování vztahuje na ChatGPT, představte si scénář, kdy učitel učí studenta psát esej. Učení pod dohledem by bylo ekvivalentem toho, kdyby učitel dal studentovi k přečtení stovky esejů. Cílem je, aby se student naučil, jak by měl být esej napsán, tím, že si zvykne na tón, slovní zásobu a strukturu stovek esejů.
Mezi těmi stovkami esejů se však najdou dobré i špatné. Vzhledem k tomu, že student byl školen na dobrých i špatných kopiích, mohl někdy student napsat špatnou esej, protože student byl v určitém okamžiku také krmen špatnými esejemi. To znamená, že když je student požádán, aby napsal esej, může napsat kopii, která není pro učitele přijatelná nebo dostatečně dobrá. Zde přichází na řadu posilovací učení.
Školení s posilovacím učením
Jakmile učitel zjistí, že student rozumí obecným pravidlům psaní esejí přečtením stovek esejů, učitel pak studentovi často zadává domácí úkoly k psaní esejí. Následně učitel poskytl zpětnou vazbu na esej při psaní domácího úkolu a řekl studentům, co udělali dobře a co by mohli zlepšit. Student využívá zpětnou vazbu k vedení následného domácího úkolu při psaní eseje, což mu pomáhá časem se zlepšovat.
Je to podobné jako ve fázi učení zesílení při trénování modelu GPT. Poté, co byl nakrmen obrovským množstvím textu staženého z internetu, může model odpovídat na otázky. Jeho přesnost však nebude dostatečná. Lidští trenéři kladou modelu otázku a poskytují zpětnou vazbu, která odpověď je pro každou otázku vhodnější.
Model využívá zpětnou vazbu ke zlepšení své schopnosti odpovídat na otázky přesněji a podobně jako by reagoval člověk. Takto může ChatGPT generovat lidsky znějící odpovědi, které jsou koherentní, poutavé a obecně přesné.
Jak je ChatGPT schopen odpovídat na otázky?
Navštívíte tedy web ChatGPT a přihlásíte se. Vyzýváte ChatGPT: "napište rapovou píseň ve stylu Snoop Dogg." Reaguje textem na rapovou píseň, která se nápadně podobá tomu, co by napsal Snoop Dogg. Jak je tohle možné?
No, „kouzlo“ za ChatGPT se dokonale propojuje s jeho tréninkem.
Poté, co pokryjete každý centimetr své učebnice Fyzika 101, je velká šance, že budete schopni odpovědět na jakoukoli otázku, která vás napadne. Proč? Protože jste to četli a naučili jste se to. S ChatGPT je to stejné – učí se. A jak ukázala lidská civilizace, s dostatečným tréninkem je možné vyřešit téměř jakýkoli problém.
Zatímco za svůj život pravděpodobně zvládnete spravovat stovky knih, ChatGPT nebo GPT již pohltily obrovský kus internetu. To je obrovské množství informací. Tam někde jsou pravděpodobně texty četných písní Snoop Dogga. ChatGPT to tedy samozřejmě musel spotřebovat (nezapomeňte, že je to předem natrénované) a rozpoznal vzory v textech Snoop Dogga. Potom by použil „znalosti“ tohoto vzoru k „předpovědi“ textu písně podobné tomu, co by napsal Snoop Dogg.
Důraz je zde kladen na „předvídání“. ChatGPT neodpovídá na otázky stejným způsobem jako my jako lidé. Například, když stojíte před otázkou jako: "Jaké je hlavní město Portugalska?" můžete říci Lisabon a říci to jako „fakt“. ChatGPT však neodpovídá na otázky se 100% jistotou. Místo toho se snaží předpovědět správnou odpověď na základě dat, která spotřebovala ve svém tréninkovém datovém souboru.
Přístup ChatGPT k odpovídání na otázky
Abyste lépe porozuměli konceptu předpovídání reakcí, představte si ChatGPT jako detektiva, který má za úkol vyřešit vraždu. Detektivovi jsou předloženy důkazy, ale neví, kdo vraždu spáchal a jak k ní došlo. S dostatkem důkazů však detektiv dokáže s velkou přesností „předpovědět“, kdo je za vraždu zodpovědný a jak byl zločin spáchán.
Po spotřebování dat z internetu ChatGPT zahodí původní data a uloží neuronová spojení nebo vzory, které se z dat naučil. Tato spojení nebo vzorce jsou jako důkazy, které ChatGPT analyzuje, když se pokouší reagovat na jakoukoli výzvu.
Takže teoreticky je ChatGPT jako velmi dobrý detektiv. Neví jistě, jaká by měla být fakta odpovědi, ale zkouší to s působivým dopadem přesnost, předpovídat logickou sekvenci textu v lidském jazyce, která by nejlépe odpovídala otázka. Takto získáte odpovědi na své otázky.
A to je také důvod, proč některé z těchto odpovědí vypadají velmi přesvědčivě, ale jsou strašně špatné.
ChatGPT: Odpovídá jako člověk, myslí jako stroj
Základní technické detaily ChatGPT jsou složité. Nicméně ze základního hlediska funguje tak, že se učí a reprodukuje to, co se naučil, když je k tomu vyzván, stejně jako my jako lidé.
Jak se ChatGPT vyvíjí prostřednictvím výzkumu, může se změnit způsob, jakým funguje. Jeho základní pracovní principy však zůstanou po nějakou dobu stejné, alespoň dokud nepřijde nová rušivá technologie.