Po spuštění ChatGPT v listopadu 2022 se fenomenální chatbot AI stal jedním z nejdůvěryhodnějších nástrojů pro psaní na internetu. Je to jednoduché; popište, co potřebujete napsat, a ChatGPT to během několika sekund vytiskne na obrazovku.
V době, kdy je text generovaný umělou inteligencí předán jako psaný člověkem a používán k získání nespravedlivé výhody, je však identifikace obsahu umělé inteligence velmi důležitá. ChatGPT však nedokáže přesně rozpoznat obsah AI, dokonce ani svou vlastní práci – ale proč?
Existuje rozdíl mezi textem AI a lidským psaním?
Předpokladem pro ChatGPT, aby si všiml svého vlastního psaní nebo jakéhokoli textu generovaného AI, je, že mezi ním a textem napsaným člověkem musí být rozdíl. Existuje tedy nějaký významný rozdíl mezi textem psaným člověkem a obsahem generovaným umělou inteligencí? Pokud existuje, určitě by to měl být schopen rozpoznat nástroj jako ChatGPT.
Napsali jsme krátký příběh bez jakéhokoli vstupu z jakéhokoli nástroje AI a poté jsme se zeptali ChatGPT, zda je příběh obsahem psaným AI. ChatGPT to s jistotou označil jako text generovaný AI.
Poté jsme požádali ChatGPT, aby vygeneroval příběh, a do stejného vlákna chatu jsme vygenerovaný text zkopírovali a vložili a zeptali se ChatGPT, zda byl text vytvořen AI. Odpověď ChatGPT? Sebevědomé "Ne."
ChatGPT v obou případech nedokázal identifikovat text psaný člověkem nebo AI. Jak to, že ChatGPT nedokáže detekovat svůj vlastní text? Znamená to, že mezi umělou inteligencí a lidským textem není žádný rozdíl?
No, je. O rozdílech mezi nimi bychom mohli napsat celou knihu, ale na tom moc nezáleží. Pokud tedy existuje rozdíl, proč ChatGPT nebo jakýkoli jiný nástroj umělé inteligence nedokáže tyto rozdíly identifikovat a přesně poukázat na text vytvořený umělou inteligencí z textu napsaného lidmi? Odpověď spočívá v jak ChatGPT funguje a jak generuje text.
Jak ChatGPT generuje text
Když požádáte ChatGPT o vygenerování textu, pokusí se napodobit proces lidského psaní. Zaprvé, model ChatGPT – Generative Pre-trained Transformer (GPT) – byl trénován na velkém korpusu lidského textu. Vše od e-mailů, článků o zdraví, technických článků, středoškolských esejí a téměř jakéhokoli textu, který najdete online, bylo předáno modelce během tréninku. ChatGPT tedy rozumí tomu, jak by měl být každý z těchto typů textů napsán.
Pokud požádáte ChatGPT, aby napsal e-mail svému šéfovi, ví, jak by takový e-mail měl vypadat, protože byl vyškolen na podobných e-mailech – pravděpodobně jich jsou tisíce. Podobně, pokud jej požádáte, aby napsal středoškolskou esej, také ví, jak by měla znít středoškolská esej. ChatGPT se pokusí napsat, co chcete, aby to napsal člověk.
Má to ale háček. Na rozdíl od toho, jak lidé píší, ChatGPT ve skutečnosti nerozumí tomu, co píše, způsobem, který by člověk pochopil. Místo toho se chatbot snaží předpovědět, jaké by bylo nejpravděpodobnější další slovo ve větě, dokud nedokončí zápis.
Jak ChatGPT píše podle předpovědi
Řekněme, že požádáte ChatGPT, aby napsal příběh o fiktivním městě zvaném Volkra. Existuje obrovská možnost, že chatbot zahájí příběh slovy „Kdysi“. Je to proto, že chatbot nemyslí za sám, ale snaží se předvídat, co by člověk napsal, na základě toho, co se naučil z tisíců příběhů, během kterých byl nakrmen výcvik.
ChatGPT by se tedy v domnění, že by člověk pravděpodobně začal příběh se slovy „Once upon“, pokusil předpovědět další logické slovo, které by být „a“ následované „časem“. Takže byste měli "Tenkrát..." následované dalším logickým slovem a dalším, dokud nebude příběh dokončen. ChatGPT v zásadě píše tak, že předpovídá, jaké slovo by přirozeně (nebo alespoň s nejvyšší pravděpodobností) následovalo ve větě, a vloží je.
Když se tedy nástroj AI snaží zjistit, zda je text generován AI, jedním z kritérií, které se snaží zvážit, je předvídatelnost textu, protože nástroje AI píší podle predikce. Tato míra předvídatelnosti se v řeči umělé inteligence nazývá zmatenost. Nyní, když je kromě jiných kritérií prezentován text, nástroj AI, jako je ChatGPT, se pokouší analyzovat text, aby změřil, jak předvídatelná je sekvence slov nebo vět v textu. Větší předvídatelnost nebo nízká složitost obvykle znamená, že text je pravděpodobně generován AI. Menší předvídatelnost nebo vyšší zmatenost obvykle znamená, že text pravděpodobně napsali lidé.
Tato kritéria spolu s dalšími faktory, jako je úroveň kreativity textu, bohužel nestačí k tomu, abychom s jistotou určili, zda je text napsán nástrojem AI či nikoli. Je to proto, že lidé mohou psát s větší variabilitou, jako v ukázkovém textu, který jsme použili pro demonstraci na začátku tohoto článku.
AI chatboti jako ChatGPT jsou navrženi tak, aby co nejvíce napodobovali přirozený lidský jazyk. Takže zatímco text AI může mít rozeznatelné vzory, tyto vzory nejsou tak zřejmé ani pro mocný nástroj, jako je ChatGPT. To je důvod, proč ChatGPT nemůže rozpoznat své vlastní psaní, stejně jako proč nástroje pro detekci textu AI nefungují.
Rozpozná ChatGPT v budoucnu své vlastní psaní?
Nástroje jako ChatGPT v současné době nedokážou zjistit, zda byl text napsán sám nebo jakýmkoli jiným nástrojem AI, protože v obsahu generovaném AI neexistuje žádný jasný a rozpoznatelný vzor. Je však velká šance, že se to brzy změní. Díky úsilí společností, jako je ChatGPT, zavést digitální vodoznaky do obsahu generovaného ChatGPT, bude text generovaný chatbotem lépe rozpoznatelný.