OpenAI dala ChatGPT možnost mluvit pomocí syntetizovaného hlasu a brzy se dostane i do vašeho smartphonu.

ChatGPT se má stát interaktivním generativním zážitkem AI. OpenAI odhalilo, že přední světový chatbot s umělou inteligencí bude schopen mluvit a odpovídat na dotazy uživatelů pomocí syntetizovaného, ​​pravděpodobně generovaného hlasu.

Spolu se svým nově nalezeným hlasem bude ChatGPT také schopen reagovat a diskutovat o konkrétních obrázcích nahraných do něj nebo pořízených při používání aplikace ChatGPT pro Android nebo iOS. Funkce rozpoznávání obrazu zní podobně jako Google Lens a další aplikace, které k přesné detekci dat a informací používají neuronové sítě.

OpenAI dává ChatGPT hlas

25. září 2023 vývojář ChatGPT OpenAI odhaleno dal by hlas svému přednímu světovému generativnímu chatbotovi s umělou inteligencí. Uživatelé ChatGPT mohou mluvit přímo s chatbotem a požadovat, aby se ozval zpět, což efektivně umožňuje ChatGPT poprvé konverzovat přímo hlasem.

V ukázkovém klipu OpenAI je žena, která žádá ChatGPT, aby vytvořil jedinečný příběh před spaním, na který ChatGPT náležitě zareaguje ženským syntetizovaným hlasem.

instagram viewer

Podle Kabelové, nový model převodu textu na řeč byl vyvinut interně. Dokáže generovat „lidský“ zvuk z textu a několika sekund ukázkové řeči (pomocí modelu OpenAI Whisper) a mluví různými tóny a styly. Řadu hlasových ukázek najdete na blog OpenAI.

Některé společnosti již používají nový hlasový model OpenAI. Například Spotify používá model převodu textu na řeč OpenAI k překladu podcastů do různých jazyků, přičemž kombinuje schopnost ChatGPT jazykového překladu s novou schopností mluvit.

Nový model převodu textu na řeč ChatGPT je k dispozici pouze předplatitelům Plus a Enterprise, kteří používají oficiální Aplikace pro Android a iOS a jejich uvedení na trh se očekává během příštích dvou týdnů (od 25. 2023). Kromě toho je nová hlasová funkce zpočátku omezena na angličtinu, i když bychom očekávali, že se to rychle změní.

ChatGPT dokáže rozpoznat a analyzovat obrázky a fotografie

Druhou částí aktualizace ChatGPT OpenAI je schopnost analyzovat a mluvit obrázky nahrané do nástroje. Možnost vizuální analýzy obrazu byla uvedena v aktualizačních videích GPT-4, ale od té doby se o ní příliš nemluvilo (Interpret kódu ChatGPT stranou).

ChatGPT nyní získává funkcionalitu podobnou Google Lens. Můžete nahrát obrázek do ChatGPT nebo pořídit fotografii pomocí fotoaparátu smartphonu v aplikaci ChatGPT a obrázek bude podrobně popsán a v případě potřeby přidá další kontext.

Nazvat to „podobné jako Google Lens“ je opravdu nespravedlnost. Schopnost chatovat tam a zpět o obrázku, abyste získali více informací a kontextu, je mimořádně užitečná pro širokou škálu nastavení. Je však důležité si všimnout drobného písma, protože OpenAI jasně uvádí, že má omezenou „schopnost ChatGPT analyzovat a přímo vyjadřovat se k lidem“ z důvodů ochrany soukromí a přesnosti. Přesto, mohl by nástroj „Who Is This“ založený na OpenAI v budoucnu fungovat? (Doufejme, že ne!)

Stejně jako nový model převodu textu na řeč zavede OpenAI v příštích dvou týdnech rozpoznávání obrázků, i když bude dostupné na všech platformách, nejen na aplikaci ChatGPT.

Soukromí, bezpečnost a další problémy

Důsledky hlasově poháněného ChatGPT jsou výrazné. Jistě, je to vzrušující. Schopnost vytvořit jedinečně syntetizovaný hlas s použitím pouze krátkého úryvku jako příkladu však přináší značné problémy s ochranou soukromí a zabezpečením. Potenciál pro zneužití těchto nástrojů pro zlomyslné aktéry je obrovský a jako u každého generativního nástroje umělé inteligence platí, že jakmile je džin z láhve venku, už se do ní nevrátí. Žádná regulace AI od vlád nebo myšlenkových vůdců nemůže zvrátit příliv.

Zdá se, že i varování OpenAI na toto téma obchází samozřejmé, přestože tyto problémy zmiňuje:

Tyto schopnosti však také představují nová rizika, jako je možnost, aby se zákeřní činitelé vydávali za veřejné osobnosti nebo se dopouštěli podvodu. To je důvod, proč tuto technologii používáme k podpoře konkrétního případu použití – hlasového chatu.

Vzhledem k tomu, že se jedná o špičku ledovce, očekávejte odmítnutí nově nalezeného hlasu ChatGPT, zvláště jednou existuje předvídatelný nárůst nechutných titulků, které tvrdí, že ChatGPT je používán k páchání podvodů a tak na.

OpenAI dělá z ChatGPT aplikaci Go-To AI

Čím více OpenAI přidává do ChatGPT uživatelsky přívětivé funkce, tím více se stává běžnou generativní aplikací AI. Jako první, kdo dosáhl široké slávy během počátečního generativního boomu umělé inteligence, ChatGPT stále vede cestu a je používá pouze aplikace, a to navzdory konkurenci jako Google Bard (a potenciálně Google Gemini) a Anthropic's Claude.

Dokud bude OpenAI moci i nadále přidávat funkce, které usnadňují používání ChatGPT, udrží lidi v kontaktu a budou se stále více přibližovat svému cíli, kterým je skutečně multimodální nástroj umělé inteligence.