Zůstaňte o krok před šílenstvím převodu textu na hudbu experimentováním s hudebním nástrojem umělé inteligence Meta.
Meta vydala kód pro MusicGen, další hudební generátor AI, který dokáže přeměnit textové popisy na hudební melodie. Demo lze nalézt online a k vyzkoušení potřebujete pouze prohlížeč. Výsledky nejsou špatné, ale více než to ukazuje, jak daleko pokročily hudební modely AI.
Zde je to, co potřebujete vědět o MusicGen a jak generovat hudbu.
Co je MusicGen?
V červnu 2023 vydala společnost Meta svůj model hudební generace AI s názvem MusicGen. Není to první společnost, která se vypořádala se složitým problémem syntézy syrové hudby z jednoduchého textového popisu; zatím můžete vytvářet hudbu pomocí OpenAI Jukebox nebo generujte úryvky skladeb pomocí MusicLM.
Ale je to první společnost, která vytvořila kód open-source, což vám umožní spouštět software lokálně na vašem počítači počítač, pokud máte GPU s minimálně 16 GB paměti – i když jsme byli schopni zajistit, aby fungoval s pouhými 11 GB.
Pokud nemáte hardware, nezoufejte, protože webovou aplikaci MusicGen můžete zdarma vyzkoušet pomocí prohlížeče. Z online dema můžete očekávat, že vygenerování zvukového úryvku o délce přibližně 12 sekund bude trvat něco málo přes minutu.
Jak zní MusicGen?
Podle Meta může MusicGen produkovat vysoce kvalitní hudební vzorky, i když jsme zjistili, že to definovali zúčastnění výzkumníci vysoce kvalitní až 32 kHz. To je někde mezi požadavky na syntézu řeči (16 kHz) a standardem pro digitální hudbu (44,1 kHz).
Ve skutečnosti zvuk nesplňuje minimální standardy kvality, na které jste zvyklí slyšet v rádiu nebo na streamovacích platformách. Ve srovnání s jinými hudebními generátory AI as ohledem na to, kde se technologie nachází v době psaní, je však kvalita zvuku poměrně dobrá s nízkou úrovní šumu v souboru.
Jak blízko je hudba v souladu s výzvami? Můžete to rychle pochopit poslechem příkladů, které jsme vytvořili níže. V širokém měřítku se mu daří držet populárních hudebních žánrů při zachování soudržnější hudební struktury ve srovnání s jeho předchůdci.
Jak generovat hudbu pomocí MusicGen
MusicGen se snadno používá a nevyžaduje registraci. Rozhraní je také přímočaré, takže je snadné jej vyzkoušet pro zábavu.
Zde je návod, jak generovat hudbu pomocí MusicGen:
- Otevři Webová aplikace MusicGen.
- V textovém poli s názvem Popište svou hudbu, zadejte výzvu. Můžete zkusit něco tak jednoduchého, jako je „irská lidová melodie“, nebo to udělat podrobnějšími tím, že zahrnete nástroj, tempo, žánr nebo emoce.
- zmáčkni generovat tlačítko pro zahájení procesu. Po minutě nebo dvou se v modulu Generovaná hudba vpravo objeví audio přehrávač.
- Umístěním ukazatele myši na modul zobrazíte ovládací prvky přehrávače a poslechnete si soubor, nebo stisknutím ikony stahování v pravém horním rohu uložte soubor do počítače. Upozorňujeme, že je k dispozici ke stažení pouze jako soubor .mp4.
- Pokud si chcete vyzkoušet úpravu výsledků pomocí existující melodie, můžete nahrát nahrávku do modulu vedle textového pole. Případně můžete vybrat Mic nahrát melodii pomocí mikrofonu.
Úprava melodie použije jako referenci textový popis i melodii, kterou zadáte. Toto je užitečný nástroj pro formování výsledků, které získáte z MusicGen.
Jaká jsou omezení používání MusicGen Audio?
Kód pro MusicGen je volně šířen pod licencí MIT s několika omezeními. Pokud jde o zvuk, který generujete pomocí modelu, není jasné, zda existují nějaké právní pokyny. Místo toho možná budete chtít věnovat pozornost Varování Meta o používání MusicGen:
„Model by neměl být používán k záměrnému vytváření nebo šíření hudebních skladeb, které vytvářejí nepřátelské nebo odcizující prostředí pro lidi. To zahrnuje vytváření hudby, kterou by lidé předvídatelně považovali za znepokojující, znepokojující nebo urážlivou; nebo obsah, který propaguje historické nebo současné stereotypy.“
Meta dále vysvětluje, že MusicGen je určen pro výzkumníky, kteří chtějí prozkoumat AI hudební generaci, a nikoli pro „následné použití“, což předpokládáme, že znamená činnosti, jako je nahrávání a distribuce hudby umělé inteligence při streamování platformy.
The etické klady a zápory odrážejí generaci umění AI. Získání souhlasu s používáním dat k trénování modelů umělé inteligence plus problém kompenzace/udělování kreditů umělcům, je-li to vhodné, jsou pro Meta všechny důvody, proč hrát na jistotu.
Stručně řečeno, zkoumání modelu pro zábavu pravděpodobně nepoškodí, ale může to být ožehavější problém, pokud jde o použití zvuku pro komerční hudbu. Mnoho lidí se ptá co budoucnost pop music s umělou inteligencí vypadá jako.
Meta přidává další model generování hudby k tomu, co je venku, a vydala MusicGen, model umělé inteligence s otevřeným zdrojovým kódem schopný generovat nezpracovanou hudbu z jednoduchého textového popisu. Pokud jste zvědaví na vyzkoušení technologie, můžete si vyzkoušet ukázku pouze pomocí webového prohlížeče.