Přemýšleli jste někdy, jak Shazam „slyší“ hudbu, kterou hrajete, a identifikuje ji s takovou přesností? Nejste sami.

Technologie napájející službu rozpoznávání hudby je pro mnohé záhadou, zejména proto, že služba byla spuštěna roky předtím, než se chytré telefony a strojové učení staly věcí.

V tomto článku se podíváme na to, jak Shazam funguje a jak dokáže přesně rozpoznat hudbu.

Co je Shazam?

Shazam je populární aplikace pro rozpoznávání hudby, kterou můžete použít k vyhledání informací o nové skladbě, kterou máte rádi, ale neznáte název ani jméno umělce.

Řekněme, že jste v kavárně nebo se procházíte v obchodě na rohu, a uslyšíte novou skladbu, kterou byste chtěli mít ve své hudební knihovně. Shazam vám pomůže snadno najít skladbu. Vše, co musíte udělat, je nahrát několik sekund skladby do aplikace.

Aplikace Shazam využívá sofistikovanou technologii rozpoznávání zvuku k identifikaci hudby, kterou slyšíte sekund, takže můžete zjistit jméno umělce a sledovat, sledovat videa, nebo dokonce koupit nebo streamovat skladbu ve vašem přístroj.

Stažení: Shazam pro iOS |Android (Volný, uvolnit)

Jak funguje Shazam?

Galerie obrázků (4 obrázky)
Rozšířit
Rozšířit
Rozšířit
Rozšířit

Obrázek 1 ze 4

Obrázek 2 ze 4

Obrázek 3 ze 4

Obrázek 4 ze 4

Shazam používá k identifikaci shody skladeb dotazovaných na jeho platformě patentovanou technologii vyvinutou Avery Lin-Chun Wangem, spoluzakladatelem aplikace a hlavním datovým vědcem. Tato technologie vytváří otisky prstů pro zvukové nahrávky, což je tajná omáčka za Shazamovými úžasnými schopnostmi rozpoznávání.

Shazam vytváří a ukládá zvukové otisky prstů sestávající ze sbírek číselných dat pro každou více než 15 miliard skladeb. Když uživatel „shazamuje“ skladbu, Shazam rychle vytvoří zvukový otisk zvuku přijatého ze smartphonu nebo mikrofonu počítače.

Jakmile je vytvoření zvukového otisku prstu pro záznam hotové, nahraje Shazam zvukový otisk prstu (nikoli zvuk) na svůj server, kde spustí vyhledávání v databázi. Pokud je nalezena shoda, vrátí informace o skladbě s možnostmi, kam ji streamovat nebo koupit, spolu s identifikačními informacemi.

Co je zvukový otisk prstu?

Zvukový otisk prstu je zhuštěný digitální souhrn zvukových signálů. Používají se k identifikaci zvukového vzorku nebo k vyhledání podobných položek v zvukové databázi.

Technologie otisků prstů společnosti Shazam dokáže spojit neoznačené části zvukového obsahu s odpovídajícími shodami v její zvukové databázi. Shazam identifikuje název skladby, kterou jste nahráli (zvukový obsah bez označení), a to porovnáním otisku písně s otiskem písně v její databázi.

Shazam vytváří jedinečné otisky prstů pro skladby ve své databázi pomocí určitých datových bodů identifikovaných s pomocí spektrogramu.

Co je to Spektrogram?

Spektrogram je trojrozměrný graf používaný jako reprezentace zvuku. Spektrogram ukazuje změnu frekvencí za určité období, přičemž bere v úvahu také amplitudu nebo objem. Níže uvedená fotografie je příkladem čtení spektrogramu.

Uznání za obrázek: Akce na ochranu pobřeží Changhua /https://search.creativecommons.org/photos/e6b0b0f3-79ea-4621-9029-1b73365a52ac

V rozhovoru z roku 2003 s Scientific AmericanAvery Wang odhalil, že algoritmus Shazam využívá ke generování zvukových otisků prstů spektrogramové body představující noty s nejvyšší energií.

Když ignoruje většinu informací v písni a soustředí se pouze na několik definujících poznámek, může Shazam prohledávat svou databázi a poskytovat přesné shody pro dotazy na písně neuvěřitelnou rychlostí.

Jak je Shazam schopen identifikovat písně na hlučných místech?

Shazam používá záznamy písní bez šumu a zkreslení pozadí k vytváření otisků prstů pro svou databázi. Když nahráváte skladbu pomocí aplikace na hlučném místě, vytvoří zvukový otisk vašeho záznamu tím, že identifikuje noty s nejvyšší energií v záznamu.

Poté vyhledá ve své databázi shodu zvukových otisků vaší nahrávky za předpokladu, že úroveň pozadí nebyla dostatečně vysoká, aby narušila data použitá k vytvoření zvuku otisk prstu.

Časy, kdy vám Shazam nemůže pomoci určit píseň

Shazam je skvělý v párování skladeb, dokonce i temné hudby, o které si myslíte, že ji ve své databázi nemusí mít. Jsou ale chvíle, kdy Shazam nedokáže identifikovat stopu?

Zkreslený záznam

Když shazamujete skladbu na místě, kde je příliš vysoká úroveň šumu v pozadí, hluk zkreslí data ve Spectrogramu. Z tohoto důvodu se zvukový otisk vaší nahrávky bude lišit od zvukového otisku původní skladby.

Když se to stane, Shazam vrátí Píseň není známá dialog, protože nemůže najít shodu pro zvukový otisk prstu.

Živá hudba

Shazam nedosahuje schopnosti identifikovat hudbu z živých vystoupení. Je to proto, že zvuk, který nahráváte při živých vystoupeních, se často liší od původní verze písně, kterou Shazam používá k vytváření zvukových otisků prstů.

Jediným způsobem, jak Shazam dokáže identifikovat skladbu během živého vystoupení, je, pokud je skupina dostatečně zručná, aby provedla skladbu přesně tak, jak byla zaznamenána. Hodně štěstí s kapelou, která se o to snaží...

Váš hlasový záznam

"Mohl bych přimět Shazama, aby rozpoznal píseň, kterou jsem zpíval, kdybych byl opravdu dobrý zpěvák?"

Stručně řečeno, ne.

Algoritmus Shazam dokáže identifikovat pouze předem nahranou hudbu. Aby Shazam identifikoval píseň, kterou zpíváte, musíte mít stejné vokály s instrumentálky v přesném tempu s původní nahrávkou písně.

Vaše bzučení

Shazam nedokáže identifikovat shody pro bzučení, protože jeho algoritmus používá přesné frekvence a amplitudy k vytváření zvukových otisků prstů pro skladby ve své databázi.

Když hučíte píseň, Shazam k ní vytvoří otisk prstu. Ale protože bzučení je pouze pokusem o resyntézu skladby, algoritmus se nepodaří shodovat s nahrávkou.

Je Shazam jedinou aplikací pro identifikaci hudby?

Shazam byla první službou identifikace hudby a v současné době je nejpoužívanější aplikací pro identifikaci skladeb. Existují však další aplikace, které můžete použít k identifikaci skladby hrát si kolem tebe Někteří dokonce dokážou identifikovat píseň, kterou zpíváte nebo hučíte.

Tři z nejpopulárnějších alternativ Shazam jsou SoundHound, Musixmatch Lyrics a Genius. Musixmatch a Genius vám především pomohou identifikovat texty pro hudbu, která hraje kolem vás, zatímco SoundHound je nejbližší konkurent Shazam.

Příbuzný: Nejlepší aplikace pro rozpoznávání hudby k vyhledání skladeb podle jejich naladění

Pomocí aplikace SoundHound můžete dělat téměř všechno, co dělá Shazam. Jeho hlavní výhodou oproti Shazamu je, že má přidanou funkcionalitu identifikace písní, které zpíváte nebo hučíte.

Image Credit: Sulastri Sulastri / Shutterstock.com

E-mailem
Jak identifikovat hudbu a písně ve videích YouTube

Zajímá vás, jak identifikovat skladbu z videa na YouTube? Tady je návod pro vyhledávání skladeb YouTube, který vám pomůže identifikovat hudbu z videí.

Přečtěte si další

Související témata
  • Vysvětlení technologie
  • Shazam
  • Music Discovery
  • SoundHound
  • Musixmatch
O autorovi
John Awa-abuon (Publikováno 6 článků)

John je milovník technologie od narození, tvůrce digitálního obsahu trénováním a spisovatel Tech Lifestyle Writing od Profession. John věří v pomoc lidem při řešení problémů a píše články, které to dělají.

Více od Johna Awa-abuona

Přihlaste se k odběru našeho zpravodaje

Připojte se k našemu zpravodaji s technickými tipy, recenzemi, bezplatnými elektronickými knihami a exkluzivními nabídkami!

Ještě jeden krok…!

V e-mailu, který jsme vám právě poslali, potvrďte svou e-mailovou adresu.

.