reklama
Nedávno jsem pracoval na příběhu týkajícím se osoby, která uskutečnila telefonní hovor, která byla zaznamenána. Tato osoba později odmítla připustit, že vůbec někdy zavolali.
S nahraným hlasem z telefonního hovoru a klipem osoby, která obvinění popřela, jsem se pokusil najít způsob, jak prokázat, že hlasy byly stejné a stejné.
Přiznám se, že jsem trochu posedlá hlasovými technologiemi. Proto jsem čekal hlas Googlu Jak používat Google Voice k blogování po telefonu Přečtěte si více díky pokročilé technologii rozpoznávání hlasu a proto miluji aplikace pro ovládání hlasu v počítači jako Tazti Povolte ovládání řeči na text a hlas pomocí nastavení rozpoznávání řeči v systému WindowsRozpoznávání řeči zůstává silnější než Cortana. Řídí ovládání řeči, textu a hlasu. Tento článek vám ukáže, co program Rozpoznávání řeči může udělat, jak jej nastavit, trénovat a používat. Přečtěte si více . Pokud však jde o digitální porovnání hlasů, byl jsem v rozpacích. Pravděpodobně jste viděli ty špionážní filmy, kde počítač dokáže automaticky identifikovat hlas známého zločince pouze pomocí hlasového tisku.
Abych byl upřímný, jakmile jsem objevil Sonogram Visible Speech, uvědomil jsem si, že spektrogramová hlasová technologie ve skutečnosti je v současné době je to životaschopný způsob, jak spolehlivě identifikovat osobu podle jejího hlasu.
Pochopení spektrogramu
Pokud víte o chemických izotopech, pak víte, že s izotopy mohou chemici identifikovat chemický makeup sloučeniny izolací základních prvků a pomocí rozpisu k identifikaci jednotlivých složek každého z nich směs. Stejně tak audio spektrogram rozděluje zvukový zvuk na základní frekvence. Zajímavostí lidského hlasu je to, že nikdo nehovoří jednou frekvencí. Vaše ústa, nosní průchody a struktura hlasové schránky určuje směs frekvencí, které tvoří váš jedinečný hlas.
Sonogram Visible Speech je bezplatná softwarová aplikace pro spektrogramy, která bude pořizovat video nebo audio soubory a rozbít se dolů zvukové stopy do celého spektra - všechny jeho frekvence v celém časovém rámci dráha. Dokončený spektrogram vypadá jako na obrázku níže.
Jak vidíte, spodní stopa vypadá jako základní zvuková vlna, kterou byste viděli v programu jako Drzost 3 tipy pro vylepšení zaznamenaných rozhovorůČistý zvuk je nezbytný pro všechny podcasty nebo nahrávky, které chcete publikovat. Zvyšte svou kvalitu zvuku pomocí Audacity ve třech snadných krocích. Přečtěte si více , ale střední podokno zobrazuje každý segment zvukového souboru v celém jeho frekvenčním rozvržení. Úžasná věc na tomto softwaru je, že existuje mnoho dalších průběhů, které můžete použít k prozkoumání zvukového souboru. Jedná se zejména o pokročilé uživatele.
Můžete nastavit, jak se má každá z těchto vln zobrazovat, v nabídce „Možnosti“ a výběrem „Obecné“ Nastavení." Zde můžete definovat, jak logaritmické grafy vypočítávají výstup a obecné nastavení zobrazení všech dostupných grafy.
Pokud je zvuk poměrně tichý nebo hlas, který analyzujete, je šeptající, můžete zvážit použití logaritmického zobrazení frekvence. Povolíte ji z nabídky „Možnosti“ a vyberete „Logaritmická frekvence“. To poněkud „zvětší“ významné oblasti frekvence ve spektrogramu.
To může skutečně pomoci identifikovat jasné kmitočtové vzorce, které někoho identifikují podle zvuku jejich hlasu. Pokud jste úplně ztraceni a nevíte, kde začít, kliknutím na „Nápověda“ a přechodem na „Online nápovědu“ se otevře velmi dobře napsaná příručka online nápovědy Sonogramu. Toto je skvělé místo pro začátek, pokud jste ve spektrogramové audio analýze nováčkem.
Experiment se spektrogramy pomocí lovu duchů
Krása tohoto softwaru je, že je dobrá pro mnoho různých použití. Jedním z artefaktů, které se často objevují při lovu duchů, je můj osobní zájem „Elektronický fenomén hlasu“ - kde se na zvuku údajně objevuje hlas zjevení nebo ducha nahrávky. Tyto nahrávky jsou rozptýleny po celém webu, takže jsem se rozhodl stáhnout několik z webů lovců duchů a provést spektrogramovou analýzu.
Spektrogram ukazuje, že frekvence hlasu jsou obecně nízké, ale pro lepší představu o hlasech v záznamu je třeba otevřít další průběhy. V pohledu Autocorrelation View se vypočítá „rozteč“ v časovém rámci, ve kterém umístíte kurzor myši.
„Duch“ má průměrnou pitchovou frekvenci asi 129,0 Hz. Posun na konec záznamu, kde uslyšíte hlas vyšetřovatele, vypočtená výška tónu frekvence je asi 208,0 hz (což dává smysl, protože se jedná o ženský hlas a zvuky duchů) mužský.)
Otevření displeje Fast Fourier odhalí ještě více podrobností o hlasech. Tento graf rychle rozebírá primární frekvence a zobrazuje je v barevném kódu.
V tomto případě je členění kmitočtů rozptýleno, s některými vysokými, ale i dobrým počtem nízkých frekvencí ve směsi. Vyšetřovatel v místnosti však jasně hovoří hlasem, který je seskupen na frekvenci více směrem k horní hranici rozsahu, jak je znázorněno zde.
Tato rychlá analýza prokázala, že tyto dva hlasy jsou zcela odlišné, ale jedná se pouze o základní příklad schopností tohoto výkonného softwaru. V podstatě každá situace, kdy může pomoci členění kmitočtů zvukové vlny - to je software pro vás. Snadno se učí, rychle nastavuje a konfiguruje a funguje stejně dobře nebo lépe než jakýkoli placený spektrogramový software na trhu.
Máte nějaké projekty, které by mohly využít spektrogram? Už jste někdy vyzkoušeli Sonogram Visible Speech? Sdílejte svůj přehled v sekci komentářů níže.
Ryan má bakalářský titul z elektrotechniky. Pracoval 13 let v automatizační technice, 5 let v IT a nyní je Apps Engineer. Bývalý šéfredaktor MakeUseOf, vystoupil na národních konferencích o vizualizaci dat a vystupoval v národních televizích a rádiích.