Google vydal svůj zdrojový kód beta audio kodeku Lyra na GitHubu a všem vývojářům zpřístupňuje zpracování zvuku v neuvěřitelně kvalitní kvalitě s nízkou přenosovou rychlostí. Kodek je nejužitečnější v integrovaných situacích a situacích s omezenou šířkou pásma, kde je třeba uložit co nejvíce dat.
Lyra: Téměř nic neznělo tak dobře
Zvukový kodek pracuje na principu poskytování co nejpřirozeněji znějící řeči s nejnižší možnou rychlostí přenosu dat. Úspěšně vytváří téměř děsivé úrovně reprodukce zvuku s přenosovými rychlostmi až 3 kb / s. Google používá kompresi Lyra v reálném čase již ve své aplikaci Duo, ačkoli vám nebude vyčítáno, že jste si ani neuvědomili rozdíl oproti běžnému zvuku šířky pásma.
Abychom předvedli, o kolik je Lyra lepší než jiné kodeky, Google poskytuje příklady prostřednictvím a příspěvek na blogu porovnání kompresního kodeku řízeného Machine Learning s jinými alternativami 3 a 6 kbps.
Je to rozdíl mezi nocí a dnem a vývojářům, kteří se budou těšit na tyto nástroje, bude významným faktorem při zlepšování kvality komunikace tam, kde je šířka pásma omezená. Je to také vynikající motivátor pro vývojáře, kteří chtějí vytvářet nové aplikace na rozvíjejících se trzích, což Google letos určitě pokryje
bezplatná virtuální online konference Google I / O.Zdrojový kód beta je v současné době navržen s ohledem na 64bitová zařízení Arm, příklady však budou fungovat také na 64bitových systémech Linux x86. Zdrojový kód je poskytován plně zdokumentovaný, i když je v beta verzi, a stránka GitHub obsahuje pokyny k instalaci a jak sestavit Lyru na Linuxu pro 64bitové cíle Arm.
Chcete-li získat zdrojový kód beta verze Lyra, přejděte na stránku Stránka Lyra GitHub.
Jak funguje Lyra?
Skutečný proces, který Lyra používá, je neuvěřitelně složitá kombinace trénovaných modelů strojového učení tisíce hodin dat řeči a optimalizace stávající technologie zvukových kodeků, teorie je docela jednoduchý.
Každých 40 ms jsou funkce převzaty z řeči a komprimovány na 3 kb / s. Tyto funkce představují body energie řeči napříč frekvenčním spektrem nejblíže lidské sluchové řeči - věci, které musíme rozpoznat a porozumět jim, když někdo mluví.
Klíčovou součástí toho, čím je Lyra výjimečná, je způsob, jakým využívá tyto informace:
Nicméně tradiční parametrické kodeky, které jednoduše extrahují z řeči kritické parametry, které pak mohou být slouží k opětovnému vytvoření signálu na přijímacím konci, dosažení nízkých přenosových rychlostí, ale často zní roboticky a nepřirozeně. Tyto nedostatky vedly k vývoji nové generace vysoce kvalitních generátorů zvuku, které mají revoluci v poli tím, že dokáže nejen rozlišovat mezi signály, ale také generovat zcela nové ty.
Po přenosu Lyra znovu sestaví křivku vyplněním toho, co chybí, pomocí tohoto procesu, aniž by byla výpočetně příliš složitá.
Na jedné straně je to technologický zázrak, který poběží téměř kdekoli. Na druhou stranu stále nejsem 100% přesvědčen, že to není čarodějnictví.
Google Duo je jednou z nejlepších aplikací pro videohovory. Má mnoho funkcí a tady jsou ty, o kterých si myslíme, že byste je měli opravdu používat.
Přečtěte si další
- Tech News
- Android
- Strojové učení
Ian Buckley je novinář na volné noze, hudebník, performer a producent videa žijící v Berlíně v Německu. Když nepíše ani na jevišti, hraje si s kutilskou elektronikou nebo kódem v naději, že se z něj stane šílený vědec.
Přihlaste se k odběru našeho zpravodaje
Připojte se k našemu zpravodaji s technickými tipy, recenzemi, bezplatnými elektronickými knihami a exkluzivními nabídkami!
Ještě jeden krok…!
V e-mailu, který jsme vám právě poslali, potvrďte svou e-mailovou adresu.