Pravděpodobně jste již viděli aplikace, které tvrdí, že překládají, co vaše kočka říká. Ale mohou opravdu přeložit kočičí mňau do angličtiny? Krátká odpověď je ano. Je to obtížné kvůli tomu, jak jedinečný je „jazyk“ každé kočky, ale s moderní technologií se mohou docela přiblížit.

Aplikace pro překlady koček, jako je MeowTalk, používají formu rozpoznávání řeči, která zdůrazňuje strojové učení. Podívejme se blíže.

Rozpoznávání řeči a strojové učení

Mary Theresa McLean /Pixabay

Rozpoznávání řeči funguje tak, že zaznamenává řeč a přeměňuje zvuk na digitální datový soubor. Kóduje data, jako je výška a objem, jako datové body, které aplikace může analyzovat a porovnávat s významy. Mikrofony DPA vysvětluje, že tyto datové body mohou vypadat velmi odlišně v závislosti na zvucích pozadí a způsobu mluvení slova.

Někdy považujeme rozpoznávání hlasu za samozřejmost, ale je to neuvěřitelný technologický výkon. Zejména vzhledem k tomu, jak složitá je lidská řeč. Tak jako Vědec vysvětluje, každé slovo zahrnuje širokou škálu zvuků nebo „fonémů“ smíchaných do sebe. Dostat počítač k porozumění řeči je velmi obtížné. Nová hranice kočičích zvuků bude ještě těžší.

instagram viewer

Aplikace, které používají rozpoznávání řeči, jsou naprogramovány pomocí slovníku slov zvaného datová sada. Aplikace poté odpovídá vaší řeči na nejbližší možnost v datovém slovníku.

Když udělá chybu, opravíte ji a uloží tato data pro příště. Toto je součást strojového učení. Takto se program naučí rozpoznávat řeč, i když není identická se souborem dat, se kterým začal.

Příbuzný: Co jsou to algoritmy strojového učení? Jak fungují

Rozpoznávání hlasu má stále problémy, zejména s řečovými vadami a akcenty. Některé společnosti jsou zlepšení strojového učení k překonání těchto problémů, ačkoli. V průběhu času může strojové učení změnit rozpoznávání řeči na mocný nástroj.

Tak funguje rozpoznávání řeči u lidí. Ale funguje to pro kočky?

Rozpoznávání řeči vs. Meow Recognition

Ariana Suárez /Unsplash

Nejprve musíme pochopit, proč se překlad určitého druhu mňau jako „mám hlad“ liší od analýzy lidské řeči. Problém je většinou v tom, že komunikace koček se více spoléhá na neverbální podněty, jako je držení těla. Dalším problémem je absence univerzálního „kočičího jazyka“.

Podle ASPCA„Dospělé divoké kočky na sebe nikdy nekoukají, pouze na lidi. Další výzkum od humánní společnost dodává, že tyto zvuky „se nevyskytují ve vakuu“. Musíme je interpretovat spolu s řečí těla a jinými kontexty. V mnoha případech jsou tyto tiché signály jediným rozdílem mezi mňaukáním, které znamená „mám hlad“ a tím, co znamená „chci hrát“.

Přidáním tohoto problému žádné dvě kočky nemají stejný jazyk. Kočky vyvíjejí pro své majitele personalizované „jazyky“. Ty jsou částečně založeny na napodobování hlasu majitele a částečně na osobnosti kočky. Žádné dvě kočky neznějí stejně, i když vyjadřují stejnou touhu nebo potřebu. Jak tedy může překladový slovník jedné aplikace přeložit pro všechny?

Flexibilní strojové učení pro kočky

Zdarma zvuky /Unsplash

Ačkoli několik virtuálních asistentů rád Oto pokus o porozumění tónu a emocím, rozpoznávání řeči je stále hrozné u neverbálních signálů. To ale neznamená, že je nemožné je interpretovat.

MeowTalk používá flexibilnější druh strojového učení, aby pomohl překonat tyto problémy.

Stažení: MeowTalk pro Android | iOS (Volný, uvolnit)

Meowtalk vytvořil Javier Sanchez, který pracoval také v týmu Alexa. Představoval si aplikaci jako krok k chytrým obojkům. Tyto obojky převádějí zvuky koček do lidské řeči, čerpají ze složitých strategií strojového učení, které pomáhají lidem lépe porozumět a pečovat o své kočky.

Tým MeowTalk kompenzoval problémy s jedinečností vytvořením konkrétnějších profilů pro každou kočku. V aplikaci zaregistrujete každou kočku zvlášť. Science Norsko uvádí, že koťata mňoukají jinak než dospělé kočky, takže aplikace také požaduje narozeniny kočky. Každý profil generuje pro kočku jedinečnou datovou síť, která do strojového učení začleňuje trochu hlubokého učení.

Příbuzný: Deep Learning vs. Strojové učení vs. AI: Jak spolu chodí?

Pro slovní zásobu začíná MeowTalk s 10 zvukovými profily ve své datové sadě. Každý z nich má jiný význam, například „šťastný“ nebo „lovecký“. Když aplikace uslyší zvuk a pokazí ho, můžete jej opravit nebo vytvořit novou interpretaci.

CATSOUNDS data shromážděná z Akvelon

Oprava říká aplikaci, aby nahradila základní slovní zásobu novým zvukem.

Například můžete aplikaci říct, aby místo dlouhého kvílení přiřadila „Lov“ ke krátkým cvrlikáním. Tento druh korekce je užitečnější než přidání více zvuků, aby odpovídaly jednomu, což znamená způsob rozpoznávání řeči laň, což by bylo jako říct aplikaci, že dlouhé yowl a krátké cvrlikání oba znamená "Matka volání."

Strojové učení v aplikacích pro rozpoznávání řeči obvykle tomuto typu přepisu odolává. Bylo by to jako pokusit se naučit Siriho, že když řeknete „technologický blog“, máte na mysli opravdu „hrušku“. Ale flexibilnější forma strojového učení, kterou MeowTalk používá, dokáže tuto opravu zvládnout více snadno.

Vytvoření nové interpretace přidává význam, který nebyl dříve zakódován. Například pokud má vaše kočka konkrétní hovor, když chce svou oblíbenou hračku, můžete jako možnost přidat „Chci svou myš“. Je to podobné jako přidání slova do slovníku automatických oprav.

Příbuzný: Jak definovat svá vlastní automatická slova v systému Android

Postupem času můžete pro svou kočku vytvořit vysoce přizpůsobený řečový profil. Nakonec může být dokonce dostatečně sofistikovaný, aby byl užitečný pro domácí mazlíčky nebo pro řešení problémů s chováním. Pokud nic jiného, ​​pomáhá majitelům koček, aby byli pozornější ke svým mazlíčkům.

Verdikt: Fungují aplikace pro překlady koček?

Nakonec se „překlad koček“ stále hodně spoléhá na to, že uživatel učí aplikaci, jak jejich kočka mluví. Pravděpodobně tomu tak bude vždy kvůli tomu, jak jedinečná je komunikace každé kočky.

Skutečnost, že strojové učení přišlo tak daleko, že vývojáři v tom mohou dokonce částečně uspět, je neuvěřitelná. Strojové učení a AI postupují závratnou rychlostí a my se nemůžeme dočkat, až uvidíme, kam jdou dál.

E-mailem
Související témata
  • Vysvětlení technologie
  • Výuka jazyků
  • Strojové učení
O autorovi
Natalie Stewart (16 článků publikováno)

Natalie Stewart je spisovatelka pro MakeUseOf. Nejprve se začala zajímat o technologii na vysoké škole a na univerzitě si vytvořila vášeň pro psaní médií. Natalie se zaměřuje na technologie, které jsou přístupné a snadno použitelné, a miluje aplikace a zařízení, která obyčejným lidem usnadňují život.

Více od Natalie Stewart

Přihlaste se k odběru našeho zpravodaje

Připojte se k našemu zpravodaji s technickými tipy, recenzemi, bezplatnými elektronickými knihami a exkluzivními nabídkami!

Ještě jeden krok…!

V e-mailu, který jsme vám právě poslali, potvrďte svou e-mailovou adresu.

.