Při všech těch řečech o strojovém učení v posledních letech je těžké ignorovat touhu vyzkoušet si to na vlastní kůži. Zdá se, že se tato technologie vyvíjí velmi rychlým tempem a v mnoha prostředích si již našla uplatnění. Pokud máte nějaké znalosti programování a základní znalosti některých pojmů týkajících se statistiky, je dobré jít z hlediska požadavků na dovednosti.
Budete však muset vzít v úvahu také hardware, který k tomu budete potřebovat. Můžete buď vše hostit doma, nebo použít vzdálené služby - obojí má své výhody i nevýhody.
Základní požadavky na vývoj strojového učení
Budete potřebovat nějaký relativně výkonný hardware, aby se věci daly do pohybu. I když většinu levných nástrojů můžete provozovat na levném notebooku, budete mít značně omezený potenciál učení a vše bude trvat mnohem déle, než je třeba.
Zde je nejdůležitější GPU (Graphics Processing Unit). Nemá to nic společného s grafikou přímo. Jde jen o to, že GPU jsou vhodnější pro typy výpočtů, na které se strojové učení spoléhá.
GPU, který podporuje CUDA, zde bude ještě lepší, i když vás bude stát víc, než se vám do rukou dostane. Nebojte se, pokud si tento druh hardwaru v tuto chvíli nemůžete dovolit. Svá řešení můžete také spustit na dálku, budete se ale muset vypořádat s výkyvy tohoto nastavení.
Přečtěte si více: Co jsou jádra CUDA?
Proč mohou být vaše náklady v roce 2021 vyšší
Za zmínku také stojí, že nakupování nového hardwaru pro strojové učení může být právě teď ještě náročnější. Vzniká složitá globální situace, která se točí kolem nedostatku polovodičů používaných při výrobě různé spotřební elektroniky. Od GPU po smartphony a další zařízení byla ovlivněna řada trhů.
Některé předpovědi tvrdí, že tento nedostatek může trvat několik dalších let, protože byl výsledkem neočekávaného sladění několika faktorů. Mezi pandemií, která zhoršuje produkční schopnosti a zvyšuje poptávku, a horníky a scalpery výkupem celé akcie byla situace náročná pro ty, kteří si chtějí jen pořídit novou GPU.
Příbuzný: Proč jsou grafické karty tak drahé právě teď?
Není ani jasné, kdy se ceny normalizují - ceny by se mohly i nadále zvyšovat. Hledání použitého GPU by mohlo být lepší volbou, i když nemůžete zaručit, že najdete něco vhodného.
Výhody a nevýhody hostovaných platforem
Hostovaná platforma pro vývoj strojového učení vám umožní soustředit se na skutečnou vývojovou práci bez obav o hardware. Budete těžit z pokročilého výpočetního výkonu a tyto platformy mohou obvykle spouštět vaše řešení mnohem rychleji, než cokoli, co byste mohli vytvořit doma.
Tento druh energie samozřejmě nepřichází zdarma. Abyste mohli většinu těchto služeb využívat, budete muset zaplatit poplatek za předplatné. Ty, které jsou nabízeny zdarma, přicházejí s vlastními samostatnými omezeními.
Například nebudete moci spustit program na vyžádání a možná budete muset počkat ve frontě. To může být obzvláště problematické pro delší tréninky, kde budete muset přidat ještě několik hodin navíc k již tak dlouhé čekací době.
A pak se někteří lidé cítí ve své práci pohodlněji, když mají vše k dispozici na místě. Určitě může být pohodlnější pracovat se strojovým učením tímto způsobem, když některé modely mohou mít několik gigabajtů, a jejich přenos na příslušné servery a z příslušných serverů může nějakou dobu trvat.
Nejlepší z obou světů
Můžete použít smíšený přístup. Provádějte většinu svého vývoje lokálně - jako je skutečná práce na vašich algoritmech a modelech - a použijte hostovanou službu pro velké a nákladné zpracování.
Data můžete obvykle odeslat v dávkách, abyste je mohli zpracovat najednou po určitou dobu, a potom se musíte vrátit a poté své výsledky načíst. To může fungovat dobře, když nepotřebujete okamžité výsledky, a může vám to umožnit provádět nákladné školení za relativně nízkou cenu.
To je přístup, který dnes většina lidí používá. Pokud nechcete utrácet příliš mnoho za hardware, ale v pořádku je myšlenka utratit za to nějaké peníze, je to pravděpodobně to, na co byste se měli podívat.
Na trhu jsou různé nabídky, z nichž některé jsou zaměřeny na lidi s menším rozpočtem, takže se podívejte kolem sebe a podívejte se, co je tam k dispozici. Někdy se může stát, že budete mít hostování svých projektů překvapivě málo, pokud nemají žádné složité požadavky.
Buďte opatrní s citlivými daty
Pamatujte, že strojové učení může často zahrnovat práci s citlivými daty. Například vám může být uložen úkol zpracovávat lékařské záznamy nebo jiné osobní údaje. Je samozřejmé, že v těchto situacích musíte být mnohem opatrnější, pokud pracujete se službami hostovanými na dálku.
Musíte si být vědomi důsledků přenosu těchto dat na vzdálené servery. Někdy se můžete ocitnout v rozporu s určitými právními rámci, aniž byste si to uvědomili. Například v Evropské unii musíte být s GDPR velmi opatrní.
Pokud vaše cvičení strojového učení budou zahrnovat jakýkoli druh citlivých údajů, je dobré se poradit s právním specialistou. Ještě lépe, pravděpodobně byste tento druh dat neměli vůbec používat pro své první vzdělávací projekty. Stačí jít s něčím, co je bezpečnější a snadněji se s ním manipuluje.
Strojové učení na vlastní pěst
Strojové učení doma je možné a má mnoho výhod. Má však také některé negativní důsledky, které musíte vzít v úvahu, a musíte se nakonec ujistit, že najdete vyvážený přístup. Věnujte zvláštní pozornost podrobnostem, jako je práce s citlivými údaji, a vždy se seznamte s jakýmikoli právními požadavky, které by na vás mohla uvalit vaše situace.
Nakonec to může být velmi zábavná a produktivní zkušenost, díky které se dostanete na skvělé místo na trhu práce.
Python je extrémně všestranný, s aplikacemi od vývoje webu po analýzu dat.
Přečtěte si další
- Vysvětlení technologie
- Cloud Computing
- Strojové učení
Stefan je spisovatel s vášní pro nové. Původně promoval jako geologický inženýr, ale místo toho se rozhodl věnovat se psaní na volné noze.
Přihlaste se k odběru našeho zpravodaje
Připojte se k našemu zpravodaji s technickými tipy, recenzemi, bezplatnými elektronickými knihami a exkluzivními nabídkami!
Ještě jeden krok…!
V e-mailu, který jsme vám právě poslali, potvrďte svou e-mailovou adresu.