Strojové učení se dnes stalo centrem diskuse v oblasti umělé inteligence. Dotýká se všech oborů, včetně strojírenství, medicíny, obchodu, sociálních věd a dalších.

Pomocí několika dnes dostupných knihoven strojového učení je strojové učení s Pythonem, C ++, Java, Julia a R jednodušší než kdy dříve. Zde je několik populárních knihoven strojového učení, se kterými můžete začít, pokud se chcete vydat na tuto slibnou kariérní cestu.

1. Keras

Keras je součástí rozsáhlých nástrojů strojového učení společnosti TensorFlow. Ale je to jiné v tom, že je to API vyšší úrovně, které je dodáváno s TensorFlow. Navíc je přátelštější k lidem a je napsán v Pythonu. Je tedy implementovatelnější, protože nabízí stručnou dokumentaci, kterou si začátečníci strojového učení snadno zúží.

Keras však nabízí širokou škálu funkcí strojového učení, které jsou ideální pro školení strukturovaných dat i surových médií. Knihovna však pokrývá textové a obrazové algoritmy pro školení a testování vaší datové sady.

Jedinečnou vlastností Keras je, že vás soustředí na knihovnu, protože poskytuje vše, co potřebujete pro svůj projekt v jednom kuse. Sotva si tedy budete muset rozdělovat půjčky na nástroje z jiných knihoven. Ladění hyperparametrů, výběr funkcí, bohaté vrstvy předzpracování dat a čištění dat jsou některé z jeho velkolepě integrovaných funkcí.

instagram viewer

S Keras můžete číst obrázky a texty přímo z rozdělených složek v nadřazeném adresáři a získat z nich označenou datovou sadu. A pokud jsou vaše data velká a nesedí vám v paměti počítače, Keras nabízí možnost vysoce výkonného objektu datové sady. Vždy na to můžete přepnout.

Příbuzný: Jak upgradovat své dovednosti v Pythonu a AI pomocí knihoven strojového učení Pythonu

Kromě toho nabízí různé grafické procesorové jednotky (GPU) pro zpracování velké množiny dat. Umožňuje vám tedy současně asynchronně spouštět výpočty CPU spolu se zpracováním GPU.

2. TensorFlow

Představený společností Google v roce 2015, TensorFlow je více rámcem než knihovnou. Je to open-source knihovna postavená na C ++ a funguje na základě sledování grafů toku dat.

TensorFlow je velmi univerzální a rozsáhlý a nabízí spoustu dalších vestavěných, unitárních knihoven pro spouštění výpočtů strojového učení. V podstatě TensorFlow nabízí škálovatelnou platformu pro vytváření konceptů strojového učení, jako jsou umělé neurální sítě (ANN), hluboké neurální sítě a hluboké učení.

Příbuzný: Co je TensorFlow Lite a jak je to rámec hlubokého učení?

Tensorflow kromě Pythonu podporuje mimo jiné také Javu, C ++, Julii, Rust, Ruby a JavaScript. Zatímco používání TensorFlow v programovacích jazycích jiných než Python může nabídnout snadnou integraci projektu, použití jeho jader v Pythonu je snazší, protože plně podporuje implementaci TensorFlow.

Pokud potřebujete později přepnout verze, mohou navíc vývojové kanály v jiných jazycích představovat problémy s kompatibilitou verzí API. Přestože jsou dokumenty TensorFlow komplexní, na rozdíl od Kerasu mohou být příliš diverzifikované, než aby je začátečníci pochopili. To znamená, že má solidní podporu komunity a také jich najdete mnoho open-source příklady TensorFlow tam venku.

Výhodou TensorFlow oproti Kerasu je, že můžete TensorFlow používat přímo bez Kerasu. Totéž samozřejmě nemůžete říci pro Keras, protože je to rozvětvená třída samotného TensorFlow.

3. Mlib Spark

Tady je něco docela šikovného od Apache Spark. Vydáno a vyrobeno jako open-source v roce 2010, Mlib Spark používá iterativní výpočty ke spouštění algoritmů strojového učení. Vzhledem ke své iterativní povaze může Mlib využívat Hadoop nebo místní zdroje dat a pracovní toky. Navíc je schopen během krátké doby spustit komplexní logiku.

Nakonec je to stále jedna z nejrychlejších knihoven strojového učení. Provozuje širokou škálu algoritmů strojového učení, včetně regresních, klastrových, klasifikačních a doporučovacích modelů. Vyniká také z hlediska předzpracování dat a dolování vzorů.

Příbuzný: Co jsou algoritmy strojového učení? Zde je návod, jak fungují

Knihovna je dynamická a nabízí robustní API, které se připojuje k programům Scala, Python, R a Java. Mlib Spark je vložením samotného Sparku, takže se aktualizuje s každým vydáním Sparku.

Mlib Spark má vysvětlující dokumentaci, takže si jej může začátečník snadno vyzvednout. Trochu nevýhodou je, že se integruje pouze s několika programovacími jazyky, takže to může být problém, pokud nejste obeznámeni s jazyky, které aktuálně podporuje.

4. mlpack

mlpack byl vydán v roce 2008 a byl vyvinut v jazyce C ++ pomocí lineární algebraické knihovny s názvem Armadillo. Stejně jako Mlib Spark vám umožňuje aplikovat většinu dostupných algoritmů a konceptů strojového učení přímo do vaší datové sady pomocí stručných a čitelných řádků kódu.

Kromě toho, že je k dispozici v programovacích jazycích, jako jsou Python, C ++, Go a Julia, podporuje také provádění CLI, které vám umožňuje spouštět kód a přijímat okamžité odpovědi. Ačkoli podporuje vazbu s těmito jinými jazyky, spuštění mlpacku na velkých datových sadách, které vyžadují složité výpočty, nemusí být při použití s ​​jiným programovacím jazykem skvělý nápad. Škálovatelnost s jinými jazyky kromě C ++ je tedy často problémem mlpack.

Pokud jste začátečník v oblasti strojového učení a máte znalosti o C ++, můžete to ještě vyzkoušet. Dokumentace obsahuje snadno srozumitelné průvodce a příklady, které jsou k dispozici pro různé programovací jazyky. Protože spouští výpočty na konceptech C ++, mlpack používá nízkoúrovňový kód k rychlému provádění složitých až jednoduchých úloh strojového učení.

5. Pytorch

Facebook se vyvinul Pytorch a oficiálně jej vydal v roce 2016. Pytorch, známý svým rozsáhlým využitím v počítačovém vidění, hlubokém učení a zpracování přirozeného jazyka, je open-source knihovna postavená na architektuře Torch.

Stejně jako Keras a Tensorflow, Pytorch podporuje zpracování datových sad CPU. A pokud je vaše datová sada velká, je vybavena procesorem GPU, který zvládne vaše výpočty. Navíc je založen na tenzoru.

Kromě Pythonu knihovna podporuje vazbu pro C ++ i Java. Pytorch, kromě dalších nástrojů, nabízí dceřiné knihovny včetně pochodeň, text pochodně, torchaudio, a TorchServe.

Tyto knihovny jsou součástí funkcí strojového učení Pytorch a při psaní modelů Pytorch na ně narazíte. Díky podrobné a komplexní dokumentaci založené na výukových programech je Pytorch snadno pochopitelný, pokud znáte koncepty strojového učení.

Pytorch také umožňuje transformovat vaše datové sady do strojově přívětivého formátu. Je to tedy také perfektní knihovna pro předzpracování dat. S Pytorchem je vždy možné extrakce funkcí, čištění dat, rozdělení dat a ladění hyperparametrů.

6. Scikit-Learn

Ponořený do Pythonu, scikit-learn, také zvaný sklearn, byla veřejně vydána v roce 2010. Knihovna však slouží široké škále aplikací strojového učení, včetně modelování uváděných a nefunkčních datových sad.

Scikit-learn nabízí známé supervizované algoritmy, včetně lineárních a logistických regresních modelů, podpora vektorového stroje (SVM), Naivní Bayes, rozhodovací stromy, mj. nejbližší sousedé, mimo jiné box. Je to také bohatý zdroj výukových metod bez dohledu, jako je klastrování, Gaussův model, společně s modely neuronových sítí a další.

V podstatě scikit-learn podporuje modely pod dohledem i bez dozoru. Je to skvělý výchozí bod, pokud jste v Pythonu nebo strojovém učení obecně stále noví, protože je zcela založen na Pythonu. A pokud právě začínáte se strojovým učením nebo datovou vědou, možná budete chtít začít s dohlíženými výukovými funkcemi scikit-learn.

Celkově je pro začátečníky přívětivější než jiné knihovny v seznamu. Na rozdíl od ostatních knihoven uvedených výše je scikit-learn při provádění vysoce výkonných matematických výpočtů masivně závislý na Numpy a Scipy. A také používá Matplotlib k prezentaci přesvědčivých vizualizací vyprávění příběhu.

7. Theano

Pokud hledáte knihovnu, která vám pomůže rozložit složité problémy na flexibilní algoritmy, pak Theano může být to, co chcete. Theano, vytvořené v roce 2007 Yoshuou Bengiem v kanadském Montrealu, je výkonná knihovna pro spouštění malých až vysoce výkonných výpočtů.

Stejně jako Scikit-Learn, Theano závisí na Numpy při provádění numerických výpočtů. Knihovna podporuje výpočty založené na GPU a navíc generuje nízkoúrovňový kód C. To urychluje matematická hodnocení s Theano, bez ohledu na to, jak jsou velká. Jeho modely hlubokého učení navíc běží na tenzorech.

S Theano můžete svou datovou sadu převést na čitelné plovoucí, binární nebo celočíselné body bez ohledu na její počáteční datový typ. Možná však nedostanete dostatečnou podporu komunity. Je to proto, že Theano není tak populární jako ostatní knihovny, které jsme zmínili dříve. To neznamená, že je méně přátelský pro začátečníky.

Výukový program v dokumentech je snadno pochopitelný. Díky své schopnosti zjednodušit složitá pole a optimalizovat nekonečné výpočty je ideální pro vytváření škálovatelných modelů strojového učení.

Kterou knihovnu byste měli použít pro svůj další projekt strojového učení?

Ačkoli jsme zmínili některé z nejpoužívanějších knihoven strojového učení, přichází s nejlepší může být tvrdý, protože všechny slouží velmi podobným účelům, jen s několika rozdíly v nich funkce.

Samozřejmě, že začít s knihovnou vhodnější pro začátečníky, jako je Scikit-Learn nebo Keras, je užitečné, pokud právě proniknete do terénu. Kromě toho vám účelově vybírání knihovny pro projekt pomůže zúžit složitost vašeho vývojového kanálu. Ale to znamená, že seznámit se se základy strojového učení prostřednictvím kurzů a návodů je užitečné.

PodíltweetE-mailem
Co jsou algoritmy strojového učení? Zde je návod, jak fungují

Algoritmy strojového učení jsou navrženy tak, aby usnadňovaly život a zlepšovaly systémy, ale mohou se pokazit se špatnými důsledky.

Číst dále

Související témata
  • Programování
  • Strojové učení
  • Programování
O autorovi
Idowu Omisola (91 publikovaných článků)

Idowu je zapálený pro cokoli chytrého a produktivního. Ve svém volném čase si hraje s kódováním a když se nudí, přepne na šachovnici, ale také se rád jednou za čas odpoutá od rutiny. Jeho vášeň ukazovat lidem cestu kolem moderních technologií ho motivuje psát více.

Více od Idowu Omisola

Přihlaste se k odběru našeho zpravodaje

Připojte se k našemu zpravodaji a získejte technické tipy, recenze, bezplatné elektronické knihy a exkluzivní nabídky!

Kliknutím sem se přihlásíte k odběru