Když se člověk podívá na scénu nebo obrázek, pochopí to - jaké objekty jsou v něm a co se děje, pokud dojde k akci. Počítač na druhé straně zpracovává pouze digitální data, která popisují hodnotu barvy každého pixelu. Pro člověka je rozpoznání pizzy na přeplněném stole snadné. Až donedávna však počítače nemohly provádět stejný úkol.
Počítačové vidění neboli CV umožňuje počítači získat z vizuálních vstupů důležité informace a na základě těchto informací vytvářet přesné předpovědi a doporučení.
Jak funguje počítačové vidění?
Před počítačovým viděním by člověk musel udělat hodiny ruční práce nohou, aby vytvořil program, který rozpoznal konkrétní obraz. Nejprve by musela být shromážděna databáze podobných obrázků.
Poté by tyto obrázky musely být ručně analyzovány, měřeny a anotovány příslušnými daty že si výzkumník myslel, že dokáže identifikovat dotyčný objekt (jako je barva, měření a tvar). Teprve potom mohl být software použit k vytváření předpovědí.
Na druhou stranu počítačové vidění automatizuje celý tento proces pomocí přístupu strojového učení známého jako hluboké učení.
Hluboké učení využívá vícevrstvou neuronovou síť se stovkami potenciálních vrstev. V případě obrázků se obvykle jedná o konvoluční neuronovou síť (CNN).Podrobně vysvětlíme, jak funguje hluboké učení a neurální sítě, daleko přesahuje rámec tohoto článku. V zásadě se do neuronové sítě přivádí velké množství dat. Neuronová síť data opakovaně analyzuje, dokud o nich nemůže vytvořit přesné předpovědi.
V případě CNN používaného pro úlohu počítačového vidění provede neurální síť data několika kroky. Nejprve sbalí obraz na několik částí (jednotlivé pixely nebo skupiny pixelů, které jsou předem označeny).
Poté vytváří předpovědi o tom, co je v různých částech obrazu (například tvrdé hrany nebo konkrétní objekty). Opakovaně kontroluje přesnost těchto předpovědí a pokaždé mírně mění části algoritmu, dokud se nestane velmi přesným.
Počítače jsou nyní tak výkonné, že dokáží analyzovat obraz mnohem rychleji než lidský mozek, zvláště jakmile se naučí rozpoznávat určité vzorce. Tímto způsobem je snadné pochopit, jak by algoritmus hlubokého učení mohl předstihnout lidské schopnosti.
Jaké jsou typy počítačového vidění?
Počítačové vidění zahrnuje analýzu a porozumění obrazům a výstupu příslušných předpovědí nebo rozhodnutí o obrázcích. Počítačové vidění použije k dosažení těchto cílů různé úkoly. Mezi ně patří:
- Klasifikace obrazu: Typ obrázku je rozpoznán. Například ať už jde o obličej, krajinu nebo objekt člověka. Tento druh úkolu lze použít k rychlé identifikaci a klasifikaci obrázků. Jedním z použití je automatické rozpoznávání a blokování nevhodného obsahu na sociálních médiích.
- Rozpoznávání objektů: Podobně jako klasifikace obrázků může rozpoznávání objektů identifikovat konkrétní objekt ve scéně - jako pizza na přeplněném stole.
- Detekce hrany: Běžným používáním počítačového vidění a obvykle prvním krokem v detekci objektů je identifikace tvrdých hran v obraze.
- Identifikace objektu: Jedná se o rozpoznávání jednotlivých příkladů objektu nebo obrazu, jako je identifikace konkrétní osoby, otisky prstů nebo vozidlo.
- Detekce objektu: Detekce je identifikace konkrétního znaku v obraze, jako je zlomenina kosti na rentgenovém snímku.
- Segmentace objektů: Jedná se o identifikaci, které pixely v obraze patří dotyčnému objektu.
- Sledování objektů: Ve video sekvenci, jakmile je objekt rozpoznán, lze jej snadno sledovat v celém videu.
- Obnova obrazu: Rozmazání, šum a další obrazové artefakty lze odstranit přesnou identifikací místa, kde je objekt v pozadí.
Příklady počítačového vidění
Umělá inteligence je již se používá v několika průmyslových odvětvích s ohromujícím efektem, což platí pro počítačové vidění. Zde je několik příkladů již dnes používaných životopisů.
Rozpoznávání obličeje
Rozpoznávání obličeje je jedním z hlavních způsobů, jakými se dnes používá počítačové vidění. Ve srovnání s databázemi známých tváří mohou algoritmy počítačového vidění velmi přesně identifikovat jednotlivé lidi.
- Sociální média analyzují obrázky a automaticky označují uživatele, pro které má dobrý výběr obrázků.
- Notebooky, telefony a bezpečnostní zařízení mohou identifikovat lidi, aby jim umožnili přístup.
- Donucovací orgány používají rozpoznávání obličeje v systémech CCTV k identifikaci podezřelých.
Lék
Počítačové vidění se v současnosti ve zdravotnictví používá k poskytování rychlejších a přesnějších diagnóz, než mohou odborníci stanovit. Mnoho aplikací zahrnuje analýzu rentgenových, CT nebo MRI snímků pro konkrétní stavy, včetně neurologických onemocnění, nádorů a zlomenin nebo zlomenin kostí.
Samořiditelná auta
Autonomní vozidla musí rozumět svému okolí bezpečně řídit. To znamená rozpoznávat silnice, pruhy, dopravní signály, další vozidla, chodce a další. Všechny tyto úkoly využívají systémy počítačového vidění v reálném čase, aby nedocházelo ke kolizím a byla bezpečná jízda.
Počítačové vidění je náročné
Současné aplikace počítačového vidění již začínají posouvat způsob naší práce v různých průmyslových odvětvích. Od schopnosti detekovat vadné nebo rozbité zařízení až po přesnou diagnostiku rakoviny má počítačové vidění schopnost vylepšovat systémy a zachraňovat životy.
Není to však bez výzev. Počítačové vidění je stále daleko od toho, co je lidské vidění. Máme tisíce let evoluce, která nám umožňuje rozpoznat a pochopit téměř vše, co se kolem nás děje, v reálném čase. Ale nemáme tušení, jak lidské mozky tyto úkoly plní.
Hluboké učení je obrovský krok správným směrem, ale stále vyžaduje ohromné množství práce vytvořit systém, který dokáže vykonat úkol, který lidé mohou udělat velmi snadno, jako je identifikace automobilu na vozidle silnice. Je to proto, že počítače provádějí omezené úkoly velmi efektivně. Vývoj počítače, který dokáže porozumět celkové složitosti vizuálního světa, je úplně jiná míčová hra.
Vzhledem k tomu, že bude probíhat další výzkum v oblasti aplikací AI i biologie člověka, je pravděpodobné, že v blízké budoucnosti uvidíme explozi možného využití počítačového vidění.
Algoritmy strojového učení jsou navrženy tak, aby usnadňovaly život a zlepšovaly systémy, ale mohou jít špatně se špatnými následky.
Přečtěte si další
- Vysvětlení technologie
- Programování
- Umělá inteligence
- Neuronové sítě
Jake Harfield je spisovatel na volné noze se sídlem v australském Perthu. Když nepíše, obvykle je venku v křoví a fotografuje místní divokou zvěř. Můžete ho navštívit na www.jakeharfield.com
Přihlaste se k odběru našeho zpravodaje
Připojte se k našemu zpravodaji s technickými tipy, recenzemi, bezplatnými elektronickými knihami a exkluzivními nabídkami!
Ještě jeden krok…!
V e-mailu, který jsme vám právě poslali, potvrďte svou e-mailovou adresu.