Strojové vidění je základem samořídících automobilů a je rozhodující pro plně autonomní budoucnost.
Klíčové věci
- Samořídící auta spoléhají na technologii strojového vidění, aby viděla a rozuměla svému okolí, což jim umožňuje detekovat předměty, identifikovat značky a navigovat po silnici.
- Strojové vidění v samořídících autech se skládá z kamerového systému, edge computingu a algoritmů AI, které spolupracují na sběru vizuálních informací, jejich zpracování v reálném čase a identifikaci vzorců a objektů.
- Strojové vidění je zásadní pro dosažení plné autonomie u samořídících automobilů, protože umožňuje klasifikaci objektů, detekci jízdních pruhů a signálů, identifikaci značek a rozpoznávání provozu. Budoucnost autonomních vozidel spočívá v pokrokech v AI, edge computingu a technologii fotoaparátů.
Samořídící auta vždy přitahovala pozornost. I když možná ještě nemáme plně autonomní auta, máme auta s pokročilými asistenční systémy řidiče (ADAS) schopné automatického řízení, změny jízdního pruhu, parkování a tempomat s ohledem na provoz.
Samořídící auto používá pro svůj ADAS četné senzory, přičemž strojové vidění je primárním způsobem detekce, identifikace a výpočtu vzdálenosti objektů a celkového okolí. Bez strojového vidění jsou samořídící auta s tempomatem a autopilotem velmi nepravděpodobná.
Co je strojové vidění?
Strojové vidění je technologie, která umožňuje strojům vidět a rozpoznávat předměty v jejich okolním prostředí. Jedná se o podmnožinu počítačového vidění, která se zaměřuje na průmyslové aplikace detekce objektů orientovaných na vidění v autonomních strojích, jako jsou roboti a vozidla.
Strojové vidění dnes využívá algoritmy hlubokého učení umělé inteligence, jako jsou konvoluční neuronové sítě (CNN) vytvářet robustní a dobře zobecněné modely, které dokážou přesně identifikovat objekty v různých podmínky. Umožňuje implementovat strojové vidění na různé úkoly vyžadující vyšší spolehlivost ve výrobě, zemědělství, robotice a automobilovém průmyslu.
Jak funguje strojové vidění v samořídících autech?
Strojové vidění v samořídících automobilech lze obvykle rozdělit do tří částí: kamerový systém, zpracování (edge computing) a AI. Tato sada technologií umožňuje autonomnímu vozidlu vidět, přemýšlet a identifikovat značky a překážky za jízdy. Pojďme diskutovat o každé části do hloubky, abychom pochopili, jak se tyto technologie propojují, aby vytvořily strojové vidění samořídícího vozu.
Kamerový systém
Strojové vidění spoléhá na kamerové systémy, které shromažďují vizuální informace o prostředí. Samořídící auta využívají několik kamer instalovaných kolem vozu, aby shromáždily co nejvíce vizuálních informací.
V kamerách pro strojové vidění se používají dva hlavní senzory: komplementární metal-oxidové polovodiče (CMOS) a nabíjecí zařízení (CCD). U aut s vlastním řízením je CMOS často preferován pro svou vysokou rychlost čtení a výkon na lodi elektronika a možnosti paralelního zpracování, což z něj činí rychlejší snímač, i když náchylný k šumu nebo artefakty. Řešení, jako jsou různé režimy osvětlení, digitální noční vidění a filtry, mohou pomoci snímači CMOS za méně než ideálních světelných podmínek.
U aut s vlastním řízením jsou kamery instalovány v určitých vzdálenostech od sebe, aby se vytvořilo stereoskopické vidění. Stereoskopické vidění je schopnost kombinovat dva nebo více vizuálních vstupů, čímž vzniká pocit hloubky nebo trojrozměrnosti objektů a prostředí. To zase autům umožňuje triangulovat a vypočítat přibližnou vzdálenost mezi objektem a autem.
Protože lidé mají dvě oči, profitujeme také ze stereoskopického vidění. Můžete si to sami vyzkoušet; zavřete jedno oko a vyberte malý předmět ze svého stolu. Položte ruku na stranu předmětu a ujistěte se, že špička předmětu je vzdálena alespoň dva palce. Zkuste se na několik sekund zastavit a uvidíte, jak si jistí svým přiblížením. Nyní zkuste otevřít obě oči a uvidíte, jak je váš smysl pro hloubku mnohem lepší.
Počítač Edge
Zatímco kamerový systém na samořídícím voze shromažďuje data, palubní počítač (edge procesor) zpracuje všechny vstupy v reálném čase a aktualizuje systém o stavu prostředí ihned. Ačkoli typické úlohy strojového vidění mohou ušetřit peníze pomocí cloud computingu, je toho prostě příliš mnoho riziko připojení samořídících aut ke cloudu, i když jde o outsourcing procesu v jeho požadavcích na strojové vidění.
Použití okrajového počítače pro zpracování vstupních dat eliminuje problémy s latencí a zajišťuje, že data jsou přijímána, zpracovávána a komunikována v reálném čase. Počítače Edge pro samořídící auta používají specializované počítače integrující grafické procesory AI, jako jsou NVIDIA Tensor Core a CUDA Core.
Algoritmy AI
Algoritmy byly vždy klíčovou součástí strojového vidění. Algoritmus umožňuje počítači identifikovat všechny vzory, tvary a barvy poskytované kamerovým systémem. Použití umělé inteligence oproti tradičním algoritmům strojového vidění výrazně zvyšuje schopnost samořídícího vozu spolehlivě identifikovat objekty, pouliční značky, dopravní značení a semafory. Mnoho algoritmů umělé inteligence se používá k výcviku samořídících aut. Mezi nejoblíbenější patří:
- YOLO (podíváš se jen jednou): Algoritmus detekce objektů v reálném čase, který identifikuje a sleduje objekty v zorném poli vozu.
- SIFT (transformace funkce Scale-Icar'sant): Používá se pro extrakci funkcí a pomáhá vozu rozpoznat výrazné orientační body a objekty v jeho okolí.
- Histogram orientovaných přechodů (HOG): Používá se pro rozpoznávání objektů a zaměřuje se na extrahování místních vzorů a přechodů z obrázků.
- TextonBoost: Algoritmus, který pomáhá s rozpoznáváním objektů analýzou textur v prostředí.
- AdaBoost: AdaBoost, který se používá pro klasifikaci dat, kombinuje několik slabých klasifikátorů, aby mohl přijímat silná rozhodnutí o objektech a překážkách v cestě vozidla.
Význam strojového vidění v samořídících autech
Strojové vidění je primárním způsobem, jak samořídící auto vnímat a rozumět svému okolí. Bez strojového vidění je velmi pravděpodobné, že samořídící auta budou posunuta zpět na úroveň 1 stupnice autonomie vozidla a nikdy nemusí dosáhnout plné autonomie.
Díky strojovému vidění jsou nyní samořídící auta schopna klasifikace objektů, detekce jízdních pruhů a signálů, identifikace značek a rozpoznávání provozu.
Ačkoli mnoho samořiditelných vozidel nyní používá různé senzory, jako je LIDAR, RADAR a SONAR, všechny se do značné míry spoléhají na strojové vidění, abyste viděli prostředí, identifikovali objekty a pochopili význam značek a semaforů na obrazovce silnice. Všechny tyto další senzory jsou zde pouze proto, aby rozšířily strojové vidění a zvýšily bezpečnost lidí, zvířat a majetku.
To znamená, že strojové vidění může fungovat nezávisle bez pomoci dalších senzorů, které poskytují funkce autopilota. Ve skutečnosti nejnovější samořídící auta Tesly upustila od RADARu a nyní se u svého systému Autopilot spoléhají výhradně na strojové vidění.
Ačkoli to neznamená nic ve smyslu diskreditace užitečnosti jiných senzorových technologií, ukazuje to důležitost a sílu strojového vidění v samořídících autech.
Budoucnost strojového vidění v autonomních vozidlech
Strojové vidění je základem samořídících automobilů. Prostřednictvím strojového vidění mohou auta vidět a vnímat životní prostředí přesně jako lidé. I když problémy přetrvávají, nelze výhody strojového vidění z hlediska bezpečnosti a navigace podceňovat. Pokud jde o budoucnost autonomních vozidel, jakékoli další pokroky v AI, edge computingu a/nebo fotoaparátu technologie jistě učiní samořídící auta zdatnějšími, což je pravděpodobně posune na vyšší úroveň automatizace.