YOLO-NAS je vrcholem modelů detekce objektů v řadě YOLO. Proč je ale považován za nejlepší?

Po YOLOv8 je tu ještě nový a lepší, nejmodernější model detekce objektů, YOLO-NAS. Jedná se o algoritmus detekce objektů vyvinutý společností Deci AI, aby se vypořádal s omezeními předchozích modelů YOLO (You Only Look Once).

Model je vytvořen z AutoNAC, vyhledávače neuronové architektury. Překonává rychlost a výkon modelů SOTA, což představuje velký skok v detekci objektů zlepšením kompromisů mezi přesností a latencí a podporou kvantizace.

Tento článek pojednává o silných stránkách a vlastnostech YOLO-NAS a zkoumá, proč je to nejlepší model detekce objektů v řadě YOLO.

Pochopení toho, jak YOLO-NAS funguje

AutoNAC (Automated Neural Architecture Construction) společnosti Deci generuje architekturu YOLO-NAS. AutoNAC je bezproblémový proces, který poskytuje zvýšení výkonu stávajícím hlubokým neuronovým sítím.

Potrubí AutoNAC využívá hlubokou neuronovou síť vycvičenou uživatelem jako vstup, datovou sadu a přístup k inferenčnímu systému. Uživatelsky trénovaná hluboká neuronová síť pak prochází přepracováním pomocí potrubí. Bez kompromisů v přesnosti je pak dosaženo optimalizované architektury s nižší latencí.

instagram viewer

YOLO-NAS používá RepVGG. RepVGG jej zpřístupňuje pro optimalizaci po tréninku pomocí reparametrizace nebo kvantizace po tréninku. Jedná se o typ architektury neuronové sítě založené na VGG. Využívá regularizační techniky navržené ke zvýšení schopnosti generalizace modelů hlubokého učení.

Návrh architektury je efektivnější z hlediska rychlosti a paměti. RepVGG prochází školením využívajícím vícevětvovou architekturu, aby bylo dosaženo rychlejšího odvození. Poté je pomocí přeparametrizace převedena na jedinou větev.

Díky této funkci je YOLO-NAS velmi užitečný pro produkční nasazení. Je to proto, že je možné trénovat a optimalizovat model s naprostou přesností pro rychlost odvození a využití paměti.

Klíčové vlastnosti YOLO-NAS

Mezi klíčové funkce YOLO-NAS patří následující:

  • Kvantování-Aware školení: Model využívá QSP a QCI (moduly s vědomím kvantizace) ke snížení ztráty přesnosti během kvantizace po trénování kombinací přeparametrizace 8bitové kvantizace.
  • Automatický návrh architektury: AutoNAC, patentovaná technologie NAS společnosti Deci, hledá optimální architekturu modelu, která integruje základní architektury modelů YOLO, aby bylo možné vytvořit optimalizovaný model.
  • Hybridní kvantizační technika: Standardní kvantizační metoda ovlivňuje celý model. Naproti tomu hybridní kvantovací technika kvantuje část modelu, aby vyvážila latenci a přesnost modelu.
  • Použijte jedinečné přístupy k přípravě modelu pro trénování pomocí automaticky označených dat. Model se pak učí ze svých předpovědí a přistupuje k velkému množství dat.

Srovnávací analýza: YOLO-NAS vs. ostatní modely YOLO

Níže je uvedeno srovnání různých modelů řady YOLO.

YOLO-NAS je lepší než již existující modely detekce objektů, ale má své nevýhody. Zde je seznam výhod a nevýhod YOLO-NAS:

Klady

  • Je to open-source.
  • Je o 10-20% rychlejší než předchozí modely YOLO.
  • Je přesnější ve srovnání s již existujícími modely YOLO.
  • Využívá lepší architekturu AutoNAC. To nastavuje nový rekord v detekci objektů, poskytuje nejlepší přesnost a výkonnost při kompromisu latence.
  • Bezproblémová podpora pro inferenční motory, jako je NVIDIA. Tato funkce z něj dělá model připravený k výrobě.
  • Má lepší paměťovou efektivitu a vyšší rychlost odvozování.

Nevýhody

  • Zatím není stabilní, protože technologie je stále nová a ve výrobě nebyla divoce používána.

Implementace YOLO-NAS

budete používat Google Colab psát a spouštět kódy v této implementaci. Alternativou pro Google Colab by bylo vytvořit virtuální prostředí a použijte IDE na místním počítači.

Model je velmi náročný na zdroje. Před spuštěním na vašem počítači se ujistěte, že máte alespoň 8 GB RAM. Čím větší je velikost videa, tím více paměti využívá.

Instalace závislostí

Nainstalujte závislost YOLO-NAS, super-gradienty pomocí příkazu níže:

pip install super-gradients==3.1.2

Po úspěšné instalaci budete nyní moci trénovat model YOLO-NAS.

Modelový trénink

Chcete-li model trénovat, spusťte níže uvedený blok kódu:

z super_gradients.trénink import modely
yolo_nas_l = models.get("yolo_nas_l", pretrénované_váhy="kokos")

V tomto kódu importujete trénovací model z nainstalované knihovny SuperGradients. Potom používáte předem natrénované modelové váhy z datové sady COCO.

Modelová inference

Vyvození modelu má potenciální aplikace pro úlohy zjišťování, klasifikace a segmentace obrazu.

V tomto případě se zaměříte na úkol detekce objektů pro videa a obrázky. Chcete-li detekovat objekt v obrázku, spusťte níže uvedený blok kódu:

url = "img_path"
yolo_nas_l.predict (url, conf=0.25).ukázat()

Ujistěte se, že používáte přesnou cestu k obrázku. V takovém případě nahrajte obrázek do prostředí Google Colab a poté zkopírujte cestu k obrázku.

Očekávaný výstup:

Chcete-li detekovat objekty ve videu, spusťte níže uvedený blok kódu:

import pochodeň

input_video_path = "cesta_k_videu"
output_video_path = "detected.mp4"
zařízení = 'cuda'-li torch.cuda.is_available() jiný"procesor"
yolo_nas_l.to (zařízení).předvídat (cesta_vstupu_videa).uložit (cesta_výstupu_videa)

Stejně jako obrazová data nahrajte video, u kterého chcete detekovat jeho objekty, do prostředí Google Colab a zkopírujte cestu do proměnné videa. Předpokládané video bude přístupné z prostředí Google Colab pomocí názvu zjištěno.mp4. Před ukončením relace si stáhněte video do místního počítače.

Očekávaný výstup:

YOLO-NAS také podporuje dolaďování modelu a školení na vlastních datech. Dokumentace je k dispozici na Deci's doladění startovacího notebooku.

Aplikace YOLO-NAS v reálném světě

Zdrojový kód YOLO-NAS je přístupný pod licencí Apache License 2.0, která je přístupná pro nekomerční použití. Pro komerční použití by měl model projít od nuly přeškolením, aby získal vlastní závaží.

Jedná se o všestranný model, jehož aplikace je možná v několika oblastech, jako jsou:

Autonomní vozidla a robotika

YOLO-NAS může zlepšit schopnosti vnímání autonomních vozidel a umožnit jim rychleji a přesněji detekovat a sledovat objekty v reálném čase. Tato schopnost pomáhá zajistit bezpečnost silničního provozu a plynulou jízdu.

Dohledové a bezpečnostní systémy

Model může poskytovat rychlou, přesnou detekci objektů v reálném čase pro dohled a zabezpečení systémů, což pomáhá identifikovat potenciální hrozby nebo podezřelé aktivity, což vede k lepšímu zabezpečení systémy

Maloobchod a řízení zásob

Model může poskytnout rychlé a přesné funkce detekce objektů, které umožňují efektivní a v reálném čase automatizované řízení zásob, sledování zásob a optimalizaci regálů. Tento model pomáhá snižovat provozní náklady a zvyšovat zisky.

Zdravotní péče a lékařské zobrazování

Ve zdravotnictví je YOLO-NAS schopen pomoci při efektivní detekci a analýze chorobných anomálií nebo specifických oblastí zájmu. Model může lékařům pomoci přesně diagnostikovat nemoci a monitorovat pacienty, a tím zlepšit zdravotnický sektor.

S sebou YOLO-NAS

YOLO-NAS je nový model detekce objektů, který je průkopníkem nového způsobu provádění detekce objektů. Je lepší než modely SOTA. Jeho výkon při detekci objektů je velkým skokem pro projekty počítačového vidění.