V roce 2020 Apple udělal odvážný krok; opustili Intel a přešli na svůj proprietární křemík pro napájení svých MacBooků. Ačkoli přechod na architekturu ARM z designového jazyka x86 zvedl několik obočí, Apple ukázalo se, že se všichni mýlili, když MacBooky poháněné křemíkem Apple nabízely ohromující výkon watt.
Podle několika odborníků byl posun k architektuře ARM velkým důvodem pro zvýšení výkonu na watt. Zásadní roli ve zlepšení výkonu nové generace MacBooků však sehrála i nová architektura Unified Memory Architecture.
Co je tedy architektura Unified Memory Architecture společnosti Apple a jak funguje? No, pojďme to zjistit.
Proč váš počítač potřebuje paměť?
Než se pustíme do architektury Unified Memory Architecture společnosti Apple, je nezbytné pochopit, proč jsou primárně potřeba primární úložné systémy, jako je paměť RAM (Random Access Memory).
Jak vidíte, tradiční procesor běží na frekvenci 4 GHz během a Turbo zrychlení. Při této rychlosti může procesor provádět úkoly za čtvrt nanosekundy. Úložné jednotky, jako jsou SSD a HDD, však mohou dodávat data do CPU pouze každých deset milisekund – to je 10 milionů nanosekund. To znamená, že v době mezi tím, než CPU dokončí zpracování dat, na kterých pracuje, a přijetím další dávky informací, je nečinný.
To jasně ukazuje, že úložné jednotky nedokážou držet krok s rychlostí procesoru. Počítače tento problém řeší pomocí primárních úložných systémů, jako je RAM. Přestože tento paměťový systém nedokáže ukládat data trvale, je mnohem rychlejší ve srovnání s SSD – dokáže odesílat data za pouhých 8,8 nanosekund: nekonečně rychleji než nejrychlejší SSD právě teď.
Tato krátká přístupová doba umožňuje procesoru přijímat data rychleji, což mu umožňuje nepřetržitě procházet informacemi namísto čekání, až SSD odešle další dávku ke zpracování.
Díky této architektuře návrhu jsou programy v úložných jednotkách přesunuty do paměti RAM a poté k nim CPU přistupuje prostřednictvím registrů CPU. Proto rychlejší primární úložný systém zlepšuje výkon počítače, a to je přesně to, co Apple dělá se svou architekturou Unified Memory Architecture.
Pochopení toho, jak fungují tradiční paměťové systémy
Nyní, když víme, proč je potřeba RAM, musíme pochopit, jak ji GPU a CPU využívají. Ačkoli jsou GPU i CPU navrženy pro zpracování dat, CPU je navrženo pro provádění všeobecných výpočtů. Naopak, GPU je navrženo tak, aby vykonávalo stejný úkol na různých jádrech. Díky tomuto rozdílu v designu je GPU vysoce efektivní při zpracování a vykreslování obrazu.
Přestože CPU a GPU mají různé architektury, při získávání dat závisí na primárních úložných systémech. Na tradičním systému s vyhrazeným GPU existují dva typy pamětí s náhodným přístupem. Toto je VRAM a systémová RAM. Také známá jako Video RAM, VRAM je zodpovědná za odesílání dat do GPU a systémová RAM přenáší data do CPU.
Abychom však lépe porozuměli systémům správy paměti, podívejme se na skutečný příklad hraní hry.
Když hru otevřete, CPU se dostane do obrazu a programová data pro hru se přesunou do systémové RAM. Poté CPU zpracuje data a odešle je do VRAM. GPU pak tato data zpracuje a odešle je zpět do paměti RAM, kde CPU zobrazí informace na obrazovce. V případě integrovaného systému GPU sdílejí obě výpočetní zařízení stejnou RAM, ale mají přístup k různým prostorům v paměti.
Tento tradiční přístup zahrnuje velké množství přesunů dat, díky čemuž je systém neefektivní. K vyřešení tohoto problému používá Apple architekturu Unified Memory Architecture.
Jak funguje Unified Memory Architecture na Apple Silicon?
Apple dělá několik věcí jinak, pokud jde o paměťové systémy.
V případě generických systémů je RAM připojena k CPU pomocí patice na základní desce. Toto připojení omezuje množství dat odesílaných do CPU.
Na druhou stranu, Jablečný křemík používá stejný substrát pro montáž RAM a SoC. Přestože RAM není součástí SoC v takové architektuře, Apple používá pro připojení RAM k SoC vložkový substrát (Fabric). Interposer není nic jiného než vrstva křemíku mezi SOC a RAM.
Ve srovnání s tradičními paticemi, které se při přenosu dat spoléhají na dráty, interposer umožňuje RAM připojit se k čipové sadě pomocí křemíkových průchodů. To znamená, že křemíkové MacBooky Apple mají paměť RAM zapečenou přímo do obalu, takže přenos dat mezi pamětí a procesorem je rychlejší. Paměť RAM je také fyzicky blíže místu, kde jsou data potřebná (procesory), což umožňuje, aby se data dostala dříve, kam je potřeba.
Díky tomuto rozdílu v připojení paměti RAM k čipové sadě může přistupovat k velkým datovým šířkám pásma.
Kromě výše uvedeného rozdílu Apple také změnil způsob, jakým CPU a GPU přistupují k paměťovému systému.
Jak bylo vysvětleno dříve, GPU a CPU mají v tradičním nastavení různé oblasti paměti. Apple naopak umožňuje GPU, CPU a Neural Engine přístup ke stejnému paměťovému fondu. Díky tomu není nutné přenášet data z jednoho paměťového systému do druhého, což dále zvyšuje efektivitu systému.
Díky všem těmto rozdílům v architektuře paměti nabízí Unified Memory System velkou šířku datového pásma pro SoC. Ve skutečnosti M1 Ultra poskytuje šířku pásma 800 GB/s. Tato šířka pásma je podstatně větší ve srovnání s vysoce výkonnými GPU, jako je např AMD Radeon RX 6800 a 6800XT, které nabízejí šířku pásma 512 GB/s.
Tato velká šířka pásma umožňuje CPU, GPU a Neural Engine přístup k rozsáhlým datovým fondům v nanosekundách. Apple navíc v řadě M2 používá moduly RAM LPDDR5 s taktem 6400 MHz, které poskytují data ohromující rychlostí.
Kolik sjednocené paměti potřebujete?
Nyní, když máme základní znalosti o architektuře Unified Memory Architecture, můžeme se podívat na to, kolik z toho potřebujete.
Přestože architektura Unified Memory Architecture nabízí několik výhod, stále má některé nedostatky. Za prvé, RAM je připojena k SoC, takže uživatelé nemohou upgradovat RAM ve svém systému. Navíc CPU, GPU a Neural Engine přistupují ke stejnému paměťovému fondu. V důsledku toho se množství paměti požadované systémem drasticky zvyšuje.
Pokud jste tedy někdo, kdo brouzdá po internetu a používá tuny textových procesorů, 8 GB paměti by vám stačilo. Pokud však často používáte programy Adobe Creative Cloud, pořízení 16GB varianty je lepší volbou, protože budete mít plynulejší práci s úpravami fotografií, videí a grafiky na vašem počítači.
Měli byste také zvážit M1 Ultra se 128 GB RAM, pokud trénujete mnoho modelů hlubokého učení nebo pracujete na časové ose videa s mnoha vrstvami a záznamem 4K.
Je architektura jednotné paměti vše pro dobro?
Architektura Unified Memory Architecture na křemíku Apple provádí několik změn v paměťových systémech v počítači. Od změny způsobu připojení paměti RAM k výpočetním jednotkám po předefinování architektury paměti Apple mění způsob, jakým jsou paměťové systémy navrženy tak, aby zlepšily efektivitu svých systémů.
To znamená, že nová architektura vytváří konfliktní podmínky mezi CPU, GPU a Neural Engine, což zvyšuje množství paměti RAM, kterou systém potřebuje.