AMD оснастила APU 192 ГБ пам'яті для великих LLM

AMD анонсувала Ryzen AI Max 400 зі 192 ГБ об'єднаної пам'яті, з яких до 160 ГБ можна віддати під VRAM. Для бізнесу це цікаво як основа для AI-інтеграції та локального запуску великих моделей без дискретної GPU, хоча реальна швидкість ще потребує незалежних тестів.

Технічний контекст

Я відразу зацікавився не частотами, а пам’яттю: AMD показала Ryzen AI Max 400, і тут до 192 ГБ unified memory. Для тих, хто будує AI automation локально й не хоче тягнути окрему GPU, це дуже нетиповий хід.

За сухими фактами: Zen 5, RDNA 3.5, XDNA 2 NPU, LPDDR5x-8533 по 256-бітній шині. У флагмана Ryzen AI Max+ PRO 495 заявлений boost до 5,2 ГГц, 40 GPU Compute Units і до 160 ГБ пам’яті, доступної як VRAM.

Ось тут я й зробив паузу. Зазвичай на APU швидко впираєшся не у факт запуску моделі, а в стелю за вагами, KV-кешем і контекстом. А тут AMD прямо подає платформу як компактну AI-робочу станцію для локальної розробки й навіть згадує моделі на 300B+.

Але я б не купував увесь маркетинг. «Запускає» не означає «працює швидко»: усе залежатиме від квантування, довжини контексту, софту, драйверів і від того, скільки пам’яті з’їсть система. Плюс версія на 192 ГБ, судячи з поточних матеріалів AMD, і досі позначена як «coming soon», а не масово відвантажується прямо зараз.

Ще один важливий нюанс: це не революція за чистою обчислювальною потужністю. Перші дані свідчать про помірний приріст частот порівняно з минулою Halo-лінійкою, а головний апгрейд — саме обсяг пам’яті. Тобто історія не про «новий вбивця GPU», а про дуже незвичну AI architecture для задач, де влізаємість моделі важливіша за пікові FPS.

Що це змінює для бізнесу та автоматизації

Я бачу три практичні сценарії. Перший: локальні корпоративні LLM там, де дані не можна виносити в хмару. Другий: компактні станції для RAG, аналізу документів і внутрішніх асистентів без дорогої дискретної графіки. Третій: dev-бокс для команд, які тестують великі моделі ближче до продакшену.

Виграють ті, кому потрібен великий memory pool, приватність і передбачувана вартість володіння. Програють ті, хто чекає диво-продуктивності на рівні повнорозмірних серверних GPU: цього я тут поки не бачу.

Якщо ваш проєкт упирається саме в пам’ять, конфіденційність чи вартість локального інференсу, це вже привід перезібрати стек. Ми в Nahornyi AI Lab займаємося такими речами на практиці: можемо подивитися вашу поточну схему, підібрати нормальний AI solution development під реальні навантаження та зібрати впровадження без зайвого залізного фетишизму.

Раніше ми розглядали Rust LocalGPT — легкий локальний ШІ-асистент із постійною пам’яттю та HTTP API, що працює одним бінарним файлом. Він ідеально демонструє, які можливості локального AI стають реальністю з потужним обладнанням, подібним до AMD Ryzen AI Max 400.

Поділитися статтею

Twitter/X LinkedIn Telegram

AMD оснастила APU 192 ГБ пам'яті для великих LLM

Технічний контекст

Що це змінює для бізнесу та автоматизації

Ще новини

Сертифікація Claude стала фільтром у партнерці

Chronicle тихо спалює ліміти API