Технічний контекст
Я відразу зацікавився не частотами, а пам’яттю: AMD показала Ryzen AI Max 400, і тут до 192 ГБ unified memory. Для тих, хто будує AI automation локально й не хоче тягнути окрему GPU, це дуже нетиповий хід.
За сухими фактами: Zen 5, RDNA 3.5, XDNA 2 NPU, LPDDR5x-8533 по 256-бітній шині. У флагмана Ryzen AI Max+ PRO 495 заявлений boost до 5,2 ГГц, 40 GPU Compute Units і до 160 ГБ пам’яті, доступної як VRAM.
Ось тут я й зробив паузу. Зазвичай на APU швидко впираєшся не у факт запуску моделі, а в стелю за вагами, KV-кешем і контекстом. А тут AMD прямо подає платформу як компактну AI-робочу станцію для локальної розробки й навіть згадує моделі на 300B+.
Але я б не купував увесь маркетинг. «Запускає» не означає «працює швидко»: усе залежатиме від квантування, довжини контексту, софту, драйверів і від того, скільки пам’яті з’їсть система. Плюс версія на 192 ГБ, судячи з поточних матеріалів AMD, і досі позначена як «coming soon», а не масово відвантажується прямо зараз.
Ще один важливий нюанс: це не революція за чистою обчислювальною потужністю. Перші дані свідчать про помірний приріст частот порівняно з минулою Halo-лінійкою, а головний апгрейд — саме обсяг пам’яті. Тобто історія не про «новий вбивця GPU», а про дуже незвичну AI architecture для задач, де влізаємість моделі важливіша за пікові FPS.
Що це змінює для бізнесу та автоматизації
Я бачу три практичні сценарії. Перший: локальні корпоративні LLM там, де дані не можна виносити в хмару. Другий: компактні станції для RAG, аналізу документів і внутрішніх асистентів без дорогої дискретної графіки. Третій: dev-бокс для команд, які тестують великі моделі ближче до продакшену.
Виграють ті, кому потрібен великий memory pool, приватність і передбачувана вартість володіння. Програють ті, хто чекає диво-продуктивності на рівні повнорозмірних серверних GPU: цього я тут поки не бачу.
Якщо ваш проєкт упирається саме в пам’ять, конфіденційність чи вартість локального інференсу, це вже привід перезібрати стек. Ми в Nahornyi AI Lab займаємося такими речами на практиці: можемо подивитися вашу поточну схему, підібрати нормальний AI solution development під реальні навантаження та зібрати впровадження без зайвого залізного фетишизму.