AMD дала APU 192 ГБ памяти под большие LLM

AMD анонсировала Ryzen AI Max 400 с 192 ГБ унифицированной памяти, где до 160 ГБ можно отдать под VRAM. Для бизнеса это интересно как основа для AI integration и локального запуска больших моделей без дискретной GPU, хотя реальная скорость еще требует независимых тестов.

Технический контекст

Я сразу зацепился не за частоты, а за память: AMD показала Ryzen AI Max 400, и тут уже до 192 ГБ unified memory. Для тех, кто собирает AI automation локально и не хочет тащить отдельную GPU, это очень нетипичный ход.

По сухим фактам картина такая: Zen 5, RDNA 3.5, XDNA 2 NPU, LPDDR5x-8533 по 256-битной шине. У флагмана Ryzen AI Max+ PRO 495 заявлены boost до 5.2 ГГц, 40 GPU Compute Units и до 160 ГБ памяти, доступной как VRAM.

Вот здесь я и сделал паузу. Обычно на APU мы быстро упираемся не в сам факт запуска модели, а в потолок по весам, KV cache и контексту. А тут AMD прямо подает платформу как компактную AI-рабочую станцию для локальной разработки и даже говорит про 300B+ модели.

Но я бы не покупал маркетинг целиком. “Запускает” не значит “работает быстро”: все будет зависеть от квантизации, длины контекста, софта, драйверов и от того, сколько памяти съест система. Плюс 192 ГБ версия, судя по текущим материалам AMD, еще marked as coming soon, а не массово отгружается прямо сейчас.

Еще один важный нюанс: это не революция по чистой вычислительной мощности. По первым данным прирост частот относительно прошлой Halo-линейки умеренный, а главный апгрейд именно в емкости памяти. То есть история не про “новый убийца GPU”, а про очень необычную AI architecture для тех задач, где влезаемость модели важнее пикового FPS.

Что это меняет для бизнеса и автоматизации

Я вижу тут три практических сценария. Первый: локальные корпоративные LLM там, где данные нельзя выносить в облако. Второй: компактные станции для RAG, анализа документов и внутренних ассистентов без дорогой дискретной графики. Третий: dev-box для команд, которые тестируют большие модели ближе к продакшену.

Выигрывают те, кому нужен большой memory pool, privacy и предсказуемая цена владения. Проигрывают те, кто ждет чудо-производительности на уровне полноразмерных серверных GPU: этого я тут пока не вижу.

Если у вас как раз упирается проект в память, приватность или стоимость локального inference, это уже повод пересобрать стек. Мы в Nahornyi AI Lab решаем такие штуки на практике: можем посмотреть вашу текущую схему, подобрать нормальную AI solution development под реальные нагрузки и собрать внедрение без лишнего железного фетишизма.

Ранее мы рассматривали Rust LocalGPT — легковесный локальный ИИ-ассистент с постоянной памятью и HTTP API, работающий в один бинарник. Он идеально иллюстрирует, какие возможности локального AI становятся реальностью с мощным железом вроде AMD Ryzen AI Max 400.

Поделиться статьёй

Twitter/X LinkedIn Telegram

AMD дала APU 192 ГБ памяти под большие LLM

Технический контекст

Что это меняет для бизнеса и автоматизации

Ещё новости

Сертификация Claude стала фильтром в партнёрке

Chronicle тихо жжет лимиты API