Skip to main content
CloudflareAI AgentsContent and Automation

Cloudflare Markdown for Agents: зниження вартості та прискорення впровадження AI

Cloudflare випустив Markdown for Agents (beta): за запитом контент віддається в Markdown замість HTML. Це критично для бізнесу, адже знижує витрати токенів (до 80%), здешевлює агентні сценарії та значно покращує вилучення сенсу при автоматизації процесів.

Технічний контекст

Cloudflare опублікував технічний матеріал про Markdown for Agents — механізм, що дозволяє AI-агентам отримувати веб-контент не в HTML, а в Markdown. У контексті агентних систем це важливіше, ніж здається: основна «ціна» та обмеження більшості LLM-процесів — це токени та контекстне вікно. HTML роздуває контент службовою розміткою, а Markdown зберігає семантику при значно меншому обсязі.

Ключовий публічний факт зі статті Cloudflare — вимірювана економія: при конвертації їхньої публікації з HTML у Markdown кількість токенів скоротилася приблизно на 80% (з 16 180 до 3 150). Це не лабораторний бенчмарк «у вакуумі», а реальний кейс на живій сторінці.

Як працює конвертація

В основі — стандартна content negotiation через HTTP-заголовки. Агент (або ваш сервіс, що діє від імені агента) запитує сторінку з:

  • Accept: text/markdown — Cloudflare на своїй стороні конвертує HTML у Markdown і віддає вже оптимізовану відповідь.

Тобто вам не потрібно будувати окремий пайплайн «завантажити HTML → почистити → прогнати Readability → перевести в Markdown → оцінити токени». Конвертація відбувається на межі мережі (edge), ближче до джерела контенту, що зручно для масштабування та зменшує кількість компонентів в архітектурі.

Увімкнення в панелі та через API

Функція вмикається як налаштування зони Cloudflare (у статті вона фігурує як швидкий перемикач). Для інфраструктурних команд важливіший API-варіант:

  • PATCH на endpoint: /client/v4/zones/{zone_tag}/settings/content_converter
  • payload: {"value":"on"}

Це дозволяє вмикати/вимикати конвертацію декларативно (IaC/CI-CD), а також робити поетапні розгортання (rollouts) по зонах чи проєктах.

Телеметрія: оцінка токенів та сигнали використання

Cloudflare додає у відповіді службові заголовки, корисні саме для агентних систем та оркестраторів:

  • x-markdown-tokens — оцінка токенів для відданого Markdown. Це практичний інструмент, щоб агент міг заздалегідь вирішувати: «чи поміститься документ у контекст», «який обрати розмір чанка», «чи потрібен сумаризатор перед RAG».
  • Content-Signal зі значеннями виду ai-train=yes, search=yes, ai-input=yes — сигналізує політики використання контенту (навчання/пошук/ввід для агента). Cloudflare зазначає, що в майбутньому очікуються більш гнучкі політики.

Обмеження та нюанси, які варто враховувати

  • Це beta: поведінка конвертера, якість Markdown та стабільність можуть змінюватися. У продакшені варто закласти fallback (резервний варіант) на HTML-процесинг.
  • Markdown ≠ «ідеальна семантика»: складні компоненти сторінок (динамічні таблиці, вкладені віджети, інтерактив, спойлери, каруселі) можуть втрачати структуру. Для агентних сценаріїв це зазвичай прийнятно, але для юридичних/фінансових документів може знадобитися валідація.
  • Вплив на кеш: різні представлення одного ресурсу (HTML vs Markdown) — це варіанти відповіді. Перевірте, чи коректно налаштовано кешування за заголовками (Vary/Accept), щоб не отримати «перемішування» форматів.

Окремо про згаданий у вихідних даних Lovable Pro: підтверджених технічних деталей у наданих джерелах немає. Тому сприймайте «код на місяць» як корисну можливість для експерименту, але не як частину перевіреної архітектурної картини в цій новині. В інженерних проєктах я завжди розділяю «верифіковані факти» та «промо/ком'юніті-офери».

Вплив на бізнес та автоматизацію

Для бізнесу цінність Markdown for Agents — не в «новому форматі», а в зниженні операційних витрат та спрощенні архітектури агентних рішень. Якщо ви будуєте пошук по базі знань, сапорт-агента, моніторинг конкурентів, агентний комплаєнс або автоматизацію обробки веб-сторінок, то бюджет часто «з'їдає» саме токенізація великих HTML-документів.

Що змінюється в архітектурі агентних систем

  • Дешевший ingestion: менше токенів на парсинг/сумаризацію/ембединги — нижча вартість пайплайну та менші затримки (latency).
  • Більше корисного контенту в контексті: при тому ж контекстному вікні агент може взяти більше джерел, а значить — менше галюцинацій і вища точність.
  • Простіший RAG: Markdown зазвичай краще «чанкується» (розбивається на фрагменти) по заголовках і секціях, ніж HTML із глибокою вкладеністю.
  • З'являється керована метрика (x-markdown-tokens): можна робити динамічну стратегію — наприклад, якщо документ > N токенів, агент спочатку робить «outline» (структуру), потім обирає релевантні розділи.

Кому вигідно насамперед

  • Медіа, контентні платформи, маркетплейси: багато сторінок, багато звернень, висока вартість вилучення тексту.
  • SaaS-компанії з документацією та help center: агент підтримки отримує більш «чисте» джерело, швидше знаходить відповіді.
  • Виробництво та реальний сектор: внутрішні портали, регламенти, інструкції, бази знань, які часто побудовані на CMS і віддаються HTML-ом. При впровадженні AI в операційні процеси саме такі джерела стають паливом для агентів.

Хто під ризиком

  • Команди, які інвестували у складні самописні конвертери HTML→текст без чітких метрик якості: частина роботи стає commodity (стандартом), і цінність зміщується в оркестрацію, безпеку та якість знань.
  • Проєкти, які «склеїли» парсинг на милицях: поява стандартного механізму підсвічує технічний борг. Коли вартість токенів падає, конкурувати доведеться швидкістю впровадження та якістю агентних сценаріїв.

На практиці компанії часто застрягають не на моделі, а на «дрібницях»: як організувати доступ агентів до контенту, як рахувати токени, як обрати чанкінг та забезпечити контроль якості. Саме тут і починається професійна архітектура AI-рішень та грамотна автоматизація за допомогою AI: менше магії, більше вимірюваних SLA та зрозумілих залежностей.

Думка експерта Вадима Нагорного

Головна цінність Markdown for Agents — це не конвертація, а перетворення токенів на керовану статтю витрат. Коли у вас з'являється стандартний спосіб отримувати «легкий» контент і заголовок з оцінкою токенів, ви можете проєктувати агентні контури як інженерну систему: з лімітами, деградаціями, fallback-гілками та прогнозованою вартістю запиту.

У Nahornyi AI Lab ми регулярно бачимо типовий сценарій: бізнес хоче «агента», але пілот швидко впирається у вартість та нестабільність вилучення даних з HTML (особливо на різнорідних CMS). У таких проєктах оптимізація формату джерела іноді дає більший ефект, ніж заміна моделі. Cloudflare фактично пропонує зробити цей крок «на рівні мережі».

Як я би впроваджував це в реальному проєкті

  • A/B-тест на 2–3 доменах/розділах: порівняти якість вилучення фактів агентом на HTML vs Markdown, виміряти токени та затримку.
  • Політики fallback: якщо Markdown-версія «ламає» таблиці/списки — вміти точково запитувати HTML і вмикати спеціалізований парсер.
  • Token-aware orchestration: використовувати x-markdown-tokens для вибору стратегії (пряме читання, чанкінг, попереднє резюме, вибіркове цитування).
  • Контроль доступу та комплаєнс: Content-Signal — хороший початок, але корпоративні політики (що можна індексувати, що можна «згодовувати» агенту) все одно потрібно закріплювати у вашій платформі даних та проксі-шарі.

Мій прогноз: це утилітарна, «нехайпова» технологія, яка стане стандартом там, де є агентні системи та багато веб-контенту. Але виграють не ті, хто просто увімкне тумблер, а ті, хто вбудує його в цілісну AI-архітектуру: зі спостережуваністю, оцінкою якості відповідей та безпечною інтеграцією в бізнес-процеси.

Теорія — це добре, але результат вимагає практики. Якщо ви плануєте впровадження агентних сценаріїв, RAG або корпоративного асистента і хочете знизити вартість токенів без втрати якості, обговоріть задачу з Nahornyi AI Lab. Я, Vadym Nahornyi, гарантую архітектурний підхід: від пілота та метрик до промислового впровадження та AI автоматизації під реальні KPI.

Share this article