Skip to main content
GitHub CopilotLLMконтекстное окно

Copilot, похоже, начал забывать с пользой

Похоже, GitHub Copilot начал фоново компактить контекст, и это хорошо ложится на идеи context compression с controlled forgetting. Для AI integration это важный сдвиг: больше рабочего контекста, ниже задержки, но возможна просадка в поиске редких деталей внутри длинной истории.

Технический контекст

Я зацепился за наблюдение про фоновую компактизацию контекста в Copilot, потому что это очень похоже на не косметический тюнинг, а на смену внутренней механики. Если гипотеза верная, там могли внедрить что-то в духе context compression с элементом forgetting, а не просто увеличить лимиты окна.

Для меня это сразу про практическую AI integration: когда система не тащит всю историю как есть, а ужимает ее в более плотное представление. В AI automation это часто полезнее, чем тупо покупать больше токенов и ждать, пока модель захлебнется в длинном хвосте диалога или кодовой базы.

С важной поправкой: указанный arXiv ID, похоже, битый. Но сама идея отлично совпадает с двумя линиями исследований: lossy compression через забывание и recurrent context compression для длинного контекста. Смысл один и тот же: держать семантику, выбрасывать балласт.

Я бы ожидал примерно такую схему: старые фрагменты диалога, код и служебные промежуточные шаги сворачиваются в компактные представления, а в активном окне остаются свежие инструкции и локально важные куски. Для Copilot это особенно логично, потому что кодовый ассистент почти всегда работает с повторяющимися паттернами, а не с каждым символом как со священной реликвией.

Но тут и сидит цена трюка. Если компрессия агрессивная, модель начинает хуже вытаскивать иголки: редкое имя переменной, один странный комментарий, старую договоренность из начала сессии. На бенчмарках такие штуки можно долго маскировать, а в живой разработке они всплывают быстро.

Что это меняет для бизнеса и автоматизации

Первый эффект простой: длинные сессии становятся дешевле и бодрее. Это хороший сигнал для AI solution development, где ассистент должен помнить проект, а не жить в вечном режиме амнезии через каждые 20 сообщений.

Второй эффект менее приятный: если ваш процесс завязан на точное извлечение редких деталей, компрессия может укусить. Выиграют команды, которым важны скорость и общий ход работы. Проиграют сценарии, где критична безошибочная память о мелочах.

Именно поэтому я не люблю магию без архитектуры. Мы в Nahornyi AI Lab такие вещи обычно раскладываем на слои: что хранить дословно, что суммировать, что отправлять в retrieval, а что спокойно забывать.

Если у вас AI automation уже упирается в длинный контекст, latency или внезапные провалы памяти, можно спокойно разобрать ваш workflow и собрать схему без лишней романтики вокруг «бесконечного окна». В Nahornyi AI Lab я с такими задачами работаю руками: от AI architecture до кастомного агента, который помнит ровно то, что нужно бизнесу, а не все подряд.

Ранее мы анализировали, как расширенное мышление Claude Opus 4.6 создаёт измеримые затраты контекста. Та же динамика затрат является центральным давлением для стратегии компактизации, которую теперь внедряет GitHub Copilot.

Поделиться статьёй