На 11 июня 2026 четыре платных AI-ассистента для кода доминируют в engineering reviews, но benchmarks и pricing расходятся: ① Claude Code лидирует — 87,6% SWE-bench Verified, контекст 1M токенов (Max ~$100/мес); ② Cursor Composer 2.5 — 73,7% при $20/мес, лучший price/performance для IDE; ③ GitHub Copilot перешел на credit system ($10/мес); ④ Gemini Antigravity — 80,6%, миграция обязательна с 18.06; ⑤ dual stack (IDE + terminal CLI) экономит $40–$80/мес; ⑥ MACCOME Mac mini 24/7 для persistent agents. Дополняет гайд по free-tier токенам, анализ политики 18.06 и рейтинг CLI.
Большинство промахов — не из-за слабых моделей, а из-за смешения inline completion, terminal agent и quota boundaries. Июнь 2026 — критическая точка: Google закрывает Gemini CLI OAuth, Copilot переходит на credits, разрыв SWE-bench достигает 14 п.п. Ниже — шесть паттернов с техническими последствиями для throughput и latency.
Таблица — публичные benchmarks и list pricing на 11 июня 2026. SWE-bench Verified измеряет resolution реальных GitHub issues; на практике context window и rate limits определяют usable throughput сильнее одного процента.
| Ассистент | SWE-bench Verified | Контекст | Цена | Throughput boundary | Latency profile |
|---|---|---|---|---|---|
| Claude Code (Max) | 87,6% | 1M tokens | ~$100/мес | Высокий для monorepo agent | Длинный prefill при 1M ingest |
| Gemini Antigravity | 80,6% | 1M tokens | Preview free / API | 60 RPM OAuth tier | Flash-Lite для cheap tasks |
| Cursor Composer 2.5 | 73,7% | 200k+ (agent) | $20/мес (Pro) | Agent mode file-scoped | Низкая для Tab completion |
| GitHub Copilot | ~65% (оценка) | 128k | $10 credit/мес | Credit-depleting agent calls | Низкая в IDE inline |
| Dual stack (Cursor + Claude CLI) | Эффективно 80%+ | Комбинированный | ~$120/мес | Раздельные quota pools | IDE fast, CLI deep |
| Free-tier stack | Переменный | BYOK | $0 | Rate-limited | Зависит от API backend |
Дедлайн: Gemini CLI OAuth заканчивается 18 июня 2026. Прогоните идентичный prompt через Gemini CLI и Antigravity, зафиксируйте diff output — migration rehearsal до sunset.
Cursor Pro — reference IDE assistant для VS Code workflow. Composer 2.5 (июнь 2026) достигает 73,7% SWE-bench Verified — на 14 п.п. ниже Claude Code Max, но при 1/5 цены. Механизмы: multi-file edits в editor buffer, Tab completion без отдельного plugin, Agent mode с file-scope constraint, интеграция Agent Skills.
Performance boundary: agent context ~200k — при попытке ingest entire monorepo latency растет линейно с prefill tokens. Для tasks < 5 файлов Composer 2.5 дает lowest time-to-first-edit. Рекомендация: Cursor как IDE-primary; тяжелые agent sessions — в terminal CLI.
Terminal agent Anthropic лидирует по SWE-bench: 87,6% Verified. 1M-token context window устраняет необходимость multi-pass chunking — один agent session ингестит весь monorepo. Max plan включает elevated rate limits для claude CLI, MCP servers, sandbox file edits с workspace-write mode.
Throughput: оптимален для complex debugging chains, legacy migrations, multi-package refactors. Latency trade-off: 1M prefill добавляет 10–30s cold start — amortize через batch tasks. CLI context: июньский рейтинг.
Copilot Pro (июнь 2026) работает на $10 monthly credit pool вместо flat unlimited premium. Agent requests с tool execution deplete credits быстрее Tab completions. Сила: native GitHub integration (PR review, issue comments, Actions triggers). Для GitHub Enterprise teams — lowest entry cost, но credit burn при agent workflows непредсказуем.
Google мигрирует персональный Gemini CLI OAuth на Antigravity CLI 18 июня 2026. Antigravity: 80,6% SWE-bench — между Cursor и Claude Code. MCP, shell execution с approval gates, Google-native model routing. Policy risks: trust-crisis analysis.
Dual stack — рекомендуемая архитектура июня 2026: IDE assistant (Cursor или Copilot) для inline work + terminal CLI (Claude Code или Antigravity) для multi-file agent tasks. Механизм: раздельные quota pools предотвращают concurrent 429 storms; model specialization снижает aggregate token spend на 30–40% vs. single Max plan для всех tasks.
# Dual stack: Cursor IDE + Claude Code terminal # Terminal: тяжелые refactors с 1M context claude --model claude-sonnet-4 "Refactor src/auth/ — scope only this directory" # IDE: inline completion (Cursor Pro $20/mo, Composer 2.5) # Tab completion для boilerplate, Agent mode для < 5 файлов # Antigravity migration probe (до 18.06.2026) gemini /stats model # проверить OAuth quota antigravity --version antigravity "identical test prompt as gemini session"
Последовательность для engineering leads. Порядок: benchmark calibration → workload match → hosting stability.
Рекомендация июня 2026: ни один tool не покрывает всё. Cursor/Copilot для IDE, Claude Code/Antigravity для terminal, free tier для evaluation. Stability boundary: OpenClaw, Hermes или Codex sandbox на sleeping laptop = три hidden costs (broken OAuth, drift retries, unstable MCP). Для 24/7 CLI agents, multi-key rotation, predictable I/O — dedicated MACCOME Mac mini M4/M4 Pro. Pricing: тарифы аренды; CLI compare: июньский рейтинг.
Частые вопросы
Кто лидирует по SWE-bench?
Claude Code Max — 87,6% (1M context). Antigravity: 80,6%; Cursor Composer 2.5: 73,7%. Benchmark alone недостаточен — учитывайте context и pricing.
Cursor Pro или Claude Code Max?
Cursor ($20) для IDE workflow и Tab completion. Claude Max ($100) для monorepo agent sessions. Dual stack оптимален.
Что меняется 18 июня для Gemini?
Gemini CLI OAuth заканчивается; миграция на Antigravity CLI (80,6% SWE-bench). Details: policy article.
Нужен ли выделенный Mac для AI-агентов?
Для 24/7 agents — да. MACCOME Mac mini M4/M4 Pro: тарифы аренды; support: центр помощи.