Если вы платите list price за API и IDE при ужатии enterprise-бюджетов, июнь 2026 — лучшее окно подписки за два года. Статья разбирает механизмы каждой акции: постоянные −75% DeepSeek V4-Pro, incoming price war OpenAI, referral −50% Cursor, summer credits Copilot, тарифы Gemini 2.5, free SWE-1.5 Windsurf — плюс матрица срочности по восьми продуктам, stack model routing + Prompt Caching + Batch API (~80% экономии) и три action items на эту неделю. Контекст выбора инструментов: матрица AI-ассистентов и гайд по free-tier токенам.
Конкурентная ось 2026 сместилась: vendors продают не только «кто сильнее», но кто дешевле при том же throughput. Три силы сошлись в июне — open-source pressure DeepSeek, IPO/fundraising pressure у OpenAI и Anthropic, enterprise budget cuts (WSJ: Uber режет AI vendor spend). Результат — окно для renegotiation stack у dev-команд и малых продуктовых групп.
Фактор 1 — DeepSeek: временная скидка 2.5× на API стала permanent 22 мая 2026; с 31 мая V4-Pro закреплён на −75% без announced end date. Механизм: aggressive MoE inference + domestic Ascend/H800 fleet снижает marginal cost per token.
Фактор 2 — OpenAI: WSJ (10 июня) сообщает о drastic API price cuts ahead of GPT-5.6 (expected late June). List pricing пока не сдвинут — arbitrage window для hedge через DeepSeek daily + OpenAI frontier reserve.
Фактор 3 — tooling counter-moves: Copilot перешёл на usage-based billing 1 июня, но компенсировал summer credits до 31 августа. Cursor referral (май) — −50% month 1. Windsurf — три месяца free SWE-1.5 для всех. Anthropic 15 июня paused planned SDK billing change — Pro/Max SDK usage остаётся bundled.
Вывод: подписка по list price 2025 года = structural overpay. Ниже — breakdown по продуктам и комбинации.
Headline deal июня 2026. Limited-time 2.5× discount → permanent 22 мая; full 75% reduction с 31 мая, без end date.
Cache-hit pricing ≈ 1/700 GPT-5.5 Pro cache rates — крупнейший single-vendor arbitrage рынка. V4-Pro обходит leading OSS на published agent tool-calling benchmarks. Huawei Ascend 950 deployment H2 2026 может дать ещё один price drop — monitor при RMB billing.
Per WSJ (10 июня 2026) OpenAI готовит significant API reductions. GPT-5.6 expected late June. Current list (mid-June):
| Модель | Input ($/M tokens) | Output ($/M tokens) | Optimal workload |
|---|---|---|---|
| GPT-5.5 | $5.00 | $30.00 | Frontier reasoning, complex agents |
| GPT-5.4 | $2.50 | $15.00 | Production coding, balanced cost |
| GPT-5 Mini | $0.40 | $1.60 | Daily dev, chat |
| GPT-4.1 Nano | $0.10 | $0.40 | Classification, simple extraction |
Tactics до cuts: low-volume — delay new commitments; daily work → DeepSeek V4-Pro; enable Prompt Caching (50–75% off repeated prefixes); async → Batch API (50% off); trivial tasks → GPT-4.1 Nano.
Все Gemini 2.5 tiers — 1M token context. Optimal: long-document analysis, Google Workspace pipelines, multimodal ingest. Prompt Caching — до 75% off repeated context blocks; prefill latency растёт линейно с context size — tier Flash-Lite для bulk scan.
Anthropic планировала SDK billing change 15 июня 2026, но paused same day. Subscriptions включают SDK usage:
Claude лидирует в agentic coding — tool loop stability и long system prompts. Prompt Caching до 90% off cached input — critical для production Agents с fat system prompts.
Referral program (май 2026): новые пользователи −50% month 1:
Referrer: $25 credit per signup, cap 10/мес. Links — Reddit, X, Discord; sample code: LK2CBD2DJNJX. Boundary: heavy Agent users часто exceed included usage → $60+/мес effective — budget до commit.
Usage-based billing с 1 июня 2026. Summer promo (июнь–август, deadline 31 августа 2026):
Org admin must opt-in — credits не automatic. Agent sessions с tool calling deplete credits быстрее Tab completions.
Cascade multi-file editing, Arena Mode для side-by-side model compare. После promo — revert к standard tiers.
| Dimension | Cursor | Windsurf |
|---|---|---|
| Entry price (июнь 2026) | Pro $10 month 1 (referral) | Free tier + SWE-1.5 promo |
| Heavy-use tier | Ultra $100–200/мес | Max $200/мес |
| Agent editing | Composer 2.5, MCP integration | Cascade, Arena Mode |
| Model choice | Built-in multi-model routing | Arena Mode compare |
| Best for | MCP + Agent Skill workflows | Teams evaluating models pre-commit |
Stack трёх техник снижает bill ~100M tokens/month application на ~80% vs single-model GPT-5.5 routing:
Routing layer — не «cheapest always»: latency SLA и tool-calling reliability определяют tier per request class.
Cache key stability — repeated byte-identical system prompt blocks; drift в prompt versioning = cache miss storm.
OpenAI и Google Batch APIs halve pricing для jobs с hours latency tolerance — eval suites, overnight code review, bulk document processing. Throughput boundary: queue depth и SLA на completion window.
Пример FinOps: 100M tokens/month на GPT-5.5 list (~$1,750 input+output blend) → ~$350 при 70% volume DeepSeek V4-Pro cache hits, 20% Gemini Flash-Lite, 10% GPT-5.4, Batch API на overnight jobs.
| Продукт | Текущая акция | Optimal use | Срочность | Deadline |
|---|---|---|---|---|
| DeepSeek V4-Pro | −75% permanent; cache hit ¥0.025/M | API volume, CN teams, agent backends | Сейчас | Без end date (monitor H2 Ascend 950) |
| OpenAI API | Cuts incoming; GPT-5.6 late June | Frontier reasoning post-reprice | Wait or hedge | Конец июня 2026 (GPT-5.6) |
| Gemini 2.5 | Flash-Lite $0.10/$0.40; 1M context | Long docs, Google ecosystem | Stable pricing | Ongoing |
| Claude Pro/Max | SDK usage bundled (billing pause) | Agentic coding, fat system prompts | Subscribe now | Pause indefinite — watch Anthropic blog |
| Cursor | −50% month 1 referral | IDE Agent + MCP workflows | Сейчас | Referral ongoing |
| GitHub Copilot | Summer credits +58% Business, +79% Enterprise | GitHub-native teams, CI integration | Opt-in now | 31 августа 2026 |
| Windsurf | SWE-1.5 free 3 mo; 25 free Cascade credits | Model compare, Cascade editing | Try before promo ends | ~3 мес от signup |
| Model routing stack | Combined ~80% savings @ 100M tokens/mo | Production apps, cost governance | Implement now | Immediate ROI |
LK2CBD2DJNJX — −50% Pro/Pro+/Ultra month 1.Дешёвые tokens решают половину задачи. Agents на laptop с sleep policy, background throttling или SSE drop force expensive re-runs — съедают savings от routing. Shared dev machines дают environment drift и ломают reproducible Agent pipelines.
Dedicated always-on Mac node убирает failure modes: fixed Xcode/toolchain, uninterrupted long Agent sessions, stable MCP Server connections для team deploy. Три hidden costs consumer hardware: lid-close обрывает SSE/MCP, Wi-Fi handoff → reconnect storms, background scheduler throttling → silent retry loops. Для production AI Agent workloads 7×24 MACCOME Mac cloud hosting — predictable option vs stacking promos на ноутбуке. Тарифы: цены аренды Mac Mini; onboarding: центр помощи.
FAQ
Можно ли стабильно использовать DeepSeek V4-Pro API из Китая?
Да. Domestic infrastructure, RMB billing, без VPN для mainland. −75% permanent делает V4-Pro default API для CN-команд. Prompt Caching — cache-hit от ¥0.025/M tokens.
Реферальная скидка Cursor −50% легальна?
Официальная referral-программа (май 2026): −50% первый месяц; реферер до $25 credit (max 10/мес). Links из official channels или trusted community — не paid link farms.
Copilot summer credits начисляются автоматически?
Нет. Business/Enterprise org admin opt-in до 31 августа 2026. Credits ($30 / $70) stack поверх подписки. Personal Pro ($10) и Pro+ ($39) не затронуты.
Claude или GPT: какая подписка выигрывает в июне 2026?
Agentic coding — Claude Pro ($20), SDK bundled после pause 15 июня. API volume — daily на DeepSeek V4-Pro, frontier на GPT-5.4/5.5 после cuts OpenAI. Полная матрица: сравнение ассистентов.
Что будет с Windsurf после SWE-1.5 promo?
После трёх месяцев free — Free (25 Cascade credits/мес), Pro ($15–20/мес), Max ($200/мес). Heavy users сравните Cursor Pro+ до закрытия окна.
Ждать снижения цен OpenAI или подписываться сейчас?
API spend < ~$50/мес — ждите GPT-5.6 (конец июня, WSJ). Production сейчас — daily на DeepSeek V4-Pro, OpenAI на Prompt Caching + Batch API. Dedicated cloud Mac снижает re-run costs — тарифы MACCOME.