Скидки на ИИ в июне 2026: DeepSeek −75% навсегда, OpenAI готовит снижение цен, Cursor −50% по рефералу

Около 18 мин чтения · MACCOME

Если вы платите list price за API и IDE при ужатии enterprise-бюджетов, июнь 2026 — лучшее окно подписки за два года. Статья разбирает механизмы каждой акции: постоянные −75% DeepSeek V4-Pro, incoming price war OpenAI, referral −50% Cursor, summer credits Copilot, тарифы Gemini 2.5, free SWE-1.5 Windsurf — плюс матрица срочности по восьми продуктам, stack model routing + Prompt Caching + Batch API (~80% экономии) и три action items на эту неделю. Контекст выбора инструментов: матрица AI-ассистентов и гайд по free-tier токенам.

Шесть причин завышенного AI-биллинга в июне 2026

  1. Single-vendor lock-in: routing всего трафика на GPT-5.5 Pro игнорирует модели с cache-hit в ~700× дешевле по input prefill.
  2. Prompt Caching выключен: повтор system prompt без cache = full input rate на каждый request; Anthropic даёт до 90% off cached blocks.
  3. Sync API для batch jobs: nightly eval, report generation, data labeling должны идти через Batch API (50% off у OpenAI и Google).
  4. Over-provisioned editor tiers: Cursor Ultra $200/мес на light Tab completion — waste; referral снижает Pro до $10 в первый месяц.
  5. Promo windows пропущены: Copilot summer credits (+58% effective value) и Windsurf SWE-1.5 free trial требуют admin action до дедлайна.
  6. Agents на laptop: sleep policy обрывает long Agent sessions → retry loops умножают token spend; performance boundary — не модель, а host stability.

Конкурентная ось 2026 сместилась: vendors продают не только «кто сильнее», но кто дешевле при том же throughput. Три силы сошлись в июне — open-source pressure DeepSeek, IPO/fundraising pressure у OpenAI и Anthropic, enterprise budget cuts (WSJ: Uber режет AI vendor spend). Результат — окно для renegotiation stack у dev-команд и малых продуктовых групп.

Почему июнь 2026 — точка перелома ценовой войны

Фактор 1 — DeepSeek: временная скидка 2.5× на API стала permanent 22 мая 2026; с 31 мая V4-Pro закреплён на −75% без announced end date. Механизм: aggressive MoE inference + domestic Ascend/H800 fleet снижает marginal cost per token.

Фактор 2 — OpenAI: WSJ (10 июня) сообщает о drastic API price cuts ahead of GPT-5.6 (expected late June). List pricing пока не сдвинут — arbitrage window для hedge через DeepSeek daily + OpenAI frontier reserve.

Фактор 3 — tooling counter-moves: Copilot перешёл на usage-based billing 1 июня, но компенсировал summer credits до 31 августа. Cursor referral (май) — −50% month 1. Windsurf — три месяца free SWE-1.5 для всех. Anthropic 15 июня paused planned SDK billing change — Pro/Max SDK usage остаётся bundled.

Вывод: подписка по list price 2025 года = structural overpay. Ниже — breakdown по продуктам и комбинации.

API-акции: DeepSeek, OpenAI, Gemini, Claude

DeepSeek V4-Pro — permanent −75%

Headline deal июня 2026. Limited-time 2.5× discount → permanent 22 мая; full 75% reduction с 31 мая, без end date.

  • Cache hit: ¥0.025/M tokens
  • Cache miss input: ¥3/M tokens
  • Output: ¥6/M tokens
  • Concurrency: 500 simultaneous requests на standard tier

Cache-hit pricing ≈ 1/700 GPT-5.5 Pro cache rates — крупнейший single-vendor arbitrage рынка. V4-Pro обходит leading OSS на published agent tool-calling benchmarks. Huawei Ascend 950 deployment H2 2026 может дать ещё один price drop — monitor при RMB billing.

OpenAI — cuts incoming; optimize сейчас

Per WSJ (10 июня 2026) OpenAI готовит significant API reductions. GPT-5.6 expected late June. Current list (mid-June):

МодельInput ($/M tokens)Output ($/M tokens)Optimal workload
GPT-5.5$5.00$30.00Frontier reasoning, complex agents
GPT-5.4$2.50$15.00Production coding, balanced cost
GPT-5 Mini$0.40$1.60Daily dev, chat
GPT-4.1 Nano$0.10$0.40Classification, simple extraction

Tactics до cuts: low-volume — delay new commitments; daily work → DeepSeek V4-Pro; enable Prompt Caching (50–75% off repeated prefixes); async → Batch API (50% off); trivial tasks → GPT-4.1 Nano.

Gemini 2.5 — long context at scale

  • Pro: $1.25–2.50 input / $10 output per M tokens (tier-dependent)
  • Flash: $0.30 / $2.50 per M tokens
  • Flash-Lite: $0.10 / $0.40 per M tokens

Все Gemini 2.5 tiers — 1M token context. Optimal: long-document analysis, Google Workspace pipelines, multimodal ingest. Prompt Caching — до 75% off repeated context blocks; prefill latency растёт линейно с context size — tier Flash-Lite для bulk scan.

Claude — pause SDK billing hike

Anthropic планировала SDK billing change 15 июня 2026, но paused same day. Subscriptions включают SDK usage:

  • Pro: $20/month
  • Max 5×: $100/month
  • Max 20×: $200/month

Claude лидирует в agentic coding — tool loop stability и long system prompts. Prompt Caching до 90% off cached input — critical для production Agents с fat system prompts.

IDE-акции: Cursor, Copilot, Windsurf

Cursor — −50% первый месяц по referral

Referral program (май 2026): новые пользователи −50% month 1:

  • Pro: $10 (list $20)
  • Pro+: $20 (list $40)
  • Ultra: $100 (list $200)

Referrer: $25 credit per signup, cap 10/мес. Links — Reddit, X, Discord; sample code: LK2CBD2DJNJX. Boundary: heavy Agent users часто exceed included usage → $60+/мес effective — budget до commit.

GitHub Copilot — usage-based + summer credits

Usage-based billing с 1 июня 2026. Summer promo (июнь–август, deadline 31 августа 2026):

  • Business: $19/мес sub + $30 usage credits (+58% effective value)
  • Enterprise: $39/мес sub + $70 usage credits (+79% effective value)
  • Personal Pro: $10/мес
  • Personal Pro+: $39/мес

Org admin must opt-in — credits не automatic. Agent sessions с tool calling deplete credits быстрее Tab completions.

Windsurf — SWE-1.5 free три месяца

  • SWE-1.5 model: free для всех в promo window
  • Free tier: 25 Cascade credits/month
  • Pro: $15–20/month
  • Max: $200/month

Cascade multi-file editing, Arena Mode для side-by-side model compare. После promo — revert к standard tiers.

DimensionCursorWindsurf
Entry price (июнь 2026)Pro $10 month 1 (referral)Free tier + SWE-1.5 promo
Heavy-use tierUltra $100–200/месMax $200/мес
Agent editingComposer 2.5, MCP integrationCascade, Arena Mode
Model choiceBuilt-in multi-model routingArena Mode compare
Best forMCP + Agent Skill workflowsTeams evaluating models pre-commit

Cost-saving combo: routing, caching, batch

Stack трёх техник снижает bill ~100M tokens/month application на ~80% vs single-model GPT-5.5 routing:

1. Model routing (40–80% savings)

  • Complex reasoning / agents: GPT-5.4, Claude Opus, DeepSeek V4-Pro
  • Daily development: GPT-5 Mini, Gemini Flash, DeepSeek Flash
  • Classification / extraction: GPT-4.1 Nano, Gemini Flash-Lite, DeepSeek cache-hit tier

Routing layer — не «cheapest always»: latency SLA и tool-calling reliability определяют tier per request class.

2. Prompt Caching

  • Anthropic: до 90% off cached input
  • OpenAI: 50% off cached prefixes
  • Google: до 75% off
  • DeepSeek: cache hit ¥0.025/M tokens

Cache key stability — repeated byte-identical system prompt blocks; drift в prompt versioning = cache miss storm.

3. Batch API (50% off async)

OpenAI и Google Batch APIs halve pricing для jobs с hours latency tolerance — eval suites, overnight code review, bulk document processing. Throughput boundary: queue depth и SLA на completion window.

warning

Пример FinOps: 100M tokens/month на GPT-5.5 list (~$1,750 input+output blend) → ~$350 при 70% volume DeepSeek V4-Pro cache hits, 20% Gemini Flash-Lite, 10% GPT-5.4, Batch API на overnight jobs.

ПродуктТекущая акцияOptimal useСрочностьDeadline
DeepSeek V4-Pro−75% permanent; cache hit ¥0.025/MAPI volume, CN teams, agent backendsСейчасБез end date (monitor H2 Ascend 950)
OpenAI APICuts incoming; GPT-5.6 late JuneFrontier reasoning post-repriceWait or hedgeКонец июня 2026 (GPT-5.6)
Gemini 2.5Flash-Lite $0.10/$0.40; 1M contextLong docs, Google ecosystemStable pricingOngoing
Claude Pro/MaxSDK usage bundled (billing pause)Agentic coding, fat system promptsSubscribe nowPause indefinite — watch Anthropic blog
Cursor−50% month 1 referralIDE Agent + MCP workflowsСейчасReferral ongoing
GitHub CopilotSummer credits +58% Business, +79% EnterpriseGitHub-native teams, CI integrationOpt-in now31 августа 2026
WindsurfSWE-1.5 free 3 mo; 25 free Cascade creditsModel compare, Cascade editingTry before promo ends~3 мес от signup
Model routing stackCombined ~80% savings @ 100M tokens/moProduction apps, cost governanceImplement nowImmediate ROI

Восемь шагов: зафиксировать акции июня 2026

  1. Audit spend: export 30-day API + editor invoices; tag requests по complexity tier.
  2. DeepSeek V4-Pro: API key, caching headers, route daily traffic immediately.
  3. Cursor referral: community link или code LK2CBD2DJNJX — −50% Pro/Pro+/Ultra month 1.
  4. Copilot summer credits: org admin opt-in до 31 августа — Business $30 / Enterprise $70 bonus.
  5. Prompt Caching: enable на OpenAI, Anthropic, Google endpoints с repeat system prompts.
  6. Model routing config: Nano/Flash-Lite для simple, V4-Pro/Flash для daily, GPT-5.4/Claude для complex — см. decision matrix.
  7. Batch API migration: eval pipelines, bulk summarization, overnight code review queues.
  8. Claude Pro при agent-heavy load: SDK billing pause — lock bundled SDK usage пока действует.

Три hard numbers для FinOps spreadsheet

  • 1/700: DeepSeek V4-Pro cache-hit vs GPT-5.5 Pro cache pricing — крупнейший single-vendor arbitrage июня 2026.
  • ~80%: combined savings routing + Prompt Caching + Batch API на 100M tokens/month production workload vs single-model GPT-5.5.
  • +79%: effective value uplift Copilot Enterprise summer credits ($70 на $39/мес sub) — highest percentage bonus среди editor deals, expires 31 августа 2026.

Три action items на эту неделю

  1. Cursor referral pricing — −50% month 1 = lowest entry в production Agent IDE; pair с free-tier из token guide.
  2. Copilot summer credits — confirm с org admin до 31 августа.
  3. Daily API traffic → DeepSeek V4-Pro — −75% permanent без announced expiry, beats OSS benchmarks на agent tasks.

Где крутить cost-optimized Agents 7×24

Дешёвые tokens решают половину задачи. Agents на laptop с sleep policy, background throttling или SSE drop force expensive re-runs — съедают savings от routing. Shared dev machines дают environment drift и ломают reproducible Agent pipelines.

Dedicated always-on Mac node убирает failure modes: fixed Xcode/toolchain, uninterrupted long Agent sessions, stable MCP Server connections для team deploy. Три hidden costs consumer hardware: lid-close обрывает SSE/MCP, Wi-Fi handoff → reconnect storms, background scheduler throttling → silent retry loops. Для production AI Agent workloads 7×24 MACCOME Mac cloud hosting — predictable option vs stacking promos на ноутбуке. Тарифы: цены аренды Mac Mini; onboarding: центр помощи.

FAQ

Можно ли стабильно использовать DeepSeek V4-Pro API из Китая?

Да. Domestic infrastructure, RMB billing, без VPN для mainland. −75% permanent делает V4-Pro default API для CN-команд. Prompt Caching — cache-hit от ¥0.025/M tokens.

Реферальная скидка Cursor −50% легальна?

Официальная referral-программа (май 2026): −50% первый месяц; реферер до $25 credit (max 10/мес). Links из official channels или trusted community — не paid link farms.

Copilot summer credits начисляются автоматически?

Нет. Business/Enterprise org admin opt-in до 31 августа 2026. Credits ($30 / $70) stack поверх подписки. Personal Pro ($10) и Pro+ ($39) не затронуты.

Claude или GPT: какая подписка выигрывает в июне 2026?

Agentic coding — Claude Pro ($20), SDK bundled после pause 15 июня. API volume — daily на DeepSeek V4-Pro, frontier на GPT-5.4/5.5 после cuts OpenAI. Полная матрица: сравнение ассистентов.

Что будет с Windsurf после SWE-1.5 promo?

После трёх месяцев free — Free (25 Cascade credits/мес), Pro ($15–20/мес), Max ($200/мес). Heavy users сравните Cursor Pro+ до закрытия окна.

Ждать снижения цен OpenAI или подписываться сейчас?

API spend < ~$50/мес — ждите GPT-5.6 (конец июня, WSJ). Production сейчас — daily на DeepSeek V4-Pro, OpenAI на Prompt Caching + Batch API. Dedicated cloud Mac снижает re-run costs — тарифы MACCOME.