Скидки на ИИ в июне 2026: DeepSeek −75% навсегда, OpenAI готовит снижение цен, Cursor −50% по рефералу

Q: Можно ли стабильно использовать DeepSeek V4-Pro API из Китая?

Да. DeepSeek работает на domestic infrastructure с биллингом в RMB, без VPN для mainland. Постоянная скидка 75% делает V4-Pro default API для CN-команд; Prompt Caching даёт cache-hit от ¥0.025/M tokens.

Q: Реферальная скидка Cursor −50% легальна?

Официальная referral-программа (май 2026): новый пользователь −50% на первый месяц, реферер до $25 credit за signup (max 10/мес). Используйте ссылки из официальных каналов или доверенных community-постов — не paid link farms.

Q: Copilot summer credits начисляются автоматически?

Нет. Org admin Business/Enterprise должен opt-in до 31 августа 2026. Credits ($30 Business / $70 Enterprise) stack поверх подписки. Personal Pro ($10) и Pro+ ($39) не затронуты.

Q: Claude или GPT: какая подписка выигрывает в июне 2026?

Для agentic coding Claude Pro ($20) лидирует — SDK usage bundled после pause billing 15 июня. Для API volume route daily tasks на DeepSeek V4-Pro, frontier reasoning — GPT-5.4/5.5 после снижения OpenAI.

Q: Что будет с Windsurf после SWE-1.5 promo?

После трёх месяцев free SWE-1.5 — standard tiers: Free (25 Cascade credits/мес), Pro ($15–20/мес), Max ($200/мес). Heavy users сравните с Cursor Pro+ до закрытия окна.

Q: Ждать снижения цен OpenAI или подписываться сейчас?

При API spend < ~$50/мес — ждите GPT-5.6 (конец июня, WSJ). Для production сейчас — daily traffic на DeepSeek V4-Pro, OpenAI на Prompt Caching + Batch API. Dedicated cloud Mac снижает re-run costs от обрыва сессий.

Около 18 мин чтения · MACCOME

Если вы платите list price за API и IDE при ужатии enterprise-бюджетов, июнь 2026 — лучшее окно подписки за два года. Статья разбирает механизмы каждой акции: постоянные −75% DeepSeek V4-Pro, incoming price war OpenAI, referral −50% Cursor, summer credits Copilot, тарифы Gemini 2.5, free SWE-1.5 Windsurf — плюс матрица срочности по восьми продуктам, stack model routing + Prompt Caching + Batch API (~80% экономии) и три action items на эту неделю. Контекст выбора инструментов: матрица AI-ассистентов и гайд по free-tier токенам.

Шесть причин завышенного AI-биллинга в июне 2026

Single-vendor lock-in: routing всего трафика на GPT-5.5 Pro игнорирует модели с cache-hit в ~700× дешевле по input prefill.
Prompt Caching выключен: повтор system prompt без cache = full input rate на каждый request; Anthropic даёт до 90% off cached blocks.
Sync API для batch jobs: nightly eval, report generation, data labeling должны идти через Batch API (50% off у OpenAI и Google).
Over-provisioned editor tiers: Cursor Ultra $200/мес на light Tab completion — waste; referral снижает Pro до $10 в первый месяц.
Promo windows пропущены: Copilot summer credits (+58% effective value) и Windsurf SWE-1.5 free trial требуют admin action до дедлайна.
Agents на laptop: sleep policy обрывает long Agent sessions → retry loops умножают token spend; performance boundary — не модель, а host stability.

Конкурентная ось 2026 сместилась: vendors продают не только «кто сильнее», но кто дешевле при том же throughput. Три силы сошлись в июне — open-source pressure DeepSeek, IPO/fundraising pressure у OpenAI и Anthropic, enterprise budget cuts (WSJ: Uber режет AI vendor spend). Результат — окно для renegotiation stack у dev-команд и малых продуктовых групп.

Почему июнь 2026 — точка перелома ценовой войны

Фактор 1 — DeepSeek: временная скидка 2.5× на API стала permanent 22 мая 2026; с 31 мая V4-Pro закреплён на −75% без announced end date. Механизм: aggressive MoE inference + domestic Ascend/H800 fleet снижает marginal cost per token.

Фактор 2 — OpenAI: WSJ (10 июня) сообщает о drastic API price cuts ahead of GPT-5.6 (expected late June). List pricing пока не сдвинут — arbitrage window для hedge через DeepSeek daily + OpenAI frontier reserve.

Фактор 3 — tooling counter-moves: Copilot перешёл на usage-based billing 1 июня, но компенсировал summer credits до 31 августа. Cursor referral (май) — −50% month 1. Windsurf — три месяца free SWE-1.5 для всех. Anthropic 15 июня paused planned SDK billing change — Pro/Max SDK usage остаётся bundled.

Вывод: подписка по list price 2025 года = structural overpay. Ниже — breakdown по продуктам и комбинации.

API-акции: DeepSeek, OpenAI, Gemini, Claude

DeepSeek V4-Pro — permanent −75%

Headline deal июня 2026. Limited-time 2.5× discount → permanent 22 мая; full 75% reduction с 31 мая, без end date.

Cache hit: ¥0.025/M tokens
Cache miss input: ¥3/M tokens
Output: ¥6/M tokens
Concurrency: 500 simultaneous requests на standard tier

Cache-hit pricing ≈ 1/700 GPT-5.5 Pro cache rates — крупнейший single-vendor arbitrage рынка. V4-Pro обходит leading OSS на published agent tool-calling benchmarks. Huawei Ascend 950 deployment H2 2026 может дать ещё один price drop — monitor при RMB billing.

OpenAI — cuts incoming; optimize сейчас

Per WSJ (10 июня 2026) OpenAI готовит significant API reductions. GPT-5.6 expected late June. Current list (mid-June):

Модель	Input ($/M tokens)	Output ($/M tokens)	Optimal workload
GPT-5.5	$5.00	$30.00	Frontier reasoning, complex agents
GPT-5.4	$2.50	$15.00	Production coding, balanced cost
GPT-5 Mini	$0.40	$1.60	Daily dev, chat
GPT-4.1 Nano	$0.10	$0.40	Classification, simple extraction

Tactics до cuts: low-volume — delay new commitments; daily work → DeepSeek V4-Pro; enable Prompt Caching (50–75% off repeated prefixes); async → Batch API (50% off); trivial tasks → GPT-4.1 Nano.

Gemini 2.5 — long context at scale

Pro: $1.25–2.50 input / $10 output per M tokens (tier-dependent)
Flash: $0.30 / $2.50 per M tokens
Flash-Lite: $0.10 / $0.40 per M tokens

Все Gemini 2.5 tiers — 1M token context. Optimal: long-document analysis, Google Workspace pipelines, multimodal ingest. Prompt Caching — до 75% off repeated context blocks; prefill latency растёт линейно с context size — tier Flash-Lite для bulk scan.

Claude — pause SDK billing hike

Anthropic планировала SDK billing change 15 июня 2026, но paused same day. Subscriptions включают SDK usage:

Pro: $20/month
Max 5×: $100/month
Max 20×: $200/month

Claude лидирует в agentic coding — tool loop stability и long system prompts. Prompt Caching до 90% off cached input — critical для production Agents с fat system prompts.

IDE-акции: Cursor, Copilot, Windsurf

Cursor — −50% первый месяц по referral

Referral program (май 2026): новые пользователи −50% month 1:

Pro: $10 (list $20)
Pro+: $20 (list $40)
Ultra: $100 (list $200)

Referrer: $25 credit per signup, cap 10/мес. Links — Reddit, X, Discord; sample code: LK2CBD2DJNJX. Boundary: heavy Agent users часто exceed included usage → $60+/мес effective — budget до commit.

GitHub Copilot — usage-based + summer credits

Usage-based billing с 1 июня 2026. Summer promo (июнь–август, deadline 31 августа 2026):

Business: $19/мес sub + $30 usage credits (+58% effective value)
Enterprise: $39/мес sub + $70 usage credits (+79% effective value)
Personal Pro: $10/мес
Personal Pro+: $39/мес

Org admin must opt-in — credits не automatic. Agent sessions с tool calling deplete credits быстрее Tab completions.

Windsurf — SWE-1.5 free три месяца

SWE-1.5 model: free для всех в promo window
Free tier: 25 Cascade credits/month
Pro: $15–20/month
Max: $200/month

Cascade multi-file editing, Arena Mode для side-by-side model compare. После promo — revert к standard tiers.

Dimension	Cursor	Windsurf
Entry price (июнь 2026)	Pro $10 month 1 (referral)	Free tier + SWE-1.5 promo
Heavy-use tier	Ultra $100–200/мес	Max $200/мес
Agent editing	Composer 2.5, MCP integration	Cascade, Arena Mode
Model choice	Built-in multi-model routing	Arena Mode compare
Best for	MCP + Agent Skill workflows	Teams evaluating models pre-commit

Cost-saving combo: routing, caching, batch

Stack трёх техник снижает bill ~100M tokens/month application на ~80% vs single-model GPT-5.5 routing:

1. Model routing (40–80% savings)

Complex reasoning / agents: GPT-5.4, Claude Opus, DeepSeek V4-Pro
Daily development: GPT-5 Mini, Gemini Flash, DeepSeek Flash
Classification / extraction: GPT-4.1 Nano, Gemini Flash-Lite, DeepSeek cache-hit tier

Routing layer — не «cheapest always»: latency SLA и tool-calling reliability определяют tier per request class.

2. Prompt Caching

Anthropic: до 90% off cached input
OpenAI: 50% off cached prefixes
Google: до 75% off
DeepSeek: cache hit ¥0.025/M tokens

Cache key stability — repeated byte-identical system prompt blocks; drift в prompt versioning = cache miss storm.

3. Batch API (50% off async)

OpenAI и Google Batch APIs halve pricing для jobs с hours latency tolerance — eval suites, overnight code review, bulk document processing. Throughput boundary: queue depth и SLA на completion window.

warning

Пример FinOps: 100M tokens/month на GPT-5.5 list (~$1,750 input+output blend) → ~$350 при 70% volume DeepSeek V4-Pro cache hits, 20% Gemini Flash-Lite, 10% GPT-5.4, Batch API на overnight jobs.

Продукт	Текущая акция	Optimal use	Срочность	Deadline
DeepSeek V4-Pro	−75% permanent; cache hit ¥0.025/M	API volume, CN teams, agent backends	Сейчас	Без end date (monitor H2 Ascend 950)
OpenAI API	Cuts incoming; GPT-5.6 late June	Frontier reasoning post-reprice	Wait or hedge	Конец июня 2026 (GPT-5.6)
Gemini 2.5	Flash-Lite $0.10/$0.40; 1M context	Long docs, Google ecosystem	Stable pricing	Ongoing
Claude Pro/Max	SDK usage bundled (billing pause)	Agentic coding, fat system prompts	Subscribe now	Pause indefinite — watch Anthropic blog
Cursor	−50% month 1 referral	IDE Agent + MCP workflows	Сейчас	Referral ongoing
GitHub Copilot	Summer credits +58% Business, +79% Enterprise	GitHub-native teams, CI integration	Opt-in now	31 августа 2026
Windsurf	SWE-1.5 free 3 mo; 25 free Cascade credits	Model compare, Cascade editing	Try before promo ends	~3 мес от signup
Model routing stack	Combined ~80% savings @ 100M tokens/mo	Production apps, cost governance	Implement now	Immediate ROI

Восемь шагов: зафиксировать акции июня 2026

Audit spend: export 30-day API + editor invoices; tag requests по complexity tier.
DeepSeek V4-Pro: API key, caching headers, route daily traffic immediately.
Cursor referral: community link или code LK2CBD2DJNJX — −50% Pro/Pro+/Ultra month 1.
Copilot summer credits: org admin opt-in до 31 августа — Business $30 / Enterprise $70 bonus.
Prompt Caching: enable на OpenAI, Anthropic, Google endpoints с repeat system prompts.
Model routing config: Nano/Flash-Lite для simple, V4-Pro/Flash для daily, GPT-5.4/Claude для complex — см. decision matrix.
Batch API migration: eval pipelines, bulk summarization, overnight code review queues.
Claude Pro при agent-heavy load: SDK billing pause — lock bundled SDK usage пока действует.

Три hard numbers для FinOps spreadsheet

1/700: DeepSeek V4-Pro cache-hit vs GPT-5.5 Pro cache pricing — крупнейший single-vendor arbitrage июня 2026.
~80%: combined savings routing + Prompt Caching + Batch API на 100M tokens/month production workload vs single-model GPT-5.5.
+79%: effective value uplift Copilot Enterprise summer credits ($70 на $39/мес sub) — highest percentage bonus среди editor deals, expires 31 августа 2026.

Три action items на эту неделю

Cursor referral pricing — −50% month 1 = lowest entry в production Agent IDE; pair с free-tier из token guide.
Copilot summer credits — confirm с org admin до 31 августа.
Daily API traffic → DeepSeek V4-Pro — −75% permanent без announced expiry, beats OSS benchmarks на agent tasks.

Где крутить cost-optimized Agents 7×24

Дешёвые tokens решают половину задачи. Agents на laptop с sleep policy, background throttling или SSE drop force expensive re-runs — съедают savings от routing. Shared dev machines дают environment drift и ломают reproducible Agent pipelines.

Dedicated always-on Mac node убирает failure modes: fixed Xcode/toolchain, uninterrupted long Agent sessions, stable MCP Server connections для team deploy. Три hidden costs consumer hardware: lid-close обрывает SSE/MCP, Wi-Fi handoff → reconnect storms, background scheduler throttling → silent retry loops. Для production AI Agent workloads 7×24 MACCOME Mac cloud hosting — predictable option vs stacking promos на ноутбуке. Тарифы: цены аренды Mac Mini; onboarding: центр помощи.

FAQ

Можно ли стабильно использовать DeepSeek V4-Pro API из Китая?

Да. Domestic infrastructure, RMB billing, без VPN для mainland. −75% permanent делает V4-Pro default API для CN-команд. Prompt Caching — cache-hit от ¥0.025/M tokens.

Реферальная скидка Cursor −50% легальна?

Официальная referral-программа (май 2026): −50% первый месяц; реферер до $25 credit (max 10/мес). Links из official channels или trusted community — не paid link farms.

Copilot summer credits начисляются автоматически?

Нет. Business/Enterprise org admin opt-in до 31 августа 2026. Credits ($30 / $70) stack поверх подписки. Personal Pro ($10) и Pro+ ($39) не затронуты.

Claude или GPT: какая подписка выигрывает в июне 2026?

Agentic coding — Claude Pro ($20), SDK bundled после pause 15 июня. API volume — daily на DeepSeek V4-Pro, frontier на GPT-5.4/5.5 после cuts OpenAI. Полная матрица: сравнение ассистентов.

Что будет с Windsurf после SWE-1.5 promo?

После трёх месяцев free — Free (25 Cascade credits/мес), Pro ($15–20/мес), Max ($200/мес). Heavy users сравните Cursor Pro+ до закрытия окна.

Ждать снижения цен OpenAI или подписываться сейчас?

API spend < ~$50/мес — ждите GPT-5.6 (конец июня, WSJ). Production сейчас — daily на DeepSeek V4-Pro, OpenAI на Prompt Caching + Batch API. Dedicated cloud Mac снижает re-run costs — тарифы MACCOME.