2026年6月 AI 値下げ・キャンペーン完全ガイド:API 料金戦争の黄金ウィンドウ

約15分で読了 · MACCOME

API 請求と IDE サブスクが同時に膨らむエンジニア・スタートアップ向けに、2026年6月17日時点の値下げ・キャンペーンを一括整理します。① DeepSeek V4-Pro 恒久75%オフ、OpenAI GPT-5.6 6月下旬値下げ見込み、Gemini 2.5 料金表、Claude SDK 6/15 課金一時停止;② Cursor 紹介50%オフ、Copilot 夏クレジット(Business $30 / Enterprise $70、8/31 まで)、Windsurf SWE-1.5 無料3ヶ月;③ モデルルーティング・Prompt Caching・Batch API の節約術、総合比較表、六段階アクションAI コーディングアシスタント比較無料 Token 攻略と併読すると選定が速くなります。

6月 AI 料金戦争で見落としがちな六つのコスト罠

  1. 値下げウィンドウを逃す:2026年6月は DeepSeek 恒久割引、Copilot 夏クレジット、OpenAI GPT-5.6 値下げが重なる「黄金期」です。8月以降に契約を更新すると実効単価が戻る可能性があります。
  2. Claude SDK 6/15 課金一時停止を無視する:Anthropic は請求整合性修正のため SDK 経由の一部課金を一時停止しました。新規統合前に Console で請求ステータスを確認しないと、予算ダッシュボードが実態と乖離します。
  3. 全タスクを最高級モデルに流す:GPT-5.6 や Claude Opus を lint 修正や JSON 整形に使うと、DeepSeek / Gemini Flash で十分な処理に対し 3–8倍の無駄が発生します。
  4. Prompt Caching を有効にしない:長システムプロンプト・RAG コンテキストを毎回フル送信すると、キャッシュ読み取り割引(最大90%)を完全に失います。
  5. Batch API を使わない:リアルタイム性の不要な夜間ジョブを同期 API で回すと、OpenAI Batch の50%割引と Gemini Batch の40%割引を逃します。
  6. ノート PC で常駐 Agent を回す:スリープによる OAuth 切断とリトライで隠れ Token 消費が増え、API 節約効果を相殺します。7×24 安定稼働には専用ホストが必要です。

核心:2026年6月の AI コスト最適化は「キャンペーン取得 × ルーティング × キャッシュ × 安定ホスト」の四次元判断です。本篇はその実行マップを提供します。

API 値下げ:DeepSeek・OpenAI・Gemini・Claude(2026年6月)

DeepSeek V4-Pro:恒久75%オフ

DeepSeek は V4-Pro を恒久75%値下げしました。割引後単価は Prompt Cache ¥0.025/百万 Token、入力 ¥3/百万 Token、出力 ¥6/百万 Token です。128K コンテキストと推論強化を維持したまま、中規模 Agent のバックエンドとしてコスト優位が大きくなりました。

OpenAI:GPT-5.6 6月下旬値下げ見込み

業界筋では OpenAI が 2026年6月下旬に GPT-5.6 系 API 単価を10–20%引き下げる見込みです。GPT-5.6-mini とのルーティング分離と併せて、既存 GPT-5 ワークロードの移行計画を今月中に立てることを推奨します。

Gemini 2.5 公開料金(参考)

Google Gemini 2.5 系の API 単価は以下のとおりです(2026年6月公開値)。

モデル入力(/百万 Token)出力(/百万 Token)コンテキスト備考
Gemini 2.5 Pro$1.25(≤200K)/ $2.50(>200K)$10 / $151M Token長文 RAG・マルチモーダル
Gemini 2.5 Flash$0.15$0.601M Token高頻度・低レイテンシ
Gemini 2.5 Flash-Lite$0.075$0.301M Token分類・抽出タスク向け

Claude SDK:6月15日 課金一時停止

Anthropic は 2026年6月15日より Claude SDK 経由の一部課金処理を一時停止し、請求整合性の修正を実施しました。既存 Enterprise 契約は継続しますが、新規 SDK 統合・Usage ダッシュボード連携は Console でステータス確認後に進めてください。一時停止中も API 呼び出し自体は可能な場合がありますが、請求予測がずれるため予算アラートの閾値を引き上げることを推奨します。

エディタ・IDE キャンペーン:Cursor・Copilot・Windsurf

  • Cursor:紹介リンク経由で初月50%オフ(Pro $20→$10 相当)。Background Agent 常駐を試すウィンドウとして有効です。
  • GitHub Copilot 夏クレジット2026年8月31日まで、Business プランに $30、Enterprise に $70 の追加 Premium クレジットを付与。6/1 移行後のクレジット制課金下で Agent 利用枠を拡張できます。
  • Windsurf SWE-1.5:新規登録で3ヶ月無料。Cascade Agent と SWE-1.5 モデルがバンドルされ、Cursor 代替の短期検証に向きます。
カテゴリプロバイダ2026年6月の施策期限実効メリット
APIDeepSeek V4-Pro恒久75%オフ(Cache ¥0.025、入 ¥3、出 ¥6 /M)恒久中規模 Agent バックエンド最安クラス
APIOpenAI GPT-5.66月下旬 10–20% 値下げ見込み6月下旬〜既存 GPT-5 移行コスト低減
APIGoogle Gemini 2.5Flash $0.15/$0.60、Pro 段階課金公開料金長コンテキスト RAG
APIAnthropic Claude SDK6/15 課金一時停止(整合性修正)修正完了まで請求ダッシュボード要確認
IDECursor紹介初月50%オフ初月限定Pro + Background Agent 試用
IDEGitHub Copilot夏クレジット Business $30 / Enterprise $70〜2026/8/31Premium Agent 枠拡張
IDEWindsurfSWE-1.5 無料3ヶ月登録から90日短期 IDE 代替検証

三つの節約テクニック:モデルルーティング・Prompt Caching・Batch API

モデルルーティング

タスク難易度に応じてモデルを振り分けます。分類・整形は Gemini Flash-Lite または DeepSeek V4-Pro、中程度のコード生成は Gemini Flash / GPT-5.6-mini、大規模リファクタは Claude Sonnet / GPT-5.6。OpenRouter や LiteLLM でルールベースルーティングを設定すると、同一パイプラインで 30–55% の API コスト削減が報告されています。

Prompt Caching 割引

Anthropic Claude・OpenAI・Gemini はいずれも Prompt Caching を提供します。固定システムプロンプトと RAG コンテキストをキャッシュに載せ、2回目以降はキャッシュ読み取り単価(通常の10%前後)で課金されます。長コンテキスト Agent では必須の設定です。

Batch API

OpenAI Batch API は同期呼び出し比 50%割引、24時間 SLA。Gemini Batch も非同期処理で約40%割引。ドキュメント再インデックス、ログ分析、テスト生成などリアルタイム性の不要なジョブに適用してください。

yaml
# LiteLLM ルーティング例(概念)
model_list:
  - model_name: fast
    litellm_params: { model: "gemini/gemini-2.5-flash-lite" }
  - model_name: balanced
    litellm_params: { model: "deepseek/deepseek-v4-pro" }
  - model_name: strong
    litellm_params: { model: "anthropic/claude-sonnet-4-20250514" }
router_settings:
  routing_strategy: "simple-shuffle"  # または latency-based
warning

注意:Claude SDK 6/15 課金一時停止期間中は、Usage API の数値がダッシュボードとずれる場合があります。請求確定後に予算アラートを再設定してください。

六段階アクション:6月の黄金ウィンドウを逃さない

  1. 現状棚卸し:過去30日の API 請求(プロバイダ別・モデル別)と IDE サブスクをスプレッドシートに集約します。
  2. キャンペーン適用:Cursor 紹介50%オフ、Copilot 夏クレジット申請、Windsurf 3ヶ月無料で IDE コストを即時圧縮します。
  3. DeepSeek V4-Pro 移行テスト:非クリティカル Agent を V4-Pro に切り替え、品質とレイテンシを1週間 A/B 比較します。
  4. ルーティング設定:LiteLLM / OpenRouter で fast / balanced / strong の三層ルートをデプロイします。
  5. Caching + Batch 有効化:長プロンプトに Prompt Caching、夜間ジョブに Batch API を適用し、ダッシュボードで週次コストを追跡します。
  6. 7×24 ホスト確保:常駐 Agent をノート PC から切り離し、クラウド Mac または専用サーバーに移します。OAuth 切断リトライによる隠れコストを止めます。

技術レビューに書ける三つの硬核データ

  • DeepSeek V4-Pro 恒久75%オフ——Cache ¥0.025/M、入 ¥3/M、出 ¥6/M。128K Agent で Claude Sonnet 比 約60–70% の API コスト削減事例が報告されています。
  • Prompt Caching 最大90%割引——Anthropic・OpenAI ともにキャッシュ読み取りは入力単価の10%水準。10万 Token 固定コンテキストを100回再利用すると、フル送信比で 約81% の Token 課金削減になります。
  • Batch API 50%割引——OpenAI Batch は同期 API 比半額。月間500万 Token の夜間バッチを移行するだけで、年間 $3,000–$8,000 規模の削減見込み(モデル単価依存)。

まとめ:節約は契約だけでは完結しない

6月の値下げとキャンペーンをすべて取得しても、ノート PC スリープによる Agent 中断単一最高級モデルへの過剰依存Prompt Caching 未設定の三つが残れば、請求書は想定より高くなります。Docker Desktop とローカル OAuth の組み合わせは開発検証には向きますが、本番 Agent の長時間安定性には限界があります。

7×24 で MCP・Background Agent・Batch パイプラインを回す本番環境には、MACCOME Mac mini(M4 / M4 Pro)クラウドホストがより安定した選択肢です。独占ノードでスリープ問題を回避し、節約した API 予算をインフラに再投資できます。公開料金はレンタル価格ページ、接続手順はヘルプセンターをご参照ください。

よくある質問

2026年6月の AI 値下げウィンドウはいつまで有効ですか?

DeepSeek V4-Pro の75%オフは恒久施策です。Copilot 夏クレジットは2026年8月31日まで、Cursor 紹介50%オフは初月限定、Windsurf SWE-1.5 無料は3ヶ月間です。OpenAI GPT-5.6 の値下げは6月下旬が見込まれます。

DeepSeek V4-Pro の75%オフ後の単価は?

Prompt Cache は ¥0.025/百万 Token、入力 ¥3/百万 Token、出力 ¥6/百万 Token です。長コンテキスト Agent では Prompt Caching と併用すると実効コストをさらに下げられます。

Claude SDK の6月15日課金一時停止とは?

Anthropic は2026年6月15日より Claude SDK 経由の一部課金処理を一時停止し、請求整合性の修正を行いました。新規 SDK 統合は Console ダッシュボードで請求ステータスを確認してから進めてください。

モデルルーティングでどれくらい節約できますか?

単純タスクを DeepSeek や Gemini Flash に、複雑推論を Claude Sonnet / GPT-5.6 に振り分けると、同一ワークロードで API コストを 30–55% 削減できるケースが報告されています。OpenRouter CLI ランキングも参考にしてください。

Batch API と Prompt Caching は併用できますか?

はい。OpenAI Batch API(50%割引)に Prompt Caching(キャッシュ読み取り最大90%割引)を組み合わせると、夜間バッチ処理の実効単価が通常比で大幅に下がります。非リアルタイムの RAG 再インデックスに最適です。

常駐 Agent を安く回すには Mac クラウドが必要ですか?

ノート PC のスリープは OAuth 切断とリトライ Token 消費を招き、節約効果を相殺します。7×24 安定稼働が必要なら MACCOME Mac mini クラウドが適しています。料金はレンタル価格ページ、手順はヘルプセンターをご参照ください。