API 請求と IDE サブスクが同時に膨らむエンジニア・スタートアップ向けに、2026年6月17日時点の値下げ・キャンペーンを一括整理します。① DeepSeek V4-Pro 恒久75%オフ、OpenAI GPT-5.6 6月下旬値下げ見込み、Gemini 2.5 料金表、Claude SDK 6/15 課金一時停止;② Cursor 紹介50%オフ、Copilot 夏クレジット(Business $30 / Enterprise $70、8/31 まで)、Windsurf SWE-1.5 無料3ヶ月;③ モデルルーティング・Prompt Caching・Batch API の節約術、総合比較表、六段階アクション。AI コーディングアシスタント比較・無料 Token 攻略と併読すると選定が速くなります。
核心:2026年6月の AI コスト最適化は「キャンペーン取得 × ルーティング × キャッシュ × 安定ホスト」の四次元判断です。本篇はその実行マップを提供します。
DeepSeek は V4-Pro を恒久75%値下げしました。割引後単価は Prompt Cache ¥0.025/百万 Token、入力 ¥3/百万 Token、出力 ¥6/百万 Token です。128K コンテキストと推論強化を維持したまま、中規模 Agent のバックエンドとしてコスト優位が大きくなりました。
業界筋では OpenAI が 2026年6月下旬に GPT-5.6 系 API 単価を10–20%引き下げる見込みです。GPT-5.6-mini とのルーティング分離と併せて、既存 GPT-5 ワークロードの移行計画を今月中に立てることを推奨します。
Google Gemini 2.5 系の API 単価は以下のとおりです(2026年6月公開値)。
| モデル | 入力(/百万 Token) | 出力(/百万 Token) | コンテキスト | 備考 |
|---|---|---|---|---|
| Gemini 2.5 Pro | $1.25(≤200K)/ $2.50(>200K) | $10 / $15 | 1M Token | 長文 RAG・マルチモーダル |
| Gemini 2.5 Flash | $0.15 | $0.60 | 1M Token | 高頻度・低レイテンシ |
| Gemini 2.5 Flash-Lite | $0.075 | $0.30 | 1M Token | 分類・抽出タスク向け |
Anthropic は 2026年6月15日より Claude SDK 経由の一部課金処理を一時停止し、請求整合性の修正を実施しました。既存 Enterprise 契約は継続しますが、新規 SDK 統合・Usage ダッシュボード連携は Console でステータス確認後に進めてください。一時停止中も API 呼び出し自体は可能な場合がありますが、請求予測がずれるため予算アラートの閾値を引き上げることを推奨します。
| カテゴリ | プロバイダ | 2026年6月の施策 | 期限 | 実効メリット |
|---|---|---|---|---|
| API | DeepSeek V4-Pro | 恒久75%オフ(Cache ¥0.025、入 ¥3、出 ¥6 /M) | 恒久 | 中規模 Agent バックエンド最安クラス |
| API | OpenAI GPT-5.6 | 6月下旬 10–20% 値下げ見込み | 6月下旬〜 | 既存 GPT-5 移行コスト低減 |
| API | Google Gemini 2.5 | Flash $0.15/$0.60、Pro 段階課金 | 公開料金 | 長コンテキスト RAG |
| API | Anthropic Claude SDK | 6/15 課金一時停止(整合性修正) | 修正完了まで | 請求ダッシュボード要確認 |
| IDE | Cursor | 紹介初月50%オフ | 初月限定 | Pro + Background Agent 試用 |
| IDE | GitHub Copilot | 夏クレジット Business $30 / Enterprise $70 | 〜2026/8/31 | Premium Agent 枠拡張 |
| IDE | Windsurf | SWE-1.5 無料3ヶ月 | 登録から90日 | 短期 IDE 代替検証 |
タスク難易度に応じてモデルを振り分けます。分類・整形は Gemini Flash-Lite または DeepSeek V4-Pro、中程度のコード生成は Gemini Flash / GPT-5.6-mini、大規模リファクタは Claude Sonnet / GPT-5.6。OpenRouter や LiteLLM でルールベースルーティングを設定すると、同一パイプラインで 30–55% の API コスト削減が報告されています。
Anthropic Claude・OpenAI・Gemini はいずれも Prompt Caching を提供します。固定システムプロンプトと RAG コンテキストをキャッシュに載せ、2回目以降はキャッシュ読み取り単価(通常の10%前後)で課金されます。長コンテキスト Agent では必須の設定です。
OpenAI Batch API は同期呼び出し比 50%割引、24時間 SLA。Gemini Batch も非同期処理で約40%割引。ドキュメント再インデックス、ログ分析、テスト生成などリアルタイム性の不要なジョブに適用してください。
# LiteLLM ルーティング例(概念)
model_list:
- model_name: fast
litellm_params: { model: "gemini/gemini-2.5-flash-lite" }
- model_name: balanced
litellm_params: { model: "deepseek/deepseek-v4-pro" }
- model_name: strong
litellm_params: { model: "anthropic/claude-sonnet-4-20250514" }
router_settings:
routing_strategy: "simple-shuffle" # または latency-based
注意:Claude SDK 6/15 課金一時停止期間中は、Usage API の数値がダッシュボードとずれる場合があります。請求確定後に予算アラートを再設定してください。
6月の値下げとキャンペーンをすべて取得しても、ノート PC スリープによる Agent 中断、単一最高級モデルへの過剰依存、Prompt Caching 未設定の三つが残れば、請求書は想定より高くなります。Docker Desktop とローカル OAuth の組み合わせは開発検証には向きますが、本番 Agent の長時間安定性には限界があります。
7×24 で MCP・Background Agent・Batch パイプラインを回す本番環境には、MACCOME Mac mini(M4 / M4 Pro)クラウドホストがより安定した選択肢です。独占ノードでスリープ問題を回避し、節約した API 予算をインフラに再投資できます。公開料金はレンタル価格ページ、接続手順はヘルプセンターをご参照ください。
よくある質問
2026年6月の AI 値下げウィンドウはいつまで有効ですか?
DeepSeek V4-Pro の75%オフは恒久施策です。Copilot 夏クレジットは2026年8月31日まで、Cursor 紹介50%オフは初月限定、Windsurf SWE-1.5 無料は3ヶ月間です。OpenAI GPT-5.6 の値下げは6月下旬が見込まれます。
DeepSeek V4-Pro の75%オフ後の単価は?
Prompt Cache は ¥0.025/百万 Token、入力 ¥3/百万 Token、出力 ¥6/百万 Token です。長コンテキスト Agent では Prompt Caching と併用すると実効コストをさらに下げられます。
Claude SDK の6月15日課金一時停止とは?
Anthropic は2026年6月15日より Claude SDK 経由の一部課金処理を一時停止し、請求整合性の修正を行いました。新規 SDK 統合は Console ダッシュボードで請求ステータスを確認してから進めてください。
モデルルーティングでどれくらい節約できますか?
単純タスクを DeepSeek や Gemini Flash に、複雑推論を Claude Sonnet / GPT-5.6 に振り分けると、同一ワークロードで API コストを 30–55% 削減できるケースが報告されています。OpenRouter CLI ランキングも参考にしてください。
Batch API と Prompt Caching は併用できますか?
はい。OpenAI Batch API(50%割引)に Prompt Caching(キャッシュ読み取り最大90%割引)を組み合わせると、夜間バッチ処理の実効単価が通常比で大幅に下がります。非リアルタイムの RAG 再インデックスに最適です。