API 청구와 IDE 구독이 동시에 불어나는 엔지니어·스타트업을 위해 2026년 6월 17일 기준 할인·캠페인을 한 번에 정리합니다.① DeepSeek V4-Pro 영구 75% 할인, OpenAI GPT-5.6 6월 말 인하 예상, Gemini 2.5 요금표, Claude SDK 6/15 과금 일시 중단; ② Cursor 추천 50% 할인, Copilot 여름 크레딧(Business $30·Enterprise $70, 8/31까지), Windsurf SWE-1.5 3개월 무료; ③ 모델 라우팅·Prompt Caching·Batch API 절약법, 종합 비교표, 6단계 실행안. AI 코딩 어시스턴트 비교·무료 Token 공략과 함께 읽으면 선정이 빨라집니다.
핵심: 2026년 6월 AI 비용 최적화는 「캠페인 확보 × 라우팅 × 캐싱 × 안정 호스트」 4차원 판단입니다. 본문은 실행 맵을 제공합니다.
DeepSeek는 V4-Pro를 영구 75% 인하했습니다. 할인 후 단가는 Prompt Cache ¥0.025/백만 Token, 입력 ¥3/백만 Token, 출력 ¥6/백만 Token입니다. 128K 컨텍스트와 추론 강화를 유지한 채 중형 Agent 백엔드 비용 우위가 큽니다.
업계 소식에 따르면 OpenAI가 2026년 6월 말 GPT-5.6 계열 API 단가를 10–20% 인하할 전망입니다. GPT-5.6-mini와의 라우팅 분리와 함께 기존 GPT-5 워크로드 이전 계획을 이번 달 안에 수립하는 것을 권장합니다.
Google Gemini 2.5 API 단가는 아래와 같습니다(2026년 6월 공개값).
| 모델 | 입력(/백만 Token) | 출력(/백만 Token) | 컨텍스트 | 비고 |
|---|---|---|---|---|
| Gemini 2.5 Pro | $1.25(≤200K) / $2.50(>200K) | $10 / $15 | 1M Token | 장문 RAG·멀티모달 |
| Gemini 2.5 Flash | $0.15 | $0.60 | 1M Token | 고빈도·저지연 |
| Gemini 2.5 Flash-Lite | $0.075 | $0.30 | 1M Token | 분류·추출 작업 |
Anthropic은 2026년 6월 15일부터 Claude SDK 경유 일부 과금 처리를 일시 중단하고 청구 정합성을 수정했습니다. 기존 Enterprise 계약은 유지되나, 신규 SDK 통합·Usage 대시보드 연동은 Console 상태 확인 후 진행하세요. 중단 기간에도 API 호출 자체는 가능할 수 있으나 청구 예측이 어긋나므로 예산 알림 임계값 상향을 권장합니다.
| 구분 | 제공사 | 2026년 6월 정책 | 기한 | 실효 이점 |
|---|---|---|---|---|
| API | DeepSeek V4-Pro | 영구 75% 할인(Cache ¥0.025, 입 ¥3, 출 ¥6 /M) | 영구 | 중형 Agent 최저가급 |
| API | OpenAI GPT-5.6 | 6월 말 10–20% 인하 예상 | 6월 말~ | 기존 GPT-5 이전 비용 절감 |
| API | Google Gemini 2.5 | Flash $0.15/$0.60, Pro 단계 과금 | 공개 요금 | 장컨텍스트 RAG |
| API | Anthropic Claude SDK | 6/15 과금 일시 중단(정합성 수정) | 수정 완료까지 | 청구 대시보드 확인 필수 |
| IDE | Cursor | 추천 첫 달 50% 할인 | 첫 달 한정 | Pro + Background Agent 체험 |
| IDE | GitHub Copilot | 여름 크레딧 Business $30 / Enterprise $70 | ~2026/8/31 | Premium Agent 한도 확대 |
| IDE | Windsurf | SWE-1.5 3개월 무료 | 가입 후 90일 | 단기 IDE 대안 검증 |
작업 난이도별 모델 분기: 분류·포맷은 Gemini Flash-Lite 또는 DeepSeek V4-Pro, 중간 코드 생성은 Gemini Flash·GPT-5.6-mini, 대규모 리팩터는 Claude Sonnet·GPT-5.6. OpenRouter·LiteLLM 규칙 라우팅으로 동일 파이프라인 30–55% API 비용 절감 사례가 보고됩니다.
Anthropic Claude·OpenAI·Gemini 모두 Prompt Caching을 제공합니다. 고정 시스템 프롬프트·RAG 컨텍스트를 캐시에 올리면 2회차부터 캐시 읽기 단가(통상 입력의 10% 수준)로 과금됩니다. 장컨텍스트 Agent 필수 설정입니다.
OpenAI Batch API는 동기 대비 50% 할인, 24시간 SLA. Gemini Batch도 비동기 약 40% 할인. 문서 재인덱싱·로그 분석·테스트 생성 등 비실시간 작업에 적용하세요.
# LiteLLM 라우팅 예시 (개념)
model_list:
- model_name: fast
litellm_params: { model: "gemini/gemini-2.5-flash-lite" }
- model_name: balanced
litellm_params: { model: "deepseek/deepseek-v4-pro" }
- model_name: strong
litellm_params: { model: "anthropic/claude-sonnet-4-20250514" }
router_settings:
routing_strategy: "simple-shuffle" # 또는 latency-based
주의: Claude SDK 6/15 과금 일시 중단 기간 Usage API 수치가 대시보드와 어긋날 수 있습니다. 청구 확정 후 예산 알림을 재설정하세요.
6월 할인·캠페인을 모두 받아도 노트북 절전 Agent 중단, 최상위 모델 과의존, Prompt Caching 미설정이 남으면 청구서는 예상보다 큽니다. Docker Desktop+로컬 OAuth 조합은 개발 검증에는 적합하나 프로덕션 Agent 장시간 안정성에는 한계가 있습니다.
MCP·Background Agent·Batch 파이프라인을 7×24 돌리는 프로덕션 환경에는 MACCOME Mac mini(M4/M4 Pro) 클라우드 호스트가 더 안정적입니다. 독점 노드로 절전 문제를 피하고, 절약한 API 예산을 인프라에 재투자할 수 있습니다. 공개 요금은 대여 가격 페이지, 연결 절차는 고객 센터를 참고하세요.
자주 묻는 질문
2026년 6월 AI 할인 윈도우는 언제까지 유효합니까?
DeepSeek V4-Pro 75% 할인은 영구 정책입니다. Copilot 여름 크레딧은 2026년 8월 31일까지, Cursor 추천 50% 할인은 첫 달 한정, Windsurf SWE-1.5 무료는 3개월입니다. OpenAI GPT-5.6 인하는 6월 말 예상됩니다.
DeepSeek V4-Pro 75% 할인 후 단가는?
Prompt Cache ¥0.025/백만 Token, 입력 ¥3/백만 Token, 출력 ¥6/백만 Token입니다. 장컨텍스트 Agent에서는 Prompt Caching 병행 시 실효 비용을 더 낮출 수 있습니다.
Claude SDK 6월 15일 과금 일시 중단이란?
Anthropic은 2026년 6월 15일부터 Claude SDK 경유 일부 과금 처리를 일시 중단하고 청구 정합성을 수정했습니다. 신규 SDK 통합 전 Console 대시보드에서 과금 상태를 확인하세요.
모델 라우팅으로 얼마나 절약할 수 있습니까?
단순 작업은 DeepSeek·Gemini Flash, 복잡 추론은 Claude Sonnet·GPT-5.6으로 분기하면 동일 워크로드 API 비용을 30–55% 절감한 사례가 있습니다. OpenRouter CLI 순위도 참고하세요.
Batch API와 Prompt Caching을 함께 쓸 수 있습니까?
가능합니다. OpenAI Batch API(50% 할인)와 Prompt Caching(캐시 읽기 최대 90% 할인)을 결합하면 야간 배치 실효 단가가 크게 낮아집니다. 비실시간 RAG 재인덱싱에 최적입니다.