2026년 6월 AI 할인·캠페인 완전 가이드: API 가격전 황금 기간

Q: 2026년 6월 AI 할인 윈도우는 언제까지 유효합니까?

DeepSeek V4-Pro 75% 할인은 영구 정책입니다. Copilot 여름 크레딧은 2026년 8월 31일까지, Cursor 추천 50% 할인은 첫 달 한정, Windsurf SWE-1.5 무료는 3개월입니다. OpenAI GPT-5.6 인하는 6월 말 예상됩니다.

Q: DeepSeek V4-Pro 75% 할인 후 단가는?

Prompt Cache ¥0.025/백만 Token, 입력 ¥3/백만 Token, 출력 ¥6/백만 Token입니다. 장문 Agent에서는 Prompt Caching과 병행하면 실효 비용을 더 낮출 수 있습니다.

Q: 상시 Agent를 저렴하게 돌리려면 Mac 클라우드가 필요합니까?

노트북 절전은 OAuth 세션 끊김과 재시도 Token 소비를 유발해 절약 효과를 상쇄합니다. 7×24 안정 운영이 필요하면 MACCOME Mac mini 클라우드가 적합합니다. 요금은 mac-mini-daeyeo-gagyeog.html, 절차는 mac-mini-gogaeg-senteo.html을 참고하세요.

약 15분 소요 · MACCOME

API 청구와 IDE 구독이 동시에 불어나는 엔지니어·스타트업을 위해 2026년 6월 17일 기준 할인·캠페인을 한 번에 정리합니다.① DeepSeek V4-Pro 영구 75% 할인, OpenAI GPT-5.6 6월 말 인하 예상, Gemini 2.5 요금표, Claude SDK 6/15 과금 일시 중단; ② Cursor 추천 50% 할인, Copilot 여름 크레딧(Business $30·Enterprise $70, 8/31까지), Windsurf SWE-1.5 3개월 무료; ③ 모델 라우팅·Prompt Caching·Batch API 절약법, 종합 비교표, 6단계 실행안. AI 코딩 어시스턴트 비교·무료 Token 공략과 함께 읽으면 선정이 빨라집니다.

6월 AI 가격전에서 놓치기 쉬운 여섯 가지 비용 함정

할인 윈도우를 놓침: 2026년 6월은 DeepSeek 영구 할인, Copilot 여름 크레딧, OpenAI GPT-5.6 인하가 겹치는 황금기입니다. 8월 이후 갱신하면 실효 단가가 되돌아갈 수 있습니다.
Claude SDK 6/15 과금 일시 중단 무시: Anthropic은 청구 정합성 수정을 위해 SDK 경유 일부 과금을 일시 중단했습니다. 신규 통합 전 Console 과금 상태 미확인 시 예산 대시보드가 실제와 어긋납니다.
모든 작업을 최상위 모델로 처리: GPT-5.6·Claude Opus를 lint·JSON 변환에 쓰면 DeepSeek·Gemini Flash로 충분한 작업 대비 3–8배 낭비가 발생합니다.
Prompt Caching 미적용: 긴 시스템 프롬프트·RAG 컨텍스트를 매번 전송하면 캐시 읽기 할인(최대 90%)을 완전히 잃습니다.
Batch API 미사용: 실시간성 불필요한 야간 작업을 동기 API로 돌리면 OpenAI Batch 50%·Gemini Batch 약 40% 할인을 놓칩니다.
노트북에서 상시 Agent 운영: 절전으로 OAuth 끊김·재시도가 늘어 숨은 Token 소비가 API 절약 효과를 상쇄합니다. 7×24 안정 운영에는 전용 호스트가 필요합니다.

핵심: 2026년 6월 AI 비용 최적화는 「캠페인 확보 × 라우팅 × 캐싱 × 안정 호스트」 4차원 판단입니다. 본문은 실행 맵을 제공합니다.

API 할인: DeepSeek·OpenAI·Gemini·Claude (2026년 6월)

DeepSeek V4-Pro: 영구 75% 할인

DeepSeek는 V4-Pro를 영구 75% 인하했습니다. 할인 후 단가는 Prompt Cache ¥0.025/백만 Token, 입력 ¥3/백만 Token, 출력 ¥6/백만 Token입니다. 128K 컨텍스트와 추론 강화를 유지한 채 중형 Agent 백엔드 비용 우위가 큽니다.

OpenAI: GPT-5.6 6월 말 인하 예상

업계 소식에 따르면 OpenAI가 2026년 6월 말 GPT-5.6 계열 API 단가를 10–20% 인하할 전망입니다. GPT-5.6-mini와의 라우팅 분리와 함께 기존 GPT-5 워크로드 이전 계획을 이번 달 안에 수립하는 것을 권장합니다.

Gemini 2.5 공개 요금 (참고)

Google Gemini 2.5 API 단가는 아래와 같습니다(2026년 6월 공개값).

모델	입력(/백만 Token)	출력(/백만 Token)	컨텍스트	비고
Gemini 2.5 Pro	$1.25(≤200K) / $2.50(>200K)	$10 / $15	1M Token	장문 RAG·멀티모달
Gemini 2.5 Flash	$0.15	$0.60	1M Token	고빈도·저지연
Gemini 2.5 Flash-Lite	$0.075	$0.30	1M Token	분류·추출 작업

Claude SDK: 6월 15일 과금 일시 중단

Anthropic은 2026년 6월 15일부터 Claude SDK 경유 일부 과금 처리를 일시 중단하고 청구 정합성을 수정했습니다. 기존 Enterprise 계약은 유지되나, 신규 SDK 통합·Usage 대시보드 연동은 Console 상태 확인 후 진행하세요. 중단 기간에도 API 호출 자체는 가능할 수 있으나 청구 예측이 어긋나므로 예산 알림 임계값 상향을 권장합니다.

에디터·IDE 캠페인: Cursor·Copilot·Windsurf

Cursor: 추천 링크 경유 첫 달 50% 할인(Pro $20→$10 수준). Background Agent 상시 운영을 시험하기 좋은 기간입니다.
GitHub Copilot 여름 크레딧: 2026년 8월 31일까지 Business $30, Enterprise $70 추가 Premium 크레딧. 6/1 크레딧제 전환 이후 Agent 이용 한도를 확장합니다.
Windsurf SWE-1.5: 신규 가입 3개월 무료. Cascade Agent와 SWE-1.5 모델 번들, Cursor 대안 단기 검증에 적합합니다.

구분	제공사	2026년 6월 정책	기한	실효 이점
API	DeepSeek V4-Pro	영구 75% 할인(Cache ¥0.025, 입 ¥3, 출 ¥6 /M)	영구	중형 Agent 최저가급
API	OpenAI GPT-5.6	6월 말 10–20% 인하 예상	6월 말~	기존 GPT-5 이전 비용 절감
API	Google Gemini 2.5	Flash $0.15/$0.60, Pro 단계 과금	공개 요금	장컨텍스트 RAG
API	Anthropic Claude SDK	6/15 과금 일시 중단(정합성 수정)	수정 완료까지	청구 대시보드 확인 필수
IDE	Cursor	추천 첫 달 50% 할인	첫 달 한정	Pro + Background Agent 체험
IDE	GitHub Copilot	여름 크레딧 Business $30 / Enterprise $70	~2026/8/31	Premium Agent 한도 확대
IDE	Windsurf	SWE-1.5 3개월 무료	가입 후 90일	단기 IDE 대안 검증

절약 3법: 모델 라우팅·Prompt Caching·Batch API

모델 라우팅

작업 난이도별 모델 분기: 분류·포맷은 Gemini Flash-Lite 또는 DeepSeek V4-Pro, 중간 코드 생성은 Gemini Flash·GPT-5.6-mini, 대규모 리팩터는 Claude Sonnet·GPT-5.6. OpenRouter·LiteLLM 규칙 라우팅으로 동일 파이프라인 30–55% API 비용 절감 사례가 보고됩니다.

Prompt Caching 할인

Anthropic Claude·OpenAI·Gemini 모두 Prompt Caching을 제공합니다. 고정 시스템 프롬프트·RAG 컨텍스트를 캐시에 올리면 2회차부터 캐시 읽기 단가(통상 입력의 10% 수준)로 과금됩니다. 장컨텍스트 Agent 필수 설정입니다.

Batch API

OpenAI Batch API는 동기 대비 50% 할인, 24시간 SLA. Gemini Batch도 비동기 약 40% 할인. 문서 재인덱싱·로그 분석·테스트 생성 등 비실시간 작업에 적용하세요.

yaml

# LiteLLM 라우팅 예시 (개념)
model_list:
  - model_name: fast
    litellm_params: { model: "gemini/gemini-2.5-flash-lite" }
  - model_name: balanced
    litellm_params: { model: "deepseek/deepseek-v4-pro" }
  - model_name: strong
    litellm_params: { model: "anthropic/claude-sonnet-4-20250514" }
router_settings:
  routing_strategy: "simple-shuffle"  # 또는 latency-based

warning

주의: Claude SDK 6/15 과금 일시 중단 기간 Usage API 수치가 대시보드와 어긋날 수 있습니다. 청구 확정 후 예산 알림을 재설정하세요.

6단계 실행: 6월 황금 기간을 놓치지 않기

현황 파악: 최근 30일 API 청구(제공사·모델별)와 IDE 구독을 스프레드시트에 집계합니다.
캠페인 적용: Cursor 추천 50% 할인, Copilot 여름 크레딧 신청, Windsurf 3개월 무료로 IDE 비용을 즉시 압축합니다.
DeepSeek V4-Pro 이전 테스트: 비핵심 Agent를 V4-Pro로 전환, 1주 A/B로 품질·지연을 비교합니다.
라우팅 구성: LiteLLM·OpenRouter에 fast/balanced/strong 3계층 라우트를 배포합니다.
Caching + Batch 활성화: 장프롬프트에 Prompt Caching, 야간 작업에 Batch API 적용, 주간 비용을 대시보드로 추적합니다.
7×24 호스트 확보: 상시 Agent를 노트북에서 분리해 클라우드 Mac 또는 전용 서버로 이전합니다. OAuth 끊김 재시도 숨은 비용을 차단합니다.

기술 검토에 쓸 수 있는 3가지 핵심 데이터

DeepSeek V4-Pro 영구 75% 할인——Cache ¥0.025/M, 입 ¥3/M, 출 ¥6/M. 128K Agent에서 Claude Sonnet 대비 약 60–70% API 비용 절감 사례.
Prompt Caching 최대 90% 할인——Anthropic·OpenAI 모두 캐시 읽기는 입력 단가의 10% 수준. 10만 Token 고정 컨텍스트 100회 재사용 시 전송 대비 약 81% Token 과금 절감.
Batch API 50% 할인——OpenAI Batch는 동기 API 절반. 월 500만 Token 야간 배치만 이전해도 연간 $3,000–$8,000 절감 전망(모델 단가 의존).

정리: 절약은 계약만으로 끝나지 않습니다

6월 할인·캠페인을 모두 받아도 노트북 절전 Agent 중단, 최상위 모델 과의존, Prompt Caching 미설정이 남으면 청구서는 예상보다 큽니다. Docker Desktop+로컬 OAuth 조합은 개발 검증에는 적합하나 프로덕션 Agent 장시간 안정성에는 한계가 있습니다.

MCP·Background Agent·Batch 파이프라인을 7×24 돌리는 프로덕션 환경에는 MACCOME Mac mini(M4/M4 Pro) 클라우드 호스트가 더 안정적입니다. 독점 노드로 절전 문제를 피하고, 절약한 API 예산을 인프라에 재투자할 수 있습니다. 공개 요금은 대여 가격 페이지, 연결 절차는 고객 센터를 참고하세요.

자주 묻는 질문

2026년 6월 AI 할인 윈도우는 언제까지 유효합니까?

DeepSeek V4-Pro 75% 할인은 영구 정책입니다. Copilot 여름 크레딧은 2026년 8월 31일까지, Cursor 추천 50% 할인은 첫 달 한정, Windsurf SWE-1.5 무료는 3개월입니다. OpenAI GPT-5.6 인하는 6월 말 예상됩니다.

DeepSeek V4-Pro 75% 할인 후 단가는?

Prompt Cache ¥0.025/백만 Token, 입력 ¥3/백만 Token, 출력 ¥6/백만 Token입니다. 장컨텍스트 Agent에서는 Prompt Caching 병행 시 실효 비용을 더 낮출 수 있습니다.

Claude SDK 6월 15일 과금 일시 중단이란?

Anthropic은 2026년 6월 15일부터 Claude SDK 경유 일부 과금 처리를 일시 중단하고 청구 정합성을 수정했습니다. 신규 SDK 통합 전 Console 대시보드에서 과금 상태를 확인하세요.

모델 라우팅으로 얼마나 절약할 수 있습니까?

단순 작업은 DeepSeek·Gemini Flash, 복잡 추론은 Claude Sonnet·GPT-5.6으로 분기하면 동일 워크로드 API 비용을 30–55% 절감한 사례가 있습니다. OpenRouter CLI 순위도 참고하세요.

Batch API와 Prompt Caching을 함께 쓸 수 있습니까?

가능합니다. OpenAI Batch API(50% 할인)와 Prompt Caching(캐시 읽기 최대 90% 할인)을 결합하면 야간 배치 실효 단가가 크게 낮아집니다. 비실시간 RAG 재인덱싱에 최적입니다.

상시 Agent를 저렴하게 돌리려면 Mac 클라우드가 필요합니까?

노트북 절전은 OAuth 끊김·재시도 Token 소비로 절약 효과를 상쇄합니다. 7×24 안정 운영에는 MACCOME Mac mini 클라우드가 적합합니다. 요금은 대여 가격 페이지, 절차는 고객 센터를 참고하세요.