Fuer wen? Tech-Leads und Plattform-Teams, die GPT-5.6 gegen Claude Mythos 5, API-Budgets und Agent-Architektur bewerten. Kernbotschaft: Am 26. Juni 2026 veroeffentlichte OpenAI GPT-5.6 Sol, Terra und Luna — erstmals mit Sonnensystem-Namen. Sol erreicht 91,9% auf TerminalBench 2.1 und 96,7% CTF-Trefferquote, doch nur etwa 20 Partner-Organisationen haben Zugang. Aufbau: Modellmatrix → Benchmarks → Cerebras 750 token/s → Regierungspruefung → Mythos-5-Vergleich → sechs Schritte, FAQ und DSGVO-Hinweise.
OpenAI fuehrte mit GPT-5.6 erstmals eine dreistufige Namenskonvention ein: Sol (Sonne, Flaggschiff), Terra (Erde, ausgewogen) und Luna (Mond, leichtgewichtig). Alle drei Modelle erreichen OpenAIs interne «High»-Cybersecurity-Bewertung — ein Novum fuer eine gesamte Produktlinie, einschliesslich des Einstiegsmodells Luna.
Die Veroeffentlichung erfolgte unter ungewoehnlichen Rahmenbedingungen: Auf Anfrage der US-Regierung ist der breite Zugang vorerst auf etwa 20 genehmigte Partner beschraenkt. OpenAI-CEO Sam Altman erklaerte die Kooperation, warnte aber:
«Wir glauben nicht, dass dieser Art von staatlichem Zugangsprozess zur langfristigen Norm werden sollte. Er haelt die besten Werkzeuge von Nutzern, Entwicklern, Unternehmen und globalen Partnern fern, die sie brauchen.»
| Modell | Positionierung | Input | Output | Kontext | Highlight |
|---|---|---|---|---|---|
| Sol | Flaggschiff | $5 / 1M Token | $30 / 1M Token | ~1,5M | TerminalBench 91,9%, Ultra-Multi-Agent |
| Terra | Ausgewogen | $2,50 / 1M Token | $15 / 1M Token | ~1,5M | GPT-5.5-Niveau, 50% guenstiger |
| Luna | Leichtgewicht | $1 / 1M Token | $6 / 1M Token | ~1,5M | 80% guenstiger als Sol, High-Cyber-Rating |
Status Juni 2026: Breite Verfuegbarkeit in ChatGPT und oeffentlicher API steht aus. Polymarket weist einer Veroeffentlichung bis 31. Juli 2026 eine Wahrscheinlichkeit von etwa 87% zu. Hintergrund: Leaks und Timeline.
Sol ist OpenAIs leistungsfaehigstes Modell fuer komplexes Coding, mehrstufige Cybersecurity-Forschung und autonome Agent-Workflows. Neu sind:
Terra zielt auf volumenstarke Business-Workloads: Dokumentenanalyse, Kundenservice, interne Tools. Performance nahe GPT-5.5 bei 50% niedrigeren Kosten — die wirtschaftlich attraktivste Wahl fuer Massen-API-Deployments.
Luna optimiert fuer hochfrequente, latenzarme Tasks: Zusammenfassungen, Entwuerfe, Routine-Automatisierung. Bemerkenswert: Luna ist das erste Nicht-Flaggschiff-Modell von OpenAI mit gleichzeitig High-Bewertung in Cybersecurity und Biologie.
89 komplexe CLI-Planungsaufgaben testen mehrstufige Tool-Nutzung, iterative Fehlerbehebung und Koordination — naeher an realen Agent-Tasks als klassische Code-Completion-Benchmarks.
| Modell | Score | Modus |
|---|---|---|
| GPT-5.6 Sol | 91,9% | Ultra (Multi-Agent) |
| GPT-5.6 Sol | 88,8% | Standard |
| Claude Mythos 5 | 88,0% | Standard |
| GPT-5.5 | 83,4% | Standard |
| Gemini 3.1 Pro Preview | 70,7% | Standard |
Claude Mythos 5 hatte die Spitzenposition nur 17 Tage (seit 9. Juni) inne, bevor Sol ueberholte.
Sol erreicht 50,9% Task-Completion (Code-Modus) — als einziges Modell ueber der 50%-Marke. Luna liegt leicht ueber GPT-5.5.
| Modell | CTF-Trefferquote |
|---|---|
| Sol | 96,7% |
| Terra | 91,84% |
| Luna | 85,19% |
Auf ExploitBench gleicht Sol Anthropics Mythos Preview, verbraucht aber nur etwa ein Drittel der Output-Token — gleiche Security-Research-Faehigkeit bei deutlich niedrigeren API-Kosten.
Sicherheitshinweis: OpenAIs Red-Teaming bestaetigt: Sol kann Schwachstellen in Chromium- und Firefox-Codebasen erkennen, aber keine vollstaendigen, funktionsfaehigen Exploit-Ketten autonom konstruieren. Unterhalb der «Cyber Critical»-Schwelle.
Ab Juli 2026 wird GPT-5.6 Sol ueber die Cerebras-Hardware-Plattform fuer ausgewaehlte Enterprise-Kunden bereitgestellt — mit bis zu 750 token/s.
Erster Zugang limitiert auf Enterprise-Kunden, waehrend Cerebras Kapazitaet ausbaut. Kontext: OpenAIs Jalapeño-ASIC adressiert parallel die Inferenz-Kostenbasis.
Am 2. Juni 2026 unterzeichnete Praesident Trump eine Executive Order, die US-Behoerden bis zu 30 Tage Vorab-Zugang zu Frontier-Modellen fuer Sicherheitspruefungen ermoeglicht. Am 26. Juni limitierte OpenAI auf Anfrage von OSTP und ONCD den Launch auf etwa 20 «Trusted Partner»-Organisationen.
Das ist das erste Mal, dass die US-Regierung formal eine eingeschraenkte Veroeffentlichung eines Frontier-Modells verlangt — ein Praezedenzfall mit globaler Auswirkung auf API-Verfuegbarkeit und Modellrouting.
| Anbieter | Modell | Status Juni 2026 |
|---|---|---|
| OpenAI | GPT-5.6 Sol/Terra/Luna | Limitierte Preview (~20 Orgs) |
| Anthropic | Claude Fable 5 / Mythos 5 | Offline seit 12.06. (Exportkontrolle) |
| Gemini 3.5 Pro | Verschoben auf Juli |
Juni 2026 sollte der groesste AI-Release-Monat werden — stattdessen blockierten Regulierung und Exportkontrolle alle drei Frontier-Flaggschiffe. Fuer EU-Teams: API-Aufrufe mit personenbezogenen Daten erfordern unabhaengig vom Modellzugang dokumentierte Verarbeitungsorte und AV-Vertraege — siehe Datenschutz und DSGVO-TOMs.
| Dimension | GPT-5.6 Sol | Claude Mythos 5 |
|---|---|---|
| TerminalBench 2.1 | 91,9% (Ultra) / 88,8% | 88,0% |
| ExploitBench | Nahezu gleich, ~1/3 Token | Stark (offline) |
| Input-Preis | $5 / M | $10 / M (offline) |
| Verfuegbarkeit | Preview → breiter Zugang Juli | Exportkontrolle offline |
| Kontext | ~1,5M Token | 200K Token |
Fazit der Daten: Sol fuehrt bei TerminalBench und bietet vergleichbare Security-Research-Faehigkeit zum halben Preis. Mythos 5 kann auf SWE-Bench Pro weiterhin fuehren; vollstaendige GPT-5.6-System-Card-Daten stehen aus. Hintergrund: Fable-5-Exportkontrolle.
GPT-5.6 markiert drei Durchbrueche: Ultra-Multi-Agent setzt TerminalBench-Rekorde, ein Drittel Token bei gleicher Security-Research-Leistung, und 750 token/s via Cerebras ab Juli. Gleichzeitig etabliert die US-Regierungspruefung ein neues Normal — mit direkter Auswirkung auf, wann EU-Teams produktiv zugreifen koennen.
Fuer stabile Agent-Produktion unterhalb der Hyperscaler-API: Mac-Mini-Mietpreise; CLI-Routing: OpenRouter-CLI-Ranking; Hilfe: Hilfe-Center.
Haeufige Fragen
Ist GPT-5.6 bereits in ChatGPT verfuegbar?
Fuer die breite Oeffentlichkeit noch nicht. Stand Juni 2026 nur fuer etwa 20 genehmigte Partner ueber API und Codex. Breite ChatGPT-Verfuegbarkeit wird fuer Juli 2026 erwartet (Polymarket ~87% bis 31.07.).
Ist GPT-5.6 Sol besser als Claude Fable 5 fuer Coding?
Sol fuehrt TerminalBench 2.1 (91,9% vs. Mythos 5 88%). Fable 5 kann auf SWE-Bench Pro fuehren; offizielle GPT-5.6-SWE-Bench-Scores stehen aus. Sol bietet vergleichbare oder bessere Leistung zum niedrigeren Preis.
Was ist der Ultra-Modus?
Ultra verteilt Aufgaben auf mehrere parallele Sub-Agenten und synthetisiert Ergebnisse. Stark bei komplexen Tasks, aber mit deutlich hoeherem Token-Verbrauch.
Warum ist GPT-5.6 eingeschraenkt?
US-Regierung (OSTP/ONCD) nach Executive Order vom 2. Juni 2026. OpenAI limitierte Zugang waehrend Sicherheitspruefung, lehnte aber eine dauerhafte Norm ab.
Wie schnell ist GPT-5.6 auf Cerebras?
Bis zu 750 token/s — 5× bis 15× schneller als typische Frontier-Modelle. Start Juli 2026 fuer ausgewaehlte Enterprise-Kunden.
Sind alle drei Modelle fuer Cybersecurity-Arbeit geeignet?
Alle tragen «High»-Cybersecurity-Rating. OpenAI hat Schutzschichten eingebaut und bestaetigt: keine autonomen vollstaendigen Exploit-Ketten gegen gehaertete Ziele.
Wie plane ich Agent-Compute waehrend des Preview-Fensters?
API-Preview aendert nichts an Laptop-Sleep oder Session-Stabilitaet. MACCOME M4/M4 Pro fuer 7×24 Coding-Agenten. Mietpreise, Hilfe-Center.