OpenAI stellt eigenen Inferenz‑Chip «Jalapeño» vor – gebaut mit Broadcom

Im Detail

Name: Jalapeño; Typ: ASIC (spezialisiertes Schaltkreis‑Design) für AI‑Inference
Partnerschaft mit Broadcom; Arbeit an Chip-Tests läuft aktuell
OpenAI nennt frühe Testergebnisse: deutlich bessere Performance‑pro‑Watt als aktuelle Spitzenlösungen
Einsatzfokus: Echtzeit‑Modelle und Codex/ChatGPT‑Anfragen; Pre‑training bleibt wahrscheinlich Nvidia‑basiert

Warum es zählt

Ein eigener Inferenz‑Chip kann OpenAIs Abhängigkeit von Nvidia verringern und die Kosten für Echtzeit‑Anfragen signifikant senken; das beeinflusst Preisstruktur und Skalierbarkeit von Chat‑ und Agenten‑Diensten.

Für dich Beurteile, ob du bei Cloud‑Anbietern mit OpenAI‑Integration künftig auf Angebotsänderungen oder günstigere Inferenzpreise reagieren musst; prüfe Verträge und TCO‑Modelle für KI‑API‑Nutzung.

Aktualisierungen

25. Juni 2026 · 02:10

OpenAI und Broadcom haben einen speziell für Large-Language-Model-Inferenz entwickelten ASIC namens Jalapeño angekündigt, der ab Ende 2026 in Rechenzentren eingesetzt werden soll.

Der Chip wurde von Grund auf für LLM-Inferenz konzipiert und basiert auf Erkenntnissen aus OpenAIs Roadmap; Entwicklung dauerte neun Monate.
OpenAI verspricht deutlich bessere Performance pro Watt als aktuelle Systeme; detaillierte technische Berichte folgen in den kommenden Monaten.
Ziel ist vertikale Integration und Reduktion der Abhängigkeit von Nvidia sowie Bewältigung des globalen Compute-Engpasses.

25. Juni 2026 · 03:08

OpenAI und Broadcom haben den Inferenz-Chip Jalapeño vorgestellt, ein speziell für LLM-Inferenz in Rechenzentren entwickeltes ASIC, das noch 2026 deployed werden soll.

Chip wurde in neun Monaten von Grund auf für LLM-Inferenz entwickelt, basierend auf Gesprächen zwischen Broadcom und OpenAI-Forschern.
OpenAI verspricht deutlich bessere Performance pro Watt als aktuelle State-of-the-Art-Systeme; detaillierte technische Berichte folgen in den kommenden Monaten.
Deployment in Rechenzentren bis Ende 2026 geplant; erster Schritt einer langfristigen Chip-Roadmap.
Ziel: vertikale Integration und Reduktion der Abhängigkeit von Nvidia und anderen externen Chipanbietern.

25. Juni 2026 · 04:02

OpenAI und Broadcom haben Jalapeño vorgestellt, einen speziell für LLM-Inferenz in Rechenzentren entwickelten ASIC, der noch dieses Jahr deployed werden soll.

Der Chip wurde in neun Monaten von Grund auf für LLM-Inferenz entwickelt, basierend auf Gesprächen zwischen Broadcom und OpenAI-Forschern.
OpenAI verspricht deutlich bessere Performance pro Watt als aktuelle State-of-the-Art-Systeme; detaillierte Benchmarks folgen in den kommenden Monaten.
Deployment in Rechenzentren ist für Ende 2026 geplant; dies ist die erste Generation eines langfristigen Projekts.
Ziel ist vertikale Integration und Unabhängigkeit von Nvidia, um Kapazität in der globalen Compute-Knappheit zu schaffen.

25. Juni 2026 · 05:05

OpenAI und Broadcom haben Jalapeño vorgestellt, einen speziell für LLM-Inferenz in Rechenzentren entwickelten ASIC, der noch 2026 deployed werden soll.

Der Chip wurde in neun Monaten von Grund auf für LLM-Inferenz entwickelt, basierend auf Gesprächen zwischen Broadcom und OpenAI-Forschern.
OpenAI verspricht deutlich bessere Performance pro Watt als aktuelle State-of-the-Art-Systeme; detaillierte Benchmarks folgen in den kommenden Monaten.
Deployment in Rechenzentren ist für Ende 2026 geplant; dies ist die erste Generation eines langfristigen Projekts mit weiteren Verbesserungen.

25. Juni 2026 · 06:02

OpenAI und Broadcom haben Jalapeño vorgestellt, einen speziell für LLM-Inferenz in Rechenzentren entwickelten ASIC, der noch 2026 deployed werden soll.

Der Chip wurde in neun Monaten von Grund auf für LLM-Inferenz entwickelt, basierend auf Gesprächen zwischen Broadcom und OpenAI-Forschern.
OpenAI verspricht deutlich bessere Performance pro Watt als aktuelle State-of-the-Art-Systeme; detaillierte Benchmarks folgen in den kommenden Monaten.
Deployment in Rechenzentren ist für Ende 2026 geplant; dies ist die erste Generation eines langfristigen Projekts.
OpenAI reduziert damit die Abhängigkeit von Nvidia und anderen externen Chipherstellern durch vertikale Integration.

25. Juni 2026 · 07:08

OpenAI und Broadcom haben Jalapeño vorgestellt, einen speziell für Large-Language-Model-Inferenz in Rechenzentren entwickelten ASIC, der noch 2026 deployed werden soll.

Der Chip wurde in neun Monaten von Grund auf entwickelt, basierend auf Gesprächen zwischen Broadcom und OpenAI-Forschern.
OpenAI verspricht deutlich bessere Performance pro Watt als aktuelle State-of-the-Art-Systeme; detaillierte Benchmarks folgen in den kommenden Monaten.
Deployment in Rechenzentren bis Ende 2026 geplant.
Teil von OpenAIs Strategie, den vollständigen Stack zu kontrollieren und Abhängigkeit von Nvidia zu reduzieren.

25. Juni 2026 · 08:01

OpenAI und Broadcom haben Jalapeño vorgestellt, einen speziell für LLM-Inferenz in Rechenzentren entwickelten ASIC, der noch 2026 deployed werden soll.

Der Chip wurde in neun Monaten von Grund auf für LLM-Inferenz entwickelt, basierend auf Gesprächen zwischen Broadcom und OpenAI-Forschern.
OpenAI verspricht deutlich bessere Performance pro Watt als aktuelle State-of-the-Art-Chips; detaillierte Benchmarks folgen in den kommenden Monaten.
Deployment in Rechenzentren ist für Ende 2026 geplant; dies ist die erste Generation eines langfristigen Projekts.
OpenAI verfolgt damit das Ziel, den vollständigen Stack selbst zu kontrollieren und die Abhängigkeit von Nvidia zu reduzieren.

25. Juni 2026 · 09:03

OpenAI und Broadcom haben Jalapeño vorgestellt, einen speziell für LLM-Inferenz in Rechenzentren entwickelten ASIC, der noch 2026 deployed werden soll.

Der Chip wurde von Grund auf für LLM-Inferenz konzipiert, basierend auf Gesprächen zwischen Broadcom und OpenAI-Forschern; Entwicklung dauerte neun Monate.
OpenAI verspricht deutlich bessere Performance pro Watt als aktuelle State-of-the-Art-Systeme; detaillierter technischer Report folgt in den kommenden Monaten.
Deployment in Rechenzentren bis Ende 2026 geplant; Teil von OpenAIs Strategie, den vollständigen Stack zu kontrollieren und Abhängigkeit von Nvidia zu reduzieren.

25. Juni 2026 · 10:05

OpenAI und Broadcom haben einen speziell für LLM-Inferenz entwickelten ASIC-Chip namens Jalapeño angekündigt, der ab Ende 2026 in Rechenzentren eingesetzt werden soll.

Der Chip wurde von Grund auf für LLM-Inferenz konzipiert, basierend auf Gesprächen zwischen Broadcom und OpenAI-Forschern; Entwicklung dauerte neun Monate.
OpenAI verspricht deutlich bessere Performance pro Watt als aktuelle Lösungen; detaillierte technische Berichte folgen in den kommenden Monaten.
Ziel ist vertikale Integration: OpenAI will den vollständigen Stack selbst kontrollieren und damit die Abhängigkeit von Nvidia reduzieren.
Deployment in Rechenzentren ist für Ende 2026 geplant.

25. Juni 2026 · 14:08

OpenAI und Broadcom kündigen Jalapeño an, einen speziell für Large-Language-Model-Inferenz in Rechenzentren entwickelten ASIC-Chip.

Entwicklung dauerte neun Monate, basiert auf Einsichten aus OpenAI-Roadmap.
Verspricht bessere Performance-pro-Watt als aktuelle State-of-the-Art-Chips.
Erste Generation eines langfristigen Projekts – weitere Verbesserungen geplant.
Deployment in Rechenzentren bis Ende 2026 geplant; detaillierter technischer Report folgt.

25. Juni 2026 · 15:07

OpenAI und Broadcom haben einen speziell für LLM-Inference in Rechenzentren entwickelten ASIC namens Jalapeño angekündigt, der ab Ende 2026 deployed werden soll.

Chip wurde von Grund auf für LLM-Inference konzipiert, basierend auf OpenAI-Roadmap und neunmonatiger Entwicklung.
OpenAI verspricht "substantially better performance per watt" als aktuelle State-of-the-Art; detaillierter technischer Report folgt in den kommenden Monaten.
Ziel: Vertikale Integration, um Abhängigkeit von Nvidia zu reduzieren und Kapazität in globalem Compute-Engpass zu erhöhen.
Deployment in Rechenzentren bis Ende 2026 geplant.

Quellen

Zusammenfassungen werden automatisch erstellt und verlinken auf die Originalquelle.