● Aktualisiert 25. Juni 2026HardwareModelleWirtschaft

OpenAI stellt eigenen Inferenz‑Chip «Jalapeño» vor – gebaut mit Broadcom

OpenAI präsentiert Jalapeño, einen speziell für Inferenz entwickelten ASIC, den das Unternehmen gemeinsam mit Broadcom entwirft und testet.

Im Detail

  • Name: Jalapeño; Typ: ASIC (spezialisiertes Schaltkreis‑Design) für AI‑Inference
  • Partnerschaft mit Broadcom; Arbeit an Chip-Tests läuft aktuell
  • OpenAI nennt frühe Testergebnisse: deutlich bessere Performance‑pro‑Watt als aktuelle Spitzenlösungen
  • Einsatzfokus: Echtzeit‑Modelle und Codex/ChatGPT‑Anfragen; Pre‑training bleibt wahrscheinlich Nvidia‑basiert

Warum es zählt

Ein eigener Inferenz‑Chip kann OpenAIs Abhängigkeit von Nvidia verringern und die Kosten für Echtzeit‑Anfragen signifikant senken; das beeinflusst Preisstruktur und Skalierbarkeit von Chat‑ und Agenten‑Diensten.

Für dich Beurteile, ob du bei Cloud‑Anbietern mit OpenAI‑Integration künftig auf Angebotsänderungen oder günstigere Inferenzpreise reagieren musst; prüfe Verträge und TCO‑Modelle für KI‑API‑Nutzung.

Aktualisierungen

OpenAI und Broadcom haben einen speziell für Large-Language-Model-Inferenz entwickelten ASIC namens Jalapeño angekündigt, der ab Ende 2026 in Rechenzentren eingesetzt werden soll.

  • Der Chip wurde von Grund auf für LLM-Inferenz konzipiert und basiert auf Erkenntnissen aus OpenAIs Roadmap; Entwicklung dauerte neun Monate.
  • OpenAI verspricht deutlich bessere Performance pro Watt als aktuelle Systeme; detaillierte technische Berichte folgen in den kommenden Monaten.
  • Ziel ist vertikale Integration und Reduktion der Abhängigkeit von Nvidia sowie Bewältigung des globalen Compute-Engpasses.

OpenAI und Broadcom haben den Inferenz-Chip Jalapeño vorgestellt, ein speziell für LLM-Inferenz in Rechenzentren entwickeltes ASIC, das noch 2026 deployed werden soll.

  • Chip wurde in neun Monaten von Grund auf für LLM-Inferenz entwickelt, basierend auf Gesprächen zwischen Broadcom und OpenAI-Forschern.
  • OpenAI verspricht deutlich bessere Performance pro Watt als aktuelle State-of-the-Art-Systeme; detaillierte technische Berichte folgen in den kommenden Monaten.
  • Deployment in Rechenzentren bis Ende 2026 geplant; erster Schritt einer langfristigen Chip-Roadmap.
  • Ziel: vertikale Integration und Reduktion der Abhängigkeit von Nvidia und anderen externen Chipanbietern.

OpenAI und Broadcom haben Jalapeño vorgestellt, einen speziell für LLM-Inferenz in Rechenzentren entwickelten ASIC, der noch dieses Jahr deployed werden soll.

  • Der Chip wurde in neun Monaten von Grund auf für LLM-Inferenz entwickelt, basierend auf Gesprächen zwischen Broadcom und OpenAI-Forschern.
  • OpenAI verspricht deutlich bessere Performance pro Watt als aktuelle State-of-the-Art-Systeme; detaillierte Benchmarks folgen in den kommenden Monaten.
  • Deployment in Rechenzentren ist für Ende 2026 geplant; dies ist die erste Generation eines langfristigen Projekts.
  • Ziel ist vertikale Integration und Unabhängigkeit von Nvidia, um Kapazität in der globalen Compute-Knappheit zu schaffen.

OpenAI und Broadcom haben Jalapeño vorgestellt, einen speziell für LLM-Inferenz in Rechenzentren entwickelten ASIC, der noch 2026 deployed werden soll.

  • Der Chip wurde in neun Monaten von Grund auf für LLM-Inferenz entwickelt, basierend auf Gesprächen zwischen Broadcom und OpenAI-Forschern.
  • OpenAI verspricht deutlich bessere Performance pro Watt als aktuelle State-of-the-Art-Systeme; detaillierte Benchmarks folgen in den kommenden Monaten.
  • Deployment in Rechenzentren ist für Ende 2026 geplant; dies ist die erste Generation eines langfristigen Projekts mit weiteren Verbesserungen.

OpenAI und Broadcom haben Jalapeño vorgestellt, einen speziell für LLM-Inferenz in Rechenzentren entwickelten ASIC, der noch 2026 deployed werden soll.

  • Der Chip wurde in neun Monaten von Grund auf für LLM-Inferenz entwickelt, basierend auf Gesprächen zwischen Broadcom und OpenAI-Forschern.
  • OpenAI verspricht deutlich bessere Performance pro Watt als aktuelle State-of-the-Art-Systeme; detaillierte Benchmarks folgen in den kommenden Monaten.
  • Deployment in Rechenzentren ist für Ende 2026 geplant; dies ist die erste Generation eines langfristigen Projekts.
  • OpenAI reduziert damit die Abhängigkeit von Nvidia und anderen externen Chipherstellern durch vertikale Integration.

OpenAI und Broadcom haben Jalapeño vorgestellt, einen speziell für Large-Language-Model-Inferenz in Rechenzentren entwickelten ASIC, der noch 2026 deployed werden soll.

  • Der Chip wurde in neun Monaten von Grund auf entwickelt, basierend auf Gesprächen zwischen Broadcom und OpenAI-Forschern.
  • OpenAI verspricht deutlich bessere Performance pro Watt als aktuelle State-of-the-Art-Systeme; detaillierte Benchmarks folgen in den kommenden Monaten.
  • Deployment in Rechenzentren bis Ende 2026 geplant.
  • Teil von OpenAIs Strategie, den vollständigen Stack zu kontrollieren und Abhängigkeit von Nvidia zu reduzieren.

OpenAI und Broadcom haben Jalapeño vorgestellt, einen speziell für LLM-Inferenz in Rechenzentren entwickelten ASIC, der noch 2026 deployed werden soll.

  • Der Chip wurde in neun Monaten von Grund auf für LLM-Inferenz entwickelt, basierend auf Gesprächen zwischen Broadcom und OpenAI-Forschern.
  • OpenAI verspricht deutlich bessere Performance pro Watt als aktuelle State-of-the-Art-Chips; detaillierte Benchmarks folgen in den kommenden Monaten.
  • Deployment in Rechenzentren ist für Ende 2026 geplant; dies ist die erste Generation eines langfristigen Projekts.
  • OpenAI verfolgt damit das Ziel, den vollständigen Stack selbst zu kontrollieren und die Abhängigkeit von Nvidia zu reduzieren.

OpenAI und Broadcom haben Jalapeño vorgestellt, einen speziell für LLM-Inferenz in Rechenzentren entwickelten ASIC, der noch 2026 deployed werden soll.

  • Der Chip wurde von Grund auf für LLM-Inferenz konzipiert, basierend auf Gesprächen zwischen Broadcom und OpenAI-Forschern; Entwicklung dauerte neun Monate.
  • OpenAI verspricht deutlich bessere Performance pro Watt als aktuelle State-of-the-Art-Systeme; detaillierter technischer Report folgt in den kommenden Monaten.
  • Deployment in Rechenzentren bis Ende 2026 geplant; Teil von OpenAIs Strategie, den vollständigen Stack zu kontrollieren und Abhängigkeit von Nvidia zu reduzieren.

OpenAI und Broadcom haben einen speziell für LLM-Inferenz entwickelten ASIC-Chip namens Jalapeño angekündigt, der ab Ende 2026 in Rechenzentren eingesetzt werden soll.

  • Der Chip wurde von Grund auf für LLM-Inferenz konzipiert, basierend auf Gesprächen zwischen Broadcom und OpenAI-Forschern; Entwicklung dauerte neun Monate.
  • OpenAI verspricht deutlich bessere Performance pro Watt als aktuelle Lösungen; detaillierte technische Berichte folgen in den kommenden Monaten.
  • Ziel ist vertikale Integration: OpenAI will den vollständigen Stack selbst kontrollieren und damit die Abhängigkeit von Nvidia reduzieren.
  • Deployment in Rechenzentren ist für Ende 2026 geplant.

OpenAI und Broadcom kündigen Jalapeño an, einen speziell für Large-Language-Model-Inferenz in Rechenzentren entwickelten ASIC-Chip.

  • Entwicklung dauerte neun Monate, basiert auf Einsichten aus OpenAI-Roadmap.
  • Verspricht bessere Performance-pro-Watt als aktuelle State-of-the-Art-Chips.
  • Erste Generation eines langfristigen Projekts – weitere Verbesserungen geplant.
  • Deployment in Rechenzentren bis Ende 2026 geplant; detaillierter technischer Report folgt.

OpenAI und Broadcom haben einen speziell für LLM-Inference in Rechenzentren entwickelten ASIC namens Jalapeño angekündigt, der ab Ende 2026 deployed werden soll.

  • Chip wurde von Grund auf für LLM-Inference konzipiert, basierend auf OpenAI-Roadmap und neunmonatiger Entwicklung.
  • OpenAI verspricht "substantially better performance per watt" als aktuelle State-of-the-Art; detaillierter technischer Report folgt in den kommenden Monaten.
  • Ziel: Vertikale Integration, um Abhängigkeit von Nvidia zu reduzieren und Kapazität in globalem Compute-Engpass zu erhöhen.
  • Deployment in Rechenzentren bis Ende 2026 geplant.
← Alle News

Zusammenfassungen werden automatisch erstellt und verlinken auf die Originalquelle.