ModelleHardware

OpenAI und Broadcom stellen Jalapeño vor — eigener Chip für LLM‑Inference

OpenAI und Broadcom enthüllen Jalapeño, einen speziell für Large‑Language‑Model‑Inference entwickelten Beschleuniger, der bis Ende 2026 in großem Maßstab laufen soll.

Im Detail

  • Jalapeño ist OpenAIs erstes sogenanntes ‚Intelligence Processor‘, als von Grund auf neu entworfenes Beschleuniger‑ASIC für LLM‑Inference.
  • Broadcom liefert Fertigung und Netzwerk‑IP (inkl. Tomahawk), Celestica übernimmt Boards, Racks und Systemintegration; OpenAI verantwortet das Chipdesign.
  • Engineering‑Samples laufen bereits ML‑Workloads im Labor, inklusive GPT‑5.3‑Codex‑Spark; frühe Tests melden deutlich bessere Performance pro Watt (selbstberichtete Zahlen).
  • Von Design bis Tape‑out soll der Zyklus neun Monate gedauert haben; Jalapeño ist die erste Generation einer mehrteiligen Plattform zwischen OpenAI und Broadcom.

Warum es zählt

Kontrolle über Hardware reduziert Abhängigkeit von Drittanbietern, kann Betriebskosten und Latenz senken und gibt OpenAI Vorteile bei großskaliger Bereitstellung von LLM‑Diensten — das verschiebt die Wettbewerbsbasis von reinem Modell‑IP hin zur integrierten Stack‑Optimierung.

Für dich Beurteile, ob dein Anbieter eigene Hardware‑Pläne hat oder auf spezialisierte Inferenz‑Hardware setzt; bei langen Verträgen mit Cloud‑Providern lohnt sich ein Blick auf Preisentwicklungen bei inference‑optimierter Hardware.

← Alle News

Zusammenfassungen werden automatisch erstellt und verlinken auf die Originalquelle.