HardwareWirtschaftModelle

OpenAI und Broadcom stellen Jalapeño vor – eigener Chip für LLM-Inference

OpenAI und Broadcom haben einen neuen ASIC namens Jalapeño entwickelt, der speziell für Large-Language-Model-Inference in Rechenzentren optimiert ist.

Im Detail

  • Der Chip wurde von Grund auf für LLM-Inference entworfen und basiert auf Erkenntnissen aus OpenAIs Roadmap; die Entwicklung dauerte neun Monate.
  • OpenAI verspricht deutlich bessere Performance pro Watt als aktuelle State-of-the-Art-Systeme; ein detaillierter technischer Bericht folgt in den kommenden Monaten.
  • Beide Unternehmen planen, Jalapeño-Chips bis Ende 2026 in Rechenzentren einzusetzen – Teil von OpenAIs Strategie, den vollständigen Stack zu kontrollieren und Abhängigkeit von Nvidia zu reduzieren.

Warum es zählt

Dies signalisiert, dass spezialisierte Chips für AI-Inference zum Standard werden – für Unternehmen mit großen Inference-Workloads könnte dies Kosten und Latenz senken, aber auch neue Abhängigkeiten schaffen.

Für dich Beobachte die Verfügbarkeit und Leistung von Jalapeño; wenn deine Inference-Kosten ein Problem sind, könnten spezialisierte Chips bald eine Alternative zu GPU-Clustern bieten.

← Alle News

Zusammenfassungen werden automatisch erstellt und verlinken auf die Originalquelle.