Im Detail
- Coinbase nutzt nun chinesische Modelle statt OpenAI/Anthropic; 91 % der Entwickler überschreiten ihre alten Nutzungslimits nicht mehr.
- Automatisches Routing-System wählt das beste Modell pro Request basierend auf Aufgabe, Preis und Caching-Potenzial; Caching-Optimierung erhöhte Hit-Rate von 5 auf 60 %.
- Lindy-CEO und Snowflake testen ebenfalls chinesische Modelle; OpenAI und Anthropic geraten unter Preisdruck – OpenAI bietet GPT-5.6-Sol mit besserer Token-Effizienz an.
- Coinbase koppelt Ausgaben an erwartete Geschäftsimpact: "Je mehr du auf KI ausgibst, desto mehr Impact erwarten wir."
Warum es zählt
Der Wechsel zu chinesischen Modellen durch etablierte Unternehmen signalisiert einen Wendepunkt im KI-Markt: Kostenoptimierung wird zum Wettbewerbsfaktor, und Western Labs müssen ihre Preismodelle überdenken. Für SMEs bedeutet das konkrete Alternativen zu teuren US-APIs.
Für dich Vergleiche die Gesamtkosten (Token-Preis + Caching-Effizienz) von DeepSeek, Kimi und GLM mit deinen aktuellen OpenAI/Anthropic-Ausgaben – die Einsparungen könnten erheblich sein.