- 09:44ModelleForschungSina veröffentlicht VibeThinker-3B: 3-Milliarden-Parameter-Modell konkurriert mit 100x größeren KI-SystemenDas Wichtigste
Weibos Mutterkonzern Sina hat ein kleines Sprachmodell mit nur drei Milliarden Parametern veröffentlicht, das bei Mathematik und Programmierung mit Modellen konkurriert, die hundertmal größer sind.
Im Detail- VibeThinker-3B erreicht auf Benchmarks wie AIME26 Leistung auf Augenhöhe mit DeepSeek V3.2 und Kimi K2.5, obwohl diese 200–333× mehr Parameter haben.
- Bei LeetCode-Wettbewerben (April–Mai 2026) löste das Modell 123 von 128 Aufgaben beim ersten Versuch – besser als GPT-5.2, Qwen3-Max und Kimi K2.5.
- Schwäche bei faktischem Wissen: auf dem GPQA-Diamond-Benchmark fällt VibeThinker-3B deutlich hinter größere Konkurrenten zurück.
- Basiert auf Alibabas Qwen2.5-Coder-3B; Sinas Innovation liegt in der Post-Training-Phase mit spezialisiertem Reinforcement Learning für mehrstufige Reasoning-Aufgaben.
Warum es zähltDas Modell zeigt, dass Reasoning-Fähigkeiten sich effizient komprimieren lassen, während faktisches Wissen Größe erfordert. Das hat Implikationen für die Kostenoptimierung von KI-Systemen in der Praxis.
Für dich Beobachte, ob kleinere, spezialisierte Modelle für deine Coding- oder Math-Aufgaben kostengünstiger werden – VibeThinker deutet an, dass du nicht immer die größten Modelle brauchst.
Weiterlesen Quellen: The Decoder
Zusammenfassungen werden automatisch erstellt und verlinken auf die Originalquelle.