[{"data":1,"prerenderedAt":30},["ShallowReactive",2],{"nr-de-mistral-leanstral-formale-mathematik-code-verifikation":3},{"slug":4,"title":5,"dek":6,"date":7,"time":8,"publishedAt":9,"updated":10,"updatedAt":10,"dateFmt":11,"updatedFmt":10,"kind":12,"tier":13,"author":14,"authorName":15,"topics":16,"tracker":22,"trackerLabel":23,"headlineStat":24,"image":25,"ogImage":26,"imageAlt":5,"csv":10,"minutes":27,"words":28,"html":29},"mistral-leanstral-formale-mathematik-code-verifikation","Mistral veröffentlicht Leanstral 1.5: Open-Source-Modell findet echte Bugs im Code","Das neue Modell von Mistral AI löst komplexe mathematische Beweise und entdeckt dabei auch Sicherheitslücken in echtem Code. Bei einem Scan von 57 Open-Source-Projekten fand es bereits fünf unbekannte Fehler.","2026-07-04","15:07","2026-07-04T15:07:00+02:00","","4. Juli 2026","news","standard","ideal-syka","Ideal Syka",[17,18,19,20,21],"Open-Source-KI","Formale Verifikation","Code-Sicherheit","Mathematik-KI","Mistral AI","\u002Flokale-ki","Lokale KI & Open Source","587 von 672 Aufgaben im Putnam-Benchmark gelöst; 5 echte Bugs in 57 Repositories gefunden","\u002Fnewsroom\u002Fimg\u002Fmistral-leanstral-formale-mathematik-code-verifikation.webp","\u002Fog-nr\u002Fmistral-leanstral-formale-mathematik-code-verifikation.de.png",2,479,"\u003Cp>Mistral AI hat mit \u003Cstrong>Leanstral 1.5\u003C\u002Fstrong> ein kostenloses Open-Source-Modell unter Apache-2.0-Lizenz veröffentlicht, das spezialisiert auf formale Verifikation in der Programmiersprache Lean 4 arbeitet. Das Besondere: Das Modell beherrscht nicht nur mathematische Beweise, sondern findet auch echte Bugs in produktivem Code – ein konkreter Durchbruch bei der KI-gestützten Softwareverifikation.\u003C\u002Fp>\n\u003Ch2>Kurz &amp; knapp\u003C\u002Fh2>\n\u003Cul>\n\u003Cli>\u003Cstrong>Leanstral 1.5\u003C\u002Fstrong> erreicht auf dem miniF2F-Benchmark für formale Mathematik \u003Cstrong>100 Prozent\u003C\u002Fstrong> und löst \u003Cstrong>587 von 672\u003C\u002Fstrong> Aufgaben im anspruchsvollen PutnamBench\u003C\u002Fli>\n\u003Cli>Bei der Überprüfung von \u003Cstrong>57 Open-Source-Repositories\u003C\u002Fstrong> fand das Modell \u003Cstrong>fünf bisher unbekannte Fehler\u003C\u002Fstrong>, darunter einen \u003Cstrong>Overflow-Bug in der Rust-Bibliothek varinteger\u003C\u002Fstrong>\u003C\u002Fli>\n\u003Cli>Das Modell ist kostenlos über \u003Cstrong>Hugging Face\u003C\u002Fstrong> und eine \u003Cstrong>kostenlose API\u003C\u002Fstrong> verfügbar\u003C\u002Fli>\n\u003Cli>Training mit Mid-Training, überwachtem Feintuning und \u003Cstrong>Reinforcement Learning\u003C\u002Fstrong>\u003C\u002Fli>\n\u003C\u002Ful>\n\u003Ch2>Mathematik auf Olympiade-Niveau\u003C\u002Fh2>\n\u003Cp>Die Benchmark-Ergebnisse zeigen, wie weit das Modell reicht: Auf miniF2F, das Aufgaben von Schulniveau bis zu Olympiade-Aufgaben umfasst, erreicht Leanstral 1.5 eine \u003Cstrong>perfekte Quote von 100 Prozent\u003C\u002Fstrong>. Im \u003Cstrong>PutnamBench\u003C\u002Fstrong> – einem Benchmark mit 672 Aufgaben aus dem renommierten Putnam-Mathematikwettbewerb – löst es immerhin \u003Cstrong>587 Probleme\u003C\u002Fstrong>. Bei den anspruchsvolleren Algebra-Benchmarks FATE-H und FATE-X, die Aufgaben auf Master- und Doktorandenniveau in Bereichen wie Gruppentheorie und Ringtheorie prüfen, erzielt das Modell \u003Cstrong>87 beziehungsweise 34 Prozent\u003C\u002Fstrong>.\u003C\u002Fp>\n\u003Cdiv class=\"tbl-scroll\">\u003Ctable>\n\u003Cthead>\n\u003Ctr>\n\u003Cth>Benchmark\u003C\u002Fth>\n\u003Cth>Aufgaben\u003C\u002Fth>\n\u003Cth>Leanstral 1.5\u003C\u002Fth>\n\u003Cth>Besonderheit\u003C\u002Fth>\n\u003C\u002Ftr>\n\u003C\u002Fthead>\n\u003Ctbody>\u003Ctr>\n\u003Ctd>miniF2F\u003C\u002Ftd>\n\u003Ctd>variabel\u003C\u002Ftd>\n\u003Ctd>100 %\u003C\u002Ftd>\n\u003Ctd>Schulniveau bis Olympiade\u003C\u002Ftd>\n\u003C\u002Ftr>\n\u003Ctr>\n\u003Ctd>PutnamBench\u003C\u002Ftd>\n\u003Ctd>672\u003C\u002Ftd>\n\u003Ctd>587 gelöst\u003C\u002Ftd>\n\u003Ctd>Renommierter Mathematikwettbewerb\u003C\u002Ftd>\n\u003C\u002Ftr>\n\u003Ctr>\n\u003Ctd>FATE-H\u003C\u002Ftd>\n\u003Ctd>Master-Niveau\u003C\u002Ftd>\n\u003Ctd>87 %\u003C\u002Ftd>\n\u003Ctd>Gruppentheorie, Ringtheorie\u003C\u002Ftd>\n\u003C\u002Ftr>\n\u003Ctr>\n\u003Ctd>FATE-X\u003C\u002Ftd>\n\u003Ctd>Doktoranden-Niveau\u003C\u002Ftd>\n\u003Ctd>34 %\u003C\u002Ftd>\n\u003Ctd>Höchste Schwierigkeit\u003C\u002Ftd>\n\u003C\u002Ftr>\n\u003C\u002Ftbody>\u003C\u002Ftable>\u003C\u002Fdiv>\n\u003Ch2>Von Mathe zu echten Bugs\u003C\u002Fh2>\n\u003Cp>Was das Modell besonders macht: Obwohl es hauptsächlich auf mathematische Verifikation trainiert wurde, zeigt es laut Mistral starke Fähigkeiten in der praktischen \u003Cstrong>Code-Verifikation\u003C\u002Fstrong>. Das ist nicht nur Theorie – beim Scan von 57 Open-Source-Repositories fand Leanstral 1.5 \u003Cstrong>fünf bisher unbekannte Fehler\u003C\u002Fstrong>. Darunter war ein \u003Cstrong>Overflow-Bug in der Rust-Bibliothek varinteger\u003C\u002Fstrong>, also ein echtes Sicherheitsrisiko, das in produktivem Code lauerte.\u003C\u002Fp>\n\u003Cp>Das bedeutet: Das Modell kann nicht nur mathematische Beweise formal überprüfen, sondern auch reale Softwareprojekte auf Fehler scannen – und findet dabei Dinge, die bisherige Methoden übersehen haben.\u003C\u002Fp>\n\u003Ch2>Training mit drei Techniken\u003C\u002Fh2>\n\u003Cp>Die Leistung basiert auf einem kombinierten Trainingsansatz: \u003Cstrong>Mid-Training\u003C\u002Fstrong>, \u003Cstrong>überwachtes Feintuning\u003C\u002Fstrong> und \u003Cstrong>Reinforcement Learning\u003C\u002Fstrong> wurden zusammen eingesetzt, um das Modell sowohl auf mathematische Präzision als auch auf praktische Code-Analyse zu optimieren.\u003C\u002Fp>\n\u003Ch2>Was das für deutsche Unternehmen bedeutet\u003C\u002Fh2>\n\u003Cp>Für deutsche Softwareentwickler und Sicherheitsverantwortliche könnte Leanstral 1.5 interessant werden, wenn es um Code-Review und Fehlersuche geht. Ein kostenloses, open-source Modell, das echte Bugs findet, könnte Teil einer lokalen KI-Infrastruktur werden – ohne Abhängigkeit von externen APIs. Allerdings bleibt offen, wie zuverlässig das Modell bei größeren, komplexeren Codebases ist und wie es sich in deutschen Compliance-Szenarien bewährt. Die Veröffentlichung zeigt aber: Formale Verifikation mit KI ist kein Zukunftstraum mehr, sondern praktisch einsetzbar.\u003C\u002Fp>\n\u003Ch2>Quellen\u003C\u002Fh2>\n\u003Cul>\n\u003Cli>\u003Ca href=\"https:\u002F\u002Fthe-decoder.de\u002Fmistral-veroeffentlicht-open-source-modell-fuer-formale-mathematik-und-code-verifikation\u002F\">The Decoder (DE)\u003C\u002Fa>\u003C\u002Fli>\n\u003Cli>\u003Ca href=\"https:\u002F\u002Fthe-decoder.com\u002Fmistrals-open-source-leanstral-1-5-aces-formal-math-benchmarks-and-catches-real-bugs-in-code\u002F\">The Decoder\u003C\u002Fa>\u003C\u002Fli>\n\u003C\u002Ful>\n\u003Cp>\u003Cem>Redaktionell verantwortet von \u003Ca href=\"\u002Fautor\u002Fideal-syka\">Ideal Syka\u003C\u002Fa>. Quellen und Arbeitsweise: \u003Ca href=\"\u002Fredaktion\">Redaktion &amp; Methode\u003C\u002Fa>. Hinweise und Korrekturen: \u003Ca href=\"mailto:ai@i6eal.de\">ai@i6eal.de\u003C\u002Fa>.\u003C\u002Fem>\u003C\u002Fp>\n",1783276595080]