Im Detail
- Modelle: tiny, small, medium; Parameterbereich 1.5M bis 34.5M
- small und medium unterstützen 50 Sprachen inkl. vereinfachtes/traditionelles Chinesisch, Englisch, Japanisch und 46 lateinische Schriften
- Leistung: PP-OCRv6_medium: 86.2% Detection Hmean und 83.2% Recognition auf internen Benchmarks; Verbesserungen gegenüber PP-OCRv5_server: +4.6pp Detection, +5.1pp Recognition
- Backend‑Integration mit PaddlePaddle, Transformers oder ONNX Runtime; Fokus auf kleine, produktionsbereite Modelle
Warum es zählt
Kompakte, mehrsprachige OCR‑Modelle erleichtern automatisierte Dokumentenverarbeitung und Textextraktion in Produktionsumgebungen ohne schwere VLMs; relevant für internationale Mittelständler mit vielfältigen Dokumentformaten.
Für dich Teste das passende Tier (tiny/small/medium) an einer Stichprobe deiner Dokumente, um abzuschätzen Genauigkeit vs. Laufzeit und wähle ONNX/Paddle-Deployment für ressourcenarme Server.