Immer mehr Unternehmen betreiben KI lieber im eigenen Haus – aus Datenschutz-, Kosten- und Kontrollgründen. Wir zählen täglich die Downloads der wichtigsten Werkzeuge dafür und machen so das Adoptionsrennen der lokalen KI sichtbar.
Kumulierte Downloads der wichtigsten selbst gehosteten KI-Images auf Docker Hub – von der Modell-Runtime bis zur Vektordatenbank. Sortiert nach Downloads; die Spalten zeigen den Zuwachs.
Den täglichen Zuwachs zeichnen wir ab heute auf – ab morgen füllen sich die Zuwachs-Spalten. Heute siehst du den aktuellen Stand.
| Werkzeug | Downloads | 24 h | 7 Tage | 30 Tage |
|---|---|---|---|---|
| Modell-Runtime | ||||
Ollamaollama/ollama | 149,9 Mio. | – | – | – |
vLLMvllm/vllm-openai | 26,4 Mio. | – | – | – |
LocalAIlocalai/localai | 4,8 Mio. | – | – | – |
LiteLLMlitellm/litellm | 774,4 Tsd. | – | – | – |
Text-Gen-WebUIatinoda/text-generation-webui | 252,5 Tsd. | – | – | – |
| Chat & Apps | ||||
Difylanggenius/dify-api | 20,7 Mio. | – | – | – |
Flowiseflowiseai/flowise | 6,6 Mio. | – | – | – |
LobeChatlobehub/lobe-chat | 5,8 Mio. | – | – | – |
AnythingLLMmintplexlabs/anythingllm | 3,6 Mio. | – | – | – |
| RAG & Vektor-DB | ||||
Milvusmilvusdb/milvus | 77,2 Mio. | – | – | – |
Qdrantqdrant/qdrant | 35,9 Mio. | – | – | – |
Weaviatesemitechnologies/weaviate | 18,9 Mio. | – | – | – |
Chromachromadb/chroma | 6,1 Mio. | – | – | – |
RAGFlowinfiniflow/ragflow | 3,3 Mio. | – | – | – |
| Orchestrierung & Ops | ||||
n8nn8nio/n8n | 229,1 Mio. | – | – | – |
Langfuselangfuse/langfuse | 11,9 Mio. | – | – | – |
Welche offenen Modelle laden die Leute wirklich herunter, um sie lokal laufen zu lassen? Die Top-Modelle der Ollama-Bibliothek nach Downloads. Werte gerundet (~) wie von Ollama ausgewiesen.
llama3.1~116,7 Mio.deepseek-r1~89 Mio.nomic-embed-text~77 Mio.llama3.2~75 Mio.gemma3~38,3 Mio.qwen2.5~34 Mio.qwen3~31,7 Mio.mistral~30,7 Mio.gemma2~26,9 Mio.llama3~24,6 Mio.qwen2.5-coder~18,1 Mio.phi3~17,8 Mio.gemma4~16,7 Mio.qwen3.5~14,6 Mio.llava~14,3 Mio.mxbai-embed-large~12,1 Mio.gpt-oss~10,7 Mio.phi4~7,6 Mio.gemma~7,2 Mio.llama2~7,2 Mio.qwen~7,1 Mio.qwen3-coder~6,9 Mio.glm-ocr~6 Mio.qwen2~6 Mio.codellama~5,7 Mio.minicpm-v~5,3 Mio.mistral-nemo~5,2 Mio.tinyllama~5,2 Mio.bge-m3~5 Mio.llama3.2-vision~4,8 Mio.Ehrlich und nachvollziehbar – wir lesen ausschließlich öffentliche, offizielle Zählwerte aus.
Für jedes Image lesen wir die öffentliche, exakte Gesamt-Downloadzahl (pull_count) direkt bei Docker Hub aus – ohne Schlüssel, ohne Login.
Von ollama.com übernehmen wir die ausgewiesenen Modell-Downloads. Diese sind gerundet (z. B. „116,7 Mio.“) – wir kennzeichnen sie mit ~.
Ein Dienst hält pro Tag einen Wert fest. Aus den Tageswerten entstehen die Zuwächse (24 h / 7 Tage / 30 Tage).
Keine der beiden Quellen führt eine Historie. Unser Verlauf lässt sich nur vorwärts aufbauen und wächst ab dem Start – niemand kann ihn nachträglich rekonstruieren.
„Downloads“ heißt: wie oft ein Image bzw. Modell heruntergeladen wurde – ein Näherungswert für Verbreitung, nicht für aktive Nutzung. CI-Systeme und automatische Deployments zählen mit. Offizielle Images, die nur auf ghcr.io liegen (z. B. Open WebUI), können wir nicht erfassen, weil dort keine öffentliche Download-Zahl existiert.
KI-Modelle, die du auf eigener Hardware oder in deiner eigenen Cloud betreibst, statt sie über eine fremde API zu nutzen. Der Vorteil: Deine Daten verlassen das Haus nicht – ein starkes Argument für Datenschutz und DSGVO.
Downloads sind die einzige öffentliche, verlässliche Kennzahl für Verbreitung, die Docker Hub und Ollama ausweisen. Sie zeigen Wachstum und Trend gut – aktive Nutzung messen sie nicht direkt.
Weder Docker Hub noch Ollama speichern einen Verlauf – sie zeigen immer nur den aktuellen Gesamtstand, der täglich überschrieben wird. Wer erst später zu zählen beginnt, hat die vergangenen Tage für immer verpasst. Genau das macht die Zeitreihe wertvoll.
Eine kuratierte Auswahl der verbreitetsten selbst gehosteten KI-Werkzeuge: Modell-Runtimes (Ollama, vLLM, LocalAI), Chat-Oberflächen und App-Baukästen (LobeChat, AnythingLLM, Dify, Flowise), RAG- und Vektordatenbanken (Qdrant, Chroma, Weaviate, Milvus) sowie Orchestrierung (n8n, Langfuse).
Quellen: Docker Hub (hub.docker.com) und die Ollama-Bibliothek (ollama.com), jeweils öffentlich abrufbar. Downloadzahlen sind Näherungswerte für Verbreitung. Keine Gewähr für Vollständigkeit oder Aktualität einzelner Werte.
Wir bringen selbst gehostete KI auf deine Infrastruktur – datenschutzkonform, wartbar und produktiv.