Lokale-KI-Index

Wie schnell wächst selbst gehostete KI?

Immer mehr Unternehmen betreiben KI lieber im eigenen Haus – aus Datenschutz-, Kosten- und Kontrollgründen. Wir zählen täglich die Downloads der wichtigsten Werkzeuge dafür und machen so das Adoptionsrennen der lokalen KI sichtbar.

Docker-Images: die lokale KI-Werkzeugkiste

Kumulierte Downloads der wichtigsten selbst gehosteten KI-Images auf Docker Hub – von der Modell-Runtime bis zur Vektordatenbank. Sortiert nach Downloads; die Spalten zeigen den Zuwachs.

Den täglichen Zuwachs zeichnen wir ab heute auf – ab morgen füllen sich die Zuwachs-Spalten. Heute siehst du den aktuellen Stand.

Werkzeug	Downloads	24 h	7 Tage	30 Tage
Modell-Runtime
Ollama`ollama/ollama`	149,9 Mio.	–	–	–
vLLM`vllm/vllm-openai`	26,4 Mio.	–	–	–
LocalAI`localai/localai`	4,8 Mio.	–	–	–
LiteLLM`litellm/litellm`	774,4 Tsd.	–	–	–
Text-Gen-WebUI`atinoda/text-generation-webui`	252,5 Tsd.	–	–	–
Chat & Apps
Dify`langgenius/dify-api`	20,7 Mio.	–	–	–
Flowise`flowiseai/flowise`	6,6 Mio.	–	–	–
LobeChat`lobehub/lobe-chat`	5,8 Mio.	–	–	–
AnythingLLM`mintplexlabs/anythingllm`	3,6 Mio.	–	–	–
RAG & Vektor-DB
Milvus`milvusdb/milvus`	77,2 Mio.	–	–	–
Qdrant`qdrant/qdrant`	35,9 Mio.	–	–	–
Weaviate`semitechnologies/weaviate`	18,9 Mio.	–	–	–
Chroma`chromadb/chroma`	6,1 Mio.	–	–	–
RAGFlow`infiniflow/ragflow`	3,3 Mio.	–	–	–
Orchestrierung & Ops
n8n`n8nio/n8n`	229,1 Mio.	–	–	–
Langfuse`langfuse/langfuse`	11,9 Mio.	–	–	–

Ollama: die beliebtesten lokalen Modelle

Welche offenen Modelle laden die Leute wirklich herunter, um sie lokal laufen zu lassen? Die Top-Modelle der Ollama-Bibliothek nach Downloads. Werte gerundet (~) wie von Ollama ausgewiesen.

1llama3.1~116,7 Mio.
2deepseek-r1~89 Mio.
3nomic-embed-text~77 Mio.
4llama3.2~75 Mio.
5gemma3~38,3 Mio.
6qwen2.5~34 Mio.
7qwen3~31,7 Mio.
8mistral~30,7 Mio.
9gemma2~26,9 Mio.
10llama3~24,6 Mio.
11qwen2.5-coder~18,1 Mio.
12phi3~17,8 Mio.
13gemma4~16,7 Mio.
14qwen3.5~14,6 Mio.
15llava~14,3 Mio.
16mxbai-embed-large~12,1 Mio.
17gpt-oss~10,7 Mio.
18phi4~7,6 Mio.
19gemma~7,2 Mio.
20llama2~7,2 Mio.
21qwen~7,1 Mio.
22qwen3-coder~6,9 Mio.
23glm-ocr~6 Mio.
24qwen2~6 Mio.
25codellama~5,7 Mio.
26minicpm-v~5,3 Mio.
27mistral-nemo~5,2 Mio.
28tinyllama~5,2 Mio.
29bge-m3~5 Mio.
30llama3.2-vision~4,8 Mio.

Wie wir messen

Ehrlich und nachvollziehbar – wir lesen ausschließlich öffentliche, offizielle Zählwerte aus.

1
Docker Hub, exakt
Für jedes Image lesen wir die öffentliche, exakte Gesamt-Downloadzahl (pull_count) direkt bei Docker Hub aus – ohne Schlüssel, ohne Login.
2
Ollama-Bibliothek
Von ollama.com übernehmen wir die ausgewiesenen Modell-Downloads. Diese sind gerundet (z. B. „116,7 Mio.“) – wir kennzeichnen sie mit ~.
3
Einmal täglich
Ein Dienst hält pro Tag einen Wert fest. Aus den Tageswerten entstehen die Zuwächse (24 h / 7 Tage / 30 Tage).
4
Nur vorwärts
Keine der beiden Quellen führt eine Historie. Unser Verlauf lässt sich nur vorwärts aufbauen und wächst ab dem Start – niemand kann ihn nachträglich rekonstruieren.

„Downloads“ heißt: wie oft ein Image bzw. Modell heruntergeladen wurde – ein Näherungswert für Verbreitung, nicht für aktive Nutzung. CI-Systeme und automatische Deployments zählen mit. Offizielle Images, die nur auf ghcr.io liegen (z. B. Open WebUI), können wir nicht erfassen, weil dort keine öffentliche Download-Zahl existiert.

Häufige Fragen

Was ist „lokale KI“ überhaupt?

KI-Modelle, die du auf eigener Hardware oder in deiner eigenen Cloud betreibst, statt sie über eine fremde API zu nutzen. Der Vorteil: Deine Daten verlassen das Haus nicht – ein starkes Argument für Datenschutz und DSGVO.

Warum Downloads statt Nutzerzahlen?

Downloads sind die einzige öffentliche, verlässliche Kennzahl für Verbreitung, die Docker Hub und Ollama ausweisen. Sie zeigen Wachstum und Trend gut – aktive Nutzung messen sie nicht direkt.

Warum kann diese Historie niemand nachbauen?

Weder Docker Hub noch Ollama speichern einen Verlauf – sie zeigen immer nur den aktuellen Gesamtstand, der täglich überschrieben wird. Wer erst später zu zählen beginnt, hat die vergangenen Tage für immer verpasst. Genau das macht die Zeitreihe wertvoll.

Welche Werkzeuge sind dabei?

Eine kuratierte Auswahl der verbreitetsten selbst gehosteten KI-Werkzeuge: Modell-Runtimes (Ollama, vLLM, LocalAI), Chat-Oberflächen und App-Baukästen (LobeChat, AnythingLLM, Dify, Flowise), RAG- und Vektordatenbanken (Qdrant, Chroma, Weaviate, Milvus) sowie Orchestrierung (n8n, Langfuse).

Quellen: Docker Hub (hub.docker.com) und die Ollama-Bibliothek (ollama.com), jeweils öffentlich abrufbar. Downloadzahlen sind Näherungswerte für Verbreitung. Keine Gewähr für Vollständigkeit oder Aktualität einzelner Werte.

Lokale KI, sauber aufgesetzt

Wir bringen selbst gehostete KI auf deine Infrastruktur – datenschutzkonform, wartbar und produktiv.

Projekt starten Leistungen ansehen