# KI Modellfamilien - Übersicht (Stand April 2026) - Arbeitsdokument

## Übersicht gängiger KI-Modellfamilien

<p class="callout warning">Diese Übersicht beschreibt verbreitete KI-Modellfamilien, ihre Herkunft, typische Ausprägungen, die grundsätzliche lokale Nutzbarkeit, den inhaltlichen Fokus sowie eine grobe Einordnung ihrer Verbreitung.  
Sie dient der schnellen Orientierung und erhebt keinen Anspruch auf Vollständigkeit.</p>

### Grundsätzliche Hinweise

- <span style="white-space: pre-wrap;">Modellbezeichnungen sind </span>**nicht einheitlich standardisiert**.
- Viele Namen bestehen aus einer Kombination aus:
    - **Modellfamilie**
    - **Versions- oder Generationsnummer**
    - **Größenangabe**
    - **Spezialisierung oder Einsatzschwerpunkt**
- <span style="white-space: pre-wrap;">Begriffe wie </span>`<span class="editor-theme-code">mini</span>`<span style="white-space: pre-wrap;">, </span>`<span class="editor-theme-code">pro</span>`<span style="white-space: pre-wrap;">, </span>`<span class="editor-theme-code">thinking</span>`<span style="white-space: pre-wrap;">, </span>`<span class="editor-theme-code">reasoning</span>`<span style="white-space: pre-wrap;">, </span>`<span class="editor-theme-code">vision</span>`<span style="white-space: pre-wrap;"> oder </span>`<span class="editor-theme-code">turbo</span>`<span style="white-space: pre-wrap;"> sind häufig </span>**anbieterspezifisch**.
- <span style="white-space: pre-wrap;">Die lokale Nutzbarkeit hängt zusätzlich von Faktoren wie </span>**Quantisierung**<span style="white-space: pre-wrap;">, </span>**Kontextlänge**<span style="white-space: pre-wrap;">, </span>**RAM**<span style="white-space: pre-wrap;">, </span>**VRAM**<span style="white-space: pre-wrap;"> und </span>**CPU/GPU-Leistung**<span style="white-space: pre-wrap;"> ab.</span>

---

## Tabelle: Gängige Modellfamilien

<table id="bkmrk-modellfamilieherkunf"><colgroup><col></col><col></col><col></col><col></col><col></col><col></col><col></col></colgroup><tbody><tr><th>Modellfamilie

</th><th>Herkunft / Anbieter

</th><th>Typische Ausprägungen

</th><th>Lokal nutzbar

</th><th>Grobe lokale Anforderung

</th><th>Verbreitung

</th><th>Typischer Fokus

</th></tr><tr><td>**Llama**

</td><td>Meta

</td><td>z. B. 1B, 3B, 8B, 70B

</td><td>Ja

</td><td>kleine bis mittlere Varianten gut lokal nutzbar; große Varianten eher für starke Systeme

</td><td>sehr hoch

</td><td>Allround, Chat, Assistenz, Basis für viele lokale Setups

</td></tr><tr><td>**Qwen**

</td><td>Alibaba / Qwen Team

</td><td>z. B. 0.6B, 4B, 8B, 14B, 32B, MoE-Varianten

</td><td>Ja

</td><td>kleine und mittlere Varianten gut lokal; größere Varianten deutlich anspruchsvoller

</td><td>sehr hoch

</td><td>multilingual, Coding, Reasoning, Tools

</td></tr><tr><td>**DeepSeek**

</td><td>DeepSeek

</td><td>z. B. kleine Distill-Modelle, größere Reasoning-Varianten

</td><td>Ja, vor allem kleine Varianten

</td><td>kleine Modelle gut lokal; große Modelle nur eingeschränkt sinnvoll lokal

</td><td>hoch

</td><td>Reasoning, Analyse, Mathematik

</td></tr><tr><td>**Gemma**

</td><td>Google DeepMind / Google

</td><td>z. B. 2B, 4B, 12B, 27B, Gemma-4-Varianten

</td><td>Ja

</td><td>kleine Modelle lokal gut einsetzbar; größere Varianten benötigen mehr Speicher

</td><td>mittel bis hoch

</td><td>allgemeine Nutzung, Reasoning, teils multimodal

</td></tr><tr><td>**Mistral**

</td><td>Mistral AI

</td><td>z. B. 7B, Small, Large, Mixtral, Devstral, Magistral

</td><td>Teilweise

</td><td>offene kleinere Modelle lokal gut nutzbar; große Varianten eher nicht

</td><td>hoch

</td><td>Allround, Coding, Reasoning

</td></tr><tr><td>**Phi**

</td><td>Microsoft

</td><td>z. B. Mini-, Multimodal- und Reasoning-Varianten

</td><td>Ja

</td><td>meist vergleichsweise ressourcenschonend

</td><td>mittel bis hoch

</td><td>effiziente lokale Nutzung, kompakte Modelle

</td></tr><tr><td>**GPT / o-Serie**

</td><td>OpenAI

</td><td>z. B. GPT-4.x, mini, nano, o-Modelle

</td><td>in der Regel nein

</td><td>primär Cloud-/API-Nutzung

</td><td>sehr hoch

</td><td>allgemeine Nutzung, Reasoning, Produktivbetrieb

</td></tr><tr><td>**Claude**

</td><td>Anthropic

</td><td>Haiku, Sonnet, Opus

</td><td>in der Regel nein

</td><td>primär Cloud-/API-Nutzung

</td><td>hoch

</td><td>Sprachverständnis, Analyse, Assistenz

</td></tr><tr><td>**Gemini**

</td><td>Google

</td><td>Flash, Pro

</td><td>in der Regel nein

</td><td>primär Cloud-/API-Nutzung

</td><td>hoch

</td><td>allgemeine Nutzung, multimodale Verarbeitung

</td></tr><tr><td>**Grok**

</td><td>xAI

</td><td>verschiedene Grok-Varianten

</td><td>in der Regel nein

</td><td>primär Cloud-/API-Nutzung

</td><td>mittel

</td><td>allgemeine Nutzung, Echtzeit-/Plattformintegration

</td></tr><tr><td>**Command / Aya**

</td><td>Cohere

</td><td>Command, Aya

</td><td>eher nein

</td><td>primär API-/Unternehmensnutzung

</td><td>mittel

</td><td>Enterprise, RAG, mehrsprachige Anwendungen

</td></tr></tbody></table>

---

## Einordnung der Größenangaben

### <span style="white-space: pre-wrap;">Bedeutung von </span>`<span class="editor-theme-code">B</span>`

<span style="white-space: pre-wrap;">Das Kürzel </span>**B**<span style="white-space: pre-wrap;"> steht in der Regel für </span>**Billion**<span style="white-space: pre-wrap;">, also </span>**Milliarden Parameter**.

Beispiele:

- **7B**<span style="white-space: pre-wrap;"> = 7 Milliarden Parameter</span>
- **14B**<span style="white-space: pre-wrap;"> = 14 Milliarden Parameter</span>
- **70B**<span style="white-space: pre-wrap;"> = 70 Milliarden Parameter</span>

Grundsätzlich gilt:

- kleinere B-Werte = geringerer Ressourcenbedarf
- größere B-Werte = tendenziell höhere Leistungsfähigkeit, aber auch höherer Speicherbedarf

### <span style="white-space: pre-wrap;">Bedeutung von Angaben wie </span>`<span class="editor-theme-code">A4B</span>`

<span style="white-space: pre-wrap;">Zusätze wie </span>**A4B**<span style="white-space: pre-wrap;"> oder ähnliche Schreibweisen kommen häufig bei </span>**Mixture-of-Experts-Modellen (MoE)**<span style="white-space: pre-wrap;"> vor.</span>

Dabei gilt typischerweise:

- <span style="white-space: pre-wrap;">die erste Größenangabe beschreibt die </span>**Gesamtgröße des Modells**
- <span style="white-space: pre-wrap;">die A-Angabe beschreibt die </span>**aktiv genutzten Parameter pro Verarbeitungsschritt**

Beispiel:

- **26B A4B**<span style="white-space: pre-wrap;"> = Modell mit 26 Milliarden Parametern insgesamt, davon sind pro Schritt etwa 4 Milliarden aktiv</span>

Wichtig ist dabei:

- <span style="white-space: pre-wrap;">auch wenn nur ein Teil aktiv genutzt wird, muss lokal oft </span>**das gesamte Modell geladen werden**
- dadurch kann der Speicherbedarf weiterhin hoch bleiben

---

## Typische Zusatzbezeichnungen

<table id="bkmrk-k%C3%BCrzel-%2F-begriff%C3%9Cbli"><colgroup><col></col><col></col></colgroup><tbody><tr><th>Kürzel / Begriff

</th><th>Übliche Bedeutung

</th></tr><tr><td>**B**

</td><td>Milliarden Parameter

</td></tr><tr><td>**AxxB**

</td><td>aktivierte Milliarden Parameter, häufig bei MoE

</td></tr><tr><td>**MoE**

</td><td>Mixture of Experts

</td></tr><tr><td>**mini / nano / small / flash / fast**

</td><td>kleinere, schnellere oder günstigere Variante

</td></tr><tr><td>**pro / large / opus / ultra / heavy**

</td><td>leistungsstärkere Variante

</td></tr><tr><td>**reasoning / thinking**

</td><td>auf mehrstufiges Denken oder Problemlösen optimiert

</td></tr><tr><td>**vision**

</td><td>Bildverarbeitung möglich

</td></tr><tr><td>**multimodal**

</td><td>Verarbeitung mehrerer Eingabetypen, z. B. Text und Bild

</td></tr><tr><td>**instruct / IT**

</td><td>für Anweisungen bzw. Chatnutzung optimiert

</td></tr><tr><td>**preview**

</td><td>Vorabversion

</td></tr><tr><td>**turbo**

</td><td>meist auf Geschwindigkeit optimiert, jedoch nicht einheitlich definiert

</td></tr></tbody></table>

---

## Grobe Einschätzung lokaler Anforderungen

Die folgende Übersicht dient als praxisnahe Orientierung für lokale Nutzung, etwa mit Ollama oder vergleichbaren Laufzeitumgebungen:

<table id="bkmrk-modellgr%C3%B6%C3%9Fegrobe-ein"><colgroup><col></col><col></col></colgroup><tbody><tr><th>Modellgröße

</th><th>Grobe Einschätzung

</th></tr><tr><td>**1B bis 4B**

</td><td>leicht lokal nutzbar

</td></tr><tr><td>**7B bis 8B**

</td><td>gut lokal nutzbar

</td></tr><tr><td>**12B bis 14B**

</td><td>mittlere Anforderungen

</td></tr><tr><td>**26B bis 32B**

</td><td>hohe Anforderungen

</td></tr><tr><td>**70B und größer**

</td><td>meist nur mit leistungsstarker Hardware sinnvoll

</td></tr><tr><td>**MoE-Modelle**

</td><td>abhängig von Gesamtgröße und aktivem Anteil; Speicherbedarf kann trotz Effizienz hoch bleiben

</td></tr></tbody></table>

---

## Verbreitung der Modellfamilien

Die Verbreitung lässt sich nur grob einordnen, da keine einheitlichen Vergleichswerte über alle Anbieter hinweg vorliegen.

### Sehr stark verbreitet

- Llama
- Qwen
- DeepSeek
- GPT

### Stark verbreitet

- Claude
- Gemini
- Mistral
- Gemma

### Mittel bis stark verbreitet

- Phi
- Cohere Command / Aya
- Grok

---

## Typische Fokusse nach Modellfamilie

<table id="bkmrk-modellfamilietypisch"><colgroup><col></col><col></col></colgroup><tbody><tr><th>Modellfamilie

</th><th>Typischer Schwerpunkt

</th></tr><tr><td>**Llama**

</td><td>allgemeine lokale Nutzung, Allround

</td></tr><tr><td>**Qwen**

</td><td>multilingual, Coding, Reasoning

</td></tr><tr><td>**DeepSeek**

</td><td>Reasoning, Analyse

</td></tr><tr><td>**Gemma**

</td><td>allgemeine Nutzung, effiziente moderne Open-Modelle

</td></tr><tr><td>**Mistral**

</td><td>Allround, teils Coding und Reasoning

</td></tr><tr><td>**Phi**

</td><td>kompakte, effiziente Modelle

</td></tr><tr><td>**GPT**

</td><td>allgemeine Nutzung, starke Cloud-Modelle

</td></tr><tr><td>**Claude**

</td><td>Sprachverständnis, Analyse, Assistenz

</td></tr><tr><td>**Gemini**

</td><td>multimodal, allgemeine Nutzung

</td></tr><tr><td>**Grok**

</td><td>plattformnahe Assistenz, allgemeine Nutzung

</td></tr><tr><td>**Command / Aya**

</td><td>Enterprise, RAG, Mehrsprachigkeit

</td></tr></tbody></table>

---

## Aktuelle Hauptversionen gängiger Modellfamilien

**Stand: 21. April 2026**

<table id="bkmrk-modellfamilieaktuell"><colgroup><col></col><col></col><col></col></colgroup><tbody><tr><th>Modellfamilie

</th><th>Aktuelle Hauptversion / aktuelle Linie

</th><th>Typische aktuelle Varianten

</th></tr><tr><td>**OpenAI GPT / o-Serie**

</td><td>**GPT-5.4** <span style="white-space: pre-wrap;"> als aktuelle Frontier-Modelllinie; zusätzlich </span>

**GPT-5.4-mini** <span style="white-space: pre-wrap;"> und </span>

**GPT-5.4-nano**<span style="white-space: pre-wrap;">. Die ältere Reasoning-Linie </span>

**o3 / o4-mini**<span style="white-space: pre-wrap;"> ist weiterhin dokumentiert, wird aber in den OpenAI-Modellseiten teils bereits als abgelöst eingeordnet. (</span>[OpenAI Entwickler](https://developers.openai.com/api/docs/models?utm_source=chatgpt.com "Models | OpenAI API"))

</td><td>GPT-5.4, GPT-5.4-mini, GPT-5.4-nano, o3, o4-mini

</td></tr><tr><td>**Claude**

</td><td>**Claude 4.7** <span style="white-space: pre-wrap;"> ist aktuell die neueste genannte Generation; Anthropic hebt insbesondere </span>

**Claude Opus 4.7**<span style="white-space: pre-wrap;"> hervor. In den Modelllinien bleiben außerdem </span>**Sonnet** <span style="white-space: pre-wrap;">und </span>**Haiku**

<span style="white-space: pre-wrap;"> als Klassen relevant. (</span>[Claude API Docs](https://docs.anthropic.com/ru/release-notes/claude-apps?utm_source=chatgpt.com "Release notes | Claude Help Center"))

</td><td>Opus 4.7, Sonnet 4.5+, Haiku 4.5+

</td></tr><tr><td>**Gemini**

</td><td>**Gemini 3.1 Pro**<span style="white-space: pre-wrap;"> ist aktuell die neueste hervorgehobene Pro-Generation in den Gemini-API-Modellseiten. Zusätzlich werden </span>

**Gemini 3 Flash**<span style="white-space: pre-wrap;"> und </span>**Gemini 3.1 Flash-Lite** <span style="white-space: pre-wrap;"> geführt. Parallel ist </span>**Gemini 2.5 Pro**

<span style="white-space: pre-wrap;"> weiterhin dokumentiert. (</span>[Google AI for Developers](https://ai.google.dev/gemini-api/docs/models?utm_source=chatgpt.com "Models | Gemini API - Google AI for Developers"))

</td><td>Gemini 3.1 Pro, Gemini 3 Flash, Gemini 3.1 Flash-Lite, Gemini 2.5 Pro

</td></tr><tr><td>**Gemma**

</td><td>**Gemma 4**<span style="white-space: pre-wrap;"> ist die aktuelle Hauptgeneration. Google listet für diese Generation die Größen </span>**E2B,**<span style="white-space: pre-wrap;"> </span>**E4B**,**31B**<span style="white-space: pre-wrap;"> und </span>**26B A4B**. ([Google AI for Developers](https://ai.google.dev/gemma/docs/releases?utm_source=chatgpt.com "Gemma releases | Google AI for Developers"))

</td><td>Gemma 4 E2B, E4B, 31B, 26B A4B

</td></tr><tr><td>**Llama**

</td><td>**Llama 4**<span style="white-space: pre-wrap;"> ist die aktuelle Hauptgeneration. Meta nennt derzeit insbesondere </span>

**Llama 4 Scout**<span style="white-space: pre-wrap;"> und </span>**Llama 4 Maverick**<span style="white-space: pre-wrap;"> als veröffentlichte Modelle. (</span>[ai.meta.com](https://ai.meta.com/blog/llama-4-multimodal-intelligence/?utm_source=chatgpt.com "The Llama 4 herd: The beginning of a new era of natively ..."))

</td><td>Llama 4 Scout, Llama 4 Maverick

</td></tr><tr><td>**Mistral**

</td><td><span style="white-space: pre-wrap;">Bei Mistral ist die aktuelle Hauptlinie breit aufgefächert. In den Modellübersichten werden besonders </span>**Mistral Large 3**<span style="white-space: pre-wrap;">, </span>**Devstral 2**<span style="white-space: pre-wrap;"> und </span>**Mistral Medium 3.1**

<span style="white-space: pre-wrap;"> als aktuelle Featured-Modelle hervorgehoben. (</span>[Mistral AI](https://mistral.ai/models?utm_source=chatgpt.com "Models - from cloud to edge"))

</td><td>Mistral Large 3, Devstral 2, Mistral Medium 3.1

</td></tr><tr><td>**Qwen**

</td><td>**Qwen3** <span style="white-space: pre-wrap;"> ist die aktuelle Hauptgeneration der allgemeinen Qwen-Familie. Daneben existiert mit </span>**Qwen3-Coder**<span style="white-space: pre-wrap;"> eine spezialisierte Coding-Linie. (</span>[Qwen](https://qwenlm.github.io/blog/qwen3/?utm_source=chatgpt.com "Qwen3: Think Deeper, Act Faster"))

</td><td>Qwen3-0.6B bis 32B, Qwen3-30B-A3B, Qwen3-235B-A22B, Qwen3-Coder

</td></tr><tr><td>**DeepSeek**

</td><td>**DeepSeek-V3.2**<span style="white-space: pre-wrap;"> ist die aktuelle allgemeine Hauptlinie laut DeepSeek. Zusätzlich wird </span>

**DeepSeek-V3.2-Speciale** <span style="white-space: pre-wrap;"> genannt. In der Praxis bleibt auch </span>**DeepSeek-R1**<span style="white-space: pre-wrap;"> als Reasoning-Linie sehr relevant. (</span>[DeepSeek](https://www.deepseek.com/en/?utm_source=chatgpt.com "DeepSeek"))

</td><td>DeepSeek-V3.2, DeepSeek-V3.2-Speciale, DeepSeek-R1

</td></tr><tr><td>**Phi**

</td><td>**Phi-4**

<span style="white-space: pre-wrap;"> wird von Microsoft als aktuelle Hauptgeneration der Phi-Familie hervorgehoben. (</span>

[Microsoft Azure](https://azure.microsoft.com/en-us/products/phi?utm_source=chatgpt.com "Phi Open Models - Small Language Models")

)

</td><td>Phi-4, Phi-4-mini, weitere spezialisierte Phi-4-Varianten je Plattform

</td></tr><tr><td>**Grok**

</td><td>**Grok 4.1**

<span style="white-space: pre-wrap;"> ist aktuell die neueste genannte Hauptversion in den xAI-News; zuvor wurde </span>

**Grok 4**

<span style="white-space: pre-wrap;"> eingeführt. (</span>

[xAI](https://x.ai/news/grok-4-1?utm_source=chatgpt.com "Grok 4.1")

)

</td><td>Grok 4.1, Grok 4 Heavy, Grok Code Fast 1

</td></tr><tr><td>**Command / Aya**

</td><td><span style="white-space: pre-wrap;">Bei Cohere ist </span>

**Command A**

<span style="white-space: pre-wrap;"> die aktuelle zentrale Hauptlinie; zusätzlich gibt es spezialisierte Varianten wie </span>

**Command A Reasoning**

<span style="white-space: pre-wrap;"> und </span>

**Command A Vision**

<span style="white-space: pre-wrap;">. </span>

**Aya**

<span style="white-space: pre-wrap;"> bleibt die mehrsprachige Modellfamilie. (</span>

[Cohere](https://cohere.com/command?utm_source=chatgpt.com "Cohere Command Models: AI-Powered Solutions for ...")

)

</td><td>Command A, Command A Reasoning, Command A Vision, Aya

</td></tr></tbody></table>

---

## DSGVO-Einordnung beim Einsatz von KI-Modellen

<table id="bkmrk-einsatzszenariobeisp"><colgroup><col></col><col></col><col style="width: 216px;"></col><col></col><col style="width: 90px;"></col></colgroup><tbody><tr><th>Einsatzszenario

</th><th>Beispiel

</th><th>DSGVO-Einordnung

</th><th>Typische Prüfpunkte

</th><th>Risikoniveau

</th></tr><tr><td>**Rein lokal, offline**

</td><td>Modell läuft auf eigenem Rechner oder internem Server ohne externe Datenübertragung

</td><td><span style="white-space: pre-wrap;">Datenschutzrechtlich meist </span>

**am einfachsten**

<span style="white-space: pre-wrap;"> zu bewerten, weil keine automatische Übermittlung an einen externen KI-Anbieter erfolgt. Die DSGVO bleibt dennoch anwendbar, sobald personenbezogene Daten verarbeitet werden. (</span>

[EDPB](https://www.edpb.europa.eu/news/news/2024/edpb-opinion-ai-models-gdpr-principles-support-responsible-ai_en?utm_source=chatgpt.com "EDPB opinion on AI models: GDPR principles support ...")

)

</td><td>Rechtsgrundlage, Zweckbindung, Zugriffskontrolle, Protokollierung, Löschkonzept, Berechtigungskonzept

</td><td>**Niedrig bis mittel**

</td></tr><tr><td>**Lokal im Unternehmensnetz, mit mehreren Nutzern**

</td><td>Interner KI-Server für Mitarbeitende

</td><td>Ebenfalls vergleichsweise günstig, aber organisatorisch anspruchsvoller als Einzelnutzung. Es sind interne Rollen, Berechtigungen und Schutzmaßnahmen sauber zu regeln. (

[CNIL](https://www.cnil.fr/en/ai-system-development-cnils-recommendations-to-comply-gdpr?utm_source=chatgpt.com "AI system development: CNIL's recommendations to ...")

)

</td><td>Rollen und Verantwortlichkeiten, TOMs, Zugriffstrennung, Logging, Datenschutzinformationen, interne Richtlinien

</td><td>**Mittel**

</td></tr><tr><td>**Selbst gehostet in eigenem Rechenzentrum oder bei EU-Hoster**

</td><td>Eigene KI-Anwendung auf VPS oder dediziertem Server in der EU

</td><td>Häufig gut beherrschbar, sofern Hosting, Fernzugriffe und Administratorenzugänge sauber geregelt sind. Auch bei EU-Hosting sind Verträge und technische Maßnahmen erforderlich. (

[CNIL](https://www.cnil.fr/en/ai-system-development-cnils-recommendations-to-comply-gdpr?utm_source=chatgpt.com "AI system development: CNIL's recommendations to ...")

)

</td><td>AV-Vertrag, Serverstandort, Admin-Zugriffe, Verschlüsselung, Backups, Löschung, Incident-Prozesse

</td><td>**Mittel**

</td></tr><tr><td>**Externe API / Cloud innerhalb der EU**

</td><td>KI-Dienst mit Verarbeitung in der EU

</td><td>DSGVO-relevant und regelmäßig prüfungsbedürftig. EU-Standort erleichtert die Bewertung, ersetzt aber keine Prüfung von Rechtsgrundlage, Transparenz und Verträgen. (

[EDPB](https://www.edpb.europa.eu/news/news/2024/edpb-opinion-ai-models-gdpr-principles-support-responsible-ai_en?utm_source=chatgpt.com "EDPB opinion on AI models: GDPR principles support ...")

)

</td><td>Anbieterrolle, AV-Vertrag oder Rollenabgrenzung, Zweckbindung, Datennutzung durch Anbieter, Speicherfristen, Betroffenenrechte

</td><td>**Mittel bis hoch**

</td></tr><tr><td>**Externe API / Cloud mit Drittlandtransfer**

</td><td>US- oder sonstiger Nicht-EU-Anbieter

</td><td><span style="white-space: pre-wrap;">Regelmäßig </span>

**prüfungsintensiver**

, weil zusätzlich Fragen zu internationaler Datenübermittlung, Schutzmechanismen und Anbieterzugriffen zu klären sind. Für US-Anbieter kann das EU-US Data Privacy Framework relevant sein, sofern der konkrete Empfänger darunter fällt. (

[European Commission](https://ec.europa.eu/commission/presscorner/detail/en/ip_23_3721?utm_source=chatgpt.com "Adequacy decision for safe EU-US data flows")

)

</td><td>Drittlandtransfer, Zertifizierung/Transfermechanismus, Vertragslage, Subprozessoren, Transparenz, Datennutzung für Training oder Verbesserung

</td><td>**Hoch**

</td></tr><tr><td>**Nutzung mit anonymisierten oder wirksam pseudonymisierten Daten**

</td><td>Vorverarbeitete Fälle ohne direkte Personenbeziehbarkeit

</td><td>Kann die datenschutzrechtlichen Risiken deutlich senken. Ob Daten oder sogar ein Modell als anonym gelten, ist jedoch im Einzelfall zu prüfen; die EDPB behandelt diese Frage ausdrücklich als fallbezogene Bewertung. (

[EDPB](https://www.edpb.europa.eu/news/news/2024/edpb-opinion-ai-models-gdpr-principles-support-responsible-ai_en?utm_source=chatgpt.com "EDPB opinion on AI models: GDPR principles support ...")

)

</td><td>Qualität der Anonymisierung/Pseudonymisierung, Re-Identifikationsrisiko, Trennung von Zusatzwissen, Zugriffskonzepte

</td><td>**Niedrig bis mittel**

</td></tr><tr><td>**Nutzung mit sensiblen Daten**

</td><td>Gesundheitsdaten, Sozialdaten, Beschäftigtendaten, besondere Kategorien

</td><td>Besonders kritisch. Hier steigen die Anforderungen an Rechtsgrundlage, Schutzmaßnahmen, Zugriffsbeschränkungen und Dokumentation deutlich. (

[CNIL](https://www.cnil.fr/en/ai-system-development-cnils-recommendations-to-comply-gdpr?utm_source=chatgpt.com "AI system development: CNIL's recommendations to ...")

)

</td><td>Art. 9 DSGVO, Erforderlichkeit, Datensparsamkeit, Schutzbedarf, DPIA, Zugriffstrennung, Verschlüs

</td><td></td></tr></tbody></table>

## DSGVO-Einordnung nach Modellfamilie

> **Hinweis:**<span style="white-space: pre-wrap;"> Diese Übersicht ist eine </span>**praxisnahe Orientierung**<span style="white-space: pre-wrap;"> für Dokumentationszwecke und </span>**keine Rechtsberatung**. Maßgeblich ist immer der konkrete Einsatz: lokal, selbst gehostet, über API/Cloud, mit oder ohne personenbezogene Daten. Die EDPB hat klargestellt, dass die DSGVO auch für KI-Modelle gilt. ([Anthropic](https://www.anthropic.com/transparency?utm_source=chatgpt.com "Anthropic's Transparency Hub"))

<table id="bkmrk-modellfamilietypisch-1"><colgroup><col style="width: 73px;"></col><col style="width: 112px;"></col><col style="width: 112px;"></col><col></col><col></col></colgroup><tbody><tr><th>Modellfamilie

</th><th>Typischer Betriebsmodus

</th><th>DSGVO-Tendenz

</th><th>Modellbezug / praktische Einordnung

</th><th>Prüfschwerpunkt

</th></tr><tr><td>**Llama**

</td><td><span style="white-space: pre-wrap;">häufig </span>

**lokal / self-hosted**

, da offen herunterladbar und „deploy anywhere“ beworben

</td><td>**günstig bis mittel**

, wenn lokal betrieben

</td><td><span style="white-space: pre-wrap;">Für Llama ist der DSGVO-Vorteil vor allem der </span>

**lokale oder eigene Betrieb**

: Meta stellt die Modelle zum Download bereit und beschreibt sie als überall deploybar. Dadurch kann eine externe Übermittlung an einen Modellanbieter oft vermieden werden. (

[llama.com](https://www.llama.com/?utm_source=chatgpt.com "Llama: Industry Leading, Open-Source AI")

)

</td><td>Serverstandort, interne Zugriffe, Logging, Löschung, keine unnötige Cloud-Anbindung

</td></tr><tr><td>**Gemma**

</td><td><span style="white-space: pre-wrap;">häufig </span>

**lokal / self-hosted**

</td><td>**günstig bis mittel**

, wenn lokal betrieben

</td><td><span style="white-space: pre-wrap;">Gemma ist als offene Modellfamilie für lokale Nutzung relevant. Datenschutzrechtlich ist sie daher typischerweise </span>

**einfacher**

<span style="white-space: pre-wrap;"> als reine Cloud-Modelle, sofern keine personenbezogenen Daten an externe Dienste fließen. Die DSGVO-Frage hängt hier eher am Hosting als am Modellnamen. (</span>

[Anthropic](https://www.anthropic.com/transparency?utm_source=chatgpt.com "Anthropic's Transparency Hub")

)

</td><td>Lokale Verarbeitung, Zugriffskonzepte, Datenminimierung

</td></tr><tr><td>**Mistral**

</td><td>**hybrid**

: Cloud, private Cloud, VPC, on-prem

</td><td>**mittel**

, bei on-prem günstiger

</td><td><span style="white-space: pre-wrap;">Mistral bewirbt ausdrücklich </span>

**private Deployments**

, VPC- und On-Prem-Optionen sowie „your data stays within your walls“. Dadurch ist Mistral aus DSGVO-Sicht oft flexibler als reine SaaS-Modelle. Zusätzlich gibt es ein DPA. (

[Mistral AI](https://mistral.ai/?utm_source=chatgpt.com "Mistral AI: Frontier AI LLMs, assistants, agents, services")

)

</td><td>AV-Vertrag, Hosting-Variante, Admin-Zugriffe, Datenfluss zwischen Cloud und On-Prem

</td></tr><tr><td>**Phi**

</td><td><span style="white-space: pre-wrap;">oft </span>

**lokal**

, alternativ Azure-/Microsoft-Umfeld

</td><td>**günstig bis mittel**

, je nach Hosting

</td><td>Phi ist als kleine Modellfamilie gut für lokale Nutzung geeignet; Microsoft positioniert Phi zudem unter dem Aspekt „privacy and security“. Datenschutzrechtlich ist lokal am einfachsten, bei Azure-Betrieb kommt die übliche Cloud-/Vertragsprüfung hinzu. (

[Microsoft Azure](https://azure.microsoft.com/en-us/products/phi?utm_source=chatgpt.com "Phi Open Models - Small Language Models")

)

</td><td>Lokal vs. Azure, Verträge, Region, Speicherort

</td></tr><tr><td>**Qwen**

</td><td><span style="white-space: pre-wrap;">sowohl </span>

**lokal**

<span style="white-space: pre-wrap;"> als auch </span>

**Cloud/API**

</td><td>**lokal günstiger**

<span style="white-space: pre-wrap;">, Cloud </span>

**mittel bis hoch**

</td><td><span style="white-space: pre-wrap;">Qwen ist als Modellfamilie lokal nutzbar, hat aber auch einen eigenen API-/Cloud-Zugang. Für die DSGVO ist deshalb wichtig, </span>

**welcher Weg genutzt wird**

. Bei lokaler Nutzung ist die Bewertung deutlich einfacher als bei Verarbeitung über die Qwen-Cloud. (

[qwen.ai](https://qwen.ai/apiplatform?utm_source=chatgpt.com "Qwen API")

)

</td><td>Ob lokal oder API, Anbieterrolle, Übermittlung, vertragliche Einbindung

</td></tr><tr><td>**DeepSeek**

</td><td><span style="white-space: pre-wrap;">sowohl </span>

**lokal**

<span style="white-space: pre-wrap;"> als auch </span>

**Cloud/API**

</td><td>**lokal klar günstiger**

<span style="white-space: pre-wrap;">, Cloud </span>

**hoch**

</td><td><span style="white-space: pre-wrap;">Bei DeepSeek ist der Modellbezug besonders wichtig: Die Modelle können lokal laufen, aber die DeepSeek-Privacy-Policy sagt ausdrücklich, dass personenbezogene Daten zur Diensterbringung </span>

**in der Volksrepublik China verarbeitet und gespeichert**

<span style="white-space: pre-wrap;"> werden können. Für personenbezogene Daten ist deshalb der </span>

**lokale Betrieb**

<span style="white-space: pre-wrap;"> deutlich günstiger. (</span>

[cdn.deepseek.com](https://cdn.deepseek.com/policies/en-US/deepseek-privacy-policy.html?utm_source=chatgpt.com "DeepSeek Privacy Policy")

)

</td><td>Drittlandtransfer, Speicherort China, sensible Daten vermeiden, möglichst self-hosted

</td></tr><tr><td>**GPT / o-Serie**

</td><td><span style="white-space: pre-wrap;">typischerweise </span>

**Cloud/API**

</td><td>**mittel bis hoch**

</td><td><span style="white-space: pre-wrap;">OpenAI ist klar cloud-orientiert. Positiv ist: Für Business-Angebote gibt es ein DPA; für Kunden im EWR/der Schweiz wird dieses mit </span>

**OpenAI Ireland Ltd.**

<span style="white-space: pre-wrap;"> geschlossen. OpenAI erklärt außerdem, dass </span>

**Business-Daten standardmäßig nicht zum Training verwendet werden**

. Trotzdem bleibt Cloud-Verarbeitung DSGVO-prüfungsintensiv. (

[OpenAI](https://openai.com/policies/data-processing-addendum/?utm_source=chatgpt.com "OpenAI Data Processing Addendum")

)

</td><td>Rechtsgrundlage, AV/DPA, Anbieterrolle, Transfermechanismus, Speicher- und Löschregeln

</td></tr><tr><td>**Claude**

</td><td><span style="white-space: pre-wrap;">typischerweise </span>

**Cloud/API**

</td><td>**mittel bis hoch**

</td><td><span style="white-space: pre-wrap;">Claude ist primär ein Cloud-Modell. Bei Anthropic ist relevant, dass es für Consumer-Nutzung eine </span>

**Opt-in-Logik**

<span style="white-space: pre-wrap;"> zur Datennutzung für Trainings-/Verbesserungszwecke gibt; zugleich verweist Anthropic für Unternehmen auf Trust-/Compliance-Unterlagen. Für DSGVO-Zwecke ist Claude daher vor allem als </span>

**vertrags- und plattformabhängiges Cloud-Modell**

<span style="white-space: pre-wrap;"> zu prüfen. (</span>

[Anthropic](https://www.anthropic.com/news/updates-to-our-consumer-terms?utm_source=chatgpt.com "Updates to Consumer Terms and Privacy Policy")

)

</td><td>Consumer vs. Business trennen, Opt-in/Datennutzung, Verträge, Speicherort

</td></tr><tr><td>**Gemini**

</td><td><span style="white-space: pre-wrap;">typischerweise </span>

**Cloud/API**

</td><td>**mittel bis hoch**

</td><td><span style="white-space: pre-wrap;">Bei Gemini ist die Unterscheidung zwischen </span>

**unpaid**

<span style="white-space: pre-wrap;"> und </span>

**paid tiers**

<span style="white-space: pre-wrap;"> besonders relevant: Google weist für Unpaid Services darauf hin, dass Eingaben/Ausgaben von Menschen geprüft und zur Produktverbesserung genutzt werden können und dass </span>

**keine sensiblen, vertraulichen oder personenbezogenen Daten**

<span style="white-space: pre-wrap;"> eingereicht werden sollen. Für Paid Tiers heißt es, dass Prompts/Responses </span>

**nicht**

<span style="white-space: pre-wrap;"> zur Produktverbesserung genutzt werden. (</span>

[Google AI for Developers](https://ai.google.dev/gemini-api/terms?utm_source=chatgpt.com "Gemini API Additional Terms of Service")

)

</td><td>Tarifmodell, Datennutzung zur Verbesserung, Human Review, sensible Daten nur in geeignetem Vertragsrahmen

</td></tr><tr><td>**Grok**

</td><td><span style="white-space: pre-wrap;">typischerweise </span>

**Cloud/API**

</td><td>**hoch**

</td><td>Grok ist derzeit im Kern ein cloudbasiertes Modellangebot. Für DSGVO-Zwecke ist es daher ähnlich wie andere Cloud-Modelle zu behandeln: rechtliche Grundlage, Datenfluss, Empfänger, Speicherort und Nutzungsbedingungen sind vor produktivem Einsatz mit personenbezogenen Daten zu prüfen. (

[Anthropic](https://www.anthropic.com/transparency?utm_source=chatgpt.com "Anthropic's Transparency Hub")

)

</td><td>Vertragslage, Speicherort, Empfänger, Drittlandtransfer

</td></tr><tr><td>**Command / Aya (Cohere)**

</td><td><span style="white-space: pre-wrap;">typischerweise </span>

**API/Enterprise**<span style="white-space: pre-wrap;">, teils </span>**private deployment**

</td><td>**mittel**, bei Private Deployment günstiger

</td><td><span style="white-space: pre-wrap;">Cohere ist für DSGVO-Zwecke relativ interessant, weil das Unternehmen sowohl </span>

**DPA**

<span style="white-space: pre-wrap;">, </span>

**Zero Data Retention**

<span style="white-space: pre-wrap;"> für Enterprise-Fälle als auch </span>

**private deployment options**

<span style="white-space: pre-wrap;"> nennt. In der Privacy Policy steht zugleich, dass Trial-/Research-Umgebungen </span>

**nicht**

<span style="white-space: pre-wrap;"> für personenbezogene Daten gedacht sind. (</span>

[Cohere](https://cohere.com/privacy?utm_source=chatgpt.com "Cohere Privacy Policy")

)

</td><td>Produktstufe prüfen, DPA anfordern, ZDR/Retention, Private Deployment bevorzugen

</td></tr></tbody></table>

## Kurztext für unter die Tabelle

> **Einordnung:**  
> <span style="white-space: pre-wrap;">Der DSGVO-Bezug hängt bei KI-Modellen nicht nur am Hersteller, sondern stark am </span>**typischen Betriebsmodus**<span style="white-space: pre-wrap;"> der jeweiligen Modellfamilie. </span>**Open-weight-Modelle**<span style="white-space: pre-wrap;"> wie Llama, Gemma oder oft auch Qwen/DeepSeek/Mistral können lokal oder selbst gehostet betrieben werden und sind deshalb datenschutzrechtlich häufig günstiger zu bewerten. </span>**Cloud-first-Modelle**<span style="white-space: pre-wrap;"> wie GPT, Claude, Gemini oder Grok erfordern regelmäßig eine vertiefte Prüfung von Rechtsgrundlage, Vertragslage, Speicherort, möglichem Drittlandtransfer und Datenverwendung durch den Anbieter. (</span>[Anthropic](https://www.anthropic.com/transparency?utm_source=chatgpt.com "Anthropic's Transparency Hub"))

## Noch kürzere Fassung

<table id="bkmrk-gruppedsgvo-tendenzt"><colgroup><col></col><col></col><col></col></colgroup><tbody><tr><th>Gruppe

</th><th>DSGVO-Tendenz

</th><th>Typische Modelle

</th></tr><tr><td>**Open-weight / lokal betreibbar**

</td><td>meist günstiger

</td><td>Llama, Gemma, Phi, oft Qwen, DeepSeek, Mistral (

[llama.com](https://www.llama.com/?utm_source=chatgpt.com "Llama: Industry Leading, Open-Source AI")

)

</td></tr><tr><td>**Cloud-first / API-zentriert**

</td><td>meist prüfungsintensiver

</td><td>GPT, Claude, Gemini, Grok, Command (

[OpenAI](https://openai.com/policies/data-processing-addendum/?utm_source=chatgpt.com "OpenAI Data Processing Addendum")

)

</td></tr></tbody></table>

---

## Zusammenfassung

Zur schnellen Einordnung kann folgende Struktur verwendet werden:

**\[Familie\] + \[Version\] + \[Größe\] + \[Spezialisierung\]**

Beispiele:

- **Gemma 4 27B IT**
- **Qwen3 14B**
- **DeepSeek R1**
- **Claude Sonnet**
- **GPT-4.1 mini**

Dabei gilt:

- **Familie**<span style="white-space: pre-wrap;"> = Modellreihe</span>
- **Version**<span style="white-space: pre-wrap;"> = Generation oder Entwicklungsstand</span>
- **Größe**<span style="white-space: pre-wrap;"> = Parameteranzahl</span>
- **Spezialisierung**<span style="white-space: pre-wrap;"> = Einsatzschwerpunkt oder Optimierung</span>

---