Was Unternehmen bei Open-Source-KI beachten müssen – Ein umfassender Leitfaden für IT-Rechtsexperten und Datenschutzverantwortliche
Meta Llama ist anders als klassische Cloud-Services
Was Llama NICHT ist
Meta Llama ist kein Cloud-Service wie ChatGPT, Claude oder Grok. Es handelt sich um ein Open-Source-Modell, das Sie selbst hosten oder über Drittanbieter nutzen.
Wichtigste Konsequenz: Es gibt keinen klassischen Auftragsverarbeitungsvertrag (AV-Vertrag/DPA) mit Meta.
Was stattdessen gilt
Llama Community License Agreement – Custom-Lizenz mit spezifischen Einschränkungen (keine DPA)
Acceptable Use Policy – Nutzungsbedingungen, die bestimmte Anwendungen ausschließen
Sie sind selbst verantwortlich für DSGVO-Compliance beim Hosting
Zusätzlicher Rechtsrahmen: Der EU AI Act stellt seit August 2024 weitere Anforderungen, die bis 2027 phasenweise umgesetzt werden müssen. Dies betrifft insbesondere General Purpose AI Models (GPAI) wie Llama.
Zwei grundsätzliche Wege zur Llama-Nutzung
Option 1: Self-Hosting
On-Premise oder eigene Cloud
Modell-Download von Hugging Face oder llama.com
Hosting auf eigener Infrastruktur (eigene Server, AWS EC2, Azure VM, Google Compute)
DSGVO-Rolle: Sie sind alleiniger Verantwortlicher (Controller)
✓ Volle Datenkontrolle
✓ Keine Drittlandtransfers
✓ Kein AV-Vertrag mit Dritten
✗ Hoher technischer Aufwand
✗ Hardware-Kosten (GPUs erforderlich)
Option 2: Managed Services
Nutzung über Drittanbieter
Cloud-Provider hostet das Modell (AWS Bedrock, Azure AI, Google Vertex AI, Replicate, Together AI, Groq)
API-basierter Zugriff
DSGVO-Rolle: Sie = Verantwortlicher, Provider = Auftragsverarbeiter
✓ Einfache Integration
✓ Keine eigene Infrastruktur
✓ Skalierbar
✗ AV-Vertrag mit Provider erforderlich
✗ Möglicherweise Drittlandtransfer
Meta verarbeitet in beiden Fällen keine Daten für Sie. Meta stellt nur das Modell bereit. Prüfen Sie Ihre technischen Kapazitäten und Compliance-Anforderungen sorgfältig, bevor Sie sich für eine Option entscheiden.
Llama Community License: Zentrale Regelungen
Die Llama-Lizenz ist keine Open-Source-Lizenz im klassischen Sinne (nicht OSI-konform), sondern eine Custom-Lizenz mit spezifischen Einschränkungen.
✓ Erlaubt
Kommerzielle Nutzung (royalty-free)
Modifikation und Finetuning nach Bedarf
Redistribution mit Attribution
Eigentum an Derivative Works – Ihre angepassten Modelle gehören Ihnen
✗ Einschränkungen
700-Millionen-MAU-Grenze: Unternehmen mit mehr als 700 Mio. monatlich aktiven Nutzern (konzernweit aggregiert) benötigen separate Lizenz von Meta
EU-Verbot für multimodale Modelle: Llama 3.2, 3.3, 4 (Vision) dürfen von EU-Unternehmen NICHT direkt genutzt werden
Attribution-Pflicht: "Built with Llama" muss prominent angezeigt werden
Wichtig: Diese Lizenzbestimmungen sind Vertragsrecht, nicht Datenschutzrecht. Sie regeln die Nutzung des Modells, sagen aber nichts über DSGVO-Compliance aus.
Kritische Lizenz-Einschränkungen im Detail
1
700-Millionen-MAU-Grenze
Unternehmen mit mehr als 700 Millionen monatlich aktiven Nutzern benötigen eine separate Lizenz. MAU werden konzernweit aggregiert (inkl. Tochtergesellschaften, verbundene Unternehmen). Ein Konzern mit mehreren Apps (je 300 Mio. MAU) überschreitet die Grenze bereits.
Llama 3.2, 3.3, 4 (Vision/multimodal) dürfen von EU-Unternehmen NICHT genutzt werden. Dies gilt für Unternehmen mit Hauptsitz in der EU.
Llama 3, 3.1 (reine Text-Modelle) sind erlaubt
Workaround: Zugang über US-Cloud-Provider (AWS/Azure/Google), die EU-Vertriebslizenzen haben
3
Kein Training konkurrierender Modelle
Llama-Outputs dürfen nicht zum Training anderer Large Language Models verwendet werden (außer Llama-Derivate). Sie dürfen Llama-Antworten nicht nutzen, um GPT, Claude oder andere Modelle zu trainieren.
4
Acceptable Use Policy (AUP)
Keine illegalen oder schädlichen Anwendungen: Gewalt, Terrorismus, Kindesmissbrauch, Hate Speech, Betrug, Menschenhandel.
Wenn Sie Llama selbst hosten, sind Sie allein verantwortlich für die Einhaltung der DSGVO. Meta ist nicht involviert. Dies erfordert umfassende technische und organisatorische Maßnahmen.
01
Technische und organisatorische Maßnahmen (TOMs) nach Art. 32 DSGVO
Verschlüsselung: TLS 1.3 für Daten in Transit, AES-256 für Daten at Rest
Zugriffskontrollen: RBAC, MFA für Admin-Zugriff, Least-Privilege-Prinzip
Logging: Audit-Logs für alle Datenzugriffe, Monitoring auf Anomalien
Bei sensiblen Daten (Art. 9): Zusätzliche Rechtsgrundlage erforderlich
03
Datenschutzerklärung aktualisieren
Informieren Sie über KI-Nutzung, Zweck, Rechtsgrundlage, verarbeitete Daten, Speicherdauer, Empfänger und Betroffenenrechte.
04
Verzeichnis von Verarbeitungstätigkeiten (RoPA)
Dokumentieren Sie: Name der Verarbeitung, Verantwortlicher, Zweck, Kategorien Betroffener/Daten, Empfänger, Drittland, Löschfristen, TOMs.
05
Datenschutz-Folgenabschätzung (DSFA) nach Art. 35
Erforderlich bei: Sensiblen Daten, großem Umfang, automatisierten Entscheidungen mit Rechtswirkung, Profiling mit hohem Risiko.
Oft NICHT erforderlich bei: Reinem Text-Processing, gelegentlicher Nutzung, Self-Hosting in EU, anonymisierten Daten.
AV-Vertrag bei Managed Services
Wenn Sie Llama über einen Drittanbieter nutzen, gelten normale AV-Vertrags-Regeln wie bei jedem Cloud-Service. Sie brauchen einen DPA mit dem Hosting-Provider, NICHT mit Meta.
1
1. Provider auswählen
Prüfen Sie DSGVO-Konformität. EU-Hosting bevorzugen (keine Drittlandtransfers). Falls USA: SCCs und DSFA erforderlich.
2
2. Enterprise-Account
Business/Enterprise-Pläne haben meist automatisches DPA. Consumer-Pläne oft ohne DPA → nicht für geschäftliche Nutzung geeignet.
3
3. DPA aktivieren
Bei AWS/Azure/Google: DPA meist automatisch in Terms integriert. Bei kleineren Anbietern: Separates DPA-Dokument anfordern.
Microsoft Azure AI – Microsoft Product Terms + Microsoft DPA
Google Cloud Vertex AI – Google Cloud Platform Agreement + Google DPA
Replicate – Replicate Terms + DPA
Together AI – Together AI Terms + DPA
Groq – Groq Terms + DPA
Dokumentationspflichten
Datenschutzerklärung: "Wir nutzen Meta Llama über [Provider], einen Auftragsverarbeiter gemäß Art. 28 DSGVO mit Sitz in [Land]. Es besteht ein AV-Vertrag."
Meta Llama ist ein General Purpose AI Model (GPAI) und unterliegt den GPAI-Regeln des EU AI Act, die seit August 2025 in Kraft sind. Meta trägt als GPAI-Anbieter bestimmte Pflichten (technische Dokumentation, Transparenz, Copyright-Compliance). Als Nutzer/Deployer haben Sie eigene Anforderungen.
1
Seit Februar 2025: AI Literacy-Pflicht
Gilt für ALLE AI-Nutzer, nicht nur Hochrisiko: Mitarbeiter müssen im sicheren Umgang mit KI geschult werden. Themen: Funktionsweise, Risiken, Grenzen, rechtliche Anforderungen. Dokumentation der Schulungen erforderlich.
2
Seit August 2025: GPAI-Regeln
Meta's Verantwortung: Technische Dokumentation, Transparenz, Copyright-Compliance. Bei systemischen Risiken: Risikobewertung und Mitigation.
3
Ab August 2026: Hochrisiko-Anforderungen
Falls Ihre Anwendung als Hochrisiko gilt: Risikomanagementsystem, Data Governance, technische Dokumentation, Logging, Transparenz, Human Oversight, Konformitätsbewertung, EU-Datenbank-Registrierung.
Hochrisiko-Prüfung erforderlich: Prüfen Sie, ob Ihre Anwendung unter Annex III AI Act fällt (Biometrie, kritische Infrastruktur, Bildung, HR, Kreditvergabe, Strafverfolgung, Migration, Justiz).
Hochrisiko-Anforderungen nach EU AI Act
Falls Ihre Llama-Anwendung als Hochrisiko-System eingestuft wird (ab August 2026), müssen Sie umfangreiche Anforderungen erfüllen:
1
Risikomanagementsystem
Identifizierung und Bewertung von Risiken, kontinuierliches Monitoring, Dokumentation aller Maßnahmen.
2
Data Governance
Trainingsdaten müssen relevant, repräsentativ, fehlerfrei sein. Vermeidung von Bias und Diskriminierung. Datenschutz-Compliance sicherstellen.
Automatische Logs von Eingaben und Ausgaben. Rückverfolgbarkeit von Entscheidungen gewährleisten.
5
Transparenz
Nutzer müssen wissen, dass sie mit KI interagieren. Bereitstellung von Informationen über das System.
6
Human Oversight
Menschen können KI-Entscheidungen überstimmen. Notausschalter (Stop-Button). Kontinuierliches Monitoring.
7
Genauigkeit & Sicherheit
Systeme müssen zuverlässig und sicher sein. Schutz vor Adversarial Attacks. Incident Response Plan.
8
Konformitätsbewertung
Interne Kontrolle oder externe Prüfung. CE-Kennzeichnung. Anmeldung in EU-Datenbank.
Fazit und Empfehlungen für die Praxis
Self-Hosting (EU-Unternehmen mit hohen Anforderungen)
Empfohlen: Llama 3.1 (70B/405B) auf EU-Servern
Volle Kontrolle, keine Drittlandtransfers, minimale DSFA-Anforderungen
Managed Service (KMU ohne GPU-Infrastruktur)
Empfohlen: EU-Provider oder AWS/Azure/Google mit EU-Hosting
Einfache Integration, DPA mit etablierten Anbietern
Vision-Features (EU-Unternehmen)
Empfohlen: Llama 3.2/4 über AWS Bedrock, Azure AI oder Google Vertex AI
Provider haben separate Meta-Lizenz und tragen Compliance-Last
Wichtigste Erkenntnisse
Meta Llama ist kein Cloud-Service – Sie tragen die volle DSGVO-Verantwortung
Kein AV-Vertrag mit Meta, bei Managed Services: DPA mit Hosting-Provider
EU-Verbot für multimodale Modelle (Llama 3.2/3.3/4) – Workaround über US-Cloud-Provider
700-Millionen-MAU-Grenze gilt konzernweit – separate Lizenz bei Überschreitung
EU AI Act Compliance: AI Literacy-Pflicht seit Februar 2025, Hochrisiko-Anforderungen ab August 2026
Regelmäßige Überprüfung: Alle 6 Monate Lizenz/AUP prüfen, bei neuen Versionen Hochrisiko-Prüfung wiederholen
⚠️ Haftungsausschluss: Diese Anleitung dient ausschließlich Informationszwecken und ersetzt keine individuelle Rechtsberatung. Die Llama Community License und Acceptable Use Policy können sich jederzeit ändern. Lassen Sie Ihren konkreten Anwendungsfall durch einen Fachanwalt für IT-Recht oder Datenschutzexperten prüfen. Stand: Oktober 2025