Ein Praxisbericht über 7 Monate KI-Einsatz mit 175 Mitarbeitern – und warum die meisten Unternehmen für dieselbe Leistung das Achtfache bezahlen.
Die unbequeme Wahrheit über KI-Kosten
Wenn Sie für 200 Mitarbeiter ChatGPT Plus-Abonnements kaufen, zahlen Sie 48.000 USD pro Jahr. Klingt nach einer vernünftigen Investition in die digitale Zukunft? Die Realität sieht anders aus: Sie werfen vermutlich 85 % dieses Budgets zum Fenster hinaus.
Diese Zahl stammt nicht aus einer Beraterpräsentation oder einer Herstellerstudie. Sie basiert auf echten, anonymisierten Logs eines KI-Rollouts bei einem mittelständischen Unternehmen, das Varexa Digitalagentur über sieben Monate begleitet hat. Die Erkenntnisse sind eindeutig – und für die meisten Geschäftsführer überraschend.
Der Kontext: Warum Sie dieses Thema nicht ignorieren können
Hier die unbequeme Realität: 50-60 % Ihrer Mitarbeiter nutzen bereits KI-Tools. Täglich. Ohne dass Sie es wissen. Ohne Kontrolle. Ohne Datenschutz.
Die Zahlen sprechen für sich:
- 71 % der Büroangestellten verwenden KI ohne Genehmigung der IT-Abteilung
- 38 % teilen vertrauliche Unternehmensdaten mit öffentlichen KI-Diensten
- 46 % würden KI-Tools selbst bei explizitem Verbot weiter nutzen
Die Frage ist also nicht ob Ihr Unternehmen KI einsetzt, sondern ob Sie die Kontrolle darüber haben oder nicht.
Das Experiment: 175 Mitarbeiter, alle Marktmodelle, volle Transparenz
Das Unternehmen entschied sich für einen radikalen Ansatz: Allen Mitarbeitern Zugang zu verschiedenen KI-Modellen geben, unterschiedliche Anbieter testen und schauen, was in der Praxis tatsächlich passiert. Keine theoretischen Annahmen, sondern harte Daten.
Die zentrale Entscheidung: API-Modell statt Abonnements. Bezahlt wird pro angefragtem Token, nicht pauschal pro Kopf.
Die Ergebnisse nach 7 Monaten (Juni bis Dezember 2025):
- 139 von 175 Mitarbeitern haben KI mindestens einmal genutzt
- 40.782 Anfragen insgesamt
- Durchschnittlich 42 Anfragen pro Nutzer und Monat
- Gesamtkosten: 2.284 USD
- Kosten pro aktivem Nutzer: 2,35 USD/Monat
Zum Vergleich: Mit 20-Dollar-ChatGPT-Abonnements hätte das Unternehmen für dieselbe Nutzung 19.460 USD bezahlt – 8,5-mal so viel.
Wo das Geld wirklich hinfließt
Die Budgetverteilung offenbart eine Überraschung:
Bildgenerierung:
- 34 % aller Anfragen
- 64 % des Gesamtbudgets
Textmodelle:
- 66 % aller Anfragen
- 36 % des Gesamtbudgets
Bildgenerierung ist 3,5-mal teurer als Text. Und 74 % der Mitarbeiter (130 von 175) haben mindestens einmal Bilder generiert – nicht nur die Designabteilung, sondern buchstäblich alle, einschließlich der Buchhaltung.
Laut McKinsey nutzen nur 35 % der Organisationen KI für Bildgenerierung. Die 74 % in diesem Fall liegen doppelt so hoch. Warum? Weil Menschen experimentieren, wenn sie die Möglichkeit haben.
Die drei größten Kostenfallen – und wie man sie vermeidet
1. Das Abonnement-Modell ist eine Flatrate, die niemand ausnutzt
ChatGPT Plus kostet 20 USD pro Monat. Das klingt fair – ist es aber nur, wenn der Mitarbeiter auch entsprechend viel nutzt.
Die Mathematik ist eindeutig: Ein Abonnement rechnet sich erst ab 53 Millionen Tokens pro Monat und Person (GPT-4o-mini). Das entspricht etwa 40.000 Textseiten. Pro Monat. Pro Person.
Realistisch? Nein. Außer vielleicht für Korrektoren oder technische Übersetzer – aber die brauchen dann keine Mini-Modelle.
Das API-Modell funktioniert anders: Sie bezahlen nur, was wirklich genutzt wird. 50 Anfragen im Monat? Sie zahlen für 50. 500 Anfragen? Sie zahlen für 500.
Ergebnis: Durchschnittlich 2,35 USD pro Nutzer statt 20 USD – eine Ersparnis von 88,25 %.
2. Bildgenerierung frisst zwei Drittel des Budgets
GPT Image kostet 0,44 USD pro Anfrage. Gemini Image kostet 0,053 USD. Faktor 8.
Im September wechselte das Unternehmen von GPT Image zu Gemini – ohne große Ankündigung, die Migration dauerte einen Tag.
Die Zahlen:
- 15.300 Bildanfragen über 4 Monate (Oktober–Dezember)
- Kosten mit Gemini: 810 USD
- Kosten wären mit GPT gewesen: 6.779 USD
- Ersparnis: 5.969 USD
Die durchschnittlichen Kosten pro Nutzer fielen von 6,47 USD (September) auf 3,67 USD (Oktober) – halbiert in einem Monat, nur durch den Anbieterwechsel.
Wenn Sie viele Mitarbeiter haben: Kalkulieren Sie Bildgenerierung ein. Und wählen Sie von Anfang an den günstigsten Anbieter.
3. 20 % der Nutzer verursachen 80 % der Kosten
Das Pareto-Prinzip gilt bis auf den Prozentpunkt genau:
- 20 % der Nutzer = 79,4 % der Ausgaben
- Top 10 Nutzer (5,7 %) = 20 % des Gesamtbudgets
Der Spitzennutzer: 308 USD in 7 Monaten, 3.578 Anfragen.
Ein anderer Nutzer: 2.757 Anfragen, aber nur 139 USD.
Der Unterschied? Der eine generiert Bilder, der andere Text.
Was das bedeutet: Überwachen Sie Ihre Top-20-%-Nutzer. Sie bestimmen Ihr Budget. Und stellen Sie sicher, dass teure Funktionen wie Bildgenerierung nur dort verfügbar sind, wo sie wirklich gebraucht werden.
Weitere versteckte Kostentreiber
Mitarbeiter wählen immer das teuerste Modell
Wenn Sie Mitarbeitern Zugang zu allen Modellen geben, nutzen sie standardmäßig das teuerste – selbst für einfache Aufgaben wie „Schreibe eine E-Mail an den Kunden“.
GPT-5 Mini ist 6-mal günstiger als GPT-5. Gemini Flash ist 7-mal günstiger als Pro.
Wie viele Anfragen gingen über günstige Modelle? 2.438 von 61.729. 4 Prozent.
Warum? Status-quo-Bias. Menschen wechseln nicht, was funktioniert – selbst wenn die Alternative deutlich günstiger ist.
Lösung: Machen Sie das günstige Modell zum Standard. Das teure Modell auf Anfrage. Für die meisten Aufgaben reichen GPT-5 Mini oder Gemini Flash völlig aus.
Standardeinstellungen fressen Budget
GPT Image erlaubt die Wahl von Qualität und Anzahl der Bilder pro Anfrage. Was wählen Nutzer? Maximale Qualität. Vier Bilder auf einmal. „Falls man es braucht.“
Die Rechnung: 4 Bilder × 0,25 USD = 1 USD pro Anfrage. Bei 15-20 Iterationen bis zum gewünschten Ergebnis: 15-20 USD pro Aufgabe.
Als das Team die Logs analysierte und die Preisstruktur erklärte, verschwand das Problem. Zugang zu Bildgenerierung wurde auf die Mitarbeiter beschränkt, die sie wirklich benötigen.
Die Erwartungslücke: Tabellen und KI
Buchhalter, Projektmanager, Analysten – alle arbeiten mit Tabellen. Die logische Erwartung: Excel-Datei in die KI hochladen, Analyse erhalten.
Die Realität: Mitarbeiter laden eine Million Zeilen hoch. Nichts funktioniert. Frustration entsteht.
Warum? Standard-Chat-Interfaces können keine Tabellen verarbeiten. Dafür braucht man Agenten mit Code Interpreter – die Python in isolierten Umgebungen ausführen. Das ist ein anderes Produkt, ein anderer Preis, andere Einschränkungen.
Noch schlimmer: Manche Dienste tun so, als würden sie Tabellen analysieren. In Wirklichkeit nehmen sie die ersten 100 Zeilen und halluzinieren Schlussfolgerungen.
Was zu tun ist: Erklären Sie den Nutzern von Anfang an die Grenzen. KI ist kein Excel-Ersatz. Noch nicht.
Rechnet sich KI überhaupt?
Die entscheidende Frage für jede Geschäftsführung.
Studien von Federal Reserve, BCG und Adecco zeigen: KI spart 2-5 Stunden pro Woche und Mitarbeiter. Power-User sparen bis zu 11 Stunden.
Angewendet auf diesen Fall:
- 200 aktive Mitarbeiter × 3 Stunden/Woche × 4 Wochen = 2.400 Stunden/Monat
- Durchschnittlicher Stundensatz in Deutschland 2025: ca. 25 €/Stunde
- Einsparung: 60.000 €/Monat
- KI-Kosten: 200 × 2,50 € = 500 €/Monat
Selbst wenn KI nur 30 Minuten pro Woche spart – die Investition amortisiert sich um den Faktor 20.
Zugegeben: Diese Schätzungen berücksichtigen nicht die Einarbeitungszeit. Und manche Mitarbeiter nutzen KI auch privat (medizinische Fragen, psychologische Beratung, Bilder für den Eigengebrauch). Aber die Mehrheit der Aufgaben war arbeitsbezogen.
Datenschutz: Landen Ihre Daten wirklich bei OpenAI?
Ja – so wie Ihre Dokumente bei Google landen.
Werden diese Daten dort verarbeitet? Nein, wenn Sie über API arbeiten.
Seit März 2023 werden Daten, die über API gesendet werden, standardmäßig nicht für das Training von OpenAI-Modellen verwendet. Das gilt auch für Anthropic und Google.
Der entscheidende Unterschied:
- Kostenloses ChatGPT: Daten können für Training verwendet werden (abschaltbar in Einstellungen)
- API: Daten werden standardmäßig nicht für Training verwendet
Logs werden bis zu 30 Tage für Monitoring gespeichert. Enterprise-Kunden können Zero Data Retention vereinbaren – dann wird nichts gespeichert.
Der Administrator sieht Logs und kann Mitarbeiter identifizieren, die das System missbräuchlich nutzen.
Zuverlässigkeit: Brauchen Sie Redundanz?
In diesem Fall gab es in 7 Monaten keinen einzigen kritischen Ausfall.
Aber: Ein einzelner Anbieter ist keine Strategie, sondern ein Glücksspiel. Selbst OpenAI liefert an manchen Tagen nur 90-95 % erfolgreiche Antworten.
Empfohlener Setup 2026:
- Direkte APIs: OpenAI, Anthropic, Google (Gemini), xAI (Grok)
- Aggregator: OpenRouter – wenn ein Anbieter ausfällt, läuft der Traffic über einen anderen
- Reserve: Azure OpenAI – dieselben Modelle, andere Infrastruktur
So funktioniert es: Die Anfrage geht an den Hauptanbieter. Bei Timeout oder Fehler wird automatisch auf den nächsten umgeschaltet. Der Nutzer merkt nichts. Nur Ihr Monitoring sieht es.
Brauchen Sie einen dedizierten KI-Spezialisten?
Nein. Sie brauchen einen verantwortlichen Mitarbeiter, aber das ist kein Full-time-Job.
System überwachen, gelegentlich Logs prüfen, Mitarbeiterfragen beantworten – das ist Teil der Arbeit einer Person, keine separate Stelle.
Full-time wird nur nötig, wenn Sie zusätzlich anbieten: regelmäßige Schulungen für neue Mitarbeiter, Webinare mit Best Practices, Erfahrungsaustausch zwischen Abteilungen. Aber das ist Weiterentwicklung, nicht Betrieb.
Schulung: Der unterschätzte Erfolgsfaktor
Das Unternehmen investierte in Onboarding:
- 2 Stunden aufgezeichnetes Video (Prompting, Einschränkungen, verschiedene Modelle für verschiedene Aufgaben)
- 2 Wochen Zeit zum Anschauen
- Live-Webinar mit Q&A (1 Stunde)
Wichtig: Nicht überstürzen. Eine Testwoche vor dem unternehmensweiten Rollout ist essenziell. Einen unfertigen Service auszurollen bedeutet, Interesse und Reputation bei den Nutzern sofort zu verlieren. Enterprise-Nutzer verzeihen keine Fehler. Einmal nicht funktioniert = nie wieder geöffnet.
Was nach 7 Monaten wirklich passierte
85 % der Nutzer verwenden KI auch nach dem ersten Monat weiter. Das ist eine außergewöhnlich hohe Retention-Rate.
Die Anzahl der Anfragen stieg um den Faktor 27 in sechs Monaten.
Was bedeutet das für Ihr Budget? Wenn Sie 100 Mitarbeitern Zugang geben, werden nach sechs Monaten nicht 20, sondern 60-80 aktiv sein. Das Budget wächst – nicht weil es teurer wird, sondern weil mehr Menschen es nutzen.
Das ist gut fürs Geschäft. Schlecht für die, die kein Wachstum eingeplant haben.
Die fünf wichtigsten Empfehlungen
- Rechnen Sie über API, nicht über Abonnements (Faktor 5-10 Unterschied)
- Planen Sie Wachstum ein: 80+ % Retention bedeutet steigende Nutzung
- Separates Budget für Bilder oder separate Limits pro Nutzer
- Überwachen Sie die Top 20 % – sie bestimmen Ihr Budget
- Geben Sie offiziellen Zugang – sonst entsteht Shadow-IT
Das Fazit, das Geschäftsführer interessiert
KI-Integration für 200 Mitarbeiter kostet weniger als ein einziges Jahresgehalt. Weniger als eines.
Die MIT-Studie 2025 zeigt: 95 % der KI-Piloten haben keinen messbaren Einfluss auf P&L. 42 % der Unternehmen haben 2025 die meisten KI-Initiativen abgebrochen.
Warum? Weil sie die Implementierungskosten kalkulieren, nicht die Nutzungskosten. Sie kaufen Enterprise-Abonnements für alle, obwohl nur 20 % aktiv nutzen.
Der richtige Ansatz: API + Monitoring + Schulung.
Nicht „Was kostet die Lizenz?“, sondern „Was kostet die Anfrage?“.
In diesem Fall bedeutete das: 85 % Retention. Wer KI ausprobiert, hört nicht auf.
Die meisten Unternehmen überschätzen ihre KI-Kosten um den Faktor 5. Die Realität ist günstiger – wenn man es richtig macht.
Nächste Schritte
Wenn Sie eine durchdachte, kosteneffiziente KI-Lösung für Ihr Unternehmen implementieren möchten, unterstützt Varexa Digitalagentur Sie dabei – von der Konzeption über die technische Umsetzung bis zum Monitoring.
Varexa Digital Agency is the 2025 Award-winning company in Germany for our Artificial Intelligence services 🏆