Die meisten KI-Projekte stehen und fallen mit den Daten dahinter. Was das bedeutet - und was Sie aktiv tun können.
Unternehmen diskutieren über das richtige KI-Modell, den besten Anbieter, die passende Strategie. Selten diskutieren sie über ihre Daten. Dabei ist Datenqualität der häufigste Grund, warum KI-Projekte im Mittelstand nicht das halten, was sie versprechen.
Das Prinzip ist nicht neu: Garbage in, garbage out. Ein Sprachmodell, das auf inkonsistenten, unvollständigen oder falschen Daten arbeitet, produziert inkonsistente, unvollständige oder falsche Ergebnisse - und zwar zuverlässig und in hohem Tempo.
Schlechte Daten sind nicht immer offensichtlich falsch. Häufiger sind sie unvollständig (Felder leer gelassen, weil sie im Alltag nicht gebraucht wurden), inkonsistent (dasselbe Datum in drei verschiedenen Formaten), veraltet (Stammdaten, die seit zwei Jahren nicht gepflegt wurden) oder isoliert (wichtige Information liegt in E-Mails oder PDFs, nicht in strukturierten Feldern).
Für KI-Automatisierung ist besonders die letzte Kategorie kritisch. Wenn relevante Informationen in Freitext, handschriftlichen Notizen oder eingescannten Dokumenten stecken, ist der erste Schritt nicht KI - sondern Strukturierung.
Silos: Vertrieb hat CRM-Daten, Buchhaltung hat ERP-Daten, Projektmanagement hat Excel-Dateien. Alle drei enthalten relevante Kundendaten - keine davon ist vollständig. Ein KI-System, das übergreifend arbeiten soll, scheitert an den Grenzen dieser Silos.
Historische Inkonsistenz: Vor drei Jahren wurde das CRM-System gewechselt. Die Datenmigration war unvollständig. Altdaten wurden mit neuen Formaten vermischt. Wer heute auf diese Daten aufsetzt, baut auf einem wackeligen Fundament.
Fehlende Disziplin bei der Eingabe: Pflichtfelder werden umgangen, Freitext wird verwendet wo strukturierte Felder wären, Abkürzungen sind nicht standardisiert. Das ist kein Versagen der Mitarbeitenden - es ist ein strukturelles Problem, das Werkzeuge und Prozesse gemeinsam lösen müssen.
Ein realistischer KI-Audit schaut sich immer zuerst die Daten an. Nicht um zu bremsen, sondern um einzuschätzen, was der erste sinnvolle Schritt ist. Manchmal ist das die KI-Implementierung. Manchmal ist es zuerst ein Datenbereinigungs-Projekt - das dann die Grundlage für eine deutlich wirkungsvollere KI legt.
Unternehmen, die direkt in KI-Technologie investieren ohne ihre Daten zu kennen, kaufen ein leistungsstarkes Werkzeug für ein schlecht vorbereitetes Handwerk. Das Werkzeug ist nicht das Problem.
Der pragmatische Einstieg: Einen einzigen Prozess wählen, der für KI-Automatisierung vorgesehen ist, und die Datenlage dafür spezifisch analysieren. Welche Eingabedaten braucht das geplante System? Liegen diese vor? In welchem Format und in welcher Qualität?
Aus dieser Analyse ergibt sich, ob eine Bereinigung nötig ist, ob Erfassungsprozesse angepasst werden müssen, oder ob die Datenlage bereits für einen ersten Piloten ausreicht. Dieser fokussierte Ansatz ist deutlich effizienter als eine unternehmensweite Datenbereinigung ohne konkreten Anwendungsfall.
Das klingt ernüchternd, ist es aber nicht. Die gute Nachricht: Fast jedes Unternehmen hat bessere Daten, als es denkt - sie liegen nur nicht immer dort, wo sie gebraucht werden. Ein strukturierter Blick auf die Datenlage, bevor KI-Technologie zum Einsatz kommt, ist der entscheidende Unterschied zwischen einem Piloten der läuft und einem, der nach sechs Wochen in der Schublade landet.
Im KI-Audit schaue ich mir zuerst Ihre Datenlage an - ehrlich und ohne Verkaufsabsicht.