Datenbereinigung: Wie Sie richtig Geld sparen können
Eine Mitarbeiterin hat zum Beispiel die Position innerhalb des Unternehmens gewechselt. Leider wurde jedoch versäumt, ihre Kostenstelle im System zu ändern, sodass die Kollegin weiterhin über die alte Kostenstelle läuft – ein Fehler in der Abrechnung.
So etwas ist schnell passiert. Falsche Datensätze ziehen automatisch fehlerhafte Daten nach sich. Im schlimmsten Fall blockieren sie Prozesse und legen im Folgenden das System lahm. Zum Ärger der Nutzer:innen und zum Leidwesen der Organisation. In manchen Unternehmen ist die Entstehung von Fehlern in feste Routinen eingebettet und hat beinahe schon Methode, ohne dass dies den Mitarbeitenden bewusst ist. Vor allem, wenn eine Firma keine klare Strategie für den Umgang mit Daten, keine Data Strategy hat. Dann mangelt es an Data-Engineering-Expertise, an einer klaren und einheitlichen Dateninfrastruktur und an einer wirkungsvollen Data Governance, also am ganzheitlichen Management von Daten, das mithilfe von Richtlinien die Datenqualität, den Datenschutz und die Datensicherheit gewährleistet. Doch Data Governance gilt heutzutage als Muss.
Fehlen solche Richtlinien nämlich, wissen die Mitarbeitenden nicht, in welchen Datenbanken sie welche Informationen ablegen sollen, geschweige denn, wie die Daten zu pflegen sind. Schlimmer noch: Meist ist den Mitarbeitenden gar nicht bewusst, welche Daten überhaupt existieren. Mit der Folge, dass sie eine Kundenadresse neu anlegen, anstatt nachzuprüfen, ob sie vielleicht schon im System vorhanden ist. So entstehen im Handumdrehen Dubletten. Hunderte.
Ein weiteres unerwünschtes Phänomen sind Datensilos. Sie entstehen beispielsweise, wenn die einzelnen Fachbereiche eines Unternehmens unabhängig voneinander Informationen sammeln und sie horten. Auf diese Weise häufen sich innerhalb einer Business Unit Datenbanken mit Datensätzen, von denen andere Einheiten keine Kenntnis haben, weil sich die Fachbereiche untereinander nicht oder nur unzureichend darüber abstimmen, welche Datensätze sie in welcher Form benötigen.
Ohne Datenbereinigung ist der Schaden immens
Der Wildwuchs von Daten, also die Existenz von Dubletten, Datensilos, falschen oder unsortiert abgelegten Daten, wirkt sich in Unternehmungen mannigfaltig aus – aber immer negativ. Mit folgenden Konsequenzen müssen Organisationen rechnen:
- Frustration bei den Mitarbeitenden: Rund ein Drittel ihrer Arbeitszeit verbringen Beschäftigte mit dem Suchen von Daten. Diese Schätzung entstammt einem Bericht des Beratungshauses McKinsey.
- Fehlerhafte Analysen und Ergebnisse: Fehler machen auch vor den Stammdaten im ERP-System nicht halt. Im eingangs erwähnten Beispiel verursacht ein konkretes Versäumnis eine falsche Abrechnung, doch selbst ein Tippfehler kann bereits zusätzliche Kosten verursachen, wenn jemand im Lernmanagementsystem seine geleisteten acht Trainingsstunden beispielsweise versehentlich zweimal eingibt.
- Verstöße gegen Compliance-Regeln und Datenschutz: Qualität und Transparenz der Daten sind auch deshalb wichtig, weil die Firmen ständig neue gesetzliche und regulatorische Anforderungen zu erfüllen haben, wenn sie nicht empfindliche Bußgelder und Schadenersatzansprüche in Kauf nehmen wollen.
- Imageschäden und Vertrauensverlust: Schlechte Datenqualität kann den Ruf einer Firma massiv schädigen und zu Vertrauensverlust führen, zum Beispiel wenn Kund:innen aufgrund fehlerhaft hinterlegter Informationen das falsche Produkt erhalten.
Fazit: Eine mangelhafte Datenqualität kostet richtig Geld, genau genommen etwa ein Fünftel des Umsatzes – diese Zahl veröffentlichte das Sloan Management Review des MIT, und der US-Konzern IBM beziffert die Gesamtkosten ähnlich hoch. Allein für die US-Wirtschaft entstehen auf diese Weise Verluste von rund 3 Billionen US-Dollar pro Jahr.
Angesichts solcher Summen verblüfft eine im Gartner Data Quality Market Survey von 2017 veröffentlichte Zahl: Danach wissen sechs von zehn Unternehmen gar nicht, wie viel Geld sie Jahr für Jahr aufgrund ihrer schlechten Datenqualität verlieren. Warum? Weil sie gar nicht wissen, welche Auswirkungen falsche Daten oder schlechtes Datenmanagement haben, und für sie eine Folgenabschätzung daher nicht relevant erscheint.
Datenbereinigung: fünf schlagende Argumente
Das ist fatal. Denn nur, wer sich die Verluste bewusst macht, ist im Folgenden auch bereit, etwas zu ändern, indem er etwa eine Datenbereinigung, ein Data Cleansing, in die Wege leitet.
Unter dem Begriff Data Cleansing werden verschiedene Methoden und Verfahren zusammengefasst, die darauf abzielen, Daten zu korrigieren, die nicht gewissen Qualitätskriterien entsprechen, und Dubletten zu löschen. Höchste Zeit also, den ersten Schritt zu gehen und die Datenbereinigung als Ziel zu definieren, denn das lohnt sich in vielerlei Hinsicht:
- Mit Data Cleansing treffen Sie sicherere Entscheidungen.
Durch das Bereinigen Ihrer Daten können Sie sich ein genaues Bild von der Realität machen und auf dieser Basis fundierte Entscheidungen treffen. Je „sauberer“ die Daten sind, die Ihnen vorliegen, desto aktueller sind die Informationen und desto sicherer Ihre Entscheidungen. - Mit Data Cleansing steigern Sie die Effizienz.
Das Bereinigen und die Pflege des Datenbestands beschleunigt Ihre Geschäftsprozesse. Ihr Vertriebsteam gewinnt zum Beispiel enorm viel Zeit, wenn es sich darauf verlassen kann, dass die Kundendaten und die Einträge im CRM-System stets aktuell sind. - Mit Data Cleansing optimieren Sie das Risikomanagement.
Mit einer Datenbereinigung lassen sich alle finanziellen Risiken ganz gleich auf welcher Ebene, ob bei der Rohstoffbeschaffung oder bei der Auslieferung, korrekt einschätzen. - Mit Data Cleaninsing schärfen Sie die Kundenansprache.
Je aktueller die Datensätze, desto genauer fällt die Kundenansprache aus. Mit bereinigten Daten verfügen Sie über die Voraussetzungen, um Ihren Kunden das richtige Produkt zum richtigen Zeitpunkt anzubieten. - Mit Data Cleansing stellen Sie die Compliance sicher.
Mit dem Bereinigen von Daten legen Sie die Basis für Datenintegrität. Sie stellen sicher, dass Ihre Daten stets korrekt sind und verlässlich genutzt werden können. Nur so können Sie auch Ihren Dokumentationspflichten uneingeschränkt nachkommen.
Data Cleansing: am besten sofort und mit Methode
Doch wann ist der richtige Zeitpunkt für ein Data Cleansing? Am besten ist es natürlich, die Daten von Anfang an sauber zu erstellen. Wer dies nicht getan hat, sollte sich unverzüglich an die Korrektur machen. Je früher ein Unternehmen seine Daten bereinigt, desto besser. Nicht strukturierte Daten sind teuer und datenschutzrechtlich riskant – spätestens, wenn der Umzug in die Cloud ansteht.
Das Thema Datenbereinigung sollte daher in jedem Unternehmen Chefsache sein. Dazu gehört, dass die Verantwortlichen mit den nötigen Kompetenzen ausgestattet werden und dafür gesorgt ist, dass sich alle Beteiligten in puncto Datenpflege eng untereinander austauschen, denn nach einer Datenanalyse müssen die fehlerhaften Daten identifiziert und korrigiert, Datenmengen reduziert und etwaige Datenquellen konsolidiert werden. Unter Umständen ist sogar eine Überführung der Daten in neue Datenbanken notwendig – eine gute Möglichkeit, um im gleichen Schritt auch die Prozesse zu standardisieren.
Im Zeitalter der Digitalisierung gehört ein manuelles Data Cleansing selbstverständlich der Vergangenheit an. Moderne Lösungen und Software-Tools zur Datenbereinigung leisten wertvolle Dienste. Sie arbeiten kontextbasiert, ein paar wenige Schlüsseldaten reichen aus, um die im Unternehmen gesammelten Daten automatisiert zu konsolidieren und zu integrieren.
In unserem Eingangsbeispiel würde das bedeuten: Um die Kostenstellendaten zu bereinigen, müsste die Firma anstatt einer umfangreichen Vorlage mit 30 bis 60 Datenfeldern lediglich drei Schlüsseldaten liefern: den Namen, die alte und die neue Kostenstelle. Den Rest erledigt das Tool automatisch. Manchmal ist Aufräumen eben gar nicht so schlimm.