Datenqualität: Warum Daten nicht immer Gold sind
Daten sind das neue Gold, das Öl von heute – das Potenzial von Daten ist bekannt und ein beliebtes Thema. Wir zeigen Ihnen abseits allseits bekannter Buzzwords welche Möglichkeiten Sie hier mit welchen Tools tatsächlich haben.

6 Gründe für „Dirty Data“
Bevor es darum geht, wie sich das Problem mit schlechten Daten lösen lässt, ist es wichtig, schlechte Datenqualität – auch Dirty Data genannt, also schmutzige Daten – überhaupt zu erkennen. Es gibt viele Gründe und viele Möglichkeiten, wie „schlechte“ Daten aussehen können. Daher hilft es, allgemeine Alarmsignale zu kennen, die auf die mindere Datenqualität hinweisen:- Ungenaue oder veraltete Daten: Dieses Problem ist leider sehr schwierig zu erkennen. Informationen sind vorhanden und scheinen vollständig zu sein, enthalten aber Fehler, die schwierig zu erkennen sind und Wissen erfordern. Während sich noch erkennen lässt, wenn eine Kreditkarte abläuft, wird es bei einer veralteten Adresse schwierig – außer der Kunde meldet seinen Umzug selbst an. Beispiele sind Namen, Adressen, Telefonnummern, Zahlungsdetails usw.
- Unvollständige Daten: Wenn bestimmte Einträge, zum Beispiel die Straße in einer Adresse fehlt, ist der Datensatz für den Versand eines Produkts weniger wert – beziehungsweise erfordert Nacharbeit.
- Inkonsistente Daten: Ähnlich wie bei Punkt 1 sind Inkonsistenzen in Daten oft schwer zu finden. Zum Beispiel sind alle Eingaben ausgefüllt, auf dem ersten Blick und technisch korrekt, aber die Information wird inkonsistent erfasst und ausgegeben. Inkonsistente Daten können beispielsweise Telefonnummern ohne Vorwahlen, Geldbeträge in verschiedenen Währungen oder abgekürzte Namen sein.
- Invalide Daten: Die Felder sind komplett gefüllt, aber sind nicht korrekt, da sie keinen Sinn ergeben (zum Beispiel ein Minuswert bei der Anzahl verfügbarer Produkte).
- Redundante Daten: Daten werden oft wiederholt eingegeben, aber sind leicht verschieden vorhanden. Zum Beispiel ein Firmenname oder der Name einer Person mit leicht verschiedenen Schreibweisen.
- Nicht-standardkonforme Daten: Daten liegen vor, aber in einem Format, welches das System nicht verarbeiten kann – zum Beispiel falsche oder veraltete Bildformate.
Tipp: Lohnabrechnung in wenigen Minuten selbst erledigen