Datavask betegner den proces, hvor en virksomhed gennemgår, korrigerer og opdaterer sine data for at sikre, at de er nøjagtige, konsistente og brugbare. Ofte handler det om at fjerne dubletter, rette fejl, standardisere formater og berige data med manglende oplysninger.

Formål

Målet med datavask er at øge datakvaliteten, så virksomheden kan træffe bedre beslutninger, forbedre kundekontakten og reducere omkostninger forbundet med fejlinformation. Dårlige data kan eksempelvis føre til spildt markedsføring, fejl i rapportering eller tab af potentielle kunder.

Eksempler på datavask

  • Fjernelse af dubletter i en kundedatabase
  • Standardisering af adresser, telefonnumre og e-mails
  • Korrigering af stavefejl i navne eller byer
  • Opdatering af forældede oplysninger, fx kontaktpersoner eller CVR-numre
  • Tilføjelse af manglende data fra eksterne kilder

Anvendelse

Datavask bruges i mange sammenhænge, særligt inden for CRM-systemer, marketing, økonomistyring og rapportering. For virksomheder med store mængder kundedata er det en vigtig disciplin for at sikre, at kampagner rammer de rigtige personer, og at salgsteams arbejder ud fra valide oplysninger.

Metoder

Der findes både manuelle og automatiserede metoder til datavask. Mindre virksomheder kan ofte klare processen i regneark eller via simple scripts, mens større virksomheder benytter dedikerede værktøjer og integrationer, der kan validere data mod offentlige registre (fx CVR i Danmark).

Relaterede begreber