Data Quality ou Qualidade dos Dados é um esforço de equipe e envolve várias partes interessadas dentro das empresas e organizações. Cada uma delas desempenha um papel importante para garantir que os dados sejam confiáveis e úteis. Vamos analisar as responsabilidades de cada grupo:
Produtores de Dados (Data Producers):
São responsáveis por garantir que os dados não sejam alterados e se tornem incompatíveis com versões anteriores. Caso ocorram mudanças nos dados que tornem os dados incompatíveis, os Engenheiros de Dados devem ser comunicados quando essas mudanças ocorrerão e por quê, assim como os consumidores dos dados.
Engenheiros de Dados:
São responsáveis pela infraestrutura de dados e garantem que as ferramentas e processos do pipeline estejam em funcionamento. Devem fazer a gestão da orquestração, transformação, ETL (Extração, Transformação e Carga) e modelagem dos dados. Também podem acionados para resolver casos especiais.
Consumidores de Dados (Data Owners):
Entendem como os dados devem ser usados, suas entradas e implicações.
Também negociam acordos de nível de serviço (SLAs) relacionados aos dados (Prioridade de dados críticos ou menos críticos).
Trabalham em conjunto com as áreas produtoras para garantir que os dados atendam às especificações do negócio.
Gerentes de Produto (Product owners):
Priorizam as iniciativas de dados quando novas funcionalidades são lançadas.
Gerenciam o backlog e escalonam investimentos em infraestrutura à medida que o volume de dados cresce.
Se cada parte interessada assumir a responsabilidade por sua parte na cadeia de suprimentos de dados, o número de problemas de qualidade de dados certamente diminuirá significativamente. É uma abordagem colaborativa que beneficia a todos!