A limpeza de dados é uma etapa crucial na gestão de dados, garantindo que os conjuntos de dados sejam precisos, completos e consistentes. O Microsoft Copilot e o Microsoft Purview fornecem ferramentas poderosas para ajudar a simplificar e automatizar o processo de limpeza de dados. Este guia mostrará como usar essas ferramentas de forma eficaz.
1. Entenda suas necessidades de limpeza
Antes de usar o Microsoft Copilot e o Purview, identifique os problemas comuns nos dados que você precisa resolver, como.
- Valores ausentes
- Duplicatas
- Formatação incorreta
- Convenções de nomenclatura inconsistentes
- Outliers
2. Acesse o Microsoft Purview
O Microsoft Purview é uma ferramenta de governança de dados que ajuda na catalogação e gerenciamento de ativos de dados.
- Faça login no portal do Microsoft Purview.
- Navegue até Mapa de Dados para descobrir e registrar suas fontes de dados.
- Use o Catálogo de Dados para navegar pelos conjuntos de dados existentes e entender sua estrutura.
- Utilize Insights de Dados para identificar problemas de qualidade e áreas que precisam de limpeza.
3. Identifique e rotule problemas nos dados
- Use o painel Qualidade dos Dados do Purview para avaliar a qualidade do conjunto de dados.
- Rotule os ativos de dados que precisam de limpeza com etiquetas como “Incompleto”, “Precisa de Formatação” ou “Entradas Duplicadas”.
- Configure regras automatizadas para classificação e verificações de qualidade dos dados.
4. use o Microsoft Copilot para limpeza
O Microsoft Copilot, integrado ao Excel ou Power BI, pode automatizar tarefas de limpeza.
No Excel
- Abra seu conjunto de dados no Excel.
- Use o Copilot para gerar um resumo dos problemas de dados.
- Use comandos em linguagem natural, como.
- “Remova duplicatas da coluna A.”
- “Padronize os formatos de data para DD/MM/AAAA.”
- “Preencha os valores ausentes na coluna B usando a mediana.”
- Revise as sugestões do Copilot e aplique as transformações necessárias.
No Power BI
- Importe seu conjunto de dados para o Power BI.
- Use o Copilot para gerar scripts de limpeza de dados usando o Power Query.
- Aplique transformações como.
- Remover valores nulos
- Converter formatos de texto
- Unificar formatos de colunas
- Valide as alterações usando as ferramentas de visualização do Power BI.
5. Automatize a governança de dados
- Configure Políticas de Dados para aplicar regras de limpeza.
- Use Rastreamento de Dados (Data Lineage) para acompanhar as mudanças e garantir a consistência.
- Integre com o Azure Data Factory para pipelines de dados automatizados que incluam etapas de limpeza.
6. Valide e monitore a qualidade dos dados
- Use as Ferramentas de Monitoramento do Purview para garantir melhorias contínuas na qualidade dos dados.
- Agende auditorias periódicas de dados.
- Utilize o Copilot para verificações contínuas da qualidade dos dados e sugestões de melhorias.
Conclusão
Ao utilizar o Microsoft Copilot e o Microsoft Purview juntos, você pode automatizar e aprimorar o processo de limpeza de dados de maneira eficiente. Essas ferramentas ajudam a garantir a consistência dos dados, melhorar a governança e economizar tempo valioso para análise e tomada de decisões.
Veja também nosso artigo sobre Libere todo o potencial do Microsoft 365 Copilot com o Power Platform.