Apresentando o SharePoint Syntex

Por Fernando Viana e Sá
Apresentando o SharePoint Syntex

Disponível a partir do início de outubro, o SharePoint Syntex fornecerá a você a capacidade de automatizar a extração de metadados de seus arquivos. Assim, ter esse recurso hospedado diretamente no Microsoft 365 permitirá que o Centro de conteúdo do SharePoint Syntex se torne o coração do processamento de conteúdo da sua organização.

A Syntex aproveita a IA avançada e o aprendizado de máquina do Projeto Cortex para categorizar e classificar automaticamente os documentos com base em modelos configurados pelo usuário. Assim, usando esses modelos, a Syntex pode extrair dados específicos e aplicá-los como metadados a documentos. Bem como aplicar rótulos de sensibilidade e retenção para proteção de informações.

Existem dois componentes principais separados que são trazidos para o Syntex; Processamento de formulários e compreensão de documentos. Essas duas funções são usadas para extrair metadados do conteúdo. Mas foram projetadas para funcionar em diferentes situações – então, vamos mergulhar e dar uma olhada mais de perto nos recursos de ambas.

Processamento de Formulários SharePoint Syntex

Perfeito para extrair metadados de arquivos estruturados de forma consistente, como faturas e pesquisas, o Processamento de Formulários é excelente em situações em que você precisa capturar informações de grandes volumes de arquivos PDF estruturados e imagens.

Ou seja, construído sobre o componente AI Builder da plataforma Microsoft Power, o recurso de processamento de formulários do SharePoint Syntex nos permite configurar a localização precisa dos campos em um determinado formulário. Assim que um modelo for construído, o AI Builder lerá e extrairá automaticamente os metadados dos locais de campo definidos de arquivos futuros carregados.

Essas informações são armazenadas em colunas do SharePoint. O que significa que muitos dos benefícios da classificação de conteúdo podem ser aplicados imediatamente aos seus formulários. Você não apenas poderá classificar e agrupar pelos valores que foram extraídos automaticamente, mas também poderá usar a pesquisa para recuperar conteúdo por metadados capturados.

Em qualquer cenário em que você deseja extrair metadados de um número relativamente grande de locais conhecidos e consistentes em arquivos. A ferramenta de processamento de formulários do SharePoint Syntex parece ser uma excelente solução para ajudar a automatizar seus processos.

A capacidade de processamento de formulários do SharePoint Syntex só vai melhorar ainda mais com o tempo. Eu pessoalmente não posso esperar para ver a capacidade de lidar com dados tabulares, como os itens de linha individuais em uma fatura ou pedido de compra.

Entendimento do Documento SharePoint Syntex

Para mim, a funcionalidade Document Understanding do SharePoint Syntex tem um enorme potencial. O Document Understanding oferece recursos baseados em IA, por meio do ensino da máquina, para classificar arquivos automaticamente e extrair metadados de conteúdo não estruturado.

Para obter o máximo do Document Understanding, você realmente precisa ter tipos consistentes de arquivos não estruturados – você não pode apontar esta ferramenta para arquivos não estruturados não relacionados; você precisa ter, por exemplo, uma coleção de propostas ou cartas de contrato. Você precisará criar ‘Modelos de compreensão de documentos’ separados para cada tipo diferente de arquivo que deseja processar. Realisticamente, você provavelmente precisará de pelo menos algumas centenas de arquivos do mesmo tipo para realmente ver o valor dessa funcionalidade.

Classificadores e Extratores

A compreensão do documento gira em torno de dois conceitos-chave. ‘Classificadores’, que são treinados para identificar todos os arquivos de um determinado tipo que são carregados em uma biblioteca. ‘Extratores’, que capturam metadados que correspondem a frases ou padrões definidos:

  • Uma ‘frase’ fornece uma combinação de palavras-chave ou caracteres, que o modelo usa para ajudar a localizar metadados relevantes.
  • Um ‘padrão’ é usado para identificar um formato específico de caracteres e números – como uma data ou número de cartão de crédito. Uma seleção de padrões pré-formatados é fornecida para tornar o processo direto.

Depois de criar frases e padrões, o Document Understanding permite que você defina uma ‘proximidade’. Isto é, a distância que você espera que esses parâmetros estejam. Por exemplo, a proximidade permite que você procure um número de membro, que tem uma ‘frase’ de “Número de membro:” bem próximo a um número esperado ‘padrão’:

Um dos melhores novos recursos fornecidos pelo SharePoint Syntex é a capacidade de aplicar automaticamente os rótulos de sensibilidade e retenção ao conteúdo. Esse é um ótimo recurso novo, que amplia o número de maneiras que temos de garantir que a proteção e conformidade das informações possam ser incorporadas aos sistemas. Tudo isso ao mesmo tempo em que minimiza o esforço dos usuários.

Qual abordagem usar?

Determinar qual dessas abordagens será a melhor para você será determinado pelos dados que deseja extrair. então, se os arquivos que você está processando são imagens ou PDFs e têm uma estrutura rígida e consistente, o Processamento de Formulários é claramente o caminho a percorrer. No entanto, se você deseja capturar metadados de arquivos e PDF´s do Office em grande parte não estruturados, o Document Understanding será sua ferramenta de escolha.

Se você gostaria de saber mais sobre o Microsoft SharePoint Syntex, ou qualquer outro aspecto do Microsoft 365 – como equipes, sensibilidade e retenção de rótulos, proteção de informações, entre em contato com a TrinapseNossa equipe é formada por especialistas no assunto no Microsoft 365 e ficaremos sempre felizes em saber se podemos ajudá-lo a fazer mais.

Ver mais artigos

Entre em Contato

Vamos juntos transformar sua dor
em solução!

#moveFast