SharePoint Syntex: modelos de compreensão e processamento

Por Fernando Viana e Sá
SharePoint Syntex: modelos de compreensão e processamento

Neste artigo veremos como adicionar modelos de compreensão de documentos no Centro de conteúdo Syntex e como adicionar, classificar e treinar documentos com o SharePoint Syntex. Consideramos também a criação de modelos de processamento de formulários a partir de bibliotecas de documentos do SharePoint usando o AI Builder, um recurso do Microsoft Power Apps.   

Configurando um modelo de compreensão de documento no SharePoint Syntex

Para criar um modelo de compreensão de documento no SharePoint Syntex, abra o Centro de conteúdo Syntex criado na e conclua as etapas a seguir.

  • Primeiramente, clique em Novo e selecione Modelo de compreensão do documento:
  • Em seguida, para este exemplo, usarei os arquivos PDF dos meus contrachequeAssim, a primeira etapa é criar um tipo de conteúdo. Você também pode selecionar tipos de conteúdo existentes. Também optarei por aplicar um rótulo de retenção. Clique em Criar quando as configurações necessárias para o modelo estiverem concluídas.
  • Então, o assistente de criação de modelo leva você para a próxima etapa, onde você verá quatro ações principais para desenvolver seu modelo recém-criado.
  • Por fim, agora que temos nosso novo modelo, devemos adicionar alguns arquivos de exemplo. Para fazer isso, clique em Adicionar arquivos.

Você pode enviar arquivos ou pastas. Devemos enviar pelo menos 5 arquivos do mesmo tipo (positivo) e 1 arquivo de um tipo diferente (negativo). Assim que os arquivos de exemplo forem carregados, clique em Adicionar.

  • Isso o levará de volta à página principal de ações do seu modelo. Em seguida, precisamos classificar nossos arquivos e executar o treinamento. Para fazer isso, selecione a opção Treinar o classificador.

Treinando o classificador

Na tela do classificador, precisamos selecionar cada um dos documentos que carregamos em nosso modelo no painel esquerdo e, no painel de visualização à direita, escolhemos sim ou não para a pergunta Este arquivo é um exemplo.

  • Primeiramente, precisamos executar o treinamento em nossos arquivos. Clique na guia Treinar e você será solicitado a adicionar uma explicação necessária para ajudar o modelo a distinguir este tipo de documento de outros ou identificar as informações a extrair. Clique em Adicionar explicação.
  • Em seguida, para a nossa explicação, daremos o nome de contracheque e escolheremos a opção Lista de frases, onde podemos inserir palavras ou frases que serão utilizadas para identificar as informações que desejamos extrair. Também marquei a caixa de seleção para corresponder à capitalização exata. Com os detalhes da nossa explicação concluída, podemos agora clicar em Salvar.
  • Então, no painel de visualização de cada arquivo, podemos ver onde um arquivo foi corretamente previsto como um exemplo positivo. Da mesma forma, podemos ver onde um arquivo foi previsto corretamente como um exemplo negativo. Clique em Sair do treinamento.
  • Por fim, de volta à página de ações principais, temos um estágio opcional onde podemos criar extratores que extrairão informações específicas de nossos documentos com correspondência positiva e os exibirão como colunas nas bibliotecas de documentos do SharePoint às quais nosso modelo é aplicado. Clique em Criar extrator.

Criando Extratores

Desejo extrair a data de cada um dos meus recibos, portanto, criarei um extrator denominado Data de pagamento. Clique em Criar.

  • Na guia Rótulo de nosso novo extrator, precisamos rolar por cada arquivo de exemplo novamente e destacar as informações necessárias, que é a data de cada contracheque.
  • Uma vez que um arquivo tenha sido devidamente rotulado, clique em Próximo arquivo para mover para o próximo. Ao chegar ao último arquivo, que é o meu exemplo negativo, preciso clicar em Sem rótulo para este e clicar em Salvar.

Em seguida, clicarei na guia Treinar para treinar meu extrator. Preciso adicionar uma explicação para o extrator neste ponto, clicando em Adicionar explicação.

  • Primeiramente, chamarei essa explicação de Data do pagamento e, desta vez, escolherei Lista de padrões como o tipo. Como a lista de padrões fará referência a uma data, posso escolher adicionar uma lista de padrões de um modelo.
  • Em seguida, agora você verá uma lista dos modelos de explicação disponíveis. Aqui, vou escolher a opção Data (Numérica) abaixo e clicar em Adicionar.
  • Então, os padrões de modelo para o formato de data foram adicionados, e agora podemos clicar em Salvar.
  • Agora precisamos clicar em Treinar Modelo para nosso novo extrator e veremos uma correspondência.
  • Então, a criação do extrator agora está concluída. 
  • Por fim, a etapa final é aplicar o modelo a qualquer biblioteca de documentos escolhida no SharePoint Online. Para fazer isso, retorne à página de ações principais e clique em Aplicar modelo.

Crie um modelo de processamento de formulários

Para criar um modelo de processamento de formulários, precisamos concluir as etapas a seguir. Primeiro, crie uma biblioteca de documentos do SharePoint. Vou usar uma biblioteca de documentos chamada Faturas.

Na biblioteca de documentos, clique nas reticências e selecione Automatizar | Crie um modelo para processar formulários:

Em seguida, forneça um nome para nosso novo modelo. Neste exemplo, o modelo será denominado Faturas e usará um tipo de conteúdo recém-criado. Depois de inserir essas configurações, clique em Criar:

O SharePoint Online cria o novo modelo, um processo que geralmente leva vários minutos para ser concluído. Uma vez feito isso, o novo modelo é aberto no Power Apps AI Builder e podemos começar a adicionar documentos ao modelo para análise, marcação e treinamento.

Adicionar, analisar e marcar documentos no modelo de processamento de formulários

Precisamos determinar quais informações desejamos extrair dos documentos carregados na biblioteca de documentos. Para fazer isso, devemos completar as seguintes etapas.

Com o modelo aberto no Power Apps AI Builder, escolha as informações para extrair das faturas. Isso é feito inserindo nomes de campo conforme mostrado na Figura 3, onde adicionamos campos para Data, Número da fatura, Descrição, Quantidade e Total.  Clique em Avançar:

Adiconar modelo de processamento

Agora adicionamos alguns documentos de amostra ao nosso modelo. Precisamos adicionar um grupo de documentos que compartilham o mesmo layout para uma coleção clicando em ‘Nova coleção’.

Precisamos adicionar cinco ou mais documentos com o mesmo layout. Cinco é o número mínimo de documentos que você pode adicionar. No entanto, adicionar até vinte exemplos pode produzir resultados melhores. Selecione Adicionar documentos.

Você pode carregar documentos de amostra do armazenamento local, do SharePoint ou do Azure Blob Storage. Se você escolher o Armazenamento de Blob do Azure, notará que este é um recurso do Conector Premium PowerApps. Para o meu teste, carreguei exemplos de PDFs de faturas do armazenamento local.

Destaque a nova coleção de documentos e selecione Analisar.

Analisar modelo de processamento

A próxima etapa é destacar o conteúdo necessário de cada um dos cinco arquivos de amostra e combiná-lo com os campos que configuramos anteriormente no processo.

Ao concluir este processo para todos os documentos de amostra, clique em Avançar. Agora você pode revisar os detalhes que definiu para o seu modelo e, em seguida, selecionar Treinar para iniciar o processo de treinamento do modelo com base nos dados de amostra.

Agora você verá uma mensagem que diz Treinamento concluído. Selecione a opção Ir para detalhes para ir para a página do modelo. Agora precisamos clicar em Publicar e, uma vez que o processo de publicação for concluído, clique em Usar Modelo.

Observação: se o processo de treinamento do modelo falhar por qualquer motivo, tente voltar e garantir que todos os campos escolhidos em cada documento de amostra estejam devidamente rotulados e também tente adicionar mais documentos de amostra e, em seguida, execute o treinamento novamente.

Depois de escolher usar o novo modelo, são mostrados quais aplicativos usarão nosso modelo, neste caso, SharePoint e Common Data Service (agora renomeado Microsoft Dataverse). Clique em Criar fluxo.

Agora você verá uma mensagem de que o fluxo foi criado com êxito e será solicitado a Ir para o SharePoint. Isso o leva de volta à biblioteca de documentos onde o modelo foi criado.

Como o modelo existe, sempre que novas faturas (documentos que correspondem ao modelo) são carregadas para a biblioteca, o fluxo é acionado para realizar a extração de dados para que as informações possam ser exibidas.

Apresentando o SharePoint Syntex
em SharePoint

Apresentando o SharePoint Syntex

Disponível a partir do início de outubro, o SharePoint Syntex fornecerá a você a capacidade de automatizar a extração de…

por Fernando Viana e Sá
ago 30, 2021
Ver mais artigos

Entre em Contato

Vamos juntos transformar sua dor
em solução!

#moveFast