Otimizando Processamento de Documentos Financeiros com Pulse AI e Amazon Bedrock
Introdução
Instituições financeiras lidam diariamente com milhares de documentos complexos. A extração de dados desses documentos é uma tarefa crítica, onde erros de Reconhecimento Óptico de Caracteres (OCR) podem se propagar por cálculos interconectados, comprometendo a precisão analítica e gerando custos significativos. Enquanto um erro simples em um documento legal padrão pode exigir apenas uma correção manual rápida, a mesma falha em dados financeiros pode desencadear uma cascata de problemas, levando a erros sistemáticos na análise.
Na AITY, compreendemos que a solução não está apenas em digitalizar documentos, mas em extrair inteligência acionável deles. Este artigo técnico demonstra como construir uma pipeline de extração de documentos e fine-tuning de modelos que aborda esses desafios. Ao combinar as capacidades avançadas de compreensão de documentos da Pulse AI com os poderosos serviços de IA do Amazon Bedrock, as organizações podem alcançar precisão de nível empresarial e extrair insights financeiros contextualmente relevantes em escala.
Desafios do Processamento de Documentos Financeiros
As ferramentas tradicionais de OCR são deficientes no processamento de documentos financeiros complexos, como balanços, demonstrações de resultados, relatórios da SEC, pesquisas e materiais de auditoria. Esses documentos frequentemente apresentam:
- Estruturas de tabela intrincadas: Com células mescladas e dados hierárquicos.
- Layouts multi-colunas: Com referências interconectadas.
- Informações dependentes do contexto: Exigindo compreensão semântica.
Abordagens tradicionais de OCR tratam esses documentos como meras imagens, perdendo as relações estruturais e as nuances contextuais que os tornam significativos. O resultado é uma série de correções manuais, atrasos na entrada de dados e erros analíticos sistemáticos.
A Solução Híbrida: Pulse AI e Amazon Bedrock
A AITY adota uma abordagem inovadora combinando Pulse AI e Amazon Bedrock para transformar a extração de documentos financeiros.
Pulse AI: Compreensão Avançada de Documentos
Diferente das pipelines monolíticas de OCR, a Pulse AI integra modelos de linguagem de visão com componentes clássicos de Machine Learning (ML), especificamente projetados para a compreensão de documentos. Isso cria uma solução inteligente que:
- Extrai dados estruturados com consciência semântica.
- Gera datasets aprimorados para fine-tuning supervisionado de modelos de domínio financeiro.
- Permite a implantação de Large Language Models (LLMs) personalizados, treinados com seus dados financeiros específicos.
A Pulse AI é utilizada por empresas globais, incluindo Samsung e instituições financeiras da Fortune 500, processando altos volumes de documentos financeiros e operacionais. Em um caso real, um lote de aproximadamente 1.000 documentos financeiros complexos, que antes exigiam vários dias para serem processados, foi concluído em menos de três horas, produzindo resultados estruturados e auditáveis, prontos para análises e aplicações de IA downstream.
Amazon Bedrock: IA Gerenciada e Escalável
O Amazon Bedrock complementa a Pulse AI oferecendo serviços de IA totalmente gerenciados, que permitem:
- Personalização de modelos sem overhead de MLOps: As equipes podem focar na inovação, não na infraestrutura.
- Implantação sob demanda: Sem necessidade de planejamento de capacidade.
- Modelos Nova family: Oferecem excelentes características de custo-desempenho para tarefas de extração.
Benefícios Chave da Integração
A combinação da Pulse AI e Amazon Bedrock proporciona um pipeline robusto para a inteligência financeira:
- Extração inteligente: A Pulse AI extrai dados estruturados e semanticamente conscientes de documentos financeiros complexos, lidando com tabelas intrincadas, layouts multi-colunas e dados hierárquicos.
- Fine-tuning de modelos: O Amazon Bedrock realiza o fine-tuning de modelos Amazon Nova com base nesses dados de alta qualidade, criando inteligência específica para as convenções financeiras da sua organização.
- Redução do trabalho manual: Modelos personalizados processam novos documentos com compreensão específica da organização, reduzindo a revisão manual de dias para horas.
Arquitetura da Pipeline de Extração e Fine-Tuning
A pipeline para construir aplicações financeiras inteligentes começa com documentos financeiros brutos e orquestra uma série sofisticada de etapas, desde o processamento do documento e fine-tuning até a implantação, para criar uma solução de IA personalizada para análise e insights de dados financeiros.
- Ingestão de Documentos: Os documentos são ingeridos no container Pulse na sua VPC ou na oferta SaaS da Pulse.
- Processamento Pulse AI: O modelo Pulse processa os documentos financeiros, extraindo dados estruturados.
- Conversão e Armazenamento: Os dados extraídos são convertidos para o formato de fine-tuning supervisionado do Amazon Bedrock Nova Micro e armazenados no Amazon Simple Storage Service (Amazon S3).
- Fine-Tuning no Bedrock: Um trabalho de fine-tuning supervisionado é executado usando o Amazon Nova Micro (
amazon.nova-micro-v1:0), um modelo custo-eficiente otimizado para tarefas de extração baseadas em texto com uma janela de contexto de 128K. - Implantação do Modelo: Após a conclusão do trabalho, o modelo resultante é implantado para inferência sob demanda. É possível usar o Provisioned Throughput para cargas de trabalho de missão crítica que exigem desempenho consistente.
- Aplicações de Usuário Final: O modelo customizado é importado para o Amazon Bedrock e implantado para alimentar uma aplicação escalável de usuário final.
Esta arquitetura combina o dataset financeiro específico do domínio com o modelo customizado via fine-tuning supervisionado, permitindo que as organizações construam aplicações de IA prontas para produção que compreendem o contexto financeiro, mantendo desempenho e eficiência de custos.
Detalhamento Técnico: Construindo a Pipeline
Para implementar esta solução, são necessários uma conta AWS com políticas IAM apropriadas para acesso ao Bedrock e S3, uma conta Pulse Standard, e um ambiente de execução (como uma instância EC2 na região us-east-1 com Python 3.12+).
-
Extração de Dados com Pulse AI: Após configurar as credenciais AWS e a chave API da Pulse (armazenada de forma segura no AWS Secrets Manager), a extração de um documento de referência é feita via API:
bash curl -X POST https://api.runpulse.com/extract -H "x-api-key: $(aws secretsmanager get-secret-value --secret-id pulse-api-key --query SecretString --output text)" -H "Content-Type: application/json" -d '{ "file_url": "https://www.impact-bank.com/user/file/dummy_statement.pdf", "figureProcessing": {"description": true}, "extensions": {"altOutputs": {"returnHtml": true}} }'> pulse_output.jsonEste comando envia um documento financeiro público para a API da Pulse, que retorna um JSON estruturado contendo os dados extraídos, incluindo cabeçalhos, números de página, tabelas e textos, com bounding boxes e pontuações de confiança.
-
Conversão para Dataset Nova Micro: Os dados extraídos pela Pulse AI precisam ser convertidos para o formato
.jsonlcompatível com o Amazon Bedrock. Um script Python (convert_to_nova.py) realiza essa conversão, criando samples de treinamento que ensinam o modelo a reconhecer a estrutura do documento, padronizar tipos de dados e preservar relações hierárquicas.```python
Exemplo simplificado de como um registro é formatado para o Bedrock
return { "schemaVersion": "bedrock-conversation-2024", "messages": [ { "role": "user", "content": [{"text": doc_str}] }, { "role": "assistant", "content": [{"text": extract_str}] } ] } ```
Este script cria samples que ensinam o modelo Nova Micro sobre padrões de dados financeiros, estrutura de documentos, consistência de tipos de dados e convenções específicas do domínio.
-
Preparação do Ambiente e Fine-Tuning: As políticas IAM são cruciais para permitir que o Amazon Bedrock acesse dados no S3 e secrets no Secrets Manager. Um exemplo de política para acesso ao S3 e Secrets Manager seria:
json { "Version": "2012-10-17", "Statement": [ { "Sid": "S3AccessForFineTuning", "Effect": "Allow", "Action": ["s3:GetObject", "s3:PutObject", "s3:ListBucket"], "Resource": ["arn:aws:s3:::your-bucket-name", "arn:aws:s3:::your-bucket-name/*"] }, { "Sid": "SecretsManagerAccess", "Effect": "Allow", "Action": ["secretsmanager:GetSecretValue"], "Resource": ["arn:aws:secretsmanager:us-east-1:your-aws-account-ID:secret:pulse-api-key-*"] } ] }Após a criação do bucket S3 e o upload do datasetnova_dataset.jsonl, o trabalho de fine-tuning é iniciado:bash aws bedrock create-model-customization-job \ --job-name my-fine-tuning-job-nova-micro \ --custom-model-name my-custom-pulse-model-nova-micro \ --role-arn arn:aws:iam::<Your-AWS-Account>:role/AmazonBedrock-FineTuning-S3-Role \ --base-model-identifier amazon.nova-micro-v1:0:128k \ --training-data-config s3Uri=s3://<your-s3-bucket>/training-data/nova_dataset.jsonl \ --output-data-config s3Uri=s3://<your-s3-bucket>/output/ \ --hyper-parameters '{"epochCount":"2","learningRate":"0.00001","learningRateWarmupSteps":"10"}' -
Implantação do Modelo Personalizado: Uma vez que o fine-tuning é concluído e o ARN do modelo personalizado é obtido, o modelo pode ser implantado:
bash aws bedrock create-custom-model-deployment \ --model-deployment-name "my-custom-pulse-model-deployment" \ --model-arn "$CUSTOM_MODEL_ARN" \ --region us-east-1
O que o Fine-Tuning Ensina ao Nova Micro
O processo de fine-tuning com os dados estruturados da Pulse AI ensina o modelo Nova Micro a entender o domínio financeiro através do aprendizado de padrões, conferindo-lhe várias capacidades chave:
- Reconhecimento da Estrutura do Documento: Compreensão de relações hierárquicas (Cabeçalhos → Tabelas → Texto → Números de Página), entendimento espacial de bounding boxes e manuseio de documentos multi-página.
- Padrões de Dados Financeiros: Preservação da estrutura de tabelas (semântica de linha/coluna), interpretação de scores de confiança e consistência de tipos de dados para números de conta, datas e valores monetários.
- Consistência Estrutural: Aderência a convenções de nomenclatura de campos e preservação de metadados para trilhas de auditoria.
- Convenções Específicas do Domínio: Reconhecimento de seções de documentos financeiros (cabeçalhos, rodapés, tabelas de transações) e extração de dados de comerciantes, incluindo IDs de terminal e informações de localização.
O modelo aprende ao ser exposto aos padrões de extração estruturada de alta qualidade da Pulse AI, internalizando essas estruturas e aplicando-as a novos documentos financeiros.
Avaliação de Performance
A tabela a seguir compara a performance de um modelo Nova Micro base com um modelo personalizado (my-custom-pulse-model-nova-micro-v5) após o fine-tuning, usando um dataset de documentos de amostra:
| Métrica | Nova Micro (Base) | my-custom-pulse-model-nova-micro-v5 | | :--------------------------- | :------------------ | :---------------------------------- | | Latência | 540,508 ms (~9 min) | 543,600 ms (~9 min 3.6 sec) | | Cheques Extraídos | 3 de 6 | 6 de 6 | | Compras POS Extraídas | 3 de 3 | 3 de 3 | | Organização de Transações | Separadas por tipo | Ordem cronológica | | Completude | 50% dos dados de cheque | 100% dos dados de cheque | | Precisão do Status da Sequência | Parcial (3 cheques) | Completa (todos os 6 cheques) | | Estrutura JSON | Formato segmentado | Lista unificada de transações | | Conhecimento de Domínio | Extração básica | Compreensão abrangente do documento |
Disclaimer: Estas métricas são específicas para o dataset de documentos de amostra. Seus resultados podem variar.
Impacto Prático e Próximos Passos
Ao combinar a compreensão avançada de documentos da Pulse AI com as capacidades de ML da AWS, as instituições financeiras podem construir sistemas de processamento de dados financeiros que são mais rápidos, mais precisos e mais escaláveis do que as abordagens tradicionais. Esta arquitetura demonstra uma abordagem pronta para produção para o processamento de documentos financeiros usando Amazon Bedrock e Pulse AI.
O verdadeiro poder do fine-tuning surge quando complementamos os modelos de fundação (FMs) com os datasets financeiros únicos da sua organização. Ao treinar modelos com seus documentos proprietários, terminologia e processos de negócios, você cria capacidades especializadas que modelos genéricos normalmente não conseguem igualar. Esta abordagem transforma a IA de uma ferramenta de propósito geral em um ativo estratégico que compreende as nuances do seu domínio financeiro específico.
Começar com a Pulse AI é simples. Você pode se inscrever para uma conta Pulse AI Standard para iniciar o uso de modelos fine-tuned em seus fluxos de trabalho financeiros. A documentação do Quickstart da Pulse AI oferece um guia passo a passo para configurar seu primeiro trabalho de fine-tuning e implantar modelos personalizados. Para assistência personalizada, a equipe da Pulse AI está pronta para ajudar a desbloquear todo o potencial da IA específica do domínio.
Para aprofundar seu conhecimento em fine-tuning supervisionado e explorar estratégias avançadas de implementação, consulte o Guia de Fine-tuning do AWS Nova e a documentação sobre a personalização de Modelos Amazon Nova. A documentação da API da Pulse também oferece orientação abrangente para integrar capacidades de extração de documentos de nível de produção em seus fluxos de trabalho existentes.
Aguardando Login...