Engenharia

Nova Forge SDK: Acesso Simplificado à Customização de LLMs Empresariais

Desbloqueando o Potencial dos LLMs Personalizados com Nova Forge SDK

Olá, sou Jackson, Engenheiro de Software Sênior e Arquiteto de Soluções na AITY. As Large Language Models (LLMs) revolucionaram nossa interação com a IA, mas a abordagem "tamanho único" nem sempre funciona. Modelos LLMs pré-treinados, com conhecimento geral, frequentemente falham em tarefas específicas de domínio, fluxos de trabalho proprietários ou requisitos de negócio únicos. Clientes empresariais necessitam cada vez mais de LLMs especializados que compreendam profundamente seus dados proprietários, processos de negócio e terminologia de domínio. Sem customização, somos forçados a aceitar respostas genéricas ou buscar um meio-termo com engenharia de contexto excessiva.

A Nova Customization oferece um conjunto de recursos robustos, que vão desde opções de customização no Amazon Bedrock, como Supervised Fine-Tuning (SFT) e Reinforcement Fine Tuning (RFT), até as capacidades de customização de IA do Amazon SageMaker, incluindo SFT, Direct Preference Optimization (DPO), RFT, e customização baseada em LoRA e full rank.

O Desafio da Customização e a Solução Nova Forge SDK

Um desafio comum ao refinar modelos em datasets especializados é a "perda catastrófica" (catastrophic forgetting), onde os modelos podem perder algumas capacidades base, como seguir instruções, habilidades de raciocínio e expertise de conhecimento amplo. O Amazon Nova Forge oferece uma ferramenta para superar essa troca, permitindo construir modelos de fronteira usando Nova, partindo de checkpoints iniciais e mesclando seus datasets com dados curados pela Amazon Nova, tudo isso hospedando seus modelos customizados de forma segura na AWS.

No entanto, esses fluxos de trabalho de customização podem ser complexos, exigindo configuração técnica de infraestrutura e um investimento considerável de tempo, criando uma alta barreira de entrada.

Para combater essa questão, estamos lançando o Nova Forge SDK, que torna a customização de LLMs acessível. Ele capacita equipes a explorar todo o potencial dos modelos de linguagem sem os desafios de gerenciamento de dependências, seleção de imagens e configuração de receitas, diminuindo drasticamente a barreira de entrada. Vemos a customização como um continuum na escala de adoção, e o Nova Forge SDK suporta todas as opções, do Amazon Bedrock ao Amazon SageMaker AI, utilizando as capacidades do Amazon Nova Forge.

Nova Forge SDK: Construído por Desenvolvedores para Desenvolvedores

O Nova Forge SDK entrega um kit de ferramentas unificado, projetado especificamente para clientes e desenvolvedores Nova. Ele abrange todo o ciclo de vida da customização, fornecendo soluções em um único lugar, desde ferramentas de preparação de dados e gerenciamento de tarefas de treinamento até a implantação de modelos.

O SDK representa um esforço para remover o "heavy lifting" indiferenciado da customização de LLMs, permitindo que você se concentre na experimentação. Ele complementa as ferramentas existentes, oferecendo fluxos de trabalho com defaults inteligentes e orientação, enquanto ainda permite que usuários avançados acessem todo o poder dos SDKs dos serviços subjacentes quando necessário. Isso oferece aos clientes fluxos de trabalho simplificados para tarefas comuns e flexibilidade total para casos de uso avançados.

Arquitetura do Nova Forge SDK

O SDK pode ser compreendido em três camadas distintas:

O usuário do Nova Forge SDK fornece um RuntimeManager configurado, um modelo para customizar e um método de treinamento para um dos métodos de API em um NovaModelCustomizer inicializado. A inicialização do Customizer inclui a especificação do local de onde ele pode recuperar os dados de treinamento, que é tipicamente um bucket do Amazon Simple Storage Service (Amazon S3). Com base nessas configurações, o Customizer lida com a configuração e o início de uma tarefa do Amazon SageMaker AI para executar a tarefa especificada. Finalmente, a tarefa concluída gera artefatos de saída e (para a API "train") um modelo treinado, que você pode então referenciar através do SDK ou diretamente usando as APIs do Amazon SageMaker.

Pré-requisitos para o Desenvolvimento

Antes de iniciar o fluxo de trabalho de customização, certifique-se de ter o seguinte configurado em seu ambiente. Esta postagem do blog usa o Amazon SageMaker Training Jobs (SMTJ) como plataforma de computação.

Configurando o Nova Forge SDK

Após concluir os pré-requisitos, você pode usar as seguintes diretrizes para configurar seu ambiente para começar a usar o Nova Forge SDK.

  1. Ambiente Python: O Nova Forge SDK requer Python 3.12 ou posterior. Recomendamos criar um ambiente virtual para isolar dependências e evitar conflitos com outros pacotes em seu sistema.

  2. Instale o SDK: Você pode instalar o SDK com o seguinte comando Pip:

    bash pip install nova-forge-sdk

  3. Verifique a Instalação: Importe os módulos chave em um arquivo Python de exemplo para verificar a instalação:

    python from nova_forge_sdk import NovaModelCustomizer, SMTJRuntimeManager, TrainingMethod, Model from nova_forge_sdk.data import CSVDatasetLoader from nova_forge_sdk.evaluation import EvaluationTask

    Abaixo, breves descrições de cada um desses módulos:

    • NovaModelCustomizer: A classe principal para interagir com o Nova Forge SDK. Contém os métodos centrais para a API e é usada para inicializar grande parte da configuração de treinamento.
    • SMTJRuntimeManager: Gerencia a infraestrutura AWS necessária para a customização SMTJ, como o tipo e a contagem de instâncias selecionadas para uma tarefa de customização.
    • TrainingMethod: Um Enum dos tipos de treinamento possíveis, que pode ser usado para configurar um NovaModelCustomizer.
    • EvaluationTask: Um Enum dos tipos de avaliação possíveis, que pode ser usado para configurar um NovaModelCustomizer.
    • CSVDatasetLoader: Usado para carregar dados de arquivos CSV para uso no Nova Forge SDK.
    • Model: Um Enum dos modelos Amazon Nova suportados pelo Nova Forge SDK.

Conclusão

A interface unificada do Nova Forge SDK abstrai a complexidade da formatação de dados e das configurações específicas da plataforma, permitindo que os desenvolvedores se concentrem no que realmente importa: seus dados, seu domínio e seus objetivos de negócio. Seja você começando com fine-tuning no Amazon SageMaker Training Jobs ou planejando executar customização com Amazon SageMaker HyperPod, o SDK oferece uma experiência consistente em todo o continuum de customização.

Ao remover as barreiras tradicionais à customização de LLMs – requisitos de expertise técnica e investimento de tempo – o Nova Forge SDK capacita as organizações a construir modelos que realmente entendem seu contexto único, sem sacrificar as capacidades gerais que tornam os modelos de base tão valiosos. O SDK lida com a configuração de recursos de computação, orquestração de todo o pipeline de customização, monitoramento de tarefas de treinamento e implantação de endpoints. O resultado é uma IA empresarial que é especializada e inteligente, especialista no domínio e amplamente capaz.

Pronto para customizar seus próprios modelos Nova? Comece com o Nova Forge SDK no GitHub e explore a documentação completa para começar a construir modelos adaptados às necessidades da sua empresa.

Comentários

Interações
Seu Perfil

Aguardando Login...