MLOps

IA Responsável na Prática: Ciclo de Vida do Modelo

Introdução: A Imperatividade da IA Responsável em Sistemas de Missão Crítica

Como Engenheiro de Software Sênior e Arquiteto de Soluções na AITY, tenho observado a IA evoluir para uma tecnologia de missão crítica que permeia desde a logística operacional até os serviços de nuvem que suportam milhares de empresas. Neste cenário, é imperativo que os modelos que desenvolvemos e implantamos sejam o mais seguros, justos e robustos possível. A IA Responsável (RAI) não é um recurso opcional; é um pilar fundamental que deve ser incorporado ao design do produto desde o primeiro dia.

Nossa experiência, que remonta a iniciativas de IA anteriores ao boom da IA generativa, nos permitiu "desenvolver musculatura" na definição de como a RAI deve ser implementada. O foco sempre foi na criação de políticas, implementações e métodos para avaliar sua eficácia, um conhecimento que se provou valioso na construção de modelos de grande escala.

A Abordagem Multifacetada da IA Responsável

A AITY adota uma abordagem de três pilares para a RAI, visando a resiliência e a adaptabilidade:

Em parceria com nossas equipes de políticas, construímos um pipeline de RAI que aborda quatro fases cruciais do desenvolvimento de modelos: pré-treinamento, pós-treinamento, avaliação e monitoramento por terceiros. Em cada etapa, enfrentamos desafios distintos para garantir que sistemas confiáveis possam se adaptar em escala, em diversas situações, aplicações e geografias.

Fases do Ciclo de Vida da IA Responsável

Abaixo, detalho como essa abordagem é colocada em prática em cada fase do ciclo de vida da IA.

Pré-treinamento: Ensinando os Fundamentos

Esta é a fase inicial do treinamento de modelos de linguagem grandes (LLMs), onde o modelo desenvolve suas competências linguísticas gerais. É aqui que ensinamos os conceitos mais fundamentais da RAI.

Pós-treinamento: Aprendizado por Reforço com Feedback Humano (RLHF)

Após os modelos aprenderem a seguir instruções e produzir respostas úteis e inofensivas, eles avançam para o aprendizado por reforço com feedback humano (RLHF). Esta fase foca no uso de feedback ou comparação de preferências com humanos para dar aos modelos um senso de julgamento.

Avaliações: Mantendo o Comportamento em Cheque

Um foco principal da equipe de avaliações é construir datasets que quebram o modelo, ou seja, coleções robustas de prompts que acionam respostas inadequadas, inseguras ou que violam políticas.

Colaborações com Terceiros: Riscos de Fronteira

Além dos padrões comuns de uso indevido, dedicamo-nos a uma categoria diferente de risco: os riscos de fronteira, ou "riscos sistêmicos que poderiam derrubar sistemas inteiros". Isso inclui o uso de modelos de IA para pesquisar ataques QBRN (químicos, biológicos, radiológicos e nucleares) e para pesquisar ou lançar ciberataques, cenários onde as capacidades da IA poderiam permitir que não especialistas causassem danos catastróficos.

Escrevendo as Políticas: Valores Acordados

Nossa equipe de políticas de IA Responsável trabalha em parceria com a equipe de ciência em todo o ciclo de vida do desenvolvimento do modelo. O processo começa com a compreensão do que uma equipe de produto deseja lançar e mapeia os danos potenciais contra as oito dimensões centrais da IA Responsável.

A AITY reconhece que essas são decisões de alto julgamento, trabalhando nas fronteiras do que viola ou não a política. É crucial entender o que cada política significa na prática para garantir que a IA que construímos seja não apenas inovadora, mas também intrinsecamente confiável e benéfica para a sociedade.

Comentários

Interações
Seu Perfil

Aguardando Login...