Acelerando a IA: A Sinfonia de Microsoft e NVIDIA para Inovação
Introdução: Impulsionando a Próxima Geração de IA Empresarial
Como Engenheiro de Software Sênior e Arquiteto de Soluções na AITY, acompanho de perto as inovações que moldam o futuro da tecnologia. A colaboração estratégica entre Microsoft e NVIDIA representa um marco significativo, combinando computação acelerada com engenharia de nuvem em escala para entregar capacidades avançadas de Inteligência Artificial. Essa sinergia é fundamental para a criação de soluções robustas e de alto desempenho que nossos clientes podem confiar e escalar. Juntos, eles estão integrando hardware, software e infraestrutura para capacitar os avanços mais importantes da IA moderna.
Na recente NVIDIA GTC, foram destacadas inovações que reforçam essa parceria:
- Expansão das capacidades do Microsoft Foundry para construir, implantar e operar agentes de IA prontos para produção em aceleradores NVIDIA e modelos NVIDIA Nemotron abertos.
- Nova infraestrutura Azure AI otimizada para cargas de trabalho de inferência intensiva e baseadas em raciocínio, incluindo a primeira nuvem hiperescala a operar os sistemas NVIDIA Vera Rubin NVL72 de próxima geração.
- Integração mais profunda entre Microsoft Foundry, Microsoft Fabric e bibliotecas NVIDIA Omniverse, juntamente com frameworks abertos, para suportar sistemas de IA Física, desde a simulação até operações no mundo real.
Capacidades Expandidas do Microsoft Foundry para Agentes de IA
O Microsoft Foundry serve como o sistema operacional para construir, implantar e operar IA em escala empresarial. Ele une modelos, ferramentas, dados e observabilidade em um sistema único, projetado para agentes de produção. As capacidades estão sendo expandidas em todo o Foundry Agent Service e modelos NVIDIA Nemotron.
- Foundry Agent Service e Observabilidade no Foundry Control Plane estão agora geralmente disponíveis, permitindo o desenvolvimento e operação de agentes de IA em escala de produção. Esses agentes podem raciocinar, planejar e agir através de ferramentas, dados e fluxos de trabalho.
- Foundry Control Plane oferece visibilidade ponta a ponta sobre o comportamento do agente, melhorando a produtividade do desenvolvedor e a confiança empresarial. Empresas como a Corvus Energy já utilizam o Foundry para substituir fluxos de trabalho de inspeção manual por inteligência operacional baseada em agentes.
- A integração do Voice Live API com o Foundry Agent Service, em prévia pública, simplifica a transição de protótipo para produção, permitindo a criação de experiências agênticas multimodais e em tempo real, priorizando a voz.
- Um portal Microsoft Foundry atualizado e integrações expandidas para Prisma AIRS da Palo Alto Networks e Zenity entregam experiências de construção mais profundas e segurança em tempo de execução ao longo de todo o ciclo de vida do agente.
- Os modelos NVIDIA Nemotron estão agora acessíveis via Microsoft Foundry, enriquecendo a já ampla seleção de modelos na nuvem. Isso complementa a parceria com a Fireworks AI, permitindo o ajuste fino de modelos de código aberto como NVIDIA Nemotron em ativos de baixa latência distribuíveis para a borda.
Infraestrutura de IA em Escala para Cargas de Trabalho Exigentes
Cargas de trabalho de inferência de IA estão remodelando os requisitos de custo, desempenho e design de sistema. Para operacionalizar a IA agêntica em escala, é crucial ter infraestrutura dedicada para cargas de trabalho intensivas em inferência e baseadas em raciocínio, que possam ser implantadas e operadas consistentemente em ambientes globais e regulamentados.
- A abordagem de infraestrutura de IA da Microsoft é projetada para integrar perfeitamente os sistemas NVIDIA de próxima geração em datacenters Azure, otimizados para energia, refrigeração, rede e atualizações geracionais rápidas. Isso assegura que os clientes permaneçam na vanguarda tecnológica.
- Em menos de um ano, centenas de milhares de GPUs Grace Blackwell resfriadas a líquido foram implantadas globalmente. A Microsoft é a primeira nuvem hiperescala a operar o novo NVIDIA Vera Rubin NVL72 em seus laboratórios, com lançamento em datacenters Azure nos próximos meses.
- A inovação de infraestrutura se estende a ambientes soberanos e regulamentados, com suporte inicial para a plataforma NVIDIA Vera Rubin no Azure Local. Isso permite que as organizações planejem cargas de trabalho de IA de próxima geração, incluindo sistemas agênticos e baseados em raciocínio, mantendo operações, governança e segurança consistentes com o Azure através da camada de software unificada com Azure Arc e Foundry Local.
Trazendo a IA para o Mundo Físico
A IA está transcendendo as experiências digitais para o mundo físico. Microsoft e NVIDIA estão colaborando para suportar essa próxima onda de IA Física.
- Este trabalho se concentra no NVIDIA Physical AI Data Factory Blueprint, com o Microsoft Foundry atuando como a plataforma para hospedar e operar sistemas de IA Física no Azure em escala de nuvem.
- Integrando este blueprint com os serviços Azure como parte de um Physical AI Toolchain, a Microsoft permite que os desenvolvedores construam, treinem e operem fluxos de trabalho de IA física e robótica que conectam ativos físicos, simulação e ambientes de treinamento em nuvem em pipelines repetíveis e de nível empresarial. Um repositório público do Azure Physical AI Toolchain no GitHub foi introduzido para este fim.
- Para ampliar o impacto da IA em ambientes físicos, Microsoft e NVIDIA estão aprofundando a integração entre o Microsoft Fabric e as bibliotecas NVIDIA Omniverse. Isso conecta dados operacionais em tempo real com gêmeos digitais fisicamente precisos e simulação, permitindo que as organizações monitorem, compreendam e ajam com base em insights de IA em seus sistemas físicos. Essa abordagem vai além de dashboards e alertas, promovendo ações coordenadas e impulsionadas por IA em máquinas, instalações e fluxos de trabalho, especialmente em setores como manufatura e operações.
A sinergia entre Microsoft e NVIDIA permite que as organizações operem inteligência de forma contínua, executando cargas de trabalho de IA intensivas em inferência, baseadas em raciocínio e de IA física com o desempenho, segurança e governança necessários para negócios reais e indústrias regulamentadas. Essa abordagem acelera a transição de insights para ações concretas em diversos cenários, desde agentes sempre ativos até a implantação de sistemas inteligentes em ambientes fabris e energéticos.
Aguardando Login...