Posição – Engenheiro(a) de IA – Sênior (Remoto)
Você conhece a Icon?
Apaixonados por pessoas e especialistas em tecnologia. Nosso trabalho é encontrar talentos e soluções sob medida para os nossos clientes.
Vem encontrar o seu projeto ideal conosco e participar da comunidade ICON!
Sobre a Vaga
Código da vaga: A55927360010
Modelo de contratação: PJ
Atuar na implementação, operação e evolução de sistemas de Inteligência Artificial Generativa, com foco em Large Language Models (LLMs), arquiteturas de RAG (Retrieval-Augmented Generation) e sistemas agentic, garantindo confiabilidade, performance, escalabilidade e robustez das soluções em produção.
Responsável por construir e sustentar aplicações baseadas em LLMs seguindo os padrões técnicos da plataforma de IA, conectando modelos, dados e agentes para gerar impacto real no negócio, com governança, observabilidade e eficiência operacional.
Responsabilidade e Atribuições
· Implementar e evoluir sistemas de IA generativa baseados em LLMs, garantindo eficiência, estabilidade, escalabilidade e aderência às diretrizes técnicas.
· Desenvolver e manter pipelines de RAG, incluindo ingestão de dados, chunking, embeddings, vetorização, indexação, recuperação e integração com LLMs.
· Projetar e implementar arquiteturas agentic, utilizando frameworks como LangChain e LangGraph, incluindo definição de agentes, ferramentas, fluxos multi-step e controle de estado e contexto.
· Implementar e gerenciar prompts, embeddings, vector stores e artefatos de IA generativa, assegurando versionamento, rastreabilidade, governança e performance.
· Integrar LLMs e agentes a sistemas corporativos, APIs e fontes de dados, garantindo segurança, controle de acesso e confiabilidade operacional.
· Aplicar práticas de LLMOps / MLOps, incluindo CI/CD para prompts, agentes e pipelines, deploy automatizado, rollback, gestão de ambientes e observabilidade.
· Operacionalizar soluções de IA generativa em Databricks e AWS, utilizando stacks combinadas para dados, agentes e inferência em produção.
· Realizar troubleshooting, correções e otimizações em pipelines de RAG, agentes e sistemas de inferência.
· Colaborar com Cientistas de Dados, operacionalizando modelos, ajustando requisitos não funcionais e garantindo a viabilidade produtiva das soluções.
· Contribuir com melhorias contínuas em performance, custo, automação e governança dentro dos padrões definidos
Requisitos e Qualificações
· Perfil pragmático, capaz de propor soluções de complexidade adequada, entregando valor incremental e garantindo alta confiabilidade operacional.
· Forte base em engenharia de software, incluindo testes, versionamento, automação, arquitetura e boas práticas de código.
· Experiência prática com LLMs em produção, incluindo prompt engineering, function calling, tool usage e avaliação de qualidade.
· Vivência sólida com pipelines de RAG, embeddings, estratégias de recuperação e vector stores.
· Experiência com arquiteturas agentic e frameworks de orquestração de LLMs e agentes, como LangChain e LangGraph ou equivalentes.
· Conhecimentos em LLMOps / MLOps, incluindo CI/CD, governança, versionamento, observabilidade e controle de custos.
· Será um diferencial conhecimento de AWS, especialmente serviços utilizados em IA generativa e backend.
· Noções de MCP (Model Context Protocol) e sua aplicação na integração entre modelos, agentes, ferramentas e workflows.
· Boa comunicação técnica e capacidade de colaboração multidisciplinar.
Local
São Paulo/SP
#vemserICON
Localidade: Brasil